'논문통계'에 해당되는 글 79건
- 2013.10.17 카이검정, 교차분석
- 2013.10.16 공분산분석 (Analysis of Covariance : ANCOVA (일명 앙코바)
- 2013.10.16 분할구획 요인설계 (Split Plot Factorial Design) ..
- 2013.10.15 반복설계 (Repeated Design)
- 2013.10.14 의학통계 관련하여
- 2013.10.14 통계의 유의수준에 대하여
- 2013.09.24 가을비오는 화요일 아침
- 2013.08.30 통계 비용 혼란스러우실겁니다.~^^
- 2013.08.30 통계분석 시작한지 언 4년째 ~ 6
- 2013.08.07 통계분석 과외 해드립니다.~
공분산분석 (Analysis of Covariance : ANCOVA (일명 앙코바)
통계분석 2013. 10. 16. 10:48 |뭐든지 그런것 같습니다. 처음 시작할때는 쉬운것 같다가 하면 할수록 복잡해지고 난해해지고 ..
통계가 그런것 같습니다. 단순 빈도를 통해서 그래프만 나와도 재미난적이 있었는데 이제는 그렇게 싫어했던 수학용어가 복잡하게 얽힌 분석을 하고 있으니 말입니다.
이번에는 공분산분석을 살짝쿵 알아보고 가겠습니다.
공분산분석은 매개변수가 연속변수일때 이의 영향을 통계적인 방법으로 통제하여 독립변수의 효과를 검정하는 것으로서
회귀분석 + 분산분석 이라고 보시면 되겠습니다.
예를들어 교육학 에서 많이 사용하는 사전 사후 검정에 있어서 사전에 공부를 잘했던 아이들은 사후에도 점수가 높을것입니다. 반면에 사전에 공부를 못했던 아이들은 당연히 사후에도 점수가 낮겠지요. 이는 만일 처치효과 즉, 어떠한 방법을 가하였다고 하여도 그 효과로 인해서가 아니라 원래 잘했던 아이들은 잘하고 못했던 아이들은 못하게 나오는것입니다.
따라서 집단별 사전능력이 다르기 때문에 공분산분석에서는 사전점수 즉 집단의 사전능력의 평균이 동일해지도록 회귀식을 이용하여 교정점수를 계산합니다.
분석방법은 전과 마찬가지로 분석-일반선형모형-일변량 으로 들어갑니다.
여기서 사후점수가 종속변수가 될것이며, 공변량은 매개변수인 사전점수를 넣습니다. 그리고 모수요인에 처치방법을 넣게 됩니다.
전과 달리 이번 분석에서는 모형을 제1유형으로 바꿔주셔야 하는데 공변량을 주효과 전에 입력학 결과를 얻기 위해서 제1유형의 제곱합을 선택합니다.
옵션에서 처치법을 평균출력기준으로 넣어주시고 확인을 누르시면 쭈르르르륵 결과가 나옵니다.
결과에서 주요히 볼 내용은 사전능력이 사후점수에 유의한 영향을 미치는가를 보고 사전점수가 사후점수에 미치는 영향을 통제한 후의 사후점수값을 확인함으로서 처치법에 따른 차이가 있는지를 확인 합니다.
문의는 언제든지 chsoo.lee@gmail.com 입니다.
분할구획 요인설계 (Split Plot Factorial Design) ..
통계분석 2013. 10. 16. 10:07 |아래글이라 해야하는지 윗글이라 해야하는지 ^^ 모르겠지만 하여간 전글에서 반복설계를 이해하셨다면..
여기서 좀더 분할을 할수 있겠습니다. 말이 어렵지만.. (우리나라 말 정말 어려움)..
쉽게 말해서 전글에서 골프채의 선호도를 분석했다고 하면 골프채의 선호도가 성별에 따라서는 어떻게 다를까 라는 의문이 들수도 있겠지요..
그럴때 사용하는 것인 분할 구획 요인설계 입니다.
분할구획요인설계는 독립변수 중 구획변수가 하나 이상 포함되어 있는 반복설계의 일종입니다. (성태제 교수님).
이를 위한 분석은 전에 언급한 반복측정 분석을 통해서 합니다. 단지 개체간 요인에 성별을 집어넣어서(?) 분석을 하게 됩니다.
옵션에서 기술통계랑과 동질성 검정을 선택하시면 되고.. 확인을 누르시면 쭈르르르륵 결과가 나옵니다.
이러한 분할구획 요인설계는 농학분야에서 시작되었으면 현재 마케팅 방면에서 다양하게 활용되고 있습니다.
문의는 언제든지 chsoo.lee@gmail.com 입니다.
반복설계 (Repeated Design)
통계분석 2013. 10. 15. 11:17 |위의 글에도 언급하였지만 의학 및 약학 분야등에서 또 많이 쓰는 연구 중의 하나가 바로 반복설계이다
몸이라는 것이 약한번 먹는다고 낳는게 아니니 반복적으로 처치를 하면서 상황을 보고 이를 통계적으로 검증한다고 해야 할까요 ?
물론 이러한 연구방법은 체육분야에서도 많이 사용되고 있습니다.
그렇다면 마케팅 방면에서는 어떻게 적용할수 있을까요 ?
요즘 한참 골프가 인기를 끌고 있죠 ? 음.. 스크린 골프는 나날이 대박을 이어가고.. 상장도 하고.. 아 좋겠네요..
그와 더불어 골프용품의 인기도 날로 늘어가네요..
근데 우리가 항상 하는 탓이있죠... 골프가 안 맞으면 채가 안좋아서.. 코스가 안좋아서..
그래서 어느정도 실력이 균일한 골프애호가를 대상으로 신제품, 기존제품. 타사제품의 골프클럽은 한달간격으로 시타해보도록 하고 선호도를 측정해봅니다..
세가지 클럽에 대해 애호가의 선호도에 차이가 있는지를요..
그러기 위해서는 반복측정분산분석을 진행해야 합니다.
개체내 요인이름을 지정하고 수준의수는 3가지 이니까 3을 넣으시고 ~
개체내 변수에 반복측정된 종속변수를 넣습니다.
다변량 검정결과에서는 대부분 윌크스 람다 값을 사용합니다. ~
자세한 스크린샷이 없어서 이해하시기가 힘들수도 있겠네요..
비가 내릴려고 하나봅이다. 날씨가 꾸물꾸물... 그래도 힘찬 화요일 됩시다
어떤 통계보다 단순하면서 사실상 가장 값에 대하여 강력한 책임을 지게하는 것이 의학통계가 아닌가 합니다.
사실상 가장 많이 의뢰 들어오는 통계가 처치전, 처치후의 검증 통계가 대부분입니다.
혈압약의 투여 효과를 검증하기 위하여 ~
당뇨약의 효과를 검증하기 위하여 ~
이런경우도 있습니다.
우리나라의 위암 발병율 및 발견율이 세계수준과는 어떠한가의 분석도 나올수가 있겠습니다..
위의종류의 의학통계는 t 검정을 통하여 이루어 집니다.
(물론 더 복잡한 경우 다른 분석방법으로 넘어가기도 합니다만 대부분의 의뢰가 t검정이라는 것을 알려드립니다 )
chsoo.lee@gmail.com (문의사항)
통계의 유의수준에 대하여
통계분석 2013. 10. 14. 13:44 |통계분석결과에 대한 질문중에서 가장 흔한 질문중의 하나가 유의수준에 대한것입니다.
유의수준이라는 것은 연구자가 지정을 할수 있는것을 말하며, 만일 .05로 잡았을경우 이것이 의미하는 것은 영가설이 진인 표집분포 아래에서 100번 중 5번 이하의 사건이 일어나면 그 사건이 일어날 확률이 극히 낮아 영가설이 아닌 진이 아니라고 판단한 확률을 말합니다. (성태제 교수님)
즉, 만일 고객만족도가 재방문에 영향을 미칠것이다 라는 대립가설에 유의수준 0.01342~ 이 나왔다면 우리는 유의수준 p<.05에서 유의한 영향력을 나타냈다고 합니다. 이는 고객만족도가 재방문에 영향을 미칠 영향이 100번중 99번 이상이라고 본다는 말입니다.
자료분석결과에 따라 유의수준을 변경하거나 유의수준을 %로 나타내는 경우는 잘못된것입니다. 특히, 통계 프로그램에 의하여 계산된 p값을 그대로 유의수준으로 옮겨 적는것 또한 유의수준을 이해하지 못하고 있는 것입니다.
p값이란 그와 같은 통계값이 나올 확률을 의미하는 것이지 어떤 허용하는 판단의 실수 범위를 말하는 것은 아닙니다.
chsoo.lee@gmail.com (문의사항)
가을비오는 화요일 아침
작은것을 사랑하는 나 2013. 9. 24. 12:01 |예전 그 노래가 생각나네요.
화요일에 비가 내리면. 오늘이 딱 그 노래와 어울리지 않나 싶습니다.
"슬픈 화요일에 비가 내리면.... " 근데 슬픈 화요일은 아니고 뭐랄까 조용한 화요일 정도가 되겠네요
시원스럽게 내리는 비도 아닌것이 부슬부슬 내리면서 사람 애간장을 녹인다고나 할까요..
아침에 근래에 몸이 안좋았던 형하고 커피를 마시면서 이런저런 이야기를 나누었네요.
사람이 아프면 생각을 많이 하게 되고 변하게 되고, 그리고 건강해지면 또 변하게 되나봅니다.
저도 그랬으니까요..
정확히 13년전이네요. 캐나다에서 유학시절 유일한 교통수단인 자전거 타고 토론토 시내를 활보하던 때입니다.
시간이 소중하다는건 누구나 알고 있는 사실이지만, 시간을 허비하지 말아야 하는것도 알아야 하는 사실이지만 그것 때문에 시간에 쫒기고 살지는 않았나 돌아 봅니다.
어느누구에게도 이것만큼은 공평한 시간인데 사용하기에 따라서는 큰 차이가 있을수도 있지요.
하지만 그 모든것도 마음에서 나타나는 차이일뿐 근본적으로 바뀌는 것은 없습니다.
점점 세상을 알아간다고 할때 또 한번 경각심을 주는 일들이 생기지요.
세상 살아가는 일에 거만을 떨어서는 안될것 같습니다. 세상과 자연은 언제나 저보다 한수 위니까요
통계 비용 혼란스러우실겁니다.~^^
통계분석 2013. 8. 30. 11:45 |도대체 이 열대야는 언제쯤 지나가려나 모르겠습니다.
그러다보니 또 어딘가의 책에서 읽었던 책 한구절이 생각나네요
"이 또한 지나가리라"
이른 8월인데 벌써부터 논문통계 시작하시는 분들이 꽤 되시네요. 물론 가장 많이 궁금해 하시는게 비용이시구요.
저도 오늘 인터넷으로 논문통계라는것을 검색해봤는데 정말 많은 글들이 올라와 있네요..
정찰제부터 시작해서, 최저가 등등.. 이 지식산업에 뭔가 씁쓸함을 느끼는 단어들이네요..
그러다보니 메일을 주셔서 아무것도 묻지않고 통계 얼마에요 ? 여쭙는 분들이 많으세요..
다른 분들은 그럴경우 대답을 해주시는것 같은데.. 저는 대답을 못합니다.
아니 웬만한 분들은 대답 못할거라 생각해요..
통계분석이라는것이 굉장히 다양한 분석방법을 가지고 있기에 어떠한 방법을 쓰는가에 따라서 비용이 달라지는 점은 제가 많은 강조를 했었지요.. (물론 석사통계에 쓰는 방법들이 내내 비슷하지만요)
그리고 이 통계분석이라는게 그냥 넘어가는게 아니라 심사를 거쳐야 하고 수정을 해야 하고..
때애 따라서는 아예 전체를 날릴수도 있는 사항입니다..
따라서 저한테 의뢰를 하지 않으시더라도 가격이 우선되어서는 안됩니다..
분석 아웃풋과 후기등을 잘 살펴보시고 진행하셔야 합니다.
통계관련해서 어떤 사항이든 문의주세요 chsoo.lee@gmail.com
통계분석 시작한지 언 4년째 ~
통계분석 2013. 8. 30. 11:44 |정말 타는듯한 그리고 찌는듯한 오후 입니다.
점심을 먹으면서도 이게 어디로 넘어가는지 모르겠고, 먹고나서도 소화가 안되는거 같고, 하여간 기력이 떨어지는 요즘입니다.
금일 통계분석을 요청하신 분이 메일로 질문을 하시더군요
" 통계관련 일을 아직도 하시는지요 ? 글 올린지가 너무 오래되어서 안하시는거 아닌지 궁금합니다 "
라고 문의를 주셨더라구요..
우선 대답부터 해드려야지요.. 아직도 하고 있고 계속 할 예정입니다. ~
그러고 나서 통계분석을 처음 시작한게 언제인지 한번 되돌아 봤습니다.
2001년 대학원시절 통계관련 수업에 타학교 특강, 통계전문가 특강, 플러스 독학을 통해서 통계분석을 시작한게 처음이네요. 당시 대학원 선배들이 거의 저한테 통계를 맡기다 시피 했고, 선배들이라서 비용을 안받고 대신에 술로 얻어 마신게 아마 인생 전체 마신술의 반은 되지 않을까 합니다.
물론 일부 기업체 선배들은 술과함께 거하게 용돈도 주신기억이 납니다. 많이 주셨던 분은 당신 등록금의 반값까지도 주신분이 계시고 아직도 연락을 하고 계시는 사장님이 계십니다.
그렇게 졸업을 하고 오프라인으로, 선배들의 소개로 통계분석을 해달라는 요청이 드문드문 있더라구요. 회사를 다니면서 투잡을 한다는게 그리 쉽지만은 않더라구요. 그래도 요청이 들어오면 무조건 받았지요. 주말에 좀 안쉬고, 밤에 잠좀 안자고 그렇게 진행을 해왔네요.
잠시 회사를 사직하고 미국으로 유학중에도 이 일은 끊임없이 진행이 되더라구요. 소개받은 사람이 후배를 소개시키고 그 후배가 또 후배를 소개해주고, 그러다보니 사실 지금은 한참 후배격인 분들의 통계도 해주고 있습니다. ~
오프라인으로 분석을 진해하면서 2009년에 블로그를 개설을 하면서 통계관련한 업무나 일, 에피소드등을 올리게 되었네요. 물론 "저 통계분석합니다 자주 애용해주세요" 라는 홍보성 글도 남겼구요 ~
근데 생각외로 많은 분들이 연락을 주시더라구요. 많이 몰릴때는 정말 많이 몰릴때도 있습니다. 근데 제가 항상 강조하는 사항인데 돈에 욕심이 생겨서 여러가지 일을 받다보면 결국은 질이 떨어지기 마련입니다. 제가 직원을 두고 하는것도 아니고 회사 퇴근후 혹은 주말에 제 시간을 할애하는것이라 능력 이외의 일은 절대 받지를 않습니다. 더군다가 온라인이 얼마나 무서운 존재 입니까 ~ 까닥 잘못하면 제 블로그에 수많은 악플을 남기지 않겠습니까 ~ ^^ 그렇게 관리를 한 결과인지 아직까지 악플은 달리지 않고 있네요. 물론 진행중에 의뢰주신분과 커뮤니케이션이 안맞았던 경우에는 최대한 서로간에 해결을 하고 있답니다.
사람과 사람이 하는일이다 보니 서로간에 맘에 안맞는 경우도 있을것이고, 또 서로간에 기분좋게 마무리를 하는 경우도 있습니다. 지난 4년간 온라인에서 만나뵈었던 분의 반정도는 외부미팅도 가졌습니다. 신뢰에 있어서 가장 큰 자산이 제 얼굴이 아닐까 하는 생각이었거든요. 물론 지방에 계시거나 해외에 계신분들은 어찌 미팅을 할 방법이 없고, 또 제 본업이 회사가 바쁜경우에는 또한 시간을 낼수가 없는 경우도 많았습니다.
이 통계업무를 제가 부업이라고 생각하면서 진행하는 것은 맞습니다. 따라서 비용을 받고, 비용도 그렇게 싸지는 않다고 합니다. 그래도 다른 저렴한곳에서 한번씩 고생을 하셨던분들은 너무 저렴한것만 찾은게 잘못이었다고 판단을 하기도 합니다.
가급적 의뢰주신분의 상황을 보다듬으려고 합니다. 회사를 다니면서, 가사를 동반하면서, 통계에 대한 지식의 부족으로 등등 다양한 이유에서 분석을 의뢰하십니다.
어떤 연유에서건 간에 분석 의뢰 주신 사항 잘 살펴드리도록 하겠습니다.
이 블로그 초창기에 말씀드린것 같은데 이 업무는 1분이라도 제 도움이 필요하다면 계속 진행이 될것입니다. 분석관련 하셔서 문의는 chsoo.lee@gmail.com 이쪽으로 주세요
폭염기간이라는데 항상 건강 유의하세요 저는 요즘 계속 어지럼에 시달리는데 대부분이 스트레스 라고 하네요 ~ 우리 모두 천천히 갑시다 빨리뛰어봤자 숨찹니다.
통계분석 과외 해드립니다.~
통계분석 2013. 8. 7. 10:25 |
2015년 5월14일에 업데이트 합니다.
많은분들은 아니어도 몇몇분들과 통계과외를 통해서 인연을 맺었습니다. 다시 볼수 있는 인연인지는 모르겠지만
짧으면 한시간 길게는 2-3일동안을 서로의 시간에 맞추어서 과외를 진행하다보니 나름 살짝의 정이드는게 사실이었습니다.
과외를 하시는분들의 대부분의 목적은 같은 값이면 내가 좀 알고 내가 분석을 돌렸으면 한다는 부분입니다.
분석의뢰를 하나 아님 과외를 몇시간 하나 비용이 비슷하다면 향후를 위해서라도 교육을 받겠다는 것입니다.
저도 사실 이러한 부분들에 흥미를 느끼는것은 사실이구요.. 비록 비용은 받지만 분석만 해서 드릴때와는 또 다른 느낌을 가지게 됩니다.
암튼요
제가 이제 제주에 조그마하게 카페와 숙박을 운영하게 됩니다. 물론 서울을 오가기는 하겠지만 제주가 이제 제 터전이 될 예정입니다. 시간만 맞으면 서울에서도 진행을 할수 있겠지만 안된다면 저희 집으로 오세요 이때는 시간만 가능하다면 재능기부 해드릴께요 ^^
항상 찾아주시고 메일주시는 분들에게 다시금 고마움 표시드리면서 통계관련하여 궁금하신 사항들은 언제든지 메일주세요
chsoo.lee@gmail.com 입니다.
---------------------------------------------------------------
2013년 8월 7일 입니다
기나긴 8월 장마도 지나고 이제 본격적인 무더위가 시작되겠네요..
이 더위가 지나면 다시 가을이 올거고..
이미 백화점에는 가을옷들이 즐비하네요..
제가 글에도 몇번 올렸지만 이리저리 통계 분석을 한지가 10년이 넘어갑니다.
통계를 도와드렸던 분들중에는 교수님으로 가서 이제 그의 제자를 도와주라고 연락오시는 분들도 계시고..
저처럼 회사로 가서 그냥 졸업장으로 사용하시는 분들도 계시네요
근데 시대가 변하나 봅니다..
이제 단순히 통계 분석만을 원하는게 아니라, 하는 방법을 배웠으면 하는 분들이 많이 계세요
사실 시간만 허락한다면 그게 가장 좋은 방법입니다.
통계라는거 사실 논문에만 쓸거 같지만 알고보면 배우고 나면 회사에서도 유용하게 쓰일수 있는 마케팅 툴입니다.
몇분들 통계분석 의뢰하면서 과외 아닌 과외를 해드렸는데, 결과가 그리 나쁜것 같지는 않습니다.
그런거겠지요.. 생선을 사먹는냐.. 아니면 낚시대를 사느냐에 관한 문제겠네요..
잡는법은 제가 가르쳐 드릴거구요..^^
나중에 본인이 배워서 분석을 하고 나면아마도 논문 한번은 더 읽어 볼거라 생각합니다.
어느것이든 좋습니다.
통계관련해서 뭐든 문의주세요 ~ chsoo.lee@gmail.com