회귀 결정계수

통계분석 2012. 4. 27. 10:06 |

통계 분석을 하다보면, 유의수준이 없는 지수들의 기준값을 얼마로 적용해야 하는지에 대해 많은 고민을 하게 됩니다.

 

그래서, 앞으로 차근히 하나씩 올려가도록 하겠습니다. (이일현 박사님 말씀)

 

회귀분석에서 많이 사용하는 결정계수의 값의 크기는 얼마 이상이어야 할까...

 

일반적으로 자연과학, 공학등에서는 70%, 사회과학에서는 30% 이상을 추천한다.

 

대표적인 학자 중의 한 분이 Cohen 에 의하면

 

                         작은 크기 : 2%

                         중간 크기 : 13%

                         큰     크기 : 35%

 

를 제시하고 있다.

따라서 설문조사 등의 사회과학 연구에서는 결정계수가 13% 이상만 되면 어느 정도의 효과가 있다라고 할 수 있다.

 

 

Cohen, J.(1988), Statistical Power Analysis for the Behavioral Sciences(2nd Ed.), Lawrence Erlbaum Associates, Inc.



:

통계 데자뷰 ~

통계분석 2012. 4. 25. 08:40 |

데자뷰 현상이라고 하지요..

 

그 언젠가 경험했던 적이 있었던것 같은 느낌이요... 오늘 아침이 정말 그렇네요.. 비오는 어느날 아침..

 

누군가에게는 당연히 비오는 어느날 아침이겠지만 오늘 저한테 묘한 느낌이 감도네요 ^^ ~~

눈오는날은 밖에서 눈을 맞으면서 걷는게 좋고, 비오는날에는 창밖에 비오는 소리를 들으면서 음악을 듣는게 너무 좋습니다. 오늘 아침 눈뜨는데 딱 그런생각이 들더군요.. 하루만 멍하니 창밖을 바라보면서 음악좀 듣고 싶다고 ~

괜히 자연현상이 비를 가지고 너스레좀 떨었네요...

 

요즘 산을 주 갑니다. 나이가 들어서 간다기보다도 사진을 찍으로 많이 가지요.. 뭐 작품촬영하는 정도는 아니고 조금한 필름카메라를 들고 이리저리 연신 셔터를 눌러댑니다. 

필름카메라를 찍으면서 느낀 한가지는 기다림입니다. 저한통을 다 찍어야 현상을 보내는데.. 빨리 볼라고 비싼 필름 한통 다 버릴수도 없고, 차근히 한장한장 생각하면서 찍게 됩니다. 이전 디카가 무조건 찍고 잘 나온거 고르자라는 방식이라면 제가 지금 사용하는 필름 카메라는 그냥 나올때 까지 기다리고 어떻게 나왔나 하는 기대감.. 그리고 사진이 나왔을때의 허무함..(아직 수준이 안되는지라 사진이 흔들리고, 빛 들어가고..ㅋㅋ) 그런 재미인것 같습니다. 또 하나의 재미가 손톱만한 렌즈창으로 보이는 것과 현상후 사진을 봤을때의 느낌을 비교보는것 그거도한 묘한 매력입니다. 찍을 때의 생각과 나중의 생각..

 

어쨋든~~ ^^ 

 


 

즘 하루하루 일주일이 참 빨리 지나갑니다. 회사에서는 녹을 먹고 있으니 회사일에 충실하고 주말 2틀 동안 계속적으로 제 개인업무를 진행하거든요.. 2009년 처음 시작해서 주말마다 시작을 한일이 어느새 부업아닌 부업이 된것 같습니다. 지난주말 급하게 통계의뢰주신 분 마무리를 해드리면서 그간 얼마나 진행을 했는지 한번 보았는데.. 생각보다 많은 작업을 해왔던것 같습니다. 학기마다 2-30분씩 하다보니 2009년 봄학기부터 2012년 봄학기 까지 7학기 째를 맞이하고 근 200여분이 의뢰를 주셨네요... ㅋ 물론 정식으로 일을 진행한것만 이정도니 상담까지 하면 더 많지 않나 싶네요..

 

일을 하면서 .. 어떤 일이든 그렇지만 좋으신 분도 있고, 난감한 분들도 계셨습니다. 물론 의뢰주시는 분들께서도 저한테 고마움을 표시를 하셨던 분들도 계신반면 많은 불평을 하시고 만족하지 못하신 분들도 계셨습니다. 그래도 저는 기본에 충실해서 일을 진행하고 있다고 나름 생각합니다. ~ 저한테 처음 통계를 맡기셨던 분들 중에는 아직까지 후배, 후배의 후배를 소개시켜주시면서 3년째 연을 맺고 계시는 분들도 계시고 그 후배의 후배님 작업을 지난주에 마무리 하였습니다.

 

지금껏 생각해보니.. 제가 글 처음에 말한 데자뷰라는거 기억이 나는거 같아요.. 아마도 블로그를 통해서 처음 통계를 받았던날이 비오는 아침이었던것 같습니다. 지난글에도 그렇게 적혀 있는것 같습니다.

 

다들 즐거운 하루 되세요 ~



:

정말로 정보화시대가 맞기는 맞습니다.. 하긴 작금의 시대에 정보화를 운운하는 자체가 이상하게 들릴지 모르지만요..

통계를 이렇게 도와드리다보니.. 논문통계 외에도 일반 통계도 문의를 주시는 분이 꽤 되시네요..

물론 모든것을 소화할수 있을만큼의 능력은 없지만 아직까지는  진행이 잘되어가네요..

어제 어떤분이 메일로  문의를 했더랍니다..

분석만 돌려주시면  해석은 본인이 하시겠다고... 그래서 저는 거꾸로 말씀을 드렸지요...

분석은 책보고 돌려보시고... 해석을 도움을 받으시라고... 같은 분석을 가지고 해석하는게 많이 달라질수 있거든요.. 수치를 잘못읽는게 아니라.. 읽어야 할수치.. 필요한 수치.. 등등을 통해서.. 시사점을 도출해야 하는데.. 그작업이 제 경험으로는  분석보다 어렵지 않나 합니다..

아래 그림을 보세요...


보시게 되면 이는 표를 읽는것입니다.. 읽는것도 정말 중요합니다.. 각각의 값이 뭘 의미하는가를 알아야 하니까요.. 하지만 그 값을 통해서  도출해낼수 있는 해석은  정말 심혈을 기울여야 합니다.

대충 분석을 통해서... 차이가 있다없다... 영향을 미친다 안미친다는 큰 의미가 없습니다..

있던 없던... 미치던 안미치던 간에.. 왜 그러한 결과가 나왔는지를 고심해봐야 하는것입니다.

통계작업은 공장작업이 아닙니다.. 적당한 가격에 뚝 맡기고.. 결과 보내주고 그런 작업이 아닙니다...

서로의 커뮤니케이션이 많아 질수록 좋은 결과가 나오는것은 당연합니다...

항상 강조하는 바입니다만... 저는 많은 분을 돕지는 못합니다... 돕는다고 하니까 무료로 도와주는것으로 오해하시는 분들도 계신데.. 합당한 금액을 저 또한 요청을 드립니다만... 정말 좋은 결과가 나올수 있도록 제 능력한에서 도와드리고 있습니다..

온라인에도 정이라는게 있습니다...  서로가 느낄수 있는 情 말입니다.....

이와 관련한 어떠한 사항이라도 문의사항 있으시면 메일주세요...   chsoo.lee@gmail.com 


:

얼마전 모 회사 에서 리서치 의뢰가 한건 들어왔습니다..

마케팅 전문 대행사 인데 이럭저럭 이야기를 해보니 예전에 저한테 논문통계를 의뢰 하셨었던 분이셨습니다.. 뭐 통계를 진행하면서 그분이 뭐를 하시는 분인지까지는 몰라도 되지만.. 간혹 이렇게 고위직(?) 분들이 계신것 같습니다.

반갑기도 하고 마음이 무겁기도 하고 그렇더군요.. 같은 통계인데 왜 너 무겁게 느껴지고 막 뭔지 모를 책임감이 넘쳐 나고... 사실.. 일반통계보다 훨씬 수월한 작업인데도 말입니다..

그렇게 큰 금액의 작업도 아니었긴 하지만 나름 많이 뿌듯했습니다.. 그쪽 회사 대표님도 만족해하셨구요..
(제 생각인가^^)


마케팅 회사에서 마케팅에 리서치는 정말 너무나 중요하다는 것 이번기회를 통해서 또 깨달았습니다. 마케팅을 머리로 나오는게 아니라 발로 나오는거라는 그 대표님의 이야기 또한 제가 이 일을 하는데 큰  이정표를  마련해주셨습니다.

배운것도 많아서 가격은 정말 저렴하게 해드렸는데.. 이게 참.. 논문하실때는 그리 깎으시더니.. 이거는 그냥 다 받으라고 챙겨주시니 참.. 이래서 세상이 살만한것 같습니다..

그러고는 소개시켜주신 몇건의 일을 더 하고 나서.. 나름 이글을 올려 봅니다..

우선.. 작은일, 큰일 관계없이 무조건 미팅을 가지도록 하겠습니다..저는 서울에 거주를 하는데, 지방이시라면 너무 장거리가 아니라면 출장미팅으로 통해서라도 가지는게 좋을듯 합니다.. 전화상이나 이메일상으로는 업무적인 커뮤니케이션에 한계가 있다는거 많이 느끼고 있습니다..

잘 아시겠지만.. 이 마케팅 통계나 리서치에 있어서 조사 설계가 명확히 이루어 지지 않으면 많은 고생을 하고도 얻고자 하는 답을 못내는 경우가 많습니다..

제가 도움이 될수 있는 1인이 되도록 하겠습니다..

어떠한내용이든 좋습니다.  자세한 문의는 우선 메일을 이용해 주세요.. 
chsoo.lee@gmail.com

비개인 목요일 오후에... 드립니다..

아래 그림은 제가 자주 애용하는 미국 마케팅 사이트 입니다..~~ 제 해당부분은 Selecting STAT 이겠지요 ~^^



:

SPSS 분석 방법

통계분석 2009. 9. 20. 17:58 |

 


더 자세한 사항은 메일로 문의 주세요.. ^^

chsoo.lee@gmail.com


:

참 제목이 우습네요.. 가끔 그렇지만 제목을 써야 할때 뭐라고 써야하난 모를때가 있습니다.. 그럴때는 글을 다 쓰고 제목을 마지막에 쓰기도 하지만 오늘은 제 등 뒤의 모습을 보고 적어보았습니다.. 아직 낮에는 따사로운 햇살 때문에 선풍기를 돌려야 하지만 잠자리 전에는 이제 창문을 닫고 자야 할정도가 되었네요..

아마도 제 메일에 논문통계 의뢰가 속속히 들어오는걸 보니.. 학기가 시작되고 교수님들의 엄포가 시작된 거 같습니다..^^ 저도 대학원시절 그랬더랍니다 .. 대학원 조교에, 연구조교까지 하면서 논문을 쓰자니 쉽지가 않았지요.. 그래도 앉아서 하던게 공부였던지라 그 덕에 통계 하나는 제 자신이 만족할 정도에 이르렀다 생각합니다..

요즘 서점을 가면 통계관련 책이 너무나도 잘 나와 있습니다.. 통계분석 뿐만 아니라, 해석에 대한 사항까지 세세하게 잘 정리를 해주신 책이 많습니다.. 그 교수님들이 제 밥줄을 끊는건 아닌가 싶은 생각도 들더군요... ^^... 그정도로 잘 되 있습니다.

그래서 저는 이번학기 들어서는 의뢰 주시는 분들한테 비용에서 2만원을 추가하여 책을 사서 드리려고 합니다.. 물론 제가 사드리는건 아닙니다만.. 그래도 조금이나만 도움이 되리라 생각이 되겠다 싶어서요... 실제로 몇분한테는 벌써 그렇게 사 드렸구요.. 그렇게 되면 나중에 제가 메일이나 전화로 설명을 드리다가 막히는 경우 책 몇페이지 펴보세요...^^ 하는식으로 설명을 드리면 이해도 빨리 되더라구요...

근데.. 가끔 사전 미팅 그리고 사후 미팅을 당연시 여기시는 분들이 계세요... ^^ 명백히 말씀 드리면 당연한건 아니에요.. 업체에서 아웃풋 보내고 따로 만나시는분 있던가요 ? 단지 저는 서로간에 이해를 빨리 하기 위해서 가급적 만나뵙는거랍니다.. 그러다보니 주말 시간도 가져야 하고 그렇습니다.. 제가 가장 아쉬운 부분은 그냥 해주기만 바라고 본인은 공부를 안하시는 부분입니다.. 아무리 졸업이 중요해도 그래도 논문에 대해서 알고 모르고의 차이는 나중에 논문 나왔을때 기분이 틀리지 않을까 합니다..

크.. 퇴근시간 한 20분 남아서요... 주저리 적어봅니다.. 이번주에 어떤분은 석사2개에 박사를 2번째 하신다는 분인데.. 통계는 처음이라고 합니다.. 그분이 저한테 이런 이야기를 해주시더라구요...

예전 초등학교 시절 까치 만화의 일화인데..

선생님이 학생들한테 숙제를 내주었다.. "다음주까지 초코파이의 성분에 대해서 알아오도록 해라"

그러자 학생들은 이리저리 연구를 하였습니다.. 먹어보고, 빻아보고, 갈아보고 등등 숙제에 여념이 없는데 까치만은 내내 놀고 있더랍니다..

친구들이 " 넌 왜 숙제를 안하니 " 라고 물어도 신경쓰지 않고 놀았답니다..

그리고 숙제를 제출하고 나서 나중에 성적을 보는데 오직 까치만이 100점을 맞았더랍니다..

이유를 물어보니.. " 네.. 저는 숙제 제출 전날 초코파이 회사에 전화를 해서 물어봤습니다" 라고 대답을 하더랍니다.


단순한 만화 내용이고... 실제 현 사회에서는 인터넷의 발달로 이러한 정보는 누구나 얻을수 있는 것일수 있습니다.. 하지만 저한테 의뢰를 주신분의 나이를 감안해 초등학교 시절이면 80년 초라고 볼수 있습니다..

그러면서 그 분이 하시는 말씀은 자기는 석사 두번 박사를 두번째 하면서 나름 전문분야가 많다... 하지만 통계분야는 내가 전문이 아니다.. 그래서 난 전문가를 찾은거고.. 그게 당신입니다.. 라는 이야기를 들었습니다..

제가 해드리는 말씀이 꽤 흡족하셨는지 모르겠지만.. 지식의 많고 적고 보다는 아는것의 최대한 전달이 되어야 하지 않을까 합니다..

그렇게 이번학기 논문통계 시작해보려고 합니다.. 자세한 사항 문의주세요
chsoo.lee@gmail.com 


:

보통 뭐가높으면 뭐도 높을것이다 라는 분석 많이 하시지요... ^^ 그때 함 참고하세요.. 네이버 지식인이네요..

1)상관분석 실시 - 과연 최종점수와 아이큐가 상관이 있는지 확인해 주기 위해서입니다.

1상관관계가 높을수록 아이큐에의해서 영향을 받는다고 볼 수 있습니다.

자~결과를 보니까 0.816이라는 양의상관관계가 일반적인 유의수준 0.05에서 유의하게 나왔습니다

(p-값 : 0.001), 따라서 아이큐에 어떤 영향을 받았다고 볼 수 도 있겠지요?

물론 상관분석 자체는 독립변수와 종속변수가 없기 때문에 원인과 결과로 해석하면 안되지만

애초에 가설을 세우실때 아이큐가 높으면 최종점수가 높을것이라고 예상하셨기 때문에 그렇게 말해

줄 수 있는 것입니다.

 

2)분산분석 실시 - 두 집단간 평균비교는 일반적으로 독립t테스트를 실시하지만

분산분석 역시 두 집단간 평균이 같은지 검정 가능 합니다.

뭐 기술통계량은 그냥 보시면 되고요.

분산분석의 경우 두 집단간 분산이 동일하다는 가정이 만족되어야 사용할 수 있습니다.

Levene 검정을 통해 확인 가능한데요, p-값이 일반적인 유의수준 0.05보다 커서

귀가설(두집단의 분산이 동일하다)를 기각 할 수 없습니다. 즉, 분산분석을 실시 할 수 있습니다.

 

그리고 이제 결과를 해석 해보면 교육방법의 p-값이 0.05보다 작아 귀무가설을 기각하여

교육방법에 따라 평균에 차이가 있음을 알 수 있습니다.

 

4)공분산분석 실시

공분산분석이란 질문자 분과 같이 집단간의 평균을 비교하는데 종속변수에

영향을 줄 것이라고 생각되는 다른 외부요인을 제거해주고 분산분석을 실시하는 것입니다.

쉽게 말해서 아이큐를 고정시켜주고 집단간의 평균을 비교해는 방식이라고 보시면 됩니다.

자 등분산성 검정까지는 같습니다.

개체간 효과 검정부분을 보시면됩니다.

공변량(아이큐)의 경우 유의한 효과를 나타내고 있지요?하지만 교육방법의 p-값을 보니 0.28로

0.05보다 커서 의미가 없다고 볼 수 있습니다. 즉 아이큐를 고정한 상태에서 교육방법에 따른 평균을

비교했더니, 차이가 없다고 나왔네요.

즉 처음에 분산분석에서 교육방법에 의해서 차이가 있다고 나왔는데, 그것을 아이큐에 의한 결과라고 볼

수 있습니다.




:

논문철이 지났음에도 꾸준히 분석을 의뢰해주시는 분들께 감사 아닌 감사를 드리고 싶습니다. 제조업 뿐만이 아니라 이 쪽에서도 구전의 효과는 그리 나쁘지 않다는것을 깨닫습니다. 그리하여 본의 아니게 일반 마케팅 분석까지 손을 대고 있습니다.

뭐 분석이야 논문 통계보다는 마케팅 통계가 더 쉬운일입니다만 분석결과를 토대로 새로운 방안이나 전략을 도출해내는점이 아마도 가장 머리를 싸매야 하는 일이 아닐까 합니다. 몇 업체 일을 같이 조인하여 해드리다 보니 어느 업체는 같이 일을 해보자는 제의도 들어오곤 합니다. 실제로 잘 몰랐던 일인데 이 통계분석을 해주시는 분들이 그렇게 많지는 않다고 합니다. 다들 업체를 통해서 진행을 하기 때문에 개인적으로 하는 경우는 드물다고 몇몇분들이 말씀을 해주십니다.

저한테 의뢰주시는 분들이 처음에는 항상 메일로 글을 주시는데 한결같이 저한테 믿음이 간다고 합니다. ^^ . 제가 이런말을 쓰니 역효과가 일어나는거 아닌가 모르겠는데요.. 저도 믿고 하는 일인지라.. 그리고 가급적이면 미팅으로 통해서 일을 진행하는게 서로가 편하거든요.. 물론 저 멀리 지방이나 더 멀리는 해외에서도 의뢰를 주시는 분들은 순전히 제 글 하나 믿고 의뢰 주신다 생각하니 이 글 하나 남기는 것도 참 쉬운일이 아닌것 같습니다.

그리고 몇몇분들은 다시 저한테 물어봅니다.. 어떤 일을 하고 있냐고~ ^^ 저 외식 컨설팅을 하고 있는 사람입니다. 나이는 그냥 바탕화면에 있는 사진 보시고 유추하시구요~ 보신분들은 아시겠지만.. 서글서글 합니다 .. 숫자가지고 노는걸 좋아하다 보니 첫 직장이었던 회사부터 영업기획을 시작으로 하여 전략기획, 사업기획등 기획에 관련된 일은 많이 한것 같습니다. 오죽하면 마케팅 부서에서 비용절감한다고 통계분석 저한테 부탁한적도 있었습니다... 다행히도 당시 제 팀장님이 마케팅한테 돈 받고 하라고 하여.. 살짝 ^^ 긴장감이 돌았던 적도 있었지요..

지금은 무모한 일인지 몰라도 저와 지인 몇명이서 컨설팅 회사를 하나 운영하고 있답니다. 배운게 도둑질이라.. (다들 그렇지만요) 다양한 외식 카테고리 중에서 전 또 사업기획 부분을 맡고 있습니다. 회사 잘 다니는 친구들이고 선배들이고 가끔 한번씩 물어봅니다. 나 자리하나 주면 안되겠느냐고요.. ^^.. 글쎄요... 전 나름대로는 행복합니다.. 일전에도 한번 말씀 드렸지만 매달 찍히던 월급통장에 숫자가 이제 간헐적으로 찍힌다는거 하나 빼면 말입니다.

오랜만에 제 주특기 나온거 같습니다.. 말 하다가 삼천포 빠지는게 제 주특기 거든요.. 그냥 저에 대해선 궁금해 하시는 약간명의 분들을 위해서 저를 한번 그려보려고 했는데.. ^^ .. 잘 그렸나 모르겠습니다. 한번은 어떤 의뢰인의 지도교수님한테 전화가 왔더랍니다. 당황스러웠는데 자기 제자가 너무 몰라서 그러니 가서 공부좀 시켜달라고 해서.. 2시간인가 앉아서 분석결과 공부 시켜드린적도 있습니다. 교수님 체면에 전화걸기가 쉽지 않으셨을텐데 제자를 사랑하시는 마음인지 답답한 마음이셨는지...

하여간 이런일 저런일 많이 생깁니다. 그리고 길게는 아니어도 자주 제 근황을 올립니다. 오늘 같이 시간이 되는날에는 좀 오래동안 자판을 두드리지만 그렇지 않을때에는 일기식으로라도 쓰곤 합니다.

궁금하신 사항은 언제든지 글 남겨주세요... 메일로도 남겨주시구여...

제 블로그 이름으로 메일주소 하나 만들었습니다.

가급적 chsoo.lee@gmail.com 으로 보내주시구요...  블로그 메일은 gofood@live.co.kr 입니다.

비가 한바탕 내리더니 다시 그쳤네여.. 아마도 퇴근시간에 비올것 같습니다... 우산 준비하세요~~


:

잘 안되시면 여기가보세요~

http://people.ku.edu/~preacher/sobel/sobel.htm

Calculation for the Sobel Test

An interactive calculation tool for mediation tests

Kristopher J. Preacher
University of Kansas
Geoffrey J. Leonardelli
University of Toronto

UPDATE: The Sobel test works well only in large samples. We recommend using this test only if the user has no access to raw data. If you have the raw data, bootstrapping offers a much better alternative that imposes no distributional assumptions. Consult Preacher and Hayes (2004, 2008) for details and easy-to-use macros that run the necessary regression analyses for you:

Preacher, K. J., & Hayes, A. F. (2008). Asymptotic and resampling strategies for assessing and comparing indirect effects in multiple mediator models. Behavior Research Methods, 40, 879-891.

Preacher, K. J., & Hayes, A. F. (2004). SPSS and SAS procedures for estimating indirect effects in simple mediation models. Behavior Research Methods, Instruments, & Computers, 36(4), 717-731.

SEE ALSO:
   
   
   

Mediation effects
A variable may be considered a mediator to the extent to which it carries the influence of a given independent variable (IV) to a given dependent variable (DV). Generally speaking, mediation can be said to occur when (1) the IV significantly affects the mediator, (2) the IV significantly affects the DV in the absence of the mediator, (3) the mediator has a significant unique effect on the DV, and (4) the effect of the IV on the DV shrinks upon the addition of the mediator to the model. These criteria can be used to informally judge whether or not mediation is occurring, but MacKinnon & Dwyer (1993) and MacKinnon, Warsi, & Dwyer (1995) have popularized statistically based methods by which mediation may be formally assessed.

Purpose of Sobel test
To test whether a mediator carries the influence of an IV to a DV.

A friendly warning
Blind use of this application without a proper understanding of mediation or the logic behind these tests will lead to erroneous conclusions. Please consult the references before proceeding.

An illustration of mediation
a, b, and c' are path coefficients. Values in parentheses are standard errors of those path coefficients.

Description of numbers needed
a = raw (unstandardized) regression coefficient for the association between IV and mediator.
sa = standard error of a.
b = raw coefficient for the association between the mediator and the DV (when the IV is also a predictor of the DV).
sb = standard error of b.

To get numbers

  1. Run a regression analysis with the IV predicting the mediator. This will give a and sa.
  2. Run a regression analysis with the IV and mediator predicting the DV. This will give b and sb. Note that sa and sb should never be negative.

To conduct the Sobel test
Details can be found in Baron and Kenny (1986), Sobel (1982), Goodman (1960), and MacKinnon, Warsi, and Dwyer (1995). Insert the a, b, sa, and sb into the cells below and this program will calculate the critical ratio as a test of whether the indirect effect of the IV on the DV via the mediator is significantly different from zero.

Input:
Test statistic:
p-value:
a
Sobel test:
b
Aroian test:
sa
Goodman test:
sb

Alternatively, you can insert ta and tb into the cells below, where ta and tb are the t-test statistics for the difference between the a and b coefficients and zero. Results should be identical to the first test, except for error due to rounding.

Input:
Test statistic:
p-value:
ta
Sobel test:
tb
Aroian test:
Goodman test:

The reported p-values (rounded to 8 decimal places) are drawn from the unit normal distribution under the assumption of a two-tailed z-test of the hypothesis that the mediated effect equals zero in the population. +/- 1.96 are the critical values of the test ratio which contain the central 95% of the unit normal distribution.

We should note that there are three principal versions of the "Sobel test" - one that adds the third denominator term (Aroian, 1944/1947 - this is the version popularized by Baron & Kenny as the Sobel test), one that subtracts it (Goodman, 1960), and one that does not include it at all. We stress that researchers should consult MacKinnon, Lockwood, Hoffman, West, and Sheets (2002), as well as sources cited therein, before attempting to interpret the results of any of these tests. Researchers should consult Krull & MacKinnon (1999) before attempting to apply the Sobel test to parameter estimates obtained from multilevel modeling.

Formulae for the tests provided here were drawn from MacKinnon & Dwyer (1994) and from MacKinnon, Warsi, & Dwyer (1995):

Sobel test equation
z-value = a*b/SQRT(b2*sa2 + a2*sb2)

Aroian test equation
z-value = a*b/SQRT(b2*sa2 + a2*sb2 + sa2*sb2)

Goodman test equation
z-value = a*b/SQRT(b2*sa2 + a2*sb2 - sa2*sb2)

The Sobel test equation omits the third term of the variance estimate in the denominator. We recommend using the Aroian version of the Sobel test suggested in Baron and Kenny (1986) because it does not make the unnecessary assumption that the product of sa and sb is vanishingly small. The Goodman version of the test subtracts the third term for an unbiased estimate of the variance of the mediated effect, but this can sometimes have the unfortunate effect of yielding a negative variance estimate.

The Sobel test and the Aroian test seemed to perform best in a Monte Carlo study (MacKinnon, Warsi, & Dwyer, 1995), and converge closely with sample sizes greater than 50 or so.

References

Aroian, L. A. (1944/1947). The probability function of the product of two normally distributed variables. Annals of Mathematical Statistics, 18, 265-271.

Baron, R. M., & Kenny, D. A. (1986). The moderator-mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of Personality and Social Psychology, 51, 1173-1182.

Goodman, L. A. (1960). On the exact variance of products. Journal of the American Statistical Association, 55, 708-713.

Hoyle, R. H., & Kenny, D. A. (1999). Sample size, reliability, and tests of statistical mediation. In R. Hoyle (Ed.) Statistical Strategies for Small Sample Research. Thousand Oaks, CA: Sage Publications.

Krull, J. L., & MacKinnon, D. P. (1999). Multilevel mediation modeling in group-based intervention studies. Evaluation Review, 23(4), 418-444.

MacKinnon, D. P., & Dwyer, J. H. (1993). Estimating mediated effects in prevention studies. Evaluation Review, 17, 144-158.

MacKinnon, D. P., Lockwood, C. M., Hoffman, J. M., West, S. G., & Sheets, V. (2002). A comparison of methods to test mediation and other intervening variable effects. Psychological Methods, 7, 83-104.

MacKinnon, D. P., Warsi, G., & Dwyer, J. H. (1995). A simulation study of mediated effect measures. Multivariate Behavioral Research, 30(1), 41-62.

MacKinnon, D. P., Warsi, G., & Dwyer, J. H. (1995). "A simulation study of mediated effect measures:" Erratum. Multivariate Behavioral Research, 30(3), ii.

Preacher, K. J., & Hayes, A. F. (2004). SPSS and SAS procedures for estimating indirect effects in simple mediation models. Behavior Research Methods, Instruments, & Computers, 36(4), 717-731.

Shrout, P. E., & Bolger, N. (2002). Mediation in experimental and nonexperimental studies: New procedures and recommendations. Psychological Methods, 7(4), 422-445.

Sobel, M. E. (1982). Asymptotic intervals for indirect effects in structural equations models. In S. Leinhart (Ed.), Sociological methodology 1982 (pp.290-312). San Francisco: Jossey-Bass.


Acknowledgments

We wish to thank David MacKinnon and David Kenny for advice which made this interactive web page possible. Comments and criticisms are welcome.

Originally posted March, 2001. All material on these pages not otherwise credited is ©2003 by Kristopher J. Preacher. This page was last updated on 8/10/06. This page was optimized to work best with Internet Explorer.

Return to quantpsy.org


Free JavaScripts provided
by The JavaScript Source
and John C. Pezzullo.
 




:

변량분석

통계분석 2009. 6. 2. 15:31 |


밖에 비가 엄청나게 오네요.... 헉... 지금 변량 분석 하다가 자료 올려 봅니다요... (오늘은 6월2일이랍니다... 2009년)

1. 일변량 분석(univariate analysis)

 한개의 변수를 가지고 분석.

 변수의 평균, 표준편차, 분산 등의 대표값 혹은 자료가 어떤 분포를 나타내는지(막대, 선그래프, 산포도)등의 기술하는 것.

 

2. 이변량 분석(bivariate analysis)

 두 변수 사이의 연관성에 대한 분석.

 하나의 변수가 다른 변수에는 어떠한 영향을 주고 있는지? 그러한 관계의 크기와 방향은 어떤지 분석.

 t-test, paired t-test, correlation, 교차분석(cross tabulation), 일원 분산 분석(one way ANOVA), 두변수 사이의 단순 회귀분석(simple linear regression)

 

3. 다변량 분석(multivariate analysis)

세개 이상의 변수를 사이의 관계에 대한 설명하기 위한 분석.

여러개의 결과 변수를 예측하는 것을 의미.

Tip. 다변량 분석(multivariate analysis)은 다변수분석(multivariable analysis)와 같은의미로 혼용.

But.....

다변수분석(multivariable analysis)는 한개의 결과 변수를 예측하는 것을 의미.

--> 다중회귀분석(multiple linear regression), 다중 로지스틱 회귀분석(multiple logistic regression analysis), 비례위험모형(proportional hazards model)




: