정리를 잘 해놓으신분이 계셔서 좀 퍼왔습니다. ~ 제일밑에 출처 있습니다. 가서 보셔도 될듯이요 ~



1. 개념신뢰성과 AVE를 구하기 위한 선행계산

 

AMOS 출력물에서 표준화람다 값으로

표준화람다의 합의 제곱

표준화람다제곱의 합

측정오차분산의 합

출력물에는 표준화 람다값만 제시됨

 

 

2. 위의 결과물에서 요인 A 의 예시 

 

1) 표준화람다의 합의 제곱

결과물의  각 관측변수의 표준화람다 값을 모두 더한값 2.286 이고

이를 제곱한 값  5.226 


2) 표준화 람다의 제곱의 합

각관측변수의 표준화람다 값을 제곱한 것

첫 번째 관측변수 0.663 제곱하면 0.440 이 계산되어지고

각각의 관측변수 제곱한 값을 다 더하면 1.757


3) 측정오차

1 에서 표준화람다 제곱한 값을 뺀것으로

첫 번째 표준화람다 제곱한 값은 0.440  이고

1 에서 빼면 0.560 입니다.

각각의 계산된 값을 더하면 1.243 입니다.

 

 

4. 요인 A 를 공식에 넣어 계산

 

1) 개념신뢰성 공식

 


 

 

 

2) AVE 공식  




 

 

5.  요인 A 의 결과

 

개념신뢰성은 


 

AVE 는 





:

날씨가 추웠다 따뜻했다. 옷 맞추어 입기가 힘드네요. 


코트를 들고 나가려니 오바고, 얇은옷은 추울것 같고.. 에이 그냥 참아버리자.. 라는 심상으로 감기가 걸린듯 합니다. ^^


아마 대부분 이시점에 논문심사 1차정도 되는것 같습니다. 


내내 손놓고 계시다가 급하게 번갯불에 콩 볶아 드시듯이 진행하시는분도 계시고, 본인이 책을 감싸안고 노력하시다가 안되서 메일 주시는 분도 계시네요. 간혹은 잠수부를 만나셔서 다시 통째로 연락주시는 분도 계시구요


저는 블로그 마케팅도 모르고, 네이버 앞에 어떻게 나와야 하는지도 잘 모릅니다. 그저 아는거라고는 태그를 써서 글 쓴다는거, 그거 하나네요. 간혹 저도 논문통계라고 치고 들어가보면 많은 분들이 진행을 하고 계시고, 이것도 규모의 경제인지 열심히 활동하시는 몇분들의 글이 몇페이지까지 올라와 있네요. 


블로그로 통계를 시작한지가 5년째 되어가는데 그때보다는 확실히 많이 늘어난게 사실입니다. 그러다 보니 의뢰주시는분들도 당연히 가성비라고 해야하나요..ㅋ 가격대비 질이 높은것으로 찾아다니시는것 같습니다. 


사실 통계 돌리시는분들 다 아시겠지만 데이터만 똑같다면 그 누가 돌린들 다른값이 나오겠습니까~ 다 같은 값 나오는거지요. 단지 거기서 어떤 해석을 하느냐가 아마 조금씩 상이하지 않을까 합니다. 그러나 설계는 다르다고 봅니다. 분석이야 똑같겠지만 분석에 대한 설계는 어떻게 잡느냐에 따라서 전체값에 큰 영향을 미치게 됩니다. 


이 연구는 A분석을 통해서 B값을 산출해 내야하는데 B분석을 통해서 A값을 산출해 낸다면 난감하겠지요.


운이 좋으면 의뢰주시는 분도, 심사하는 교수님도 이 값이 맞는 값인지 틀린값인지 모른채 논문이 퍼블리쉬 될수도 있습니다. 근데 거의 인생의 한번의 학위인데 남이 봤을때 챙피한 논문을 만드는건 아니라고 봅니다. 


그래서 항상 저는 메일 주시는 분들께 강조합니다. 비용만을 생각하신다면 저보다는 다른 많은 분들이 저렴하게 진행하고 계시니 찾아보셔도 될겁니다. 저보다 더 잘해드리고 더 저렴한 가격을 받으시는 분들도 분명 있을겁니다. 하지만 세상에 공짜는 쉽지가 않더라구요. 저도 물건 하나 살때 꼭 이리저리 비교해보고 가장 저렴한것을 사곤 했는데. 그게 항상 좋은 결과를 내놓지는 않더군요. 


나름 지식산업구매와 제품구매와의 비교가 어색할지는 모르지만 모든것에는 다 이유가 있는것 같습니다. 


오늘 만난분이 조절회귀를 설계 하신분인데, 분석하신 분이 매개회귀결과를 보내놓고 조절회귀라고 내용을 써서 보내셨더라구요. 더군다나 만난분은 그걸 조절회귀로 알고 저한테 설명을 해달라 하시더군요. 여기서 만난분이 누군지 당연히 밝히지도 않았을뿐더러 그분을 험담하는것도 아닙니다. 그분에게 글로 써서 다른분들에게 도움이 되도 되겠냐는 허락까지 받고 올리는 글입니다. 


처음서부터 차근차근 설명해드리니 제말에 대한 이해보다는 본인 스스로가 한심스럽다며 자책을 많이 하시더라구요.


통계를 맡기는건 몰라서 맡기는 겁니다. 그러니 누구한테 맡기시더라도 알수있게 해석을 아님 설명을 꼭 해달라 하세요. 작은비용 들이는 거 아닌만큼 원하는 결과 나와야지요.


잠자기전에 일기쓰다가 주저리 했네요. 궁금하신 사항 언제든 메일주세요  chsoo.lee@gmail.com





:

우리가 항상 기초가 중요하다고 합니다. 통계도 마찬가지입니다. 기초를 등한시 한채 바로 통계분석 책을 보고 분석만 돌린다면 내가 지금 무슨 분석을 돌리고 있는건지 맞는건지 모르게 됩니다.

 

왜냐하면 분석도구는 어떠한 숫자를 집어넣도 답을 뱉어내게 되어 있습니다. 왜냐하면 컴퓨터니까 말이죠

 

변수와 척도가 어떤가에 따라서 분석이 되어질 방법이 달라집니다.

 

만일 성별에 따라서 양적변수인  만족도가 다를것이다 라는 분석을 하기 위해서 카이검정을 할까요 ? 아니면 t검정을 할까요 ?

 

무슨 숫자를 집어넣어도 답은 나옵니다.

 

그 답이 무슨 답인지는 모르겠지만 말입니다.

 

 

본론으로 들어갈게요..

 

카이검정은 두가지 이상의 질적변수를 분석하는 방법입니다. 예를들자면 성별에 따른 통일 찬반여부라던지 연령별에 따른 찬반여부 등을  예로 들수가 있겠네요.

 

카이검정하고 교차분석하고 많이 헷갈리시는 분들 계신데요. 교차분석을 하고나서 모집단의 상관관계를 검정하는것이 카이검정입니다.

 

여기서 가장 중요한것인 우리가 쉽게 넘어가는 획득도수와 기대도수입니다. 획득도수와 기대도수가 5보다 작은 셀이 전체의 20%이하여야 합니다. 또한 각 칸에 떨어져 있는 도수는 독립적이어야 하지 그렇지 않으면 카이거정을 적용할수 없습니다.

 

이를 무시한채 진행되는 연구들이 많이 있으며 이는 주의를 요할필요가 있습니다.

 

 

카이검정을 하는 방법은 간단합니다.

 

기술통계량 - 교차분석 - 행열지정을 하면 됩니다.

 

통계량에서는 카이제곱과 파이 및 크램 값을 체크해주시고

 

셀 상자에서는 원하는 유형으로 클릭을 해주세요 일반적으로 관측빈도, 퍼센트는 열을 사용합니다.

 

그리고 확인을 누르면 쭈르르르르르륵  나오겠지요

 

그걸 가지고 결과를 보시면 되겠네요

 

문의사항은 chsoo.lee@gmail.com 입니다



:

뭐든지 그런것 같습니다. 처음 시작할때는 쉬운것 같다가 하면 할수록 복잡해지고 난해해지고 ..

 

통계가 그런것 같습니다. 단순 빈도를 통해서 그래프만 나와도 재미난적이 있었는데 이제는 그렇게 싫어했던 수학용어가 복잡하게 얽힌 분석을 하고 있으니 말입니다.

 

이번에는 공분산분석을 살짝쿵 알아보고 가겠습니다.

 

공분산분석은 매개변수가 연속변수일때 이의 영향을 통계적인 방법으로 통제하여 독립변수의 효과를 검정하는 것으로서

 

회귀분석 + 분산분석 이라고 보시면 되겠습니다.

 

예를들어 교육학 에서 많이 사용하는 사전 사후 검정에 있어서 사전에 공부를 잘했던 아이들은 사후에도 점수가 높을것입니다. 반면에 사전에 공부를 못했던 아이들은 당연히 사후에도 점수가 낮겠지요. 이는 만일 처치효과 즉, 어떠한 방법을 가하였다고 하여도 그 효과로 인해서가 아니라 원래 잘했던 아이들은 잘하고 못했던 아이들은 못하게 나오는것입니다.

 

따라서 집단별 사전능력이 다르기 때문에 공분산분석에서는 사전점수 즉 집단의 사전능력의 평균이 동일해지도록  회귀식을 이용하여 교정점수를 계산합니다.

 

분석방법은 전과 마찬가지로 분석-일반선형모형-일변량 으로 들어갑니다.

 

여기서 사후점수가 종속변수가 될것이며, 공변량은 매개변수인 사전점수를 넣습니다. 그리고 모수요인에 처치방법을 넣게 됩니다.

 

전과 달리 이번 분석에서는 모형을 제1유형으로 바꿔주셔야 하는데 공변량을 주효과 전에 입력학 결과를 얻기 위해서 제1유형의 제곱합을 선택합니다.

 

옵션에서 처치법을 평균출력기준으로 넣어주시고 확인을 누르시면 쭈르르르륵 결과가 나옵니다.

 

결과에서 주요히 볼 내용은 사전능력이 사후점수에 유의한 영향을 미치는가를 보고 사전점수가 사후점수에 미치는 영향을 통제한 후의 사후점수값을 확인함으로서 처치법에 따른 차이가 있는지를 확인 합니다.

 

문의는 언제든지 chsoo.lee@gmail.com 입니다.

 

 

 

 



:

아래글이라 해야하는지 윗글이라 해야하는지 ^^ 모르겠지만 하여간 전글에서 반복설계를 이해하셨다면..

 

여기서 좀더 분할을 할수 있겠습니다. 말이 어렵지만.. (우리나라 말 정말 어려움)..

 

쉽게 말해서 전글에서 골프채의 선호도를 분석했다고 하면 골프채의 선호도가 성별에 따라서는 어떻게 다를까 라는 의문이 들수도 있겠지요..

 

그럴때 사용하는 것인 분할 구획 요인설계 입니다.

 

분할구획요인설계는 독립변수 중 구획변수가 하나 이상 포함되어 있는 반복설계의 일종입니다. (성태제 교수님).

 

이를 위한 분석은 전에 언급한 반복측정 분석을 통해서 합니다. 단지 개체간 요인에 성별을 집어넣어서(?) 분석을 하게 됩니다.

 

옵션에서 기술통계랑과 동질성 검정을 선택하시면 되고.. 확인을 누르시면 쭈르르르륵 결과가 나옵니다.

 

이러한 분할구획 요인설계는 농학분야에서 시작되었으면 현재 마케팅 방면에서 다양하게 활용되고 있습니다.

 

문의는 언제든지 chsoo.lee@gmail.com 입니다.

 

 



:

위의 글에도 언급하였지만 의학 및 약학 분야등에서 또 많이 쓰는 연구 중의 하나가 바로 반복설계이다

 

몸이라는 것이 약한번 먹는다고 낳는게 아니니 반복적으로 처치를 하면서 상황을 보고 이를 통계적으로 검증한다고 해야 할까요 ?

 

물론 이러한 연구방법은 체육분야에서도 많이 사용되고 있습니다.

 

그렇다면 마케팅 방면에서는 어떻게 적용할수 있을까요 ?

 

요즘 한참 골프가 인기를 끌고 있죠 ? 음.. 스크린 골프는 나날이 대박을 이어가고.. 상장도 하고.. 아 좋겠네요..

 

그와 더불어 골프용품의 인기도 날로 늘어가네요..

 

근데 우리가 항상 하는 탓이있죠... 골프가 안 맞으면 채가 안좋아서.. 코스가 안좋아서..

 

그래서 어느정도 실력이 균일한 골프애호가를 대상으로 신제품, 기존제품. 타사제품의 골프클럽은 한달간격으로 시타해보도록 하고 선호도를 측정해봅니다..

 

세가지 클럽에 대해 애호가의 선호도에 차이가 있는지를요..

 

그러기 위해서는 반복측정분산분석을 진행해야 합니다.

 

개체내 요인이름을 지정하고 수준의수는 3가지 이니까 3을 넣으시고 ~

 

개체내 변수에 반복측정된 종속변수를 넣습니다.

 

다변량 검정결과에서는 대부분 윌크스 람다 값을 사용합니다. ~

 

자세한 스크린샷이 없어서 이해하시기가 힘들수도 있겠네요.. 

 

비가 내릴려고 하나봅이다. 날씨가 꾸물꾸물...  그래도 힘찬 화요일 됩시다

 

 

 

 



:

의학통계 관련하여

통계분석 2013. 10. 14. 13:53 |

어떤 통계보다 단순하면서 사실상 가장 값에 대하여 강력한 책임을 지게하는 것이 의학통계가 아닌가 합니다.

 

사실상 가장 많이 의뢰 들어오는 통계가 처치전, 처치후의 검증 통계가 대부분입니다.

 

혈압약의 투여 효과를 검증하기 위하여 ~

 

당뇨약의 효과를 검증하기 위하여 ~

 

이런경우도 있습니다.

 

우리나라의 위암 발병율 및 발견율이 세계수준과는 어떠한가의 분석도 나올수가 있겠습니다..

 

위의종류의 의학통계는 t 검정을 통하여 이루어 집니다.

 

(물론 더 복잡한 경우 다른 분석방법으로 넘어가기도 합니다만 대부분의 의뢰가 t검정이라는 것을 알려드립니다 )

 

chsoo.lee@gmail.com (문의사항)



:

통계분석결과에 대한 질문중에서 가장 흔한 질문중의 하나가 유의수준에 대한것입니다.

 

유의수준이라는 것은 연구자가 지정을 할수 있는것을 말하며, 만일 .05로 잡았을경우 이것이 의미하는 것은 영가설이 진인 표집분포 아래에서 100번 중 5번 이하의 사건이 일어나면 그 사건이 일어날 확률이 극히 낮아 영가설이 아닌 진이 아니라고 판단한 확률을 말합니다. (성태제 교수님)

 

즉, 만일 고객만족도가 재방문에 영향을 미칠것이다 라는 대립가설에 유의수준 0.01342~ 이 나왔다면 우리는 유의수준 p<.05에서 유의한 영향력을 나타냈다고 합니다. 이는 고객만족도가 재방문에 영향을 미칠 영향이 100번중 99번 이상이라고 본다는 말입니다.

 

자료분석결과에 따라 유의수준을 변경하거나 유의수준을 %로 나타내는 경우는 잘못된것입니다. 특히, 통계 프로그램에 의하여 계산된 p값을 그대로 유의수준으로 옮겨 적는것 또한 유의수준을 이해하지 못하고 있는 것입니다.

 

p값이란 그와 같은 통계값이 나올 확률을 의미하는 것이지 어떤 허용하는 판단의 실수 범위를 말하는 것은 아닙니다.

 

chsoo.lee@gmail.com  (문의사항)



:

도대체 이 열대야는 언제쯤 지나가려나 모르겠습니다.


그러다보니 또 어딘가의 책에서 읽었던 책 한구절이 생각나네요


"이 또한 지나가리라"


이른 8월인데 벌써부터 논문통계 시작하시는 분들이 꽤 되시네요. 물론 가장 많이 궁금해 하시는게 비용이시구요.


저도 오늘 인터넷으로 논문통계라는것을 검색해봤는데 정말 많은 글들이 올라와 있네요..


정찰제부터 시작해서, 최저가 등등.. 이 지식산업에 뭔가 씁쓸함을 느끼는 단어들이네요..


그러다보니 메일을 주셔서 아무것도 묻지않고 통계 얼마에요 ? 여쭙는 분들이 많으세요..


다른 분들은 그럴경우 대답을 해주시는것 같은데.. 저는 대답을 못합니다.


아니 웬만한 분들은 대답 못할거라 생각해요..


통계분석이라는것이 굉장히 다양한 분석방법을 가지고 있기에 어떠한 방법을 쓰는가에 따라서 비용이 달라지는 점은 제가 많은 강조를 했었지요.. (물론 석사통계에 쓰는 방법들이 내내 비슷하지만요)


그리고 이 통계분석이라는게 그냥 넘어가는게 아니라 심사를 거쳐야 하고 수정을 해야 하고..


때애 따라서는 아예 전체를 날릴수도 있는 사항입니다..


따라서 저한테 의뢰를 하지 않으시더라도 가격이 우선되어서는 안됩니다.. 


분석 아웃풋과 후기등을 잘 살펴보시고 진행하셔야 합니다.


http://gofood.tistory.com/148


통계관련해서 어떤 사항이든 문의주세요 chsoo.lee@gmail.com  



:

정말 타는듯한 그리고 찌는듯한 오후 입니다.

 

점심을 먹으면서도 이게 어디로 넘어가는지 모르겠고, 먹고나서도 소화가 안되는거 같고, 하여간 기력이 떨어지는 요즘입니다.

 

금일 통계분석을 요청하신 분이 메일로 질문을 하시더군요

 

" 통계관련 일을 아직도 하시는지요 ? 글 올린지가 너무 오래되어서 안하시는거 아닌지 궁금합니다 "

 

라고 문의를 주셨더라구요..

 

우선 대답부터 해드려야지요.. 아직도 하고 있고 계속 할 예정입니다. ~

 

그러고 나서 통계분석을 처음 시작한게 언제인지 한번 되돌아 봤습니다.

 

2001년 대학원시절 통계관련 수업에 타학교 특강, 통계전문가 특강, 플러스 독학을 통해서 통계분석을 시작한게 처음이네요. 당시 대학원 선배들이 거의 저한테 통계를 맡기다 시피 했고, 선배들이라서 비용을 안받고 대신에 술로 얻어 마신게 아마 인생 전체 마신술의 반은 되지 않을까 합니다.

 

물론 일부 기업체 선배들은 술과함께 거하게 용돈도 주신기억이 납니다. 많이 주셨던 분은 당신 등록금의 반값까지도 주신분이 계시고 아직도 연락을 하고 계시는 사장님이 계십니다.

 

그렇게 졸업을 하고 오프라인으로, 선배들의 소개로 통계분석을 해달라는 요청이 드문드문 있더라구요. 회사를 다니면서 투잡을 한다는게 그리 쉽지만은 않더라구요. 그래도 요청이 들어오면 무조건 받았지요. 주말에 좀 안쉬고, 밤에 잠좀 안자고 그렇게 진행을 해왔네요.

 

잠시 회사를 사직하고 미국으로 유학중에도 이 일은 끊임없이 진행이 되더라구요. 소개받은 사람이 후배를 소개시키고 그 후배가 또 후배를 소개해주고, 그러다보니 사실 지금은 한참 후배격인 분들의 통계도 해주고 있습니다. ~

 

오프라인으로 분석을 진해하면서 2009년에 블로그를 개설을 하면서 통계관련한 업무나 일, 에피소드등을 올리게 되었네요. 물론 "저 통계분석합니다 자주 애용해주세요" 라는 홍보성 글도 남겼구요 ~

 

근데 생각외로 많은 분들이 연락을 주시더라구요. 많이 몰릴때는 정말 많이 몰릴때도 있습니다. 근데 제가 항상 강조하는 사항인데 돈에 욕심이 생겨서 여러가지 일을 받다보면 결국은 질이 떨어지기 마련입니다. 제가 직원을 두고 하는것도 아니고 회사 퇴근후 혹은 주말에 제 시간을 할애하는것이라 능력 이외의 일은 절대 받지를 않습니다. 더군다가 온라인이 얼마나 무서운 존재 입니까 ~ 까닥 잘못하면 제 블로그에 수많은 악플을 남기지 않겠습니까 ~ ^^ 그렇게 관리를 한 결과인지 아직까지 악플은 달리지 않고 있네요. 물론 진행중에 의뢰주신분과 커뮤니케이션이 안맞았던 경우에는 최대한 서로간에 해결을 하고 있답니다.

 

사람과 사람이 하는일이다 보니 서로간에 맘에 안맞는 경우도 있을것이고, 또 서로간에 기분좋게 마무리를 하는 경우도 있습니다. 지난 4년간 온라인에서 만나뵈었던 분의 반정도는 외부미팅도 가졌습니다. 신뢰에 있어서 가장 큰 자산이 제 얼굴이 아닐까 하는 생각이었거든요. 물론 지방에 계시거나 해외에 계신분들은 어찌 미팅을 할 방법이 없고, 또 제 본업이 회사가 바쁜경우에는 또한 시간을 낼수가 없는 경우도 많았습니다.

 

이 통계업무를 제가 부업이라고 생각하면서 진행하는 것은 맞습니다. 따라서 비용을 받고, 비용도 그렇게 싸지는 않다고 합니다. 그래도 다른 저렴한곳에서 한번씩 고생을 하셨던분들은 너무 저렴한것만 찾은게 잘못이었다고 판단을 하기도 합니다.

 

가급적 의뢰주신분의 상황을 보다듬으려고 합니다. 회사를 다니면서, 가사를 동반하면서, 통계에 대한 지식의 부족으로 등등 다양한 이유에서 분석을 의뢰하십니다.

 

어떤 연유에서건 간에 분석 의뢰 주신 사항 잘 살펴드리도록 하겠습니다.

 

이 블로그 초창기에 말씀드린것 같은데 이 업무는 1분이라도 제 도움이 필요하다면 계속 진행이 될것입니다.   분석관련 하셔서 문의는 chsoo.lee@gmail.com 이쪽으로 주세요

 

폭염기간이라는데 항상 건강 유의하세요 저는 요즘 계속 어지럼에 시달리는데 대부분이 스트레스 라고 하네요 ~ 우리 모두 천천히 갑시다 빨리뛰어봤자 숨찹니다.

 

 

 



: