'논문통계' 태그의 글 목록 (7 Page)

« 2025/01 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

분산분석 ANOVA 하는 방법

통계분석 2009. 10. 5. 16:57 |

요즘들어 spss 분석방법 문의하시는 분들이 많아서요... 밥벌이가 안좋네요...^^ 그래도 본인이 하시는게 가장 좋은 방법입니다..

참고하시고 문의사항 있으시면 메일주세요 chsoo.lee@gmail.com 입니다.

저작자표시

:

SPSS 분석 방법

통계분석 2009. 9. 20. 17:58 |

더 자세한 사항은 메일로 문의 주세요.. ^^

chsoo.lee@gmail.com

저작자표시

:

통계학 기초 개념

통계분석 2009. 9. 20. 17:43 |

데이터 (data)

어떤 형태에 의하여 정보를 모아놓은 것

○ 모집단

파악하고자 하는 전체

○ 표본

전체를 파악하기 위하여 추출한 일부분

○ 케이스 (=개체, 관찰개체, 사례)

관찰하고자 하는 대상 하나하나

○ 분석단위

분석의 대상이 되는 단위

(ex) 남편, 부인, 아이를 대상으로 가족중 찬성하는 비율조사라면

남편, 부인, 아이는 각각의 케이스가 되며 가족은 분석단위가 됨

○ 변수

“명목변수→서열변수→등간변수→비율변수” 로 갈수록 데이터가 자세함

① 측정 수준에 의한 분류

- 명목변수 : 특성의 구분만 가능 (혈액형, 주소, 이름)

- 서열변수 : 대상의 우열이나 크고 작음 존재 (초등,중등,고등,대학)

- 등간변수 : 우열 존재, 숫자간 차이가 일정한 의미도 존재 (온도)

- 비율변수 : 변수간 우열의 비교, 차이, 비율의 의미가 존재

(체중 20kg은 10kg보다 두배의 의미와 비율을 갖음)

② 측정 방법에 의한 분류

- 질적변수 : 명목변수

- 양적변수 : 서열변수, 등간변수, 비율변수

③ 연속성 여부에 의한 분류

- 연속형변수

- 이산형변수

④ 부호화된 값의 형태에 따른 분류

- 숫자변수

- 문자변수

- 날짜변수

○ 코드북

원자료를 coding 하기 위하여 매칭되는 값을 기록한 기준 메뉴얼

○ 부호화 (coding)

각 변수의 값을 입력하기 쉽게 숫자 또는 기호로 표시하여 코딩용지에 입력

○ 전산화

부호화된 자료를 컴퓨터에 입력하는 것

저작자표시

:

참 제목이 우습네요.. 가끔 그렇지만 제목을 써야 할때 뭐라고 써야하난 모를때가 있습니다.. 그럴때는 글을 다 쓰고 제목을 마지막에 쓰기도 하지만 오늘은 제 등 뒤의 모습을 보고 적어보았습니다.. 아직 낮에는 따사로운 햇살 때문에 선풍기를 돌려야 하지만 잠자리 전에는 이제 창문을 닫고 자야 할정도가 되었네요..

아마도 제 메일에 논문통계 의뢰가 속속히 들어오는걸 보니.. 학기가 시작되고 교수님들의 엄포가 시작된 거 같습니다..^^ 저도 대학원시절 그랬더랍니다 .. 대학원 조교에, 연구조교까지 하면서 논문을 쓰자니 쉽지가 않았지요.. 그래도 앉아서 하던게 공부였던지라 그 덕에 통계 하나는 제 자신이 만족할 정도에 이르렀다 생각합니다..

요즘 서점을 가면 통계관련 책이 너무나도 잘 나와 있습니다.. 통계분석 뿐만 아니라, 해석에 대한 사항까지 세세하게 잘 정리를 해주신 책이 많습니다.. 그 교수님들이 제 밥줄을 끊는건 아닌가 싶은 생각도 들더군요... ^^... 그정도로 잘 되 있습니다.

그래서 저는 이번학기 들어서는 의뢰 주시는 분들한테 비용에서 2만원을 추가하여 책을 사서 드리려고 합니다.. 물론 제가 사드리는건 아닙니다만.. 그래도 조금이나만 도움이 되리라 생각이 되겠다 싶어서요... 실제로 몇분한테는 벌써 그렇게 사 드렸구요.. 그렇게 되면 나중에 제가 메일이나 전화로 설명을 드리다가 막히는 경우 책 몇페이지 펴보세요...^^ 하는식으로 설명을 드리면 이해도 빨리 되더라구요...

근데.. 가끔 사전 미팅 그리고 사후 미팅을 당연시 여기시는 분들이 계세요... ^^ 명백히 말씀 드리면 당연한건 아니에요.. 업체에서 아웃풋 보내고 따로 만나시는분 있던가요 ? 단지 저는 서로간에 이해를 빨리 하기 위해서 가급적 만나뵙는거랍니다.. 그러다보니 주말 시간도 가져야 하고 그렇습니다.. 제가 가장 아쉬운 부분은 그냥 해주기만 바라고 본인은 공부를 안하시는 부분입니다.. 아무리 졸업이 중요해도 그래도 논문에 대해서 알고 모르고의 차이는 나중에 논문 나왔을때 기분이 틀리지 않을까 합니다..

크.. 퇴근시간 한 20분 남아서요... 주저리 적어봅니다.. 이번주에 어떤분은 석사2개에 박사를 2번째 하신다는 분인데.. 통계는 처음이라고 합니다.. 그분이 저한테 이런 이야기를 해주시더라구요...

예전 초등학교 시절 까치 만화의 일화인데..

선생님이 학생들한테 숙제를 내주었다.. "다음주까지 초코파이의 성분에 대해서 알아오도록 해라"

그러자 학생들은 이리저리 연구를 하였습니다.. 먹어보고, 빻아보고, 갈아보고 등등 숙제에 여념이 없는데 까치만은 내내 놀고 있더랍니다..

친구들이 " 넌 왜 숙제를 안하니 " 라고 물어도 신경쓰지 않고 놀았답니다..

그리고 숙제를 제출하고 나서 나중에 성적을 보는데 오직 까치만이 100점을 맞았더랍니다..

이유를 물어보니.. " 네.. 저는 숙제 제출 전날 초코파이 회사에 전화를 해서 물어봤습니다" 라고 대답을 하더랍니다.

단순한 만화 내용이고... 실제 현 사회에서는 인터넷의 발달로 이러한 정보는 누구나 얻을수 있는 것일수 있습니다.. 하지만 저한테 의뢰를 주신분의 나이를 감안해 초등학교 시절이면 80년 초라고 볼수 있습니다..

그러면서 그 분이 하시는 말씀은 자기는 석사 두번 박사를 두번째 하면서 나름 전문분야가 많다... 하지만 통계분야는 내가 전문이 아니다.. 그래서 난 전문가를 찾은거고.. 그게 당신입니다.. 라는 이야기를 들었습니다..

제가 해드리는 말씀이 꽤 흡족하셨는지 모르겠지만.. 지식의 많고 적고 보다는 아는것의 최대한 전달이 되어야 하지 않을까 합니다..

그렇게 이번학기 논문통계 시작해보려고 합니다.. 자세한 사항 문의주세요 chsoo.lee@gmail.com

저작자표시

:

상관관계와 인과관계

통계분석 2009. 9. 9. 12:06 |

시간이나 장소 또는 재화의 특성을 기준으로 해서 측정한 두 개의 경제변수 X와 Y가 일정한 확률관계를 맺고 있을때 X와 Y가 상관관계를 지닌다고 말한다,

X가 그 평균치보다 큰 값을 지닐때 Y도 그 평균치보다 큰 값을 지닐 확률이 0보다 크며 동시에 X가 그 평균치보다 작은 값을 지닐때 Y도 그 평균치보다 작은 값을 지닐확률이 0보다 크다면 X와 Y는 플러스 상관관계를 지닌다.

가령 어떠 학교의 학생들을 대상으로 각자의 키와 몸무게를 조사했을때 키가 남보다 큰 사람이 몸무게도 더 나가는 경우가 그렇지 않은 경우보다 더 많았다면 키와 몸무게 사이에 플러스의 상관관계가 존재한다는 결론이 나온다.

두 변수간의 상관관계의 정도를 상관게수로 측정한다. 상관계수는 +1부터 -1까지의 값을 지니며, 그 절대값이 클수록 상관관계의 정도가 강해진다.

상관계수가 0이면 두 변수간에는 아무런 상관관계도 존재하지 않는다.

두 변수 X와 Y가 있어 X의 존재가 Y가 일어남에 있어 하나의 전제를 이루면 X가 Y의 원인이 된다고 말한다, 이 경우 Y는 X의 결과라고 할수 있다.

경제학에서는 인과관계를 이보다 조금 느슨하게 정의하여 변수 X를 포함시켜 변수 Y를 설명하는 것이 변수 X를 뺀 채 Y를 설명하는 것보다 낮다면 X가 Y를 일으킨다고 말한다. 그러나 X가 Y의 원인이 된다 하더라도 Y라는 결과를 얻는데 반드시 X가 있어야 하는것은 아니다.

예를 들어 통화 공급량을 증가시킨 결과 물가가 상승하였다면, 통화량 증가가 물가상승의 원인이 된다. 그러나 통화량 증가가 없더라도 다릉 요인으로 물가가 상승할수도 있으므로 물가가 상승하기 위해서는 반드시 통화량 증가가 필요한것은 아니다.

chsoo.lee@gmail.com

저작자표시

:

A가 높으면 B도 높을것이다.

통계분석 2009. 8. 13. 14:48 |

보통 뭐가높으면 뭐도 높을것이다 라는 분석 많이 하시지요... ^^ 그때 함 참고하세요.. 네이버 지식인이네요..

1)상관분석 실시 - 과연 최종점수와 아이큐가 상관이 있는지 확인해 주기 위해서입니다.

1상관관계가 높을수록 아이큐에의해서 영향을 받는다고 볼 수 있습니다.

자~결과를 보니까 0.816이라는 양의상관관계가 일반적인 유의수준 0.05에서 유의하게 나왔습니다

(p-값 : 0.001), 따라서 아이큐에 어떤 영향을 받았다고 볼 수 도 있겠지요?

물론 상관분석 자체는 독립변수와 종속변수가 없기 때문에 원인과 결과로 해석하면 안되지만

애초에 가설을 세우실때 아이큐가 높으면 최종점수가 높을것이라고 예상하셨기 때문에 그렇게 말해

줄 수 있는 것입니다.

2)분산분석 실시 - 두 집단간 평균비교는 일반적으로 독립t테스트를 실시하지만

분산분석 역시 두 집단간 평균이 같은지 검정 가능 합니다.

뭐 기술통계량은 그냥 보시면 되고요.

분산분석의 경우 두 집단간 분산이 동일하다는 가정이 만족되어야 사용할 수 있습니다.

Levene 검정을 통해 확인 가능한데요, p-값이 일반적인 유의수준 0.05보다 커서

귀가설(두집단의 분산이 동일하다)를 기각 할 수 없습니다. 즉, 분산분석을 실시 할 수 있습니다.

그리고 이제 결과를 해석 해보면 교육방법의 p-값이 0.05보다 작아 귀무가설을 기각하여

교육방법에 따라 평균에 차이가 있음을 알 수 있습니다.

4)공분산분석 실시

공분산분석이란 질문자 분과 같이 집단간의 평균을 비교하는데 종속변수에

영향을 줄 것이라고 생각되는 다른 외부요인을 제거해주고 분산분석을 실시하는 것입니다.

쉽게 말해서 아이큐를 고정시켜주고 집단간의 평균을 비교해는 방식이라고 보시면 됩니다.

자 등분산성 검정까지는 같습니다.

개체간 효과 검정부분을 보시면됩니다.

공변량(아이큐)의 경우 유의한 효과를 나타내고 있지요?하지만 교육방법의 p-값을 보니 0.28로

0.05보다 커서 의미가 없다고 볼 수 있습니다. 즉 아이큐를 고정한 상태에서 교육방법에 따른 평균을

비교했더니, 차이가 없다고 나왔네요.

즉 처음에 분산분석에서 교육방법에 의해서 차이가 있다고 나왔는데, 그것을 아이큐에 의한 결과라고 볼

수 있습니다.

저작자표시

:

8월3일 좋은 한주를 시작합니다.

작은것을 사랑하는 나 2009. 8. 3. 12:07 |

주말에 책좀 읽는다고 동네 분수앞에서 책 읽다가 너무 더워서 맥주도 한잔 (낮술로) 먹고 저녁에는 다시 뜀박질로 먹은거 다 소화시키고 가뿐하게 월요일을 시작합니다.

아침에 오니 반가운 편지가 한장 도착해서요... 지난번 모 신문사 기자분 대학원 졸업하시는걸 도와드린적이 있답니다. 기자분 월급이 많은 줄 알았는데 그렇게 많지 않다고 우는 소리를 하셔서.. ^^ 거의 그냥 해드리다 시피 했거든요.. 물론 저녁 한끼는 얻어먹었구요...^^.. 근데 오늘 메일을 보내셨는데, 모 기업 마케팅 통계분석 가능하냐고 물어보시더라구요.. 가격도 꽤나 쎄게 불러놨다구요.. 그리고는 바로 회사 담당자하고 통화를 했는데 이래저래 설명도 잘 해주시고 필요한 부분에 대한 명확한 지침을 주시더군요.

실상 제가 꽤나 좋아하는 일이 기업체 마케팅 분석하는 일입니다. 사람이 사람의 습성을 분석한다는게 그것도 숫자로 분석한다는게 정가는 일은 아니지만 그를 통해서 뭔가 산출이 되었을때의 느낌이라고 하나요.. 오랜 마케터 분들은 이걸 감으로 하신다고 하지요.. 그러나 저는 아직 감보다는 이 수치를 의존하는 편입니다.

오늘 아침 기분 좋은 이유는 그 기자분이 저를 소개시켜줘서가 아니라, 돈을 벌게 해줘서가 아니라, 그냥 사람 사는게 거기서 거기다라는 믿음을 다시한번 가지게 해줬다는것에 기분이 좋은것 같습니다. 욕심과 기대 조금씩만 버리면 참 세상이 달라 보입니다..

지금 당장 자신이 무슨일을 하고 있는지를, 무슨 생각을 하고 있는지를 보세요.. 그 일은, 그 생각은 결코 하찮은 것이 아닙니다. 당신을 저를 저 멀리 보내줄수 있는 원동력이 될것입니다. 저 멀리가 어디 인지는 그것을 실천에 옮기느냐 아니냐에 따라서 달라질것입니다.

저를 포함한 모든 사람에게 항상 감사합니다....

특히 요즘 또 빠지기 시작한 성당 신부님과 예수님께 감사드립니다...

저작자표시

:

새옷 입은 블로그

일기장 2009. 7. 31. 16:45 |

아 정말 이지 너무 덥습니다.

가만히 앉아 있기만 해도 땀이 나려고 합니다.. 오늘같이 불쾌지수 높은 날에는 조용이 집에가서 명상해야 하는거 아닌가 합니다..^^

오늘 시간이 조금 나서 블로그 옷좀 갈아입혔습니다. 기존에 블로그가 약간 어두침침하고 해서 이번에 환한 흰색으로 갈아입혔습니다. 그리고 제목도 달았습니다. " Choong's Studio" 라고요..^^

음식 세계화 자료를 위해서 시작했는데 뭐 하다보니까 계속 방문해주시는 분들은 소프트웨어 요청하시는 분들에 논문통계 의뢰주시는 분들이 태반을 넘어섰습니다.

무슨 연유에서든 제 블로그를 방문해주시는건 너무나 감사드리는 일입니다.. 거창하게는 아니지만 조금씩 가꾸어 나가는 블로그가 되겠습니다.

내년에요... 정말로 음식 세계화를 위해서 비행기 탈지도 모릅니다... 오랜 여정으로요...

그 때는 정말 이 블로그가 유용하리라 생각듭니다..

항상 방문해주시는 분들께 감사 드립니다.. 아울러 제 자신한테도 고맙다는 말 하고 싶네요...^^

저작자표시

:

시간 참 잘 갑니다..

작은것을 사랑하는 나 2009. 7. 29. 17:43 |

2009년도 이제 반이상을 넘었습니다. 백화점에는 이제 가을옷이 나오고 있네요

반년을 지난 지금 돌이켜 보면 또 물 흐르듯 시간이 금방 지난거 같습니다.

항상 부푼꿈을 가지고 시작하는 년초의 계획을 생각해보면 아직 진행중인 일들이 너무나 많습니다.

이제 8월부터는 한해를 정리하는 마음으로 계획했던 모든것을 지켜내려고 노력해야 겠습니다.

제 블로그에 자주 등장하시는 대구 선생님 (실질적으로는 사장님이시지요) 논문 들고 올라오셨네요...

실제 지난 학기 졸업하신 분들 논문때문에 많이 미팅을 가졌습니다. 블로그만으로 일을 진행하기에는 너무 각박해서 가급적 서울에 계시면 만나서 일을 진행을 했더랍니다.. ^^

다행스럽게도 모든 분들은 아니지만 상당수 분들이 네트워킹이 잘 되어서 용돈을 번것도 좋지만 좋으신 분들 많이 만나뵈서 참 좋았더랍니다. 그 중 가장 적극적이시고 정가셨던 분이 바로 대구 사장님이 아니셨나합니다. 업무차 서울에 자주 올라오신다 하여 논문을 주셨는데 그 안에 제가 분석한 내용 들어간걸 보니.. ^^.. 예전과는 또 다른 느낌이더라구요..

이 일을 하면서 메일로라도 좋은 답변 주시는 분들이 많으셨는데 반면에 쓴소리도 많이 듣고, 불만도 많이 듣곤 하였습니다. 100% 만족이란 있을수가 없는 일이기 때문이겠지요.. 그래도 저렇게 잊지 않으시고 일부러 찾아주시는 분들 보면 기분이 싸~~한게 좋아집니다..

제가 술을 참 좋아하거든여... 소맥이요... 그거 아마 시초가 제가 아니었을까 합니다...^^ 그 정도로 좋아하는데 지난 학기에 회사에서 퇴근만 하면 거의 바로 집에가서 분석을 하고 주말에도 거의 일을 하다보니.. 회사사람들한테 냉대아닌 냉대를 받기도 했더랍니다..^^ 제 소맥 먹고 싶어서 기다리는 사람들 많거든요....ㅋㅋ..

이 블로그 글 이제는 일기 같아졌습니다.. 잘 쓰려고 노력할 필요도 없고 그냥 제 자취를 남길수 있는 좋은 일기장이라고 생각을 합니다.

사람 미워하지 않는 그런 세상을 살고 싶습니다.. 다 같이 사랑합시다... 고맙습니다.

저작자표시

:

Category

Recent Comments

'논문통계'에 해당되는 글 79건

분산분석 ANOVA 하는 방법

SPSS로 회귀분석 하기

SPSS 분석 방법

통계학 기초 개념

통계관련 미팅을 하면서 ...

상관관계와 인과관계

A가 높으면 B도 높을것이다.

8월3일 좋은 한주를 시작합니다.

새옷 입은 블로그

시간 참 잘 갑니다..

티스토리툴바