지난해 처음 베트남 호치민을 방문했을때는 바로 휴양지로 가는 바람에 호치민 시내를 즐길 시간적 여유가 없었습니다.

장거리 버스를 타고 무이네로 가서 모든 일정을 소화하고 왔기 때문이죠..

그래서 이번투어에서는 호치민에서만 계속 있었습니다.. 물론 혹자들의 말처럼 호치민 하루면 다 본다 하지만.. 실상 느껴보니 하루갔을때 다르고, 그다음날 다르고,, 세번째날에는 결국 제가 베트남인이 되어버리더군요

지난해에도 들렸던 데탐거리 하이랜드커피숍 앞 바에서 맥주를 마시면서 몰입의 즐거움을 읽었습니다. 그 시끄러운 와중에 정말 몰입이 되더군요.. 한국에서는 그렇게 조용한 잠자리에서도 몰입이 잘 안되던데.. 정신력이라는게 참.. 그런가 봅니다


호치민을 방문했던 큰 이유중의 하나가 삼시세끼 쌀국수를 먹기 위함이 아니었나 합니다.. 저 먹음직한 고기 덩어리..


이번여행의 사진기 하이라이트 중의 하나는 파노라마 기능이 아니었나 합니다. 제가 니콘 p-300을 구매해서 가져갔는데 정말 대박 사진기 더군요... 산드라박 사진기로 유명한건데.. 하여간 너무나 좋은 사진기 같아요...


그래서 연거푸 찍은 파노라마 사진이거든요.. 도로에 오토바이 정말 무섭게 내달리고 있는데, 그래도 정말 저 적응을 빨리 하나봅니다.. 베트남 사람처럼 손사래 치면서 빨리빨리 지나갔던거 같아요...


이렇게 적응을 빨리하다 보니까 진짜 베트남 사람들이 저 베트남 사람 취급 많이 하더군요 삐끼들도 저한테 접근 안하고.. 심지어 식당 가도.. 베트남말로 물어봐요... ㅜㅜ


하루코스로 방문했던 메콩강입니다.. 아저씨가 사진기를 들이대자 고개를 반대편으로 휙~~ 돌리시더군요.. 근데 옆모습이 더 잘나오신듯 해요... 근데 메콩강 정말 넓더라구요.. 그냥 베트남 전쟁 책에서만 보던 메콩강... 좋았어요..


하루에 두번넘게 방문했던 동코이 거리에 맥주집입니다..워낙 분위기가 좋아서 자꾸 갔는데.. 역시나 텐텐을 받더군요.. 그러다보니 한국보다 더 비싸게 술먹은 유일한 집... 그래도 여기서 친구한명 만났습니다..

누구 ? ^^ 사진은 차후에 올리겠습니다... 그렇게 일정을 마치고.. 돌아오는길 항상 기내에서 찍는 기내사진 하나 찍었습니다.

 


다시 가는 그날까지... 바이 ~~~


:


연세대학교 예방의학교실 강대룡 교수님이 정리하신 보건/의학통계에 대한 내용입니다 참고자료로 올립니다.

문의사항은 chsoo.lee@gmail.com 으로 해주세요

--------------------------------------------------

보건․의학의 주 연구대상은 인간이다. 사람을 대상으로 하므로서 발생할 수 있는 윤리적인 문제들이 실제 이 분야의 연구를 수행하는데 있어 가장 어려운 점이다. 이 문제는 연구설계와 밀접한 관련성이 있다. 특히 연구설계가 관찰연구(대분분의 보건․의학연구)인 경우는 인과관계를 논하는데 있어 상당히 제한적이다. 직접적으로는 연구설계의 한계로도 생각할 수 있고 또한 연구의 결과를 왜곡시킬 수 있는 혼란변수를 통제하지 못하였거나 주요한 독립변수를 누락하였기 때문에 인과관계를 잘못 해석할 수 있다.

 

연구자의 성급함이 연구결과를 왜곡시킬 수 있다. 연구자는 빠른 시간내에 자신의 가설을 입증하려고 서두르는 경향이 있고 특히 연구설계와 분석단계에서 이러한 경향이 강하게 나타난다. 전우택 교수의 사회의학연구방법론의 서론 중「농부와 노인」이 이를 잘 설명해주고 있다. 또한 “인간을 대상으로 하는 동일 주제의 연구결과가 다양할 수 있다”는 사실이 연구전체를 왜곡시킬 수 있다. 즉, 연구자로 하여금 이런 결과도 저런 결과도 괜찮다는 생각이 심도없는 고찰없이 연구를 진행하는 하나의 요인이 될 수 있다. (물론 특정 결과를 얻기 위해 연구자의 의도가 들어가서는 더욱 않되지만!)

 

연구자가 수집한 최초의 자료는 여러 가지 잡음들이 뒤섞여 있다. 보건학 자료는 인구집단에서 자료를 수집하여 연구하는 경우가 많다. 수집한 자료에는 이상점(outlier)과 결측치(missing data) 등 여러 가지 형태의 잡음들이 존재한다. 극단적으로 말하면 잡음이 없는 자료란 없다고 생각하면 된다. 이러한 잡음을 제거 또는 수정하지 않고 분석하여 얻어진 결과는 당연히 믿을 수 없다.

 

자료분석에서 적합한 통계적 방법을 적용하지 않아 발생하는 문제점을 생각할 수 있다. 통계적 분석은 아무리 쉬운 방법일지라도 그 방법이 가지고 있는 가정(assumption)이 있다. 따라서 실제 연구자료가 가정에 맞지 않는 경우는 그 연구의 결과에 치우침이 존재할 가능성이 커진다. 단 몇시간의 기계적인 분석을 통하여 얻어진 결과를 과연 신뢰할 수 있을까? 이러한 연구의 결과가 사람의 생명과 주요한 보건문제에 직접적으로 관여하는 것이라면?

  

2. 수집한 자료를 어떻게 간결하게 표현할까? (예제자료1)

 

연구목적: 주 연구가설은 한국인 남자에서 지질섭취와 흡연이 Ischemic heart disease (IHD)와 관련성이

있는가를 알아보고자 한다.

연구설계: 환자-대조군 연구

환자군은 세브란스병원에서 1995년부터 1996년 기간동안 처음으로 발생한 acute myocardial

infarction 또는 angina pectoris로 진단된 환자이며, 대조군은 동일한 시기에 세브란스

정형외과와 안과를 내원한 사람이다.

Variable

Category or Unit

age

years

education

years

smoking

1=current, 2=ex-smoker, 3=non-smoker

chddx

1=IHD, 2=control

bmi

body mass index (kg/m2)

energy

kcal

h_hist

hypertension history (1=yes, 2=unknown, 3=no)

dprotein

protern intake (% of energy)

dlipid

total fat intake (% of energy)

dcho

carbohydrate intake (% of energy)

dpufa

polyunsaturated fatty acid (% of energy)

dsfa

saturated fatty acid (% of energy)

dmufa

monounsaturated fatty acid (% of energy)

  [예제자료1]에 대한 연구대상자의 일반적 특성 중 연령과 교육수준에 대한 분포를 다음과 같은 표로 제시할 수 있다.

 

Table 2-1. Distributions of age and education for study population                unit : person (%)

Variable

Cases (n=108)

Controls (n=142)

age

 

 

<50

38 (35.2)

52 (36.6)

50-59

37 (34.3)

49 (34.5)

≥60

33 (30.6)

41 (28.9)

education

 

 

≤9

28 (25.9)

56 (39.4)

10-12

44 (40.7)

45 (31.7)

≥13

36 (33.3)

41 (28.9)

위의 표를 통해 환자군과 대조군의 연령분포와 교육수준이 각각 어떠한지를 알 수가 있다. 연령은 두 집단간에 거의 차이가 없다 (실제 연구설계에서 환자군과 대조군은 연령에 대해 빈도짝짓기를 하였기 때문임)는 것을 알 수 있고 교육수준은 환자군에서 조금 더 높은 경향이 있음을 알 수 있다. (⇨유의한 차이가 있는지는 통계적 검정을 통해서 확인하자!)

[예제자료1]에서 관심있는 영양소 섭취의 분포를 대표값과 산포도를 통해 어떻게 제시하는지 살펴보자.

  Table 2-2. Mean intakes (SDs) of energy from specific nutrients

Variables (unit)

Cases (n=108)

Controls (n=142)

energy (kcal)

2359.8 (730.8)

2223.4 (632.6)

carbohydrate (g)

357.5 (109.6)

354.5 (101.3)

protein (g)

85.1 ( 29.6)

78.0 ( 28.0)

total fat (g)

60.3 ( 28.5)

50.2 ( 22.3)

SDs : standard deviations

 

위의 표를 통해 총열량 섭취는 환자군이 대조군보다 평균적으로 136kcal 더 많이 섭취하며 또한 총지방산 섭취도 10g 더 많이 섭취하고 있다. 전체적으로 평균에 비해 표준편차가 매우 크다는 것을 알 수 있다. 이와 같은 경우는 다음과 같은 자료의 형태를 생각할 수 있다.

☞ 이상점(outlier)이 있는가?

☞ 분포가 오른쪽으로 치우쳐 있는 형태인가?

  위의 자료에서 총 열량섭취나 총 지방산 섭취에 대해 히스토그램을 그려보면 분포가 오른쪽으로 치우쳐 있으며 정규분포와는 다른 형태임을 알 수 있다. 이런 경우 대표값과 산포도의 측도로는 중위수와 사분위수 범위가 더 합리적일 수 있다.

 

[종합정리 2-1] 본격적인 연구가설을 분석하기 전에 반드시 자료를 확인하자! 자료를 확인할 수 있는 절차를 미리

생각해 둘 필요가 있다. 확인된 자료에서 기술통계량을 구하고 나의 연구대상자들의 일반적 특성 또는 주요 측정변수의 분포를 제시하는 것이 첫 번째 할 일이다.

 

이상의 내용에 대한 기술통계량의 종류들을 나열하면 다음과 같다.

[종합정리 2-2] 자료의 요약 및 정리

자료를 모으고 정리하여 방대한 자료의 특성을 한눈에 알기 쉽게 정리하는

것을 말한다.

기술통계량 (descriptive statistics)

표나 그림을 이용한 자료의 정리

대표값 (central tendency and location)

․ 산술평균 (arithmetric mean)

․ 중위수 (median)

․ 최빈수 (mode)

․ 기하평균 (geometric mean)

․ 가중평균 (weighted mean)

 

산포도 (variability)

․ 표준편차 (standard deviation)

․ 사분위수 범위 (interquartile range)

․ 범위 (range)

․ 변이계수 (coefficient of variation)

․ 히스토그램 (histogram)

․ 돗수분포표 (frequency table)

․ 막대그래프 (bar graph)

․ 원 그래프 (pie raph)

․ 산점도 (scatter plot)

․ 줄기-잎 그림 (stem-leaf diagram)

․ 상자그림 (box plot)

이제까지 자료를 요약․정리하는 방법에 대해 알아보았다. 지금부터는 연구설계에서 궁금함을 가지고 설정한 연구가설을 통계적 가설검정을 통해 의사결정을 내리는 방법을 알아보도록 하자!

  3. 단순분석을 일차적으로 먼저 시행해 보자!

  여기서, “단순분석”이란 의미는 두 변수만의 관련성에 대한 분석으로 생각하자. 앞의 [예제자료 1]에서 주 연구가설은 다음과 같다.

 

[주 연구가설] 지방산 섭취가 환자군과 대조군간에 차이가 있는가?

(또는 총 열량에 대한 지방산 섭취 비율이 차이가 있는가?)

 

이제부터 자료의 형태에 따라 어떤 통계적 방법을 적용하면 되는지 알아보자. 변수는 크게 측정수준에 따라 크게 연속형 변수와 범주형 변수로 나눌 수 있고, 설명관계의 방향성에 따라 종속변수 (또는 반응변수)와 독립변수 (또는 설명변수)로 나눌 수 있다. 그리고 측정자료에 독립성이 있는지의 여부도 통계적 방법을 선택하는데 주요한 기준이 된다.

 

[사례①] “경구피임약을 복용하면 혈압이 증가한다”는 가설을 검정하기 위해 경구피임약을 복용하는 100명과

복용하지 않은 100명의 수축기혈압을 비교하고자 한다.

[사례②] “경구피임약을 복용하면 혈압이 증가한다”는 가설을 검정하기 위해 경구피임약을 복용하지 않는

100명을 대상으로 수축기혈압을 측정하고 일정기간 경구피임약을 복용하게 한 후 다시 혈압을

측정하여 복용전과 후의 혈압을 비교하고자 한다.

[사례③] “흡연력에 따라 폐기능에 차이가 있는가”를 알아보기 위해 흡연력을 6개의 집단 (nonsmoker,

passive smoker, non-inhaling smoker, light smoker, moderate smoker, heavy smoker)으로 구분하고

FEF(forced expiratory flow)를 측정하여 6개 집단간의 평균을 비교하고자 한다.

[사례④] "약품 A와 B의 복용에 따른 부작용에 차이가 있는가“를 알아보기 위해 1,000명을 대상으로 500명씩 A

와 B를 각각 일정기간 동안 복용하게 한 후 부작용의 유무를 조사하여 부작용의 비율에 차이가 있는가

를 비교하고자 한다.

[사례⑤] “열량섭취가 많으면 비만할까”를 알아보기 위하여 200명의 성인을 대상으로 식이섭취를 통한

총 열량섭취와 비만도()를 조사하여 그 관련성을 알아보았다.

 

[종합정리 3-1] 측정한 변수를 종속변수와 독립변수, 측정수준에 따라 범주형과 연속형, 그리고 자료의 독립성 여부에 따라 t-검정 (독립된 두 집단, 짝을 이룬 두 집단), -검정, 일요인 분산분석, (피어슨) 상관분석, 단순회귀분석 등을 구분하여 적용할 수 있다. 그리고 모집단의 분포를 가정할 수 없는 경우에는 비모수적 방법으로 윌콕슨 순위합 검정, 윌콕슨 부호순위 검정, 크루스칼-왈리스 검정, 스피어맨 상관분석 등을 각각 적용할 수 있다. 자료의 특성에 맞게 검정방법을 선택하고 제시된 유의확률을 이용하여 귀무가설과 대립가설 중 하나를 선택하면 된다.

 

※ 모수적 방법과 비모수적 방법의 적용

모수적 방법이란 표본이 추출된 모집단의 확률분포에 대하여 특정분포를 가정하고 그 가정된 분포의 모수(parameter)에 대한 검정문제를 생각하는 방법이다. 많이 사용하는 대표적인 분포는 정규분포이다. 모집단의 분포를 가정하므로서 검정통계량의 분포를 알 수가 있다. 그러나 정규분포를 따르지 않거나 특정분포를 가정할 수 없는 경우, 특히 표본의 수가 작은 경우는 순위(rank)에 기초한 비모수적(nonparametric) 방법을 사용하는 것이 좋다.

 

[예제자료1]에서 주 연구가설은 “총 열량에 대한 지방산섭취 비율(dlipid, dsfa, dpufa, dmufa)의 평균이 환자군과 대조군간에 차이가 있는가?” 이다 (종속변수와 독립변수의 방향관계를 생각하면 “지방산섭취 비율이 증가하면 환자 (IHD)가 될 위험이 증가하는가?” 이다). 자료구조를 보면 환자군과 대조군의 평균을 비교하는 문제이므로 독립된 두 집단의 t-검정 (또는 윌콕슨 순위합 검정)을 사용하면 된다.

  Table 3-1. Mean (SDs) intake of energy from specific nutrients

Variables (unit)

Cases (n=108)

Controls (n=142)

t-value

total fat (% of energy)

22.4 (5.9)

19.9 (5.2)

3.7***

PUFAs (% of energy)

4.4 (1.3)

4.1 (1.2)

2.2*

MUFAs (% of energy)

7.5 (2.9)

6.4 (2.5)

3.1**

SFAs (% of energy)

6.8 (2.5)

5.9 (2.2)

3.1**

SDs : standard deviations ; PUFAs : polyunsaturated fatty acids ;

MUFAs : monounsaturated fatty acids ; SFAs : saturated fatty acids

*: p < 0.05, ** : p <0.01, *** : p < 0.001

 

총 열량에 대한 total fat, PUFAs, MUFAs, 그리고 SFAs 모두 환자군이 대조군에 비해 통계학적으로 유의하게 많이 섭취하고 있다.

 

만약 위의 분석을 윌콕슨 순위합 검정을 하였다면, 산술평균 대신 중위수, 표준편차 대신 사분위수 범위를 적고 윌콕슨 순위합 검정의 통계량 값 또는 p-값을 적으면 된다.

 

 

환자군과 대조군에 간에 다른 특성의 차이가 있는가? 비만한 사람이 환자군에 많은가? 또한 비만도와 지방산 섭취가 관련성이 있다면?

Table 3-2. Distributions of smoking status, history of hypertension

and history of hyperlipidemia in cases and controls

Variable

Cases (n=108)

Controls (n=142)

-value

body mass index

 

 

 

<25

54 (50.0)

97 (68.3)

7.8*

≥25

54 (50.0)

45 (31.7)

 

smoking status

 

 

 

>1 pack/d

28 (25.9)

10 ( 7.0)

21.6**

≤1 pack/d

42 (38.9)

59 (41.6)

 

exsmoker

28 (25.9)

40 (28.2)

 

never smoked

10 ( 9.3)

33 (23.2)

 

history of hypertension

 

 

 

yes

41 (38.0)

20 (14.1)

19.4**

no

59 (54.6)

103 (72.5)

 

unknown

8 ( 7.4)

19 (13.4)

 

history of hyperlipidemia

 

 

 

yes

29 (26.8)

18 (12.7)

9.3*

no

42 (38.9)

76 (53.5)

 

unknown

37 (34.3)

48 (33.8)

 

unit : person (%)

* : p < 0.01, ** : p < 0.001

 

 

환자군에서 비만한 사람의 비율, 흡연자의 비율 (특히 하루 1갑 이상), 고혈압과 고지혈증에 대한 과거력이 있는 사람의 비율이 대조군에 비해 통계학적으로 유의하게 높았다.

   

[의문] 주 연구가설을 밝히는데 위의 비만도, 흡연력, 고혈압과 고지혈증 등의 변수의 영향을 통제하지 않으면

어떤 문제가 있는가?

  

이상의 내용에 대한 검정방법들을 나열하면 다음과 같다.

 

[종합정리 3-2] 간단한 통계검정

통계적 가설을 설정하고, 연구자의 가설이 지지되는지 일차적으로

단순한 분석을 시행하자!

통계 검정 방법들

분류 기준 및 검토 사항

 

종속변수가 연속형인 경우

 

모수적 방법

․ t-검정 (독립 또는 짝을 이룬 자료)

․ 분산분석(ANOVA)

․ 피어슨 상관분석

․ 단순회귀분석

비모수적 방법

․ 윌콕슨 검정(독립 또는 짝을 이룬 자료)

․ 크루스칼 왈리스

․ 스피어맨 상관분석

․ 단순회귀분석

 

 

종속변수가 범주형인 경우

 

․ 카이제곱 검정

․ Fisher의 정확도 검정(exact test)

 

․ 종속변수의 측정수준은 어떤가?

․ 종속변수가 연속형인 경우 정규분포를 가정 할 수 있는가?

․ 집단간 평균을 비교하고자 하는가?

․ 비교하고자 하는 집단은 몇 개인가?

․ 자료의 독립성을 가정할 수 있는가?

․ 범주형 자료분석에서 범주의 표본수가 너무 적지 않는가?

 

 

 

 

 

  4. 여러 요인의 영향을 동시에 분석하자 - 회귀분석적 방법

[통계 4-1] 여러 요인의 영향을 동시에 분석 또는 혼란변수를 통제하기 위해서는 회귀분석적 방법을 많이 사용한다. 회귀분석 방법은 종속변수와 독립변수들 간의 함수모형을 설정하고 (회귀모형) 그 모형을 통해 관련성을 밝히는 방법이다. 종속변수가 연속형인 경우는 다중 회귀분석 (multiple regression), 범주형인 경우는 다중 로지스틱 회귀분석 (logistic regression)을 많이 사용한다.

 

[예제자료2] 납제련소 부근에 사는 144명의 어린이들을 대상으로 혈중농도를 측정하여 위험군()과 정상군으로 분류하고 신경학적인 기능에 차이가 있는가를 알아보고자 10초간 finger-wrist tab (MaxFWT)을 측정하고 연령을 포함하여 이와 관련 있는 여러 가지 요인들을 조사하였다.

  Group(1=Exposed, 2=Normal), Sex(1=Male, 2=Female), Age(Years)

 

[의문 4-1] 연령과 성(sex)의 영향을 통제한 후 위험군과 정상군 두 군간에 MaxFWT의 차이가 있는가?

[통계 4-2] 다중 회귀분석모형

 

․ 회귀모형 :

 

․ 회귀계수의 의미 : 다른 요인을 통제하였을 때,

: Exposed 집단에 비해 Normal 집단이 MaxFWT가 평균적으로 만큼 높다.

: Male에 비해 Female 집단이 MaxFWT가 평균적으로 만큼 높다.

: 연령이 1살 증가하면 MaxFWT가 평균적으로 만큼 증가한다.

  위의 회귀모형을 분석하였을 때 얻어진 결과는 다음과 같다.

 

Table 4-1. Multiple regression model comparing mean MAXFWT

between exposed and normal after controlling for age and sex

Variable

Estimate

Standard error

p-value

Intercept

34.1

3.1

0.0001

group

-5.1

1.6

0.0014

age

2.4

0.2

0.0001

sex

-2.4

1.5

0.1172

 

[분석결과 해석] 납에 노출된 Exposed 집단이 Normal 집단에 비해 성, 연령을 통제하였을 때 신경학적인 기능인 MaxFWT의 평균이 5.1회 정도 통계학적으로 유의하게 낮다. 또한 연령이 1세 증가하면 평균적으로 MaxFWT는 2.4회 유의하게 증가하며, 남자에 비해 여자가 2.4회 정도 낮으나 통계학적으로 유의하지는 않다.

  [예제자료1]에 적합한 회귀분석인 로지스틱 회귀분석에 대해 알아보자!

 

[의문 4-2] 비만도와 흡연력, 그리고 총 열량의 영향을 통제한 후 total fat intake가 증가할 때 IHD의 위험이

증가하는가?

[통계 4-2] 다중 로지스틱 회귀분석모형

 

․ 회귀모형 :

․ 회귀계수의 의미 (odds ratio로 해석) : 다른 요인(x)을 통제하였을 때,

: 총열량에 대한 total fat이 1% 증가하면 Ischemic Heart Disease(IHD)에 걸릴 위험이 증가한다.

 

의 [예제자료1]에서 비만도, 흡연력, 그리고 총열량을 통제하였을 때의 로지스틱 회귀분석의 결과는 다음과 같다.

  Table 4-2. Adjusted odds ratios and 95% CIs of developing IHD for selected risk factors

from logistic regression analysis

Variable

Odds ratio

95% Confidence Interval

total fat (1% of energy intake)

1.08

1.02 - 1.14

energy (Kcal)

1.01

1.00 - 1.02

body mass index

 

 

≥25

2.26

1.27 - 4.01

<25

1.00

-

smoking status

 

 

>1 pack/d

10.51

3.61 - 30.56

≤1 pack/d

2.40

1.03 - 5.62

exsmoker

2.67

1.09 - 6.55

never smoker

1.00

-

 

☞ [분석결과 해석] 총 열량, 비만도, 흡연력의 영향을 통제하였을 때 total fat이 1% 증가하면 IHD에 걸릴 위험이 1.08배 증가한다. 그리고 다른 요인의 영향을 통제하였을 때 BMI가 25미만인 군에 비해 이상인 사람이 IHD에 걸릴 위험이 2.26배 증가하고, never smoker에 비해 하루에 한갑 이상 피우는 사람은 10.51배, 1갑 미만은 2.4배, 그리고 금연자는 2.67배 IHD에 걸릴 위험이 증가한다.

 

이상의 회귀분석 내용을 정리하면 다음과 같다.

 

[종합정리 4-1] 회귀분석 방법

자료의 특성에 맞는 회귀분석을 시행하므로서 여러 독립변수들의 영향을 동시에 알아보고 서로의 영향을 통제한 후의 독립적인 관련성을 알아볼 수 있다.

보건학에서 많이 사용하는

회귀분석의 종류

분류 기준 및 검토 사항

다중 회귀분석

 

로지스틱 회귀분석

 

조건부 로지스틱 회귀분석

 

포아송 회귀분석

 

Cox's의 비례위험 회귀분석

․ 종속변수의 측정수준은 어떤가?

․ 독립변수의 측정수준은 어떤가?

===> 독립변수가 범주형이면 가변수 처리를 하였는가?

․ 독립변수들간에는 다중공선성(multicollinearity)의 문제는 없는가?

․ 다중 회귀분석의 기본가정을 검토하였는가?

===> 정규분포성, 선형성, 등분산성, 이상점, 모형의 적합성 등

․ 로지스틱 회귀분석에서 종속변수의 범주의 수는 몇 개인가?

․ 로지스틱 회귀분석에서 대상자가 matching 되어 있는가?

․ 사건 발생에 대한 추적관찰된 시간 (또는 인년(person-years))의 자료인가?

 

[종합정리 4-2] 회귀모형을 구축하는 전략

 

간단한 분석(단일변량분석)을 통해서 변수간의 정보를 파악하자!

․ 단일변량분석을 통해 유의확률이 0.3미만인 독립변수는 위험요인의 가능성이 있다.

․ 독립변수간의 상호작용(영향)을 고찰하자

단일변량분석에서 어느 정도 관련성을 보이는 독립변수(p<0.3(또는 0.2)) 또는

이 연구에서 관심을 갖는 독립변수, 그리고 혼란변수를 모형에 포함하여 자료의 특성에

맞는 회귀분석을 시행하자!

선택한 회귀분석 모형의 기본가정이 만족되는가?

최종적으로 가능한 간단한 모형이면서도 설명력이 높은 모형을 찾도록 노력하자!

Categories of statistical procedures used to assess

the statistical content in the articles

 

자료 성격

권고 통계분석 방법

사례보고, 임상연구, 치료결과분석 등

No statistical methods or

Descriptive study

진단능력평가, 참고치 정하기

Sensitivity, Specificity, ROC curve

짝을 이룬 2군間 평균비교

Paired T-test

Wilcoxon signed rank test*

독립적인 2군間 평균비교

T-test, Z-test

Wilcoxon rank sun test*

Mann-Whitney U-test*

독립적인 3군間 이상 평균비교

(또는 군간비교)

ANOVA (with multiple comparison)

Kruskal-Wallis test*

동일인에 대한 연속변수의 3회 이상 반복측정

Repeated measures of ANOVA, GLM

Friedman test*

2군 또는 3군 이상 빈도비교

Pearson

Mantel-Haenszel trend test (순서형 변수)

Mantel-Haenszel test*

Fisher's Exact test*

동일인에 대한 반복측정 빈도비교

McNemar's test*

두 연속변수간 상관관계 분석

비모수적 변수의 상관관계 분석

 

Pearson's correlation

Spearman's rho*

Kendall's tau*

두 개의 연속변수간 종속관계 분석

Simple linear regression

Multiple regression

Logistic regression

생존율 연구

생존율 비교

Life table,

Kaplan-Meier estimate of survival

Log-rank test, Cox's analysis

역학적 통계량 분석

Incidence, Prevalence,

Risk ratio, Odds ratio

* : 비모수적 방법

Source : Emerson JD, Colditz GA, Use of Statistical Analysis in The New England Journal of Medicine.

N Engl J Med 1983;309:709-13.



:

My name is Maximus Decimus Meridius...


Commander of the armies of the North, general of the Felix Legions...


Loyal servant to the true emperor, Marcus Aurelius...


Father to a murdered son... husband to a murdered wife...


And I will have my vengeance, in this life or the next.



아마도 거의 마지막 장면 무렵의 대사내용일겁니다.

남자의 책임감, 의무.. 그리고 자격이 어떤것인가를 생각해보게 하는 장면이 아닌가 합니다.



:


오랜만에 또 컴플레인 글을 올리네요..  참자니 화되어서 돌아올것 같고, 그래서 어디다 분풀이 할때도 없고 해서 이렇게 몇자 올립니다..

7월 휴가를 맞이해서 작년에 갔던 베트남을 다시 방문하고자 비행기표를 끊었습니다. 패키지로 갈 생각은 없었고 한번 가봤던지라 이번에는 좀더 여유를 가지고 휴가계획을 시작하였습니다.

항공권은 그간 모아두었던 마일리지 이용해서 예약을 하였는데 바로전날 취소를 해도 위약금을 부과하지 않는다고 하니 참 안심이 놓입니다..

그리고 나서 호텔을 이리저리 알아보던중... 카페를 통해서도 알아보고, 지인을 통해서도 알아보다가,
아고다 를 방문하였습니다. 생각보다 호텔이 저렴해서 기분이 좋았지요..

근데 이리저리 또 둘러보다가
호텔스닷컴을 또 방문하게 되었네요.. 문제는 여기부터 생겼네요..

객실을 두분류로 나누어 놓았더라구요..


환불이 불가능인 방하고, 요금보증 프로그램 하고요...두분류루요..

상식적으로 하나만 물어봅시다.. 같은 방인데 하나는 환불불가능이라 저렴하다면 나머지 하나는 비싸게 주니까 환불이 가능해야 하지 않을까요 ? 저는 그렇게 생각하고 예약을 진행하였습니다..

3박4일을 예약을 하고 나니 금액이 뜨더군요.. 봉사료와 서비스금액 차지는 당연히 알지요..
그리하여 나온 금액이


적당하다고 생각하였습니다.. 시설도 나쁘지 않은것 같고...근데요..

아래에 쭉 내려가다 보니 취소규정이 있네요.. 분명히 위에서는 환불불가능과 그렇지 않은 부류로만 나뉘어 놓았는데 취소규정에


위와 같이 나와있네요.. 이걸 참 웃어야 하는건지 울어야 하는건지.. 그리하여 호텔스닷컴에 전화를 걸었습니다.

나 원 참.. 그렇게 불친절한 응대는 처음 받아봅니다.. 하다못해 보이스피싱 전화하는 중국인도 그것보다는 친절하지 않았을까 합니다..

무조건 취소규정이 있었다고 합니다.. 뭐 제가 끝까지 못본 책임도 없지는 않습니다만.. 녹음기처럼 "고객님께서 규정에 동의하셨기에 결제가 진행된것입니다" 라는 보험회사 같은 이야기만 반복을 하네요..

그럼 왜 같은 객실을 둘로 나누어 놓았냐고 묻자.. "그러게요" 라는 말을 듣고는

아!!!! 여기서 내가 더 언쟁하다가는 이번 한주가 힘드어지겠다 싶어서 알았다고 하고 끊었습니다.

사실상 국적이 어디인지도 모르겠습니다.. 유명하다고는 하는데.. 카드명세서에는 파리(해외)에서 결제가 되는걸 보니 파리가 본사인가 봅니다.

더 웃긴건 위에 올렸던 결제금액이 모두 포함되어 있다고 해서 그런줄 알았는데.. 카드사 내역서를 보니


이건 뭔가요.. 181,956이 184,299로 결제가 되었네요.. 이 결제가 해외로 진행된다는 것도 몰랐을뿐더러 혹시나 있다고 하면 알려주어야 했을텐데, 그냥 모두 포함해서 181,956 이라고 하니 그런줄만 알았지요..

다시 그 불친절한 회사에 전화를 걸어보니 역시나 저를 실망시키지 않네요..

"저희회사에서는 정확히 181,956원만 가지고 갑니다. 나머지는 카드사에 문의하세요"

...아..아... 정말 할말 잃고..말았네요..

카드사에서는 수수료와 환율등으로 변동이 있을수 있다고만  하는데...

그냥 모두를 위해서 당신네 호텔스닷컴을 이용하는 고객을 위해서 좀더 솔직하게 마케팅 했으면 하네요...

이건 마케팅이라기 보다는 기만이 아닐까 하는 정도입니다...

할일없어서 이렇게 글 올리는거 아니고, 이용하시는분들 꼭 인지하시라고 글 올립니다..

베트남 가기전에 액땜했다고 칠랍니다... 돈을 손해본건 아니지만... 여행가는 사람으로서 기분이 다운된건 사실입니다..

저에게 다시 힘을 주세요....~~~ ^^

--------------------------------------------------

안녕하세요 ~ 우선 이 리뷰를보시기전에 위의 원본을 먼저 살펴보시고 나서 읽으시길 바랍니다.

본 글은  처음 원본에 대한 후기리뷰입니다. 즉 지난 2011년 6월13일 예약을 하고나서의 리뷰를 했던 사항입니다. 리뷰 후에 많은분들이 호텔스닷컴의 불친절한 서비스에 공감을 해주셨고, 저는 이를 후기에 올렸습니다만... 아.. 우리 대한민국만 후기를 삭제하는게 아니었나봅니다.

아예 후기를 올리지도 않았더군요.. 최장 72시간안에 올린다고 하는데 깜깜무소식이네요..  

이런 메일이 저한테 왔더군요 (2011년 7월 13일 07:03:38 제 네이버 메일로)


위의 메일을 보면 3분안에 후기가 올라가진다고 하지요... 오늘이 7월21일 입니다. 8일이 지난 시간입니다. 그들이 주장했던 72시간을 무려 120시간을 초과한 시점입니다.

아래에 오늘날짜의 블루다이아몬드 후기를 살펴보겠습니다


제가 호텔스닷컴에서 후기를 올리라고 메일을 받은게 7월13일 하지만 전 이미 그전에 사이트를 들어가서 직접 후기를 남겼습니다. 그런데 오늘날짜로의 제가 묵었던 호텔 후기사이트를 가보면...

정렬순서가 새항목우선인데 6월21일이 최신으로 나옵니다. 그리고 저는 영어권 항목은 아니지만 영어권 후기 이용고객의 경우 7월14일의 후기라 올라와 있습니다.. 이걸 어떻게 생각을 해야 하는지 모르겠네요...휴..

저 나름 교양있는사람이라서 사이트에 험담을 한것도 아니고 없는 말을 지어내지도 않았습니다만 유감스럽게도 후기가 올라가지를 않네요.

제 생각은 그렇네요... 시대가 정보화로 갈수록 점점 은폐나 숨길수 있는것은 없어져갑니다. 잘한일이든 잘못한 일이든 내놓고 그리고 나서 같이 칭찬하고, 같이 혼을내서 잘한 기업은 더 잘할수 있도록 해줘야 할것이고 그게 아니라면 시정을 해서 잘 될수 있도록 할수 있는게 우리 소비자의 몫이 아닌가 합니다. 

흔히 마케팅에서 이런말을 쓰지요..

"관심이 없는 고객은 아예 기업에 대해서 거들떠 보지도 않는다, 그나마 불만을 표출할때 잡아라"

"가장 무서운 고객은 무관심한 고객이다"

저도 서비스를 업으로 하는 기업에 종사하는 일원으로서 제 자신도 반성을 하는 기회가 되었으며, 즐거운 여행 스케줄을 정하는데 있어서 비용 조금 더 들더라도 친절한 예약 사이트를 이용하는게 좋을것 같습니다.

미국에 있을때 한참 이용했던 Expedia 가 곧 한국시장에서 영업을 한다고 합니다. 두고봐야 할일이지만 호텔스닷컴으로서는 분명한 경쟁상대가 될것입니다.



:

지난번에도 한번 신청을 했었는데, 이번에 확실히 전화문의를 해서 정리를 해봅니다.

저는 개인적으로 AIG 실손과 큰병이기는 보험 두개 가지고 있거든요..

이번에 병원 다녀온 일이 있어서.. 통원치료하고 준비서류 문의하였습니다.

필요서류는

1. 초진기록지 사본
2. 진료비 영수증 원본
3. 총 통원비 20만원 초과시 진단서 첨부 (20만원이 초과가 안되면 당연히 없어도 되겠지요.)
4. 통장사본
5. 보험금 신청서 


이렇게 작성을 하셔서 


위의 주소로 등기로 보내시면 됩니다.. 빠르면 1주일내에 들어오더라구요...

 
그럼 건강하세요 ~~ ^^


:

호치민 시내 지도인데요.. 버스 노선까지 정확하게 나와 있네요..~.. 다음주에 가는데 유용할것 같아요..

참고로 공항에서 152번입니다 ~~ 괜히 택시타지 마세요..^^


사진이 조금해서 잘 안보이시면... 원본파일 드릴께요~~


:

여자가 당신에게 말하지 않는 절반의 진실 - 6점
메리 로우 퀸란 외 지음, 정경호 옮김/엘도라도


책 제목이 그럴듯 하다.. 마치 여성의 심리학에 대한 내용이 가득할것만 같은 기대를 가지게 한다..

그래도 저자한테는 상당히 미안한 이야기지만 돈주고 사기보다는 쉬는날 서점에 쭈그리고 앉아서 볼만한 도서라고 생각된다.. 그 예전 "여자가 섹스를 하는 237가지 이유" 처럼 말이다.

역시나 책을 펴보니.. 심리학이라기 보다는 마케팅 서적같은 냄새가 풍겨온다..

"전세계 소비의 85%를 책임지고 있는 여성..~~~" 이라는 문구와 함께 여성을 대상으로 한 마케팅의 성공과 실패 사례를 쏟아붓고 있다..


재미없는 책을 읽는 가장 좋은 방법은 속독법이다.. 저자는 여자들은 항상 반만 이야기 한다고 말한다.. 그러나 따지고 보면 여자가 아니라 사람이 그런게 아닌가 싶다.. 책을 읽다보니 나한테도 해당되는 사항들이 참 많이 있던데.. 나와 내 친구들은 여성호르몬이 흐르는 것일까 ^^...

일상적으로 사례를 내보이고는 역시나 결론은 미약한것 같다.. 즉.. 나머지 반을 들으라는 것이다.. 어떻게 ???

물론 그 예를 몇가지씩 제시를 하곤한다.. 하지만 마케팅 전문가가 아니고서야.. 심리학 전문가가 아니고서야.. 그렇게 세부적으로 어떻게 분석을 하겠는가..

기업마케팅 사례보다 실제 사람들의 예를 들었으면 좀더 와닿았을만한 내용이 되지 않았을까 한다..

저자가 공들여 쓴 책을 1시간만에 읽어버리고 수다를 떨어서 좀 미안한 감은 있지만... 하여간.. 좀 상업성이다~~

이런날은 집에가서 조용이 오래된미래를 다시 들쳐보고 싶다....


:

인터넷 신청해서 사용한지가 1년이 좀 넘었네요..

그 당시 옆집 무선랜을 매일 훔쳐 사용하다가, 속도도 불안정하고, 보안에 대한 우려 때문에 제돈 내고 쓰자고 결정을 했었지요..

그것도 이리저리 알아봐서 최대한 할인 받고 사은현금도 푸짐하게 받았거든요..

그리고 나서 1년이 지나니 각 업체 대리점에서 또 전화가 오네요.. 작년만큼보다 현금 더 드릴테니 통신사 바꾸시고 사은현금으로 위약금 내셔도 더 남는다고 하네요...

얼씨구나 해서 해당 통신사에 전화걸어서 문의를 했더니 위약금이 현재 약 10만원정도 남았다고 하네요..

그래서 다시 대리점 전화 와서 이것 저것 따져보니처음이랑은 또 다르게 인터넷만 사용하면 15만원정도밖에 안준다고 하네요... 그럼 10만원 내고 5만원으로 뭐하란 말입니까..^^

근데 이게 또 웬일입니다.. 해당 통신사에서 친절하게 전화가 와서.. 해지 하지 마시고 10% 할인 해드릴테니까 더 쓰시라고 하네요..

뭐 돈 5만원은 제 이동장벽을 넘어트릴만한 금액이 아닌지라 흔쾌히 예스를 했지요...

더군다나 지금 인터넷 금액이 예전보다 올랐더라구요...이것저것 다시 따지니... 그게그것인지라..

10%할인만 받고 끝내렵니다....^^

오늘 즐거운 날입니다 ~~~ 점심식사 맛나게 하세요 ~~


:

지리산 펜션마을에서 일박을 하고 내려오던길에 축제가 한창이더군요.. 녹차 축제인듯이요..

남해를 향해 가다가 잠시 최참판댁으로 들려볼까 해서 가다보니 밀면 파는곳이 있더군요..

아마도 처음 손님인듯 한데.. 우선 가격이 맘에 드네요..




여러가지 시킬게 없습니다.. 물 아니면 비빔.. 인원수대로 시켜놓는데 어르신이 저쪽에 면빼는 기계좀 찍어달라고 하십니다. 대한민국에서 하나 밖에 없는 기계라고요.. 근데.. ^^ 서울에 너무나 많은 면 기계더군요..ㅋㅋ (사진상 저 뒷편에 있는 기계)



드디어 국수가 나왔습니다.





아.. 갑자기 배가 고파지네요..물에 비빔에 두그릇을 먹었답니다.. 먹고 있는데 어르신 또 오시더니 하동 막걸리 직접 담근거 한잔 하라고 하십니다.. 그전날 숙취가 여전하지만 고양이가 생선을 그냥 넘길수는 없는지라서...


쌀 떠다니는거 보이시나요 ?..ㅋㅋ 이거 주시면서 안주 먹으라고 방금 삶아낸 두부에 김치를 주시네요
... 아... ~~



그 당시 시간이 오전 11시가 안되었는데.. 그냥 나머지 일정 빼고 눌러 앉아서 막걸리나 마셨으면 했더랍니다.. 정말이지 자연과 더불어 산다는거 언제라도 즐거운 일입니다..



:

어제 옷장정리를 하였습니다. 살다보니 제일 편한곳이 오피스텔인지라 오피 생활만 벌써 6년째에 접어드네요

그간 몇번의 이사를 통했지만 계속적으로 오피스텔만 고집을 하게 되네요..

이사를 하다보면 가장 좋은점이 구질구질 예전 옷가지들을 버리고 집안 정리하고 깔끔한 기분이 든다는 장점이 있지요. 반대로 단점이라고 한다면 역시나 시간과 비용이지요.

어제 옷장의 옷들이 너무나 지들 맘대로 널부러져 있어서 단단히 교육을 시켰지요. 겨울옷 다시 집어넣고 여름옷 꺼내들어서 오래된 냄새 나는것들은 세탁기로 직행, 안입을옷인데 괜히 아까워서 지금까지 들고 있었던 옷들은 과감히 아름다운 가게로 직행, 그리고 언제 저런 예쁜옷이 있었나 하는 옷들을 보면서 일요일 오후가 행복했네요..

빳빳하게 풀먹여진 흰색 와이셔츠 아니면 옅은 블루색상만 고집한던 내게 언제 저런 컬러풀한 셔츠가 있었는지 모르겠네요..그것도 제가 참으로 좋아하는 BANANA 브랜드~~~.. 기억을 더듬어가다보니..^^
참으로 오래된 옷이긴 하네요..

그런데도 어제 산옷처럼 깨끗하게 보존이 되어있는걸 보니 아마도.. 진짜로 한번도 안 입었나봅니다..

왜그랬을까...ㅋㅋ.. 하여간 오래된 책을 문든 펼쳤는데 만원짜리가 꽂혀있었던 기분이랄까요...

월요일아침 한주 새롭게 시작하고 싶어서 화사한 색상 한번 입어보았답니다...

초상권 침해상.. 얼굴은 비공개 입니다...^^..




: