통계분석

논문에서 많이 사용하는 대응표분분석 [사전 사후분석]

나를보는나 2025. 5. 7. 11:42

대응표본 t검정은 통계분석 중에서 꽤 자주 등장합니다.
특히 사전-사후 설계(pre-post design), 또는 동일한 집단을 두 조건에서 비교할 때 주로 사용되지요.
예를 들어, 한 집단의 스트레스 수준을 프로그램 전과 후에 비교한다든가, 동일한 참가자가 두 제품을 사용했을 때 만족도를 비교하는 경우처럼 말입니다.

이 분석은 '같은 사람'에게서 나온 두 관측값 간의 차이를 비교하는 것이기 때문에,
독립표본 t검정과는 다르게 개인 간 차이를 제거하고 순수한 조건 간 차이에 집중할 수 있다는 장점이 있습니다.
하지만 이 분석이 쉬워 보인다고 해서 항상 간단하게 넘어갈 수 있는 건 아닙니다.

우선 기본적으로 데이터는 쌍을 이루고 있어야 합니다.
두 시점 혹은 두 조건이 같은 대상에게서 측정된 것이어야 하지요.
만약 누락된 값이 많아 대응이 성립되지 않는다면, 분석에 포함할 수 없습니다.
(논문 데이터셋 정리에서 종종 빠뜨리는 부분이기도 합니다.)

그리고 또 하나, 대응표본 t검정도 차이값의 정규성이라는 전제를 가지고 있습니다.
많은 연구자들이 이 부분을 간과하는데요,
단순히 두 시점의 데이터가 정규분포인지 보는 것이 아니라,
‘두 값의 차이’를 구해서 그 차이의 분포가 정규성을 띠는지를 봐야 합니다.
SPSS에서는 이때 ‘탐색적 데이터 분석’ 기능이나 Kolmogorov-Smirnov 검정을 통해 확인할 수 있죠.

실제로 통계 분석 의뢰를 받다 보면, 대응표본 t검정을 적용하면서도
차이값 정규성 검정을 거치지 않은 경우가 많습니다.
이 조건이 충족되지 않으면, 평균의 차이에 대해 신뢰성 있는 결론을 내릴 수 없습니다.
이럴 경우에는 대응표본 t검정 대신 윌콕슨 부호순위검정(Wilcoxon signed-rank test) 같은 비모수 검정을 사용하는 것이 더 적절할 수 있습니다.

또 하나, 유의한 차이가 있다는 것이 곧 현실적으로 중요한 차이를 의미하는 건 아닙니다.
통계적으로는 p값이 0.05 아래로 떨어졌지만, 평균 차이가 크지 않다면 해석에 신중해야 합니다.
논문 심사에서 이 부분—통계적 유의성과 실제적 의미의 구분—을 꼼꼼하게 짚는 교수님들도 많습니다.

한 마디로, 대응표본 t검정은 구조상 간단해 보여도
데이터 구조와 가정 확인, 해석의 균형까지 챙겨야 제대로 된 분석입니다.
숫자 하나로 결론을 내리기보다는, 그 뒤에 숨은 조건들을 성실히 확인하는 태도가 연구의 신뢰도를 좌우합니다.

분석을 준비 중이시라면, 단순히 “두 시점 비교니까 t검정”이라는 식으로 접근하기보다는
자료의 구조와 전제를 면밀히 살펴보는 과정이 꼭 필요합니다.
이런 부분에 대해 더 깊이 점검이 필요하시다면, 같이 검토해드릴 수 있습니다.
분석은 빠르게도 할 수 있지만, 신중하게 할 때 훨씬 오래 갑니다.


통계분석만 20년째 하고 있는 사회조사분석사 입니다.

통계문의 chsoo.lee@gmail.com 

댓글보다는 메일로 주시면 답변이 가장 빠릅니다.