논문 통계분석의 첫 단추 — 변수의 척도
통계분석 2025. 4. 14. 19:00 |논문을 분석하다 보면 많은 분들이 "이 변수는 어떤 통계분석을 써야 하나요?"라는 질문을 가장 많이 하십니다. 그런데 정작 그보다 더 먼저 점검해야 할 게 있어요. 바로 그 변수가 어떤 척도로 측정되었는가입니다.
우리가 연구에서 다루는 모든 변수는 사실 네 가지 범주 중 하나에 속해요. 명목척도, 서열척도, 등간척도, 비율척도. 이걸 구분하지 않으면, 분석 방법을 고르는 것도, 해석을 하는 것도 모두 엉켜버릴 수밖에 없습니다.
예를 들어볼까요?
만약 '성별'이라는 변수를 가지고 있다면, 이건 남/여로 나뉘는 단순한 분류예요. 이를 '명목척도'라고 하죠. 숫자를 부여해도 그건 그저 코드일 뿐, 1이 2보다 크거나 작다는 의미는 없어요. 그런데 '만족도'처럼 ‘만족’, ‘보통’, ‘불만족’으로 순위를 매기는 변수는 또 다릅니다. 이건 순서가 있어요. 누군가 ‘매우 만족’을 선택했다면, ‘보통’보다는 만족도가 높다는 걸 알 수 있으니까요. 하지만 그 간격이 같은지는 알 수 없죠. 그래서 이걸 '서열척도'라고 합니다.
그런데 여기서 '온도'나 'IQ'처럼 값의 간격이 일정한 변수는 또 다른 문제예요. 20도와 30도는 10도의 차이가 있지만, 절대적인 0이 없으니까 20도가 10도의 두 배라고 할 순 없습니다. 이걸 '등간척도'라고 해요. 마지막으로 ‘키’, ‘몸무게’, ‘소득’처럼 0이 존재하고, 간격도 같고, 비율 개념까지 성립하는 건 ‘비율척도’죠. 180cm는 90cm의 두 배입니다.
이걸 왜 이렇게 강조하냐면, SPSS로 분석할 때 변수의 척도에 따라 쓸 수 있는 분석 방법이 완전히 달라지기 때문이에요.
성별 같은 명목척도를 가지고 평균을 구할 수는 없잖아요. 마찬가지로 비율척도를 가지고 단순 빈도만 보는 것도 분석의 깊이를 얕게 만드는 거고요.
그리고 또 하나.
SPSS에서는 'Variable View'에서 'Measure' 항목을 보면 Nominal, Ordinal, Scale이렇게 3가지로 설정하게 돼 있어요. 문제는 SPSS에서는 등간척도와 비율척도를 그냥 'Scale'로 묶어버린다는 거죠. 그러니 연구자는 반드시 데이터와 설문 문항을 다시 들여다보면서 이 변수가 진짜로 어떤 척도인지, 분석에 따라 어떻게 구분하고 해석할지를 따져봐야 합니다.
실제로 통계 분석을 의뢰하러 오는 분들 중 절반 이상은 이 기본 정리가 안 된 상태로 오세요. 변수의 척도를 잘못 설정해 분석을 진행하면 결과가 엉뚱하게 나오고, 논문 심사에서 바로 지적받죠. 그리고 그때 다시 처음으로 돌아가야 합니다. 시간도, 마음도 지치기 전에 이 부분을 확실히 점검하는 게 논문 통계의 핵심이에요.
제가 20년 넘게 논문 통계를 하면서 느낀 건, 통계분석의 복잡함보다 척도의 개념을 잘못 이해한 게 더 큰 문제를 일으킨다는 겁니다.
만약 지금 논문을 준비하고 있다면, 혹은 SPSS 데이터파일을 열어두었다면, 오늘 이 글을 계기로 변수 하나하나의 척도를 점검해보세요.
모호하다 싶으면 언제든 저에게 편하게 문의주셔도 좋아요. 데이터만 보내지 말고, 측정방식이나 문항 내용도 함께 알려주시면 훨씬 정확한 분석을 도와드릴 수 있습니다.
이런 작은 정리가 논문의 완성도를 좌우합니다.
오늘은 변수 척도의 중요성에 대해 함께 정리해봤고, 내일은 이 척도에 따라 사용할 수 있는 분석방법을 사례와 함께 소개해보겠습니다.
통계문의는 chsoo.lee@gmail.com 으로 연락주세요 !