기초통계 #5 — 변수와 척도의 종류, 그 헷갈림의 끝 [논문통계]
통계분석 2025. 4. 16. 09:22 |논문 통계 분석을 하다 보면 대학원생 분들께 가장 많이 받는 질문이 있어요.
"이 변수는 어떤 척도로 봐야 하나요?"
그리고 대부분은 ‘그게 뭐였더라...’ 하는 표정을 지으시죠.
사실 척도(scale)란 게 별건 아닙니다. 우리가 어떤 개념이나 현상을 수치화해서 표현할 때, 그 수치가 갖는 의미와 성격을 구분해놓은 체계거든요. 예를 들어볼게요.
누군가의 성별을 조사한다면 '남자', '여자' 라는 값에는 크고 작음이 없죠. 그냥 구분만 되는 거예요. 이런 걸 명명척도(명목척도, Nominal scale)라고 합니다.
반면, 학년이나 직급처럼 순서를 매길 수 있는 경우가 있죠. 1학년, 2학년, 3학년... 이건 순서가 있지만 1학년과 2학년의 차이와 3학년과 4학년의 차이가 같다고는 할 수 없잖아요. 이런 걸 서열척도(Ordinal scale)라고 부릅니다.
조금 더 나가볼까요?
온도나 점수처럼 숫자 간 간격이 일정하고, 덧셈과 뺄셈이 가능한 경우가 있어요. 예를 들어 20도와 30도의 차이와 30도와 40도의 차이는 같죠. 하지만 0도가 ‘없음’을 의미하진 않잖아요. 그래서 이건 등간척도(Interval scale)예요.
마지막으로 몸무게, 키, 수입 같은 건 비율척도(Ratio scale)라고 해요. 0이 절대적인 의미를 갖고, 비율 계산도 가능합니다. 0kg은 아무것도 없는 상태니까요.
이걸 왜 알아야 할까요?
척도의 종류에 따라 적용할 수 있는 통계분석이 달라지거든요.
명목척도 변수엔 빈도분석이나 카이제곱검정을, 등간척도 이상이면 t검정, ANOVA 같은 분석을 쓸 수 있는 식이죠. 그래서 논문에서 변수의 척도를 잘못 설정하면 분석 자체가 엉뚱한 방향으로 가기도 해요.
논문에서 변수마다 이 척도를 정리해두면, 그걸 바탕으로 어떤 분석기법을 써야 하는지 명확해집니다. 그리고 이걸 헷갈려서 분석방식이 잘못되면 논문 심사 때 반드시 지적받게 되어 있죠.
실제로 얼마 전에도, 한 석사과정 학생분이 오셔서 ‘독립표본 t검정’을 했다고 하는데 변수 척도를 보니 명목척도라 분석법부터 다시 잡아드린 일이 있었어요. 이런 부분에서 논문컨설팅을 의뢰하시는 분들이 많고, 저도 그런 사례를 많이 다뤄왔습니다.
혹시 지금 논문에 쓸 변수와 분석법이 애매하다 싶다면, 척도를 정리해보는 것부터 시작해보세요. 그리고 필요하면 언제든 저에게 상담 주세요. 20년 넘게 논문통계만 해온 경험으로, 가장 적절한 분석설계를 함께 잡아드릴 수 있습니다.
논문 통계 분석은 결국 변수와 척도를 제대로 설정하는 데서 절반이 결정됩니다.
그거 하나만 잘 잡아도 분석 속도가 확 줄어요.
만약 지금 보고 계신 연구 설계나 변수 목록에서 이 부분이 고민된다면, 언제든 편하게 연락 주세요. 20년 동안 대학원생 분들의 논문 통계 분석을 함께 해온 경험으로, 딱 맞는 방향 잡아드릴게요.
논문통계관련 상담문의는 chsoo.lee@gmail.com 입니다. ~