평균만 보면 놓치는 것들 — '분산'과 '표준편차' 이야기
통계분석 2025. 4. 22. 20:12 |논문 통계 의뢰를 하다 보면, 많은 대학원생분들이 통계 결과를 받아보고 가장 먼저 보는 게 평균(mean) 아닐까 합니다.
예를 들어 이런 거죠.
"우리 샘플의 평균 점수가 3.8이 나왔어요, 교수님!"
그럼 대부분 거기까지만 보고 안심을 하거나 당황하죠.
그런데 사실 평균만 보는 건, 사람 체온을 잴 때 오로지 이마 온도만 측정하는 것과 같아요.
그 순간의 상태만 보여줄 뿐, 그 온도가 의미 있는지, 정상인지, 위태로운지 알려면 다른 지표도 함께 봐야 하거든요.
바로 그게 오늘 이야기할 분산(variance)과 표준편차(standard deviation)입니다
분산은 쉽게 말해, 자료들이 평균에서 얼마나 흩어져 있는지를 알려줘요.
예를 들어 어떤 시험 점수에서 평균이 80점인데, 한 명은 100점, 다른 한 명은 60점이라면
둘 다 평균 80점이지만 이 두 점수의 차이는 크죠.
이럴 때 그 흩어짐 정도를 수치로 보여주는 게 분산입니다
근데 분산은 계산 과정에서 제곱을 해서 값이 좀 커지는 경향이 있어요.
그래서 현실적인 해석을 위해 제곱근을 씌워서 원래 단위로 돌려놓은 것이 표준편차에요.
결국 표준편차는 자료들이 평균을 중심으로 얼마나 고르게 분포해 있는지, 아니면 들쭉날쭉한지보여주는 지표죠.
표준편차가 작으면 자료가 평균 근처에 모여 있다는 뜻이고,
크면 평균에서 많이 흩어져 있다는 뜻이에요.
이게 왜 중요하냐면, 논문에서는 평균 점수만 봐선 절대 안 되는 이유가 여기 있어요.
어떤 두 집단의 평균이 같아도 표준편차가 다르면,
한 집단은 점수가 비슷비슷하고, 다른 집단은 극단적인 점수가 섞여 있을 수 있거든요.
그걸 놓치면 해석이 엉뚱해지고, 논문 지도가 꼬일 수 있어요.
논문에서 가장 많이 사용하는 SPSS 프로그램에서도
[분석] → [기술통계] → [탐색적 데이터 분석]메뉴에서
평균, 표준편차, 분산을 한 번에 볼 수 있어요.
의뢰해주시는 분들 보면 SPSS 기본값만 보고 그냥 넘어가시는 경우 많은데,
이걸 꼭 확인해야 해요.
혹시 지금 본인 논문 데이터에서 평균만 확인하고 계신 분이라면,
오늘 포스팅을 보고 한 번 표준편차와 분산 값도 같이 확인해보세요.
생각보다 재미있는 발견이 있을 거예요.
그리고 만약 데이터 해석이 애매하거나 통계 처리 과정이 복잡하다 싶으면,
언제든 편하게 의뢰 주세요.
20년 가까이 논문통계를 분석해온 사회조사분석사 입장에서
꼼꼼하게 정리해드릴게요.
‘데이터는 수치보다 해석이 중요하다’ 꼭 기억해두세요.