논문을 작성하다 보면 ‘통계’는 더 이상 선택이 아니라 필수가 됩니다.
질적 접근이든 양적 접근이든, 연구의 신뢰도와 타당성을 확보하려면 수치적 근거가 뒷받침되어야 하죠.
그런 의미에서 이번 시리즈는, 사회과학 연구자가 반드시 이해하고 있어야 할 통계의 기본 개념들을 정리해보려 합니다.

통계의 정의

통계(Statistics)는 자료를 수집하고, 정리하며, 분석하여 해석하는 일련의 절차이자 방법론입니다.
사회과학에서의 통계는 단순히 숫자를 다루는 기술이 아니라,
현상을 설명하고 예측 가능한 모델로 일반화하는 도구입니다.

즉, 연구자가 수집한 데이터를 통해

  • 모집단의 특성을 파악하고,
  • 가설을 검증하며,
  • 결론을 도출하는 데 필요한 근거를 제공하는 역할을 합니다.

통계의 두 분류: 기술통계와 추론통계

1. 기술통계 (Descriptive Statistics)

  • 자료의 분포와 특성을 요약하는 단계
  • 평균, 중앙값, 표준편차, 빈도, 백분율 등
  • 복잡한 데이터를 직관적으로 이해할 수 있도록 정리함
  • 예: 표본의 성별 분포, 연령대 평균 등

2. 추론통계 (Inferential Statistics)

  • 표본을 바탕으로 모집단의 특성을 추정하거나 가설을 검정하는 단계
  • t-검정, 분산분석, 회귀분석, 상관분석, 신뢰구간 추정 등
  • 모집단 전체를 조사할 수 없는 상황에서 유의미한 결론을 이끌어내는 데 사용

통계가 필요한 이유

사회과학 연구에서 통계는 단순히 분석 도구가 아닙니다.
연구문제를 수치화하고 검증 가능하게 만드는 '언어'이자, 연구 결과를 일반화할 수 있게 해주는 '근거' 입니다.

다음과 같은 이유로 통계는 필수적입니다:

  • 현상의 정량적 설명: 이론적 개념을 수치로 표현 가능
  • 일반화 가능성 확보: 표본으로부터 모집단을 추론
  • 가설의 검정: 주관이 아닌 데이터에 기반한 결론 도출

주요 용어 정리

용어 정의

데이터(Data) 관찰이나 측정을 통해 얻은 값
모집단(Population) 연구 대상이 되는 전체 집단
표본(Sample) 모집단 중에서 실제로 조사한 집단
모수(Parameter) 모집단의 특성치를 나타내는 값
통계량(Statistic) 표본의 특성을 나타내는 값

이 중에서 모수(parameter)와 통계량(statistic)의 개념은 내일 좀 더 자세히 다룰 예정입니다.


마무리하며

많은 연구자들이 통계를 “분석 단계에서만 쓰는 기술”로 인식하곤 하지만,
사실 통계는 연구 설계 단계에서부터 최종 해석에 이르기까지 전 과정에 영향을 미치는 핵심 도구입니다.

오늘은 서론에 해당하는 기본 개념을 정리했고,
다음 포스팅에서는 통계 분석에서 가장 자주 혼동되는 개념 중 하나인
모수(parameter)와 통계량(statistic)의 차이를 주제로 이어가겠습니다.

논문통계 관련하여 상담이 필요하시면 댓글이나 이메일  chsoo.lee@gmail.com 으로 연락주세요 (이메일 답변이 더 빠릅니다)



좋은 아침입니다.

올해 초로 기억됩니다. 통계강의를 마칠무렵에 질문을 받는데


" 선생님도 사회조사분석사 자격증이 있나요 ?"


...... 순간 뭐라 대답을 해야 하는건지.. 그거 없어도 통계분석 할수 있어요.. 라고 해야 하는건지 .. 아직 못 땃다고 해야하는건지...


뭐 숨길수는 없고..


"없습니다.. 아직 딸 생각을 못했네요"


그러고 나서 강의를 마치고 돌아가는 길에 곰곰히 생각을 해봤습니다. 그 자격증 없이도 10여년을 잘 하고 있는데 꼭 있어야 할까 ? 다시 또 누군가가 물어보면 뭐라 해야 할까 ? 


그럼.. 따보자... 라는 마음으로 산업인력공단의 문을 두드립니다. 근 13년전 조리사 자격증을 따보자고 공단 문을 두드린후 처음 입니다. 물론 그당시 한식와 양식을 자격증을 따고 엄청나게 좋아했으나 실상은 집에서 취미로 요리를 하고 있다는것.


만만하게 보았던 시험은 그리 넉넉하지가 않더라구요. 1차 시험, 필답형, 작업형 총 3단계로 이루어져 있는 시험인데 필기시험과목에 3과목인가 되었던것 같습니다. 조사방법같은경우는 나름 잘 안다고 했는데 기출 문제를 보니까 헷갈려서 다시 공부를 해야 했답니다. 더 문제는 사회통계 .. 그간 통계 계산을 SPSS가 해주었지 제가 계산기로 푼적은 없던지라 이분야도 처음 계산기를 들고 공식 외워가면서 공부했네요.


1차시험당일 즉, 필기시험당일, 예상한대로 조사방법론은 무던히 풀었는데, 사회통계는 영 머리가 안돌더군요. 바로 가답안을 준다고 하고, 시험지도 가지고 나가게 하니 채점을 해보면 바로 나올텐데, 이놈의 새가슴 그냥 결과 기다리자고 해놓고, 1주일만에 채점을 해봅니다..ㅋㅋ 떨리는 마음에 동그라미와 사선을 번갈아가면서 그은 결과..


사회통계가 의외로 높은점수가 나왔네요...다행이 합격이네요


그리고 지난 4월 중순 필답형을 보러 갔는데. 이것도 참 헷갈리더라구요. 책에서 본 내용이 기억이 안나서 그냥 지금까지 공부했던 나만으 내용으로 서술하였습니다. 필답형이니 단답형으로 쓰면 성의가 없을것 같아 대학원 이후 처음으로 서술을 길게 써내려 갔습니다. 


이제 마지막 관문 4월말에 본 작업형 시험의 경우는 문제는 제 입장에서 참 쉬웠지만, 함정이 너무 많습니다.즉, 1번에서 변수설정을 잘못해버리면 시험 망치는것과 다름이 없을것입니다. 저도 그런 함정에 하나 빠져서 아.. 떨어지는구나 했는데. 다행이 필답과 작업의 경우는 과락이 없어서 둘중의 하나만 잘봐도 되는것 같습니다.


결과는 필답의 점수가 높게 나와서 작업의 실수를 만회하여 최종합격을 하였네요.그 결과 나오는데도 한달이 걸려서 지난 5월30일 발표를 했네요.


나름 뿌듯하기도 하고, 공부를 좀더 해야겠다는 생각도 들었던 기회였습니다. 







얼핏 기능이 교차분석하고 비슷할것 같기도 합니다.


데이터를 통합하는 기능입니다.


SPSS 기능에서는 데이터 통합을 사용하시면 됩니다.





그룹별 점수 및 N 수를 계산합니다. 기능에 따라서는 새로운 파일로 생성도 가능합니다.


관련된 문의사항은 chsoo.lee@gmail.com 으로 언제든지 문의주세요