논문 통계 분석을 하다 보면 대학원생 분들께 가장 많이 받는 질문이 있어요.
"이 변수는 어떤 척도로 봐야 하나요?"
그리고 대부분은 ‘그게 뭐였더라...’ 하는 표정을 지으시죠.

사실 척도(scale)란 게 별건 아닙니다. 우리가 어떤 개념이나 현상을 수치화해서 표현할 때, 그 수치가 갖는 의미와 성격을 구분해놓은 체계거든요. 예를 들어볼게요.

누군가의 성별을 조사한다면 '남자', '여자' 라는 값에는 크고 작음이 없죠. 그냥 구분만 되는 거예요. 이런 걸 명명척도(명목척도, Nominal scale)라고 합니다.

반면, 학년이나 직급처럼 순서를 매길 수 있는 경우가 있죠. 1학년, 2학년, 3학년... 이건 순서가 있지만 1학년과 2학년의 차이와 3학년과 4학년의 차이가 같다고는 할 수 없잖아요. 이런 걸 서열척도(Ordinal scale)라고 부릅니다.

조금 더 나가볼까요?
온도점수처럼 숫자 간 간격이 일정하고, 덧셈과 뺄셈이 가능한 경우가 있어요. 예를 들어 20도와 30도의 차이와 30도와 40도의 차이는 같죠. 하지만 0도가 ‘없음’을 의미하진 않잖아요. 그래서 이건 등간척도(Interval scale)예요.

마지막으로 몸무게, 키, 수입 같은 건 비율척도(Ratio scale)라고 해요. 0이 절대적인 의미를 갖고, 비율 계산도 가능합니다. 0kg은 아무것도 없는 상태니까요.

이걸 왜 알아야 할까요?
척도의 종류에 따라 적용할 수 있는 통계분석이 달라지거든요.
명목척도 변수엔 빈도분석이나 카이제곱검정을, 등간척도 이상이면 t검정, ANOVA 같은 분석을 쓸 수 있는 식이죠. 그래서 논문에서 변수의 척도를 잘못 설정하면 분석 자체가 엉뚱한 방향으로 가기도 해요.

논문에서 변수마다 이 척도를 정리해두면, 그걸 바탕으로 어떤 분석기법을 써야 하는지 명확해집니다. 그리고 이걸 헷갈려서 분석방식이 잘못되면 논문 심사 때 반드시 지적받게 되어 있죠.

실제로 얼마 전에도, 한 석사과정 학생분이 오셔서 ‘독립표본 t검정’을 했다고 하는데 변수 척도를 보니 명목척도라 분석법부터 다시 잡아드린 일이 있었어요. 이런 부분에서 논문컨설팅을 의뢰하시는 분들이 많고, 저도 그런 사례를 많이 다뤄왔습니다.

혹시 지금 논문에 쓸 변수와 분석법이 애매하다 싶다면, 척도를 정리해보는 것부터 시작해보세요. 그리고 필요하면 언제든 저에게 상담 주세요. 20년 넘게 논문통계만 해온 경험으로, 가장 적절한 분석설계를 함께 잡아드릴 수 있습니다.

논문 통계 분석은 결국 변수와 척도를 제대로 설정하는 데서 절반이 결정됩니다.
그거 하나만 잘 잡아도 분석 속도가 확 줄어요.
만약 지금 보고 계신 연구 설계나 변수 목록에서 이 부분이 고민된다면, 언제든 편하게 연락 주세요. 20년 동안 대학원생 분들의 논문 통계 분석을 함께 해온 경험으로, 딱 맞는 방향 잡아드릴게요.

논문통계관련 상담문의는 chsoo.lee@gmail.com 입니다. ~



논문을 분석하다 보면 많은 분들이 "이 변수는 어떤 통계분석을 써야 하나요?"라는 질문을 가장 많이 하십니다. 그런데 정작 그보다 더 먼저 점검해야 할 게 있어요. 바로 그 변수가 어떤 척도로 측정되었는가입니다.
우리가 연구에서 다루는 모든 변수는 사실 네 가지 범주 중 하나에 속해요. 명목척도, 서열척도, 등간척도, 비율척도. 이걸 구분하지 않으면, 분석 방법을 고르는 것도, 해석을 하는 것도 모두 엉켜버릴 수밖에 없습니다.
예를 들어볼까요?
만약 '성별'이라는 변수를 가지고 있다면, 이건 남/여로 나뉘는 단순한 분류예요. 이를 '명목척도'라고 하죠. 숫자를 부여해도 그건 그저 코드일 뿐, 1이 2보다 크거나 작다는 의미는 없어요. 그런데 '만족도'처럼 ‘만족’, ‘보통’, ‘불만족’으로 순위를 매기는 변수는 또 다릅니다. 이건 순서가 있어요. 누군가 ‘매우 만족’을 선택했다면, ‘보통’보다는 만족도가 높다는 걸 알 수 있으니까요. 하지만 그 간격이 같은지는 알 수 없죠. 그래서 이걸 '서열척도'라고 합니다.
그런데 여기서 '온도'나 'IQ'처럼 값의 간격이 일정한 변수는 또 다른 문제예요. 20도와 30도는 10도의 차이가 있지만, 절대적인 0이 없으니까 20도가 10도의 두 배라고 할 순 없습니다. 이걸 '등간척도'라고 해요. 마지막으로 ‘키’, ‘몸무게’, ‘소득’처럼 0이 존재하고, 간격도 같고, 비율 개념까지 성립하는 건 ‘비율척도’죠. 180cm는 90cm의 두 배입니다.
이걸 왜 이렇게 강조하냐면, SPSS로 분석할 때 변수의 척도에 따라 쓸 수 있는 분석 방법이 완전히 달라지기 때문이에요.
성별 같은 명목척도를 가지고 평균을 구할 수는 없잖아요. 마찬가지로 비율척도를 가지고 단순 빈도만 보는 것도 분석의 깊이를 얕게 만드는 거고요.
그리고 또 하나.
SPSS에서는 'Variable View'에서 'Measure' 항목을 보면 Nominal, Ordinal, Scale이렇게 3가지로 설정하게 돼 있어요. 문제는 SPSS에서는 등간척도와 비율척도를 그냥 'Scale'로 묶어버린다는 거죠. 그러니 연구자는 반드시 데이터와 설문 문항을 다시 들여다보면서 이 변수가 진짜로 어떤 척도인지, 분석에 따라 어떻게 구분하고 해석할지를 따져봐야 합니다.
실제로 통계 분석을 의뢰하러 오는 분들 중 절반 이상은 이 기본 정리가 안 된 상태로 오세요. 변수의 척도를 잘못 설정해 분석을 진행하면 결과가 엉뚱하게 나오고, 논문 심사에서 바로 지적받죠. 그리고 그때 다시 처음으로 돌아가야 합니다. 시간도, 마음도 지치기 전에 이 부분을 확실히 점검하는 게 논문 통계의 핵심이에요.
제가 20년 넘게 논문 통계를 하면서 느낀 건, 통계분석의 복잡함보다 척도의 개념을 잘못 이해한 게 더 큰 문제를 일으킨다는 겁니다.
만약 지금 논문을 준비하고 있다면, 혹은 SPSS 데이터파일을 열어두었다면, 오늘 이 글을 계기로 변수 하나하나의 척도를 점검해보세요.
모호하다 싶으면 언제든 저에게 편하게 문의주셔도 좋아요. 데이터만 보내지 말고, 측정방식이나 문항 내용도 함께 알려주시면 훨씬 정확한 분석을 도와드릴 수 있습니다.
이런 작은 정리가 논문의 완성도를 좌우합니다.
오늘은 변수 척도의 중요성에 대해 함께 정리해봤고, 내일은 이 척도에 따라 사용할 수 있는 분석방법을 사례와 함께 소개해보겠습니다.

통계문의는 chsoo.lee@gmail.com 으로 연락주세요 !



 

📊  논문에서 통계를 다룰 때 가장 먼저 정리해야 할 개념이 있습니다.
바로 **기술통계(Descriptive Statistics)**와 **추론통계(Inferential Statistics)**의 구분입니다.

두 가지는 전혀 다른 목적을 가진 통계이며, 사용되는 분석방법도 완전히 다릅니다.


✅ 기술통계(Descriptive Statistics): "지금 가진 자료를 요약한다"

기술통계는 말 그대로 현재 확보된 데이터를 요약, 정리하는 데 목적이 있습니다.

  • 예: 평균, 표준편차, 중앙값, 빈도수, 백분율 등
  • 목적: 표본 데이터 자체의 특성을 파악하기 위함

📌 SPSS에서는 어떻게?
분석 → 기술통계 → 빈도 / 기술통계 / 탐색 메뉴에서 확인 가능.
논문에서는 표 1. 대상자의 일반적 특성 등에 해당하는 내용이 기술통계입니다.


✅ 추론통계(Inferential Statistics): "표본을 통해 전체를 추론한다"

추론통계는 표본 데이터를 바탕으로 모집단 전체에 대한 결론을 도출하려는 분석입니다.
즉, 검정, 예측, 일반화의 목적을 가지고 있습니다.

  • 예: t-test, ANOVA, 상관분석, 회귀분석, 카이제곱검정 등
  • 목적: 특정 가설을 검정하고, 표본 결과를 통해 전체를 추론

📌 SPSS에서는 어떻게?
분석 → 평균비교 / 일반선형모형 / 회귀분석 / 상관분석 등 다양한 메뉴를 통해 실행.
논문의 가설검정, 즉 결과 분석 파트가 바로 이 추론통계입니다.


🔍 핵심 구분 요약

구분 기술통계 추론통계

목적 요약/정리 추론/검정
분석 대상 수집된 자료 자체 모집단에 대한 일반화
SPSS 예시 평균, 빈도, 표준편차 t검정, ANOVA, 회귀 등
논문 위치 대상자 특성 기술 가설 검정 결과

📌 실전 팁

“분석을 시작할 때 기술통계는 반드시 선행되어야 합니다.”
데이터의 분포나 기본 특성을 이해하지 않은 채 가설검정을 진행하는 건,
기초 없이 건물을 올리는 것과 같기 때문입니다.

 

좋은 논문결과 나오기를 바라며 궁금하시거나 문의사항은 언제든지 chsoo.lee@gmail.com 으로 메일 주세요. 



 

논문을 작성하다 보면 ‘통계’는 더 이상 선택이 아니라 필수가 됩니다.
질적 접근이든 양적 접근이든, 연구의 신뢰도와 타당성을 확보하려면 수치적 근거가 뒷받침되어야 하죠.
그런 의미에서 이번 시리즈는, 사회과학 연구자가 반드시 이해하고 있어야 할 통계의 기본 개념들을 정리해보려 합니다.

통계의 정의

통계(Statistics)는 자료를 수집하고, 정리하며, 분석하여 해석하는 일련의 절차이자 방법론입니다.
사회과학에서의 통계는 단순히 숫자를 다루는 기술이 아니라,
현상을 설명하고 예측 가능한 모델로 일반화하는 도구입니다.

즉, 연구자가 수집한 데이터를 통해

  • 모집단의 특성을 파악하고,
  • 가설을 검증하며,
  • 결론을 도출하는 데 필요한 근거를 제공하는 역할을 합니다.

통계의 두 분류: 기술통계와 추론통계

1. 기술통계 (Descriptive Statistics)

  • 자료의 분포와 특성을 요약하는 단계
  • 평균, 중앙값, 표준편차, 빈도, 백분율 등
  • 복잡한 데이터를 직관적으로 이해할 수 있도록 정리함
  • 예: 표본의 성별 분포, 연령대 평균 등

2. 추론통계 (Inferential Statistics)

  • 표본을 바탕으로 모집단의 특성을 추정하거나 가설을 검정하는 단계
  • t-검정, 분산분석, 회귀분석, 상관분석, 신뢰구간 추정 등
  • 모집단 전체를 조사할 수 없는 상황에서 유의미한 결론을 이끌어내는 데 사용

통계가 필요한 이유

사회과학 연구에서 통계는 단순히 분석 도구가 아닙니다.
연구문제를 수치화하고 검증 가능하게 만드는 '언어'이자, 연구 결과를 일반화할 수 있게 해주는 '근거' 입니다.

다음과 같은 이유로 통계는 필수적입니다:

  • 현상의 정량적 설명: 이론적 개념을 수치로 표현 가능
  • 일반화 가능성 확보: 표본으로부터 모집단을 추론
  • 가설의 검정: 주관이 아닌 데이터에 기반한 결론 도출

주요 용어 정리

용어 정의

데이터(Data) 관찰이나 측정을 통해 얻은 값
모집단(Population) 연구 대상이 되는 전체 집단
표본(Sample) 모집단 중에서 실제로 조사한 집단
모수(Parameter) 모집단의 특성치를 나타내는 값
통계량(Statistic) 표본의 특성을 나타내는 값

이 중에서 모수(parameter)와 통계량(statistic)의 개념은 내일 좀 더 자세히 다룰 예정입니다.


마무리하며

많은 연구자들이 통계를 “분석 단계에서만 쓰는 기술”로 인식하곤 하지만,
사실 통계는 연구 설계 단계에서부터 최종 해석에 이르기까지 전 과정에 영향을 미치는 핵심 도구입니다.

오늘은 서론에 해당하는 기본 개념을 정리했고,
다음 포스팅에서는 통계 분석에서 가장 자주 혼동되는 개념 중 하나인
모수(parameter)와 통계량(statistic)의 차이를 주제로 이어가겠습니다.

논문통계 관련하여 상담이 필요하시면 댓글이나 이메일  chsoo.lee@gmail.com 으로 연락주세요 (이메일 답변이 더 빠릅니다)



결론부터 말씀드리고 시작하겠습니다. 챗지피티에게 통계분석 여부를 물어보니 아래와 같이 답변을 하였습니다.

[SPSS를 직접 사용하여 통계 분석을 수행할 수는 없지만, SPSS로 통계 분석을 수행하는 방법에 대한 안내와 분석 절차를 제공할 수 있습니다. 예를 들어, SPSS에서 데이터 입력, 회귀 분석, t-검정, ANOVA, 카이제곱 검정 등의 분석을 어떻게 진행할지에 대한 방법을 설명하거나, 관련된 SPSS 명령어와 절차를 안내할 수 있습니다.

데이터나 분석 목표에 대해 더 구체적으로 말씀해 주시면, SPSS에서 그 분석을 어떻게 설정하고 실행할 수 있는지 자세히 설명해 드릴 수 있습니다!] 

요즘은 논문통계 의뢰주시는 분들이 일단 챗지피티에게 많은 부분을 도움을 받고 저에게 메일을 보내주세요. 그러다 보니 어느 면에서는 소통이 빨리 되는 부분도 있지만, 반대로 챗지피티를 너무 맹신을 하시는 경우 진척이 안 되는 경우가 있습니다. 

논문통계는 단순하게 통계결과만 내보내는게 아닙니다. 1+2=3이라는 답을 내놓고 사회과학에서 왜 이럴 수밖에 없는가를 추론을 해야 합니다. 이 또한 지피티가 할 수도 있겠지만 제가 경험한 바로는 그저 긁어내는 답변을 위주로 하는 것 같습니다. 그도 그럴 것이 챗지피티는 새로운 것을 창조하는 게 아니라 기존의 데이터를 긁어모으는 경향이 크기 때문입니다.

예를 들어서 논문통계에 있어서 회귀분석을 하는데 영향력이 유의하게 나왔다고 가정했을 때, 이를 통한 분석결과와 시사점을 물어보니 전혀 엉뚱한 대답을 하는 경우가 부지기수였습니다. 그래서 전문적인 단어를 포함해서 다시 물어보니 조금 수정은 되었지만 여전히 논문에 올릴 만큼의 해석이나 답변은 아니었습니다.

엑셀로 데이터를 주면 일부 분석을 해주기도 하지만, 아직까지 논문통계를 전문으로 할만큼 (특히나 SPSS SAS는 못한다고 고백을 하였습니다)  지피티가 능력이 되지는 않습니다. 뭐 돈을 주고 고급버전을 사면 어떤 결과가 나올지는 모르겠지만, 그 비용으로 통계를 의뢰하는 것이 아직까지는 현명한 판단이 아닐까 합니다. 

아시다시피 논문은 일생에 한두번이고 (학위를 종류별로 취득할게 아니라면요) 서초동의 국립도서관에 내가 죽어도 남는 자료입니다. 그러니 너무 쉽게만 생각지 않으셨으면 하는 바람입니다. 

논문통계 진행하시다가 막히는점이나 궁금하신 점 언제든 문의하셔도 좋습니다. 아직까지는 제가 지피티보다 유연한 답을 드릴 수 있을 것 같습니다.

통계분석만 20년째 하고 있는 사회조사분석사 입니다.

통계문의 chsoo.lee@gmail.com 

댓글보다는 메일로 주시면 답변이 가장 빠릅니다. 



통계분석을 시작하면서 구입했던 SPSS 12.0 을 이제 보내주려 합니다. 사실 기능상에는 문제가 없습니다만 그걸 담고 있는 윈도우 10.0 노트북이 문제입니다. 켜지는데 대략 20분, 인터넷 클릭하면 대략 10분, 그러다 갑자기 모래시계와 무한로딩이 걸리네요. 그 과정을 거치고 들어가면 분석은 여전히 잘 되는데, 사실 요즘 논문에 SPSS 12.0 사용했다고 하면 왜 이리 오래된거를 쓰느냐 결과에 문제 있는거 아니냐는 등의 이의를 받곤 합니다만 그럴 일은 사실 없습니다. 계산기가 처음 나올때 1+1 =2 였듯이 지금 최신 계산기로 1+1 를 눌려봐도 결과는 2 입니다. 다만 저에게 일을 주시는 입장에서는 충분히 그럴수 있다는 판단을 하였습니다. 

몇년전에 구입한 맥북은 저에게 최대의 만족을 주고 있으며, 이번 SPSS 구입은 당연하게도 SPSS MAC 전용 26.0 버전을 구매하였습니다. 최신버전은 30.0 도 나온듯한걸로 보이는데 거기까지는 필요없고, 미국 사이트에서 약간은 디스카운트 된 가격으로 구매를 하였습니다. 아마 학생이시면 더 할인이 될듯 보이기도 합니다. 

제가 맥북을 좋아하는 이유중 하나는 다들 그러하시겠지만 뚜껑열고 바로 일하고 바로 닫고 하는 작업의 편리성 때문입니다. 물론 윈도우 노트북도 처음엔 그러하였습니다만 왜 시간이 갈수록 그렇게 오픈을 힘들게 하는지 모르겠습니다. 일 시작하려다가 진이 다빠진 정도입니다. 주변 지인들 말로는 요즘은 윈도우도 빨라지고 했다는데, 이미 애플빠가 된 이상 MAC 전용으로 구매를 하였습니다. 

SPSS MAC 26.0

설치를 하고 예전 데이터를 불러왔는데 이 부분이 잘 안되네요. 신규 데이터는 분석이 잘 되네요. 어차피 과거 데이터는 용량만 차지하고 어느정도 지나면 삭제해 버리니 이제부터는 SPSS MAC 26.0 으로 분석을 해드리겠습니다. 

이번 프로그램으로 가장 먼저 분석이 들어가는 곳은 모관공서의 고객만족도 및 직원만족도 분석입니다. 관공서나 기업체 분석은 분석이 어려운것은 아닌데 분석양이 방대하고, 모수가 엄청나게 많으며, 편집에 공을 들여야 합니다. 그래도 이런 시기에 일할수 있다는 점에 감사하는 마음으로 열심히 연말 일을 해보겠습니다.

논문통계 및 논문전체컨설팅, 기업체 마케팅 통계관련 문의는 언제든 chsoo.lee@gmail.com 으로 메일주세요. 댓글은 잘 못봅니다.

카카오톡 오픈채팅방도 열려 있습니다. https://open.kakao.com/o/scnzTdzf



현재는 2020년 9월 입니다. 아래의 업데이트 글을 또 쓴게 벌써 2년이 넘어가는듯 합니다. 


그간 많은 일이 있었지만, 지금처럼 코로나때문에 힘들줄은 아래 글을 쓸때는 미처 몰랐을겁니다. 


그래도 학교는 돌아가고, 학위는 여전히 진행을 하더군요. 지난 학기 학위 심사를 비대면으로 한다고 해서 좀 쉬울줄 알았는데, 더 어려워 졌다는 이야기도 있고요. 


여전히 문의 주시는 분들께 감사드리며, 현재도 진행을 하고 있습니다. 단지, 코로나가 끝나는 시점까지 저도 약간의 논문 통계비용을 인하하려고 합니다. 비용은 항상 말씀드리지만 통계의 양질에 따라 달라집니다. 문의는 언제든지 주시면 됩니다. 


chsoo.lee@gmail.com 이쪽으로 메일 주세요 확인하는대로 연락드립니다.


------------------------------


2018년도 이제 마무리 단계네요


티스토리에 논문통계 관련하여 글을 처음 올린게 언 10년이 다 되어 갑니다. 


회사를 다니면서 부업으로 해보자고 시작 하였던게 여전히 지금도 부업이 되고 있습니다.


본업으로 하시는분들이 많아 지면서, 글을 조금 자제하게 되었습니다. 같이 살아야 하니까요


기존에 의뢰 주셨던 분들이 그저 소개로 연결을 해주시는 일이 주가 되었네요




그분들의 첫 물음이 “아직도 통계분석 하시나요 ?” 를 여전히 물어보세요.


블로그에 업데이트가 안되서 그런가 봅니다. 


애초에 첫 글에도 올렸듯이 단 한분이라도 찾으신다면 해야지요. 


http://gofood.tistory.com/148?category=212166




위의 글이 첫 올린글이고 업데이트가 2015년에서 멈추었네요 ^^ 여전히 작업들을 하고있었습니다.


여전히 가격, 비용이 가장 궁금하실겁니다만, 이는 내용을 잘 살펴보고 서로 의견 조율후에 책정이 됩니다.


그저 새우깡 팔듯이, 이건 얼마, 이건 얼마 하고 하기엔, 좀 그렇습니다.


(대부분 석사학위의 경우 회귀분석정도까지 들어가는 편이고, 박사학위의 경우 구조방정식이 많이 들어가는 편입니다. 그러나 고급분석이라고 해서 반드시 좋은 연구라고는 볼수 없습니다. 단 하나의 교차분석으로만으로도 훌륭한 결과를 볼수도 있으니 말입니다. 비용을 알아보실때, 분석만 하는지 (분석만 하고  raw data 만 보내는경우도 있습니다.), 표편집을 해주는지, (표편집이 안되면 논문에 어찌 올립니까..), 해석을 써주는지 를 잘 알아보시고 비용을 판단하셔야 할겁니다.  


이와 관련하여 어떠한사항도  주저하지 마시고, 메일로 문의 주세요. 문의에대한 답변은 언제나 Free  입니다




가능한 작업분야는 Only SPSS, AMOS  입니다. 


이 프로그램을 통해서 하는 작업은 거의 대부분 가능합니다.


논문통계에서 가장 많이 사용하는 회귀분석, 경로분석, 구조방정식, 등을 많이 의뢰 주십니다.




가장 중요한것은 선생님들과 저와의 소통입니다. 통계분석은 컴퓨터가 돌립니다.


어떤 분석을 돌려서 결과를 어떻게 산출하여, 해석까지 마치는 가의 문제입니다.



분석과 함께, 논문양식으로 표편집, 해석까지 해드리고 있으니, 의문 있으시면 문의주세요



여전히 하고 있습니다



 chsoo.lee@gmail.com 으로 메일 주시면 확인하는 대로 보내드립니다.