데이터 (data)
어떤 형태에 의하여 정보를 모아놓은 것
○ 모집단
파악하고자 하는 전체
○ 표본
전체를 파악하기 위하여 추출한 일부분
○ 케이스 (=개체, 관찰개체, 사례)
관찰하고자 하는 대상 하나하나
○ 분석단위
분석의 대상이 되는 단위
(ex) 남편, 부인, 아이를 대상으로 가족중 찬성하는 비율조사라면
남편, 부인, 아이는 각각의 케이스가 되며 가족은 분석단위가 됨
○ 변수
“명목변수→서열변수→등간변수→비율변수” 로 갈수록 데이터가 자세함
① 측정 수준에 의한 분류
- 명목변수 : 특성의 구분만 가능 (혈액형, 주소, 이름)
- 서열변수 : 대상의 우열이나 크고 작음 존재 (초등,중등,고등,대학)
- 등간변수 : 우열 존재, 숫자간 차이가 일정한 의미도 존재 (온도)
- 비율변수 : 변수간 우열의 비교, 차이, 비율의 의미가 존재
(체중 20kg은 10kg보다 두배의 의미와 비율을 갖음)
② 측정 방법에 의한 분류
- 질적변수 : 명목변수
- 양적변수 : 서열변수, 등간변수, 비율변수
③ 연속성 여부에 의한 분류
- 연속형변수
- 이산형변수
④ 부호화된 값의 형태에 따른 분류
- 숫자변수
- 문자변수
- 날짜변수
○ 코드북
원자료를 coding 하기 위하여 매칭되는 값을 기록한 기준 메뉴얼
○ 부호화 (coding)
각 변수의 값을 입력하기 쉽게 숫자 또는 기호로 표시하여 코딩용지에 입력
○ 전산화
부호화된 자료를 컴퓨터에 입력하는 것