[통계 심층기획 - 4점 리커트 척도의 비밀 ①]
'그렇다'와 '매우 그렇다' 사이, 수학적 등간격은 존재하는가
본 기사는 인공지능(AI)이 작성한 분석 통계 전문 기사입니다.
정부의 정책 만족도 조사부터 학술 논문, 기업의 시장 조사에 이르기까지 양적연구에서 가장 흔하게 조우하는 문항 형식이 있습니다. 바로 ‘전혀 그렇지 않다(1점)’, ‘별로 그렇지 않다(2점)’, ‘그렇다(3점)’, ‘매우 그렇다(4점)’로 구성된 4점 리커트 척도(Likert Scale)입니다. 특히 중간값(모름/보통)으로의 응답 집중 현상을 방지하고 명확한 의견 표명을 유도하기 위해 4점 강제 선택 척도가 실무와 학계에서 널리 활용되고 있습니다.
그러나 통계학적 엄밀성의 관점에서 이 4점 동의척도를 ‘등간척도(Interval Scale)’로 분류하고 평균과 표준편차를 구하는 것이 과연 타당할까요? “'그렇다'와 '매우 그렇다' 사이의 심리적 거리는 '별로 그렇지 않다'와 '그렇다' 사이의 거리와 수학적으로 동일한가?” 이 질문은 양적연구의 데이터 신뢰성을 좌우하는 핵심적인 의문입니다.
서열척도와 등간척도의 개념적 경계
스탠스 스티븐스(Stanley Smith Stevens, 1946)의 측정 수준 분류에 따르면, 데이터는 명목, 서열, 등간, 비율 척도의 네 가지 단계로 구분됩니다.
서열척도는 대상의 속성에 따라 순위를 부여할 수 있지만 순위 간의 간격이 일정하지 않은 척도입니다. 반면 등간척도는 순위뿐만 아니라 속성 간의 ‘간격’이 일정한 척도입니다. 대표적인 예로 섭씨온도가 있습니다. 10°C와 20°C의 차이는 30°C와 40°C의 차이와 물리적으로 동일합니다.
이 기준을 4점 동의척도에 대입해 보면, 본질적으로 이는 서열척도에 가깝습니다. 응답자가 느끼는 '전혀 그렇지 않다'에서 '별로 그렇지 않다'로 이행할 때의 심리적 변화량과, '그렇다'에서 '매우 그렇다'로 이행할 때의 심리적 변화량이 수학적으로 1.0이라는 동일한 단위를 가졌다고 단정할 수 없기 때문입니다.
심리적 측정의 맹점: 언어적 표현과 숫자의 괴리
언어적 표현을 숫자로 계량화하는 과정에는 응답자의 주관적·심리적 해석이 개입됩니다. 통계학 및 계량심리학 연구들에 따르면, 인간이 인지하는 언어적 형용사의 강도는 선형적(Linear)이지 않습니다.
실제 인간의 심리적 인식 가치를 가설적으로 환산해 보면 그 차이가 명확해집니다. 1점(전혀 그렇지 않다)을 최하 극단인 '0'으로 보고, 2점(별로 그렇지 않다)을 부정적 편향인 '25'로 볼 때, 3점(그렇다)은 긍정적 전환점인 '60', 4점(매우 그렇다)은 최상 극단인 '100'의 가치로 인식될 수 있습니다.
이 경우 1점과 2점 사이의 간격은 25인 반면, 2점과 3점 사이는 35, 3점과 4점 사이는 40으로 모두 제각각입니다. 응답자가 체감하는 ‘그렇다’와 ‘매우 그렇다’ 사이의 간격은 심리적으로 매우 좁을 수도 있고, 반대로 ‘매우’라는 부사가 주는 중압감 때문에 ‘별로 그렇지 않다’와 ‘그렇다’의 간격보다 훨씬 넓을 수도 있습니다.
인간의 태도 변화는 등간격의 수치로 발현되지 않습니다. 따라서 4점 척도의 각 문항을 독립적으로 볼 때, 수치 간의 간격이 동일하다는 가정은 통계적 편의를 위한 '의도된 가설'에 가깝다는 것이 방법론적 한계로 지적됩니다.
출처 및 참고문헌 (References)
Stevens, S. S. (1946). On the Theory of Scales of Measurement. Science, 103(2684), 677-680.
Likert, R. (1932). A Technique for the Measurement of Attitudes. Archives of Psychology, 22(140), 1-55.
Jamieson, S. (2004). Likert scales: how to (ab)use them. Medical Education, 38(12), 1217-1218.