[통계 심층기획 - 4점 리커트 척도의 비밀 ②]
관행과 엄밀함의 타협, 리커트 척도를 다루는 올바른 데이터 분석법
본 기사는 인공지능(AI)이 작성한 분석 통계 전문 기사입니다.
앞선 1편에서 다루었듯 4점 동의척도의 수치 간 간격이 심리적·수학적으로 완벽한 등간격을 이루지 못함에도 불구하고, 국내외 수많은 양적연구 논문에서는 이를 등간척도로 전제하고 t-검정, 분산분석(ANOVA), 회귀분석 등 모수 통계분석을 수행합니다. 학계가 이러한 관행을 유지하는 데는 통계적 실용주의와 이를 뒷받침하는 통계학적 논거가 존재하기 때문입니다.
모수 통계학적 관행의 논거
첫 번째 논거는 '중심극한정리(Central Limit Theorem)'와 표본의 크기입니다. 통계학자들은 표본의 크기가 충분히 크다면(대개 30명 이상), 서열 형태의 데이터라 할지라도 이들의 합산 점수나 평균의 분포가 정규분포에 수렴한다는 점을 이용합니다. 표본의 크기만 확보되면 모수적 방법론을 적용해도 통계적 오류의 확률이 급격히 증가하지 않는다는 실용적 판단입니다.
두 번째 논거는 '리커트 척도(Scale)'와 '리커트 문항(Item)'의 구분입니다. 리커트 척도의 창시자인 레시스 리커트의 본래 의도는 하나의 문항으로 개념을 측정하는 것이 아니었습니다. 특정 개념을 측정하기 위해 유사한 성격의 4점 문항 5~10개를 배치하고, 이들의 점수를 합산하거나 평균을 내어 하나의 지표를 만드는 방식입니다. 낱개의 문항은 서열척도일지라도, 이 문항들이 결합하여 만들어진 합산 점수는 연속 변수의 성질을 띠게 되며, 이때 데이터의 분포는 등간척도로서 기능하기에 충분한 수학적 안정성을 확보한다는 연구 결과(Carifio & Perla, 2007)가 지배적입니다.
비모수 통계학의 반론과 평균의 왜곡
반면 엄격한 수학적 처리를 요구하는 통계학자들은 이러한 관행에 강한 우려를 표명합니다. 대표적인 문제가 '평균의 왜곡 현상'입니다.
예를 들어 4점 척도 조사에서 A 집단 10명의 응답이 [3점 5명, 4점 5명]인 경우와, B 집단 10명의 응답이 [2점 5명, 5점 5명(5점 척도 기준 가정)]인 경우를 비교해 보겠습니다. 두 집단의 산술 평균은 동일하게 산출될 수 있으나, 실제 응답의 양상은 완전히 다릅니다. 또한 4점 척도에서 평균이 '3.5'로 산출되었을 때, 이 3.5라는 숫자가 의미하는 실재적인 언어적 표지는 존재하지 않습니다. 3점(그렇다)과 4점(매우 그렇다) 사이의 회색지대를 산술적으로 계산하는 것이 현장의 실재를 정확히 반영하는가에 대한 비판이 제기되는 이유입니다.
특히 4점 척도는 5점이나 7점 척도에 비해 선택지가 적어 데이터가 한쪽으로 치우치는 왜도(Skewness) 문제가 발생하기 쉬우며, 이는 등간척도를 전제로 하는 통계 분석의 신뢰도를 떨어뜨릴 수 있습니다.
실제 데이터 분석과 기사 작성을 위한 대안
따라서 양적연구를 수행하는 연구자나 데이터를 다루는 기자는 4점 동의척도를 다룰 때 다음과 같은 대안적 방법론을 고려해야 합니다.
첫째, 서술 통계의 다각화가 필요합니다. 단순히 평균과 표준편차만 제시하기보다는, 가장 빈번하게 나온 응답인 최빈값(Mode), 중간에 위치한 값인 중앙값(Median), 그리고 각 문항별 빈도와 백분율을 반드시 함께 기술하여 데이터의 실제 분포를 독자에게 투명하게 보여주어야 합니다.
둘째, 비모수 검정(Non-parametric Test)의 적극적인 활용입니다. 표본의 크기가 작거나 데이터가 정규분포를 심각하게 이탈할 경우, t-검정 대신 맨-위트니 유 검정(Mann-Whitney U test)을, 분산분석(ANOVA) 대신 크루스칼-왈리스 검정(Kruskal-Wallis test)을 사용하는 것이 수학적으로 안전합니다.
셋째, 구조방정식 및 요인분석 시 추정 방식의 전환입니다. 4점 이하의 범주형 변수를 다변량 분석에 투입할 때는 일반적인 최대우도법 대신, 범주형 데이터에 최적화된 가중최소제곱법(WLSMV) 등의 추정 방식을 사용하는 것이 학계의 권장 사항입니다.
결론적으로 4점 척도를 등간척도로 분류하는 것은 데이터의 절대적 속성이라기보다는, 사회과학적 현상을 계량화하기 위해 용인된 '방법론적 타협'입니다. 데이터를 해석할 때 이러한 가정이 가진 한계를 명확히 인지하고 보완적 분석을 병행할 때, 통계의 정당성과 신뢰성이 확보될 것입니다.
출처 및 참고문헌 (References)
Carifio, J., & Perla, R. J. (2007). Ten Common Misunderstandings, Misconceptions, misunderstandings and Myths about Likert Scales and Likert Buildings' Response Formats and their Antidotes. Journal of Social Sciences, 3(3), 106-116.
Norman, G. (2010). Likert scales, levels of measurement and the laws of statistics. Advances in Health Sciences Education, 15(5), 625-632.
Jamieson, S. (2004). Likert scales: how to (ab)use them. Medical Education, 38(12), 1217-1218.