신뢰도타당보분석요인분석크론바알파/요인분석의 이론

Cronbach 알파값과 Communality

학위논문통계 2022. 11. 27. 14:25

 

오늘은 Cronbach 알파값과 Communality에 대해서 쓰고 다음에는 KMOBartelett 구형성 검증에 대해서 쓰기로 하죠.

 

1. Cronbach 알파값

 

 

옛날에는 측정도구의 신뢰도 분석을 할 때는 Cronbach 알파값만 주로 하였습니다. Cronbach 알파값은 측정도구의 타당도와는 관계가 없습니다.

 

지금은 Cronbach 알파값만 구하면 안됩니다. 탐색적 요인분석 결과도 제시하고 Cronbach 알파값도 제시해야 합니다.

 

또 매개변수가 들어간 구조방정식을 하는 경우는 탐색적 요인분석과 Cronbach 알파값과 더불어 확인적 요인분석까지 해야 합니다. 그냥 관행입니다.

 

만약 구조방정식을 하는데 AMOS를 사용하지 않고 회귀분석을 하는 프로세스 매크로를 쓰는 경우 확인적 요인분석을 하지 않아도 됩니다.

 

 

우리가 어떤 변수를 수치화, 즉 측정할 때 단순 무식하게 물어 보지를 않습니다.

 

예를 들어 사람들의 스트레스를 측정할 때 너의 스트레스 정도가 어떻습니까이렇게 한 문항으로 무식하게 물어 보지 않는다는 것이죠. 이렇게 물어보면 실제는 똑같이 느끼는 스트레스 정도도 사람들마다 평가하는 값이 다 다르다는 것입니다.

 

그래서 가능하면 사람들간의 평가의 주관적 변동을 줄이기 위해 가능하면 구체적인 상황에 대해서 물어보고, 또 이런 질문을 하나만 하는 것이 아니라 여러개를 물어본다는 것이죠.

 

Cronbach 알파값은 이렇게 여러 문항으로 물어 봤을 때 이 문항들간의 상관관계가 높으면 Cronbach 알파값이 커집니다.

 

실제로 문항들간의 상관계수를 구하지 않고 탐색적 요인분석에서 요인적재값을 보면 어느 정도 알 수 있습니다. 측정 설문문항의 요인적재값이 모두 0.8 이상으로 나오면 Cronbach 알파값이 상당히 좋게 나옵니다.

 

그러나 이 Cronbach 알파값은 한 가지 단점이 있습니다. 측정문항 수가 많으면 이 값이 커지고 설문문항 수가 적으면 이 값이 작아지는 단점이 있습니다.

 

그래서 측정문항을 만들 때 가능하면 3문항 이상으로 하는 것이 좋습니다.

 

다음의 탐색적 요인분석 결과를 한번 볼까요.

 

측정문항 요인1(경제적 스트레스) 요인2(인과관계 스트레스)
문항1 0.72 0.1
문항2 0.89 0.1
문항3 0.1 0.68
문항4 0.1 0.71
문항5 0.49 0.58
문항6 0.1 0.66

 

스트레스를 측정하는데 하위영역 변인으로 경제적 스트레스와 인과관계 스트레스로 나눴다고 생각해보죠.

 

그리고 경제적 스트레스를 문항1과 문항2, 2개의 설문문항으로 측정하고 인과관계 스트레스는 문항3, 문항4, 문항5, 문항6으로 4개의 설문문항으로 측정했다고 하죠.

 

이 경우 요인1은 경제적 스트레스로 식별되고, 요인2는 인과관계 스트레스로 식별됩니다. 그럼 경제적 스트레스와 인과관계 스트레스의 Cronbach 알파값을 구하면 경제적 스트레스의 요인적재값이 인과관계 스트레스의 요인적재값보다 상당히 크게 나왔음에도 불구하고 경제적 스트레스는 측정문항의 2개 문항, 인과관계 스트레스의 측정문항이 4개이기 때문에 경제적 스트레스의 Cronbach 알파값은 생각보다 낮게 나오고 인과관계 스트레스의 Cronbach 알파값은 생각보다 크게 나옵니다.

 

Cronbach 값이 0.7 이상으로 신뢰도가 양호하다 하고, 0.7보다 약간 낮게 나오면 수용가능한 수준이라 말하면 됩니다. 신뢰도라는 말을 너무 많이 사용했으면 신뢰도 대신 내적일치도라는 말을 사용하시면 됩니다.

 

앞에서 이야기한 것처럼 설문문항 수가 적으면 Cronbach 알파값이 낮아지는 경향이 있습니다. 그래서 설문문항이 2개라서 알파값이 낮게 나왔다면 이 내용을 언급하시면 됩니다. 이 내용은 대부분 책이 나오는 내용입니다.

 

 

 

2. Communality

 

위의 탐색적 요인분석 결과를 다시 가져와 보죠

 

측정문항 요인1(경제적 스트레스) 요인2(인과관계 스트레스)
문항1 0.72 0.1
문항2 0.89 0.1
문항3 0.1 0.68
문항4 0.1 0.71
문항5 0.49 0.58
문항6 0.1 0.66

 

 

 

일단 communality 값을 구하는 것부터 한번 보죠.

 

문항1=(0.72^2)+(0.1^2)

문항2=(0.89^2)+(0.1^2)

 

이렇게 구합니다. 물론 통계 패키지에서 다 구해주죠.

 

보면 아시겠지만 각 측정문항의 요인적재값을 제곱한 다음 더 하면 communality 값이 됩니다. 이 값이 통상 최소 0.4 이상을 기준으로 합니다. 그리고 h2라고 표시합니다.

 

 

그럼 이 communality 값이 뭘 이야기하는 것일까요.

 

사실 이 값은 논문에 거의 안 나오는데 가끔 측정개발논문에서 부적절한 설문문항 제거기준으로 사용하는 경우가 있습니다.

 

이렇게 하지 마세요. 이 값은 부적절한 설문문항을 제거하는 기준이 아니고 탐색적 요인분석 모형 자체가 좋은지 나쁜지를 보는 값입니다. 탐색적 요인분석 모형 자체가 안 좋으면 이 값이 낮은 설문문항을 제거하는 것입니다.

 

예를 들어 위의 값에서

 

문항1=(0.72^2)+(0.1^2)=0.5

문항4=(0.49^2)+(0.58^2)=0.5

 

즉 문항1이나 문항4communality 값은 모두 약 0.5 정도 됩니다.

 

그러나 문항1은 분명히 경제적 스트레스 측정문항임을 알 수 있는 반면 문항4는 요인적재값을 보면 경제적 스트레스 문항인 것 같기도 하고 인과관계 스트레스 문항인 것 같기도 하고 매우 헷갈리는 문항입니다. 즉 타당도가 매우 안 좋은 측정문항입니다. 그래서 엄격하게 기준을 따지면 문항4는 타당도가 낮은 설문문항으로 분석에서 제외를 해아 하는 측정문항입니다.

 

그럼 정확하게 이 communalty가 뭘 의미할까요. 이 값은 회귀분석에서 회귀분석 모형의 적합도는 결정계수 R2가 개념이 비슷합니다.

 

회귀분석에서 종속변수 Y와 독립변수 X를 표준화하면

 

Y=b1*X1+b2*X2+e

 

이렇게 되죠

 

이걸 위의 탐색적 요인분석 모형에 적용하면

 

문항1=0.72*요인1+0.1*요인2

 

문항4=0.49*요인1+0.58*요인2

 

이렇게 되고 특히 독립변수인 요인1과 요인2는 서로 독립적입니다.

 

이 경우 communality h2는 개념상 위의 측정문항의 회귀분석 식의 결정계수 R2과 유사한 개념이 됩니다.

 

 

, 측정문항, 설문문항의 변동을 독립변수인 요인1과 요인2가 얼마나 잘 설명하고 있는가를 보는 값입니다.