신뢰도타당보분석요인분석크론바알파/신뢰도타당도 분석

확인적 요인분석2

학위논문통계 2022. 10. 31. 13:54

1. 확인적 요인분석과 인과모형

 

 

지난번에 이야기한 스트레스==> 소진 관계에 대한 확인적 요인분석을 한다고 계속 가정하죠. 스트레스는 경제적 스트레스와 인간관계 스트레스 2개의 하위영역 변인이 있고, 경제적 스트레스는 2개의 설문문항으로, 인간관계 스트레스는 3개의 설문문항으로 측정한다고 하죠.

 

그림 확인적 요인분석 다음과 같고

만약 인과관계 가설 검증을 하기 인과 모형을 그리면 다음과 같습니다.

 

그림 인과모형

그럼 위 확인적 요인분석과 어떻게 다른가를 보면

 

1) 인과관계를 나타내는 경제적 스트레스==> 소진, 인간관계 스트레스 ==> 소진은 양방향 화살표에서 인과관계를 나타내는 일방향 화살표로 바꾸고요. 경제적 스트레스와 인간관계 스트레스간에는 인과관계가 아니기 때문에 바꿀 필요가 없습니다.

 

2) 종속변수에 해당하는 소진에 오차항 n을 추가하고 거기 회귀계수 값에 1을 지정합니다. 만약 중간에 매개변수가 들어가 있으면 매개변수에도 오차항을 넣어야 합니다. 독립변수와 매개변수만 보면 이때는 매개변수는 종속변수의 역할을 하거든요.

 

 

하여간 이렇게 측정모형을 그려서 확인적 요인분석을 합니다. Analyze==> Calculate estimates 하면 됩니다.

 

2. 적합도

 

그 다음 해야 할 일이 적합도를 올리기 위해서 수정지수 값을 봐야 합니다.

 

위 모형 그대로 하면 적합도가 매우 낮게 나옵니다. 통상 구조방정식 책에 나오는 적합도 기준에 훨씬 못 미친다는 것이죠.

 

 

View==> Analysis properties ==> output

 

가시면

 

standardized estimate 체크하고 수정지수 modification indices에 기본 사양으로 4로 되어 있는데 저는 이걸 10정도로 놓고 통상 작업합니다.

인과관계 검증하는 인과모형에서는 indirect, direct & total effects 체크하고, 다중집단 분석할 때는 Critical ratios for differences 체크하고 Bootstrap에서 값을 넣어줘야 합니다. 확인적 요인분석할 때는 이런 것 필요없습니다.

 

그래서 수정지수가 높게 나오는 부분는 양쪽 화살표로 연결을 시켜 줍니다. 그럼 적합도가 꽤 올라갑니다. 적합도가 어느 정도 만족할 때까지 계속 해야 합니다.

 

그럼 적합도의 개념부터 한번 알아보십니다.

 

1) 적합도의 개념

 

적합도는 우리가 설정한 모형이 데이터에 어느 정도 잘 맞는가를 측정하는 값입니다.

 

회귀분석할 때 결정계수 R2이 있죠. 이게 가장 대표적인 적합도 값입니다. 그런데 회귀분석할 때 결정계수 R2 신경 안쓰잖아요.

 

그런데도 구조방정식만 적합도 가지고 난리를 친다는 것이죠. 뭔가 굉장한 이론을 만들어 낸 것처럼, 그래서 어려운 논문을 한다는 착각을 가지게 하기 위해서 그런다는 것이죠.

 

 

2) 적합도가 좋으면 항상 좋은가요.

 

앞에서 말했듯이 적합도가 연구모형이 데이터에 어느 정도 잘 맞는가를 측정하는 개념이기 때문에 적합도가 높으면 무조건 좋다고 생각할 수 있습니다.

 

그러나 이렇게 적합도를 계속 높이면 엉뚱한 인과관계 결과물이 자주 나옵니다.

 

위 그림에서 보여 주듯이 인과모형에서 독립변수간 양방향 화살을 없애면 적합도는 엄청 떨어지지만 아마 여러분이 원하는 인과관계는 매우 잘 나올겁니다.

 

적합도가 높은 것이 향상 좋은 것은 아닙니다. 적합도와 합리적인 인과관계간에는 상충효과가 있습니다. 이런 것을 통계학에서는 “절약의 법칙(parsimony principle)"이라 합니다. 결과가 나쁘지 않으면 가능하면 적합도가 낮은 것, 즉 단순한 모형이 좋다는 원칙입니다.

 

 

3. 적합도는 어떻게 구하는가

 

이 부분 잘 이해가 안되시면 Lattin, Carrole, Green의 "Analyzing Multivariate Data" 책을 권합니다. 간단한 예를 통해 잘 설명해준 책입니다.

 

간단하게 이야기해서 우리가 숫자로 가지고 있는 데이터 변수가 7개 있습니다. 즉 경제적 스트레스 설문문항 2개, 인간관계 스트레스 설문문항 3개, 소진 설문문항 2개 총 7개 변수 데이터를 가지고 있습니다.

 

여기서 7개 변수의 공분산 행렬을 구합니다. 이걸 A라고 하죠.

 

그리고 확인적 요인분석이나 인과모형을 적용해서 나온 회귀계수 값을 넣어서 나온 공분산 행렬이 있습니다. 이걸 B라고 하죠.

 

수정==>

그럼 적합도는 B/A, 또는 (A-B)/A, 를 사용합니다. B/A 개념을 나타내는 적합도 기준은 0.9 이상, (A-B)/A 개념을 나타내는 적합도 기준은 0.08 이하 정도로 통상합니다.

 

적합도 지수에서 X2(카이제곱)이 나오는데 이건 대부분 유의적으로 나옵니다. 이렇게 유의적으로 나오면 적합도가 안 좋다는 이야기입니다. 아무리 적합도를 올린다고 해도 이 카이제곱은 유의적으로 나옵니다. 그래서 통상 자유도로 나눈 평균 X2=X2/df을 사용하고 이 값이 0.3 미만이면 좋다고 봅니다. 이 카이제곱 검증은

 

귀무가설 H0: 현재 모형이 좋다

 

대립가설 H1: 현재 모형보다 더 개선되어야 한다.

 

 

인데 이게 유의적으로 나왔다는 이야기는 현재 모형보다 더 개선되어야 한다는 의미입니다.

하여간 이 적합도 기준을 다 맞출 필요는 없고요. 이 기준을 다 만족시키면 “적합도는 양호하게 나왔다”, 이 기준을 일부 못 맞추면 “적합도는 수용가능한 수준으로 나왔다” 이렇게 논문에 쓰시면 됩니다.

 

이걸 전부 다 만족시키지 못한다고 시비거는 교수가 있으면 그냥 통계학의 기본 원리도 모르는 교수입니다. 앞에서 이야기했듯이 회귀분석에서 적합도는 결정계수 R2입니다. 이건 음수가 나오거나 엄청나게 낮은 값이 아니면 사람들 신경안쓰죠.

 

교수가 하라는 대로 해야 하기 때문에 원하는 만큼 나오도록 양쪽 화살표를 더 집어넣는 수밖에 없죠.

 

 

 

4. CRAVE

 

확인적 요인분석 보면 CR과 AVE 값을 들어 있습니다. 이것은 AMOS에서 구해주지 않기 때문에 본인이 직접 손 계산을 해야 합니다. 수식이 좀 복잡하기 때문에 전문가에게 부탁을 하거나요.

 

 

아마 제 생각에는 이것 그냥 조작해서 값을 많이들 넣을 겁니다. CR> 0.7. AVE>0.5 기준을 만족해야 하거든요.

 

공식은 복잡해서 여기서 적지는 않겠습니다.

 

 

CR은 (composite reliablility)라고 해서 아마 합성 신뢰도로 많이들 번역할 겁니다. 이 값은 설문문항(사각형)이 구성개념(잠재변수,타원형)을 얼마나 잘 표현하는지에 대한 내적 일관성, 즉 Cronbach 알파값과 비슷한 개념입니다.

 

 

AVE(average variance extracted)로 평균 분산 추출값으로 번역할 겁니다. 이 개념을 설문문항(사각형)이 구성개념(잠재변수, 타원형)의 변동(분산)을 얼마나 잘 설명하는지 측정하는 값입니다.

 

 

5. 하위변인이 있을 경우

 

스트레스와 같이 경제적 스트레스, 인간관계 스트레스가 하위변인으로 일을 때, 그리고 우리가 알고 싶은 인과관계가 경제적 스트레스==> 소진, 인간관계 스트레스==> 소진 이 2개의 인과관계가 아니라 전반적인 스트레스 ==> 소진 이 인과관계 하나를 검증할 경우

 

측정변수를 설문문항을 설정하는 것이 아니라 경제적 스트레스, 인간관계 스트레스의 평균을 직접 구한 다음 이 구한 경제적 스트레스와 인간관계 스트레스를 측정변수로 사용합니다. 즉 다음 그림처럼 합니다.

 

그림

이런 것은 저널 논문에 많이 나오는데 저널 논문은 논문 페이지의 한계가 있기 때문에 가능하면 단순하게 하는 경향이 있습니다.

 

6. 결론

 

확인적 요인분석에서 만족해야 할 값은

 

1) 표준회귀계수가 0.5 이상으로 유의적으로 나올 것(대부분 p값이 0.000으로 유의적으로 나옵니다). 그럼 측정도구의 신뢰도와 타당도는 양호하게 나왔다 이렇게 쓰시면 되고요.

 

2) 추가적으로 CR값이 0.7 이상이면 합성 신뢰도는 양호하게 나왔고, AVE 값도 0.5 이상으로 나오면 평균분산추출도 양호하게 나왔다고 하면 됩니다.

 

3) 이 조건만 만족하면 대부분 됩니다. 간혹 판별타당도를 원하는 분이 있는데 이 경우 경제적 스트레스와 인간관계 스트레스, 그리고 소진을 평균을 실제 구한 다음 상관계수 행렬을 구하고 AVE값과 비교하시면 됩니다.