기술통계와 상관분석

상관관계

학위논문통계 2024. 7. 18. 17:56

 

  1. 개념

 

두 변수간의 선형적 관계 정도를 측정하는 것입니다. 따라서 두 변수의 상관관계가 낮다고 해서 꼭 두 변수간의 관계가 낮은 것은 아닙니다. 두 변수 X, Y의 경우

 

선형관계: Y=b0+b1*X

이차관계: Y=b0+b1*X+b2*X2

일차 선형관계에서는 두 변수간의 관계가 약할 수 있지만 이차함수 관계에서는 두 변수간의 관계가 강할 수 있습니다.

 

이 상관관계 분석도 기술통계 분석과 마찬가지로 논문의 핵심부분이 아닙니다. 그래서 저널논문과 같이 지면이 좁은 경우 상관관계 분석과 기술통계 분석을 기초분석이라고 해서 하나의 표로 축약하는 경우가 많습니다.

 

2. 변수

 

상관관계 분석에 들어가는 변수의 유형은 연속형, 또는 범주형의 경우 나이, 학력과 같은 순위형 변수가 들어갈 수 있습니다. 그러나 지역, 종교 등 크기 개념이 없는 명목형 변수는 들어갈 수 없습니다. 명목형 변수 중 상관관계 분석에 들어 갈 수 있는 변수는 성별과 같은 이진변수 뿐입니다.

 

3. 상관관계 분석은 단순회귀분석과 결과가 같습니다. 아래 그림을 보면

 

대표사진 삭제

사진 설명을 입력하세요.

상관관계 분석에서 상관계수는 0.754이고 p=0.000이고 단순회귀분석의 표준화 계수에서 회귀계수도 0.754, p=0.000입니다.

 

 

4. 판별타당도를 점검할 때도 사용됩니다.

 

평균추출분산(AVE)가 상관계수의 제곱보다 클 경우 판별타당도가 양호하다고 합니다. 그래서 상관계수 행렬의 대각선에 평균추출분산을 삽입하는 경우가 많습니다. 문제는 통상 측정도구의 신뢰도와 타당도 분석은 논문의 3장 신뢰도와 타당도 분석에 삽입하는 반면 상관관계 분석은 논문의 4장에 주로 삽입하기 때문에 상관계수 행렬을 논문의 어디에 삽입해야 할 지 곤란한 경우가 많습니다.

 

 

 

==> 추가

 

상관관계 분석은 변수가 연속형이나 최소한 크기 개념이 있는 순위형, 또는 이진더미변수를 사용한다고 했습니다.

그럼 명목변수들간의 관계는 어떻게 볼까요.

 

명목변수들간의 관계는 연관(association)이라는 말을 통상 사용합니다. 2개의 명목변수들간의 연관은 교차분석(crosstabs analysis)를 하여 X2이나 G2 통계량을 보시면 됩니다. 또는 대응일치분석(correspondence analysis)을 하면 2차원 공간에서 두 명목변수의 연관을 그림으로 보실 수 있습니다. 이 대응일치분석은 잘 사용하지 않는 분석이라 논문 주제로 삼으면 잘 통과가 됩니다. 특히 저널 논문에서요.

 

 

 

'기술통계와 상관분석' 카테고리의 다른 글

기술통계  (0) 2024.07.18