이진 로지스틱 회귀분석/다항 로지스틱 회귀분석

다항 로지스틱 회귀분석1

학위논문통계 2024. 7. 25. 00:29

 

이진 로지스틱 회귀분석(binomial logistic regression)의 경우 종속변수가 이진 변수인 경우입니다.

 

그러나 종종 종속변수가 다항분포일 경우가 있습니다. 예를 들어 외국인에게 한류 문화 중에서 가장 좋아하는 것을 하나만 골라라 물으면 음악, 드라마, 영화, 음식 등 다양한 항목 중에서 하나만 골라야 합니다.

 

이 경우 그 항목의 선택하게 된 결정요인을 찾아라 하면 이 경우 다항 로지스틱 회귀분석을 사용하여야 합니다.

 

당연히 독립변수은 이항 로지스틱과 마찬가지로 다양한 형태의 변수가 들어올 수 있습니다. 명목형 변수, 순위형 변수, 연속형 변수등이 들어올 수 있습니다.

 

이항 로지스틱과 마찬가지로 독립변수가 명목형 변수인 경우 해석을 잘 해야 합니다. 이항 로지스틱 회귀분석을 다시 꼭 읽어 보시기 바랍니다.

 

여기서 이항 로지스틱과 다른 점은 SPSS에서 준거범주를 마지막 범주로 한다는 점입니다. 이항 로지스틱과 달리 첫 번째를 준거범주로 선택할 수 없습니다. 특별한 이유는 없고 아직 업데이트가 안된 것이죠.

 

 

문제는 종속변수도 범주형 자료이기 때문에 여기서도 준거범주 같은 것을 만들어 다항 로지스틱 회귀분석을 이진 로지스틱 회귀분석 하는 것처럼 만들어야 한다는 점입니다.

 

예를 들어 한류의 경우

 

1) 음악, 2) 드라마 3) 영화 4) 음식 4가지 범주가 있다고 하면

 

참조범주를 1) 음악으로 잡으면

 

1) 음악=1, 2) 드라마=0으로 하여 이진 로지스틱 계산

1) 음악=1, 3) 영화=0으로 하여 이진 로지스틱 계산

1) 음악=1, 4) 음식=0으로 하여 이진 로지스틱 계산을 함

 

 

참조범주를 마지막인 4) 음식으로 잡으면

 

4) 음식=1, 1) 음악=0으로 하여 이진 로지스틱 계산

4) 음식=1, 2) 드라마=0으로 하여 이진 로지스틱 계산

4) 음식=1, 3) 영화=0으로 하여 이진 로지스틱 계산

 

 

이런 식으로 3개의 이진 로지스틱 계산 결과를 보여 줍니다.

 

구체적인 결과물을 한번 볼까요.

 

여기서 참조범주는 첫 번째 범주인 A입니다.

 

그래서 위 결과물의

 

제일 상단의 B는 첫 번째 범주인 A와 두 번째 범주인 B와 이진 로지스틱 결과물이고,

 

중앙의 C는 첫 번째 범주인 A와 세 번째 범주인 C와의 이진 로지스틱 결과물이고,

 

마지막 하단의 D는 첫 번째 범주인 A와 마지막 범주인 D와의 이진 로지스틱 결과물입니다.

 

 

다항 로지스틱 회귀분석의 경우 종속변수의 경우 참조범주는 자유로이 설정할 수 있지만 독립변수가 명목형인 경우 아직 참조범주를 자유로이 설정할 수 없습니다.