이진 로지스틱 회귀분석/다항 로지스틱 회귀분석

박사급, 저널용 논문으로 적합한 다항 로지스틱 회귀분석2

학위논문통계 2024. 7. 30. 04:37

 

다중 로지스틱을 돌리면 처음에 다음과 같은 메뉴가 뜹니다.

 

 

맨 위가 종속변수인 3개 이상의 범주를 가진 변수가 띄고 여기서 참조범주를 지정해야 합니다.

 

그 다음에 요인이라는 메뉴가 범주형 독립변수, 즉 명목형 독립변수가 들어가고 그 아래 공변량에는 연속형 독립변수가 들어갑니다.

 

그래서 명목형 독립변수를 지정하고 돌리면 다음과 같은 끔찍한 결과물을 얻게 됩니다.

 

 

 

왼쪽을 보면 SPSS에서 에러 메시지를 보여 줍니다. 비정칙성행렬(singular matrix)이 생겼다고요.

 

singular 행렬이 생겼다는 이야기는 우리가 방정식을 못 풀게 되었다는 이야기랑 같은 이야기입니다.

 

그래서 이 경우 할 수 있는 방법은

 

1) 명목형 독립변수를 최소한 순위형 변수로 만들어 공변량에 집어넣어라

 

예를 들어 미국의 인종을 조사해 보니까 백인의 소득이 가장 높고, 그 다음이 동양인, 마지막이 흑인이면 흑인=1, 동양인=2, 백인=3으로 코딩한 다음 이걸 소득의 순서를 가진 순위형 변수로 볼 수 있습니다.

 

 

2) 명목형 변수의 범주에서 비슷한 범주끼리 묶어 범주의 수를 줄여라

 

예를 들어 서울과 수도권인 경기는 비슷한 범주로 볼 수 있습니다. 그럼 원래 서울=1, 경기=2로 코딩되어 있는 것을 서울=1, 경기=1로 같은 범주로 취급하여 명목형 변수를 간단하게 만들 수 있습니다