다중 로지스틱을 돌리면 처음에 다음과 같은 메뉴가 뜹니다.
맨 위가 종속변수인 3개 이상의 범주를 가진 변수가 띄고 여기서 참조범주를 지정해야 합니다.
그 다음에 ‘요인’이라는 메뉴가 범주형 독립변수, 즉 명목형 독립변수가 들어가고 그 아래 ‘공변량’에는 연속형 독립변수가 들어갑니다.
그래서 명목형 독립변수를 지정하고 돌리면 다음과 같은 끔찍한 결과물을 얻게 됩니다.
왼쪽을 보면 SPSS에서 에러 메시지를 보여 줍니다. 비정칙성행렬(singular matrix)이 생겼다고요.
singular 행렬이 생겼다는 이야기는 우리가 방정식을 못 풀게 되었다는 이야기랑 같은 이야기입니다.
그래서 이 경우 할 수 있는 방법은
1) 명목형 독립변수를 최소한 순위형 변수로 만들어 ‘공변량’에 집어넣어라
예를 들어 미국의 인종을 조사해 보니까 백인의 소득이 가장 높고, 그 다음이 동양인, 마지막이 흑인이면 흑인=1, 동양인=2, 백인=3으로 코딩한 다음 이걸 소득의 순서를 가진 순위형 변수로 볼 수 있습니다.
2) 명목형 변수의 범주에서 비슷한 범주끼리 묶어 범주의 수를 줄여라
예를 들어 서울과 수도권인 경기는 비슷한 범주로 볼 수 있습니다. 그럼 원래 서울=1, 경기=2로 코딩되어 있는 것을 서울=1, 경기=1로 같은 범주로 취급하여 명목형 변수를 간단하게 만들 수 있습니다
'이진 로지스틱 회귀분석 > 다항 로지스틱 회귀분석' 카테고리의 다른 글
다항 로지스틱3: 명목형 변수를 순위형 변수로 (0) | 2024.07.31 |
---|---|
박사급, 저널용 논문 주제로 매우 적절한 다중 로지스틱 회귀분석1 (0) | 2024.07.29 |
다항 로지스틱 회귀분석1 (4) | 2024.07.25 |