교차분석과 그 확장모형 6

로그선형모형

1. 로그선형모형(log-linear 모형)​​지난번에 두 개의 변수만 생각한 교차분석의 분할표를 살펴보았습니다. 만약 두 개의 변수 X, Y가 독립이라고 하면 분할표안에 ij칸 에 있는 빈도수 n(ij)는 어떻게 될까요?​지난번 예 흡연여부(X)와 페암여부(Y)의 경우를 살펴보죠. 표안에 있는 값은 전부 빈도입니다.구분비폐암폐암빈도비흡연n(11)n(12)N1흡연n(21)n(22)N2빈도M1M2전체 M그럼 흡연여부와 폐암여부가 독립이라면 앞의 글처럼 칸안의 비율은 서로 곱하기 해서 나옵니다.즉 독립이라면​n(11)/M = (N1/M) * (M1/M)n(21)/M= (N1/M) * (M2/M)..이런 식이 되겠죠. 일반적으로 쓰면​​n(ij)/M= (N(i)/M) * (M(j)/M)​​이런식으로 되고요. ..

트리모형1

2. 트리 모형(Decision Tree)​​종속변수, 반응변수, 즉 우리가 관심있는 변수가 연속형인 경우 Regression Tree라고 하고, 범주형일 경우 Classification Tree라고 구별하기도 합니다. ​​의사결정트리의 예입니다. 차의 중량과 마일리지 관계를 의사결정트리로 분석한 것입니다.​​​​​또 다시 흡연여부와 폐암여부로 돌아가 보죠.​다음 세 가지 상상의 경우가 있다고 생각해보죠. 안에 값은 비율, 즉 확률이고 앞에 이야기한 두 번째 비율입니다.​1)구분비폐암폐암비흡연0.50.5흡연0.50.52)구분비폐암폐암비흡연0.50.5흡연0.10.93)구분비폐암폐암비흡연0.90.1흡연0.10.9만약 여러분이 의사라고 하면 위의 세가지 경우 중 어느 쪽을 가장 좋아하겠습니까?​당연히 세 번째..