통계이론 19

다변량 차이검증:Hotelling, Wilks, Box M, 신뢰타원체

1. 다변량 차이 검증 통계량 일변량일 경우 차이 검증하는 방법은 두 집단의 경우 t 검증이 있고, 세 집단 이상인 경우 분산분석의 F검증이 있습니다. 예를 들어 사람의 신체를 비교한다고 하면 먼저, 키와 몸무게가 있고, 허리둘레, 또는 다리 길이, 상체 길이, 어깨 넓이, 머리크기 등 다양한 측정값이 있습니다. 단순히 남녀간의 키의 차이가 있다, 또는 몸무게의 차이가 있다, 허리둘레의 차이가 있다 이렇게 이야기하는 것은 일변량(univatiate) 입니다. 이 경우 t 검증입니다. 그러나 통체로 남녀간의 신체 차이가 있다고 이야기하는 경우는 앞에 이야기한 다양한 측정변수들을 통채로 이야기하는 것입니다. 이 경우 다변량(multivariate) 차이 검증이 됩니다. 구체적으로 아기가 태어난지 1년 후에 ..

공분산행렬:unstructured, autoregressive, Huynh-Feldt

3. Unstructured ​ 이번에는 (t1,t2), (t1, t3), (t2,t3)간 종속변수의 공분산이 전부 다 다른 경우입니다. ​ 4. Autoregressive ​autoregressive는 시계열 분석에서 나오는 용어인데 자기상관이라고 합니다. 일종의 상관계수인데 시차간의 상관계수라 생각하시면 됩니다. 측정변수의 시차가 2이면 로우2, 시차가 3이면 로우3이 되는데 로우가 상관계수라 절대값이 1보다 작기 때문에 측정변수의 시간 간격이 커질수록 두 변수의 상관관계가 약해집니다. 어느 정도 합리적인 가정이죠. 공변량 행렬을 보면 ​ 즉, 상관(t1, t2), 상관(t2, t3)는 로우, 상관(t1, t3)는 로우^2가 됩니다. 만약에 4번까지 측정했다면 상관(t1, t4)는 로우^3가 되겠죠...

공분산행렬1:compound symmetry

혼합모형이 기존의 모형과 가장 다른 점은 공분산 행렬의 모양입니다. ​Y=시스템 부분+e 라 하면 시스템 부분은 ​ 평균 구하는 것이면 단순한 전체 평균 u, ​ 회귀분석이면 b0+b1*X1+b2*X2, ​ 분산분석이면 u+a+b+a*b 이런 것들이 들어가겠죠. 그럼 종속변수 Y의 공분산 행렬은 오차항의 공분산 행렬과 같고, 또 독립이면 오차항의 공분산 행렬도 독립의 경우가 들어갑니다. 즉 다음의 형태입니다. ​ 혼합모형에서는 이 공분산 행렬을 분석가가 지정을 해야 합니다. 혼합모형 메뉴를 보면 첫 화면에 다음과 같은 메뉴가 뜹니다. ​ ​ 즉, 개체(subject)를 지정하고, 시간을 나타내는 시차 변수를 지정하고 그 밑에 반복 공분산 타입에서 시차에 따른 공분산 행렬을 지정해야 합니다. 그럼 어떤 경..

대조(contrast), 사후분석(post hoc), 동시추론

여기에 나오는 내용을 정말 정확하게, 또 깊게 공부하시려면 Sheffe의 ANOVA를 권합니다. 저는 학부때 이 책을 가지고 공부했지만 솔직히 통계학과 학부 수준에서도 상당히 어려운 책입니다. 그 당시 교수가 워낙 실력있는 교수라 학생들 수준을 무시하고 사용한 교재입니다. 예를 들어 분산분석을 어떻게 하면 회귀분석 결과로 나오게 할 수 있을까 의문이 들 때 이 책을 보면 자세히 나옵니다. spss에서 parameter estimates를 체크하면 회귀분석이 아닌데도 회귀분석 결과물이 나옵니다. spss처럼 회귀분석 결과물이 나오도록 하려면 이론적으로 어떻게 하면 되는지 자세히 설명되어 있습니다. 간단히 말해 Design 행렬을 어떻게 0과 1로 적어 넣을지 가르쳐 줍니다. spss 결과물에 보면 cont..

구형성검증, 다변량검증, 공분산행렬, 독립

구형성 검증이라고 탐색적 요인분석에서 바트렛 검증이 나오고 또 spss 곳곳에서 나옵니다. 이 구형성 검증의 용어를 이해하려면 불행이도 상당한 수학 이론을 이해해야 합니다. ​일단 스트레스 설문문항이 3개 이고, 소진 설문문항이 2개가 있다고 하죠. 그럼 우리는 5개의 측정치, 즉 5개 변수에 해당하는 데이타를 가지고 있는 것입니다. ​ 그럼 이 5개의 변수의 공변산을 구했을때 이 공분산 행렬이 대각행렬(diagonal matrix), 또는 identity matrix인가 아닌가를 알고 싶다는 것이죠. 예를 들어 공분산 행렬이 대각행렬이라는 말은 5개의 변수가 서로 독립이라는 이야기입니다. 그럼 스트레스 측정문항과 소진 측정문항간에는 독립적일 가능성도 좀 있지만 스트레스 측정문항3개간에는, 그리고 소진 ..