실험계획 10

혼합모형으로 실험효과보기:시차t를 연속변수로 처리

이번에 쓸 이야기는 시차 t를 연속형 변수처럼 처리하는 경우입니다. 연속형 변수로 쓸 것이니까 시차를 ‘1차’, ‘2차’ 이렇게 문자열로 코딩하면 안되고 숫자 1, 2, 3 이렇게 코딩해야 합니다. 인터넷에 검색하면 혼합모형 쓰는 경우로 이 시차 t를 연속형으로 처리하는 예제가 많이 나옵니다. 만약 확률효과를 넣지 않으면, 즉 고정효과만 사용하면 이 모형은 독립변수가 시차 t인 단순회귀분석에 불과합니다. 물론 시간에 따라서 종속변수가 올라갔다 내려갔다 이렇게 변할 수 있습니다. 그럼 데이터에 t제곱, t3제곱 이런 변수를 만들어 회귀분석하면 됩니다. 그러나 시차 t가 상당히 커야 합니다. 단순히 시차 t 하나의 변수만 독립변수로 하는 경우랑, t, t제곱, t3제곱 이렇게 3개의 변수를 독립변수로 넣어 ..

혼합모형으로 실험효과보기2

혼합모형으로 실험효과를 볼 때 데이터 형태는 long format으로 해야 합니다. 패널데이타와 같은 모양입니다. 개체(subject) 집단 시차(time) Y X1 X2 A1 A 1 A1 A 2 A1 A 3 A2 A 1 A2 A 2 A2 A 3 A3 A 1 A3 A 2 A3 A 3 B1 B 1 B1 B 2 B! B 3 B2 B 1 B2 B 2 실험효과 데이터의 경우 개체는 주로 사람이나 동식물 등이 되지만 경영이나 경제 데이터에 많이 나오는 패널데이터의 경우 개체는 기업, 산업, 지역, 국가 등이 됩니다. 위 데이터에서 개체나 집단은 숫자 1, 2, 3 이렇게 표시해도 됩니다. 지난번 글에서 이야기했지만 실험의 상황이 매우 다양하기 때문에 결과물의 해석을 주의해서 해야 합니다. 즉 분산분석표의 유의적이..

혼합모형으로 실험효과 보기1

지금까지 혼합모형에 대한 글은 혼합모형이라는 것을 이해하기 위해서 쓴 글이고 현실적으로 논문 분석에 적용할 수 있는 것은 아닙니다. 혼합모형이 논문 분석에 사용될 수 있는 분야는 실험효과 분석하는 부분입니다. 인터넷에 돌아다니는 혼합모형에 관한 글은 예로서 병원, 학교, 또는 학급 같은 예로 많이들 설명하는데 이때 표본추출 방식은 군집표본으로 일반적인 논문 분석에는 맞지 않는 표본추출 방식입니다. 이런 표본추출은 많은 돈이 들어가는 정부나 기업들이 사용하는 있는 표본추출 방법입니다. 1) 흔히 실험의 효과를 볼 때 많이 사용하는 방법은 실험집단과 통제집단을 만들어 사전, 사후 값을 측정하는 것입니다. 집단 사전 Y1 사후 Y2 실험집단 통제집단 2) 위 방법이랑 비슷한 것 같지만 완전히 다른 실험이 있습..

설문데이타로 혼합모형 확률효과로 분석하기

오늘은 설문지 데이터를 가지고 확률효과를 넣은 혼합모형을 쓸 수 없을까 하는 문제를 다뤄 보겠습니다. 모형은 편의상 가장 단순한 단순회귀분석으로 하죠. 독립변수가 여러개 들어가는 다중회귀분석도 마찬가지입니다. 독립변수는 변혁적 리더십, 종속변수는 자기효능감입니다. 즉 상사의 변혁적 리더십이 조직원의 자기효능감에 영향을 미치는가 하는 문제입니다. 그럼 모형식은 다음과 같습니다. 자기효능감=b0+b1*변혁적 리더십+오차 이걸 SPSS에서 회귀분석 메뉴에 가서 분석해도 되고 지난번 글에서 이야기했지만 혼합모형 메뉴에 가서 고정효과만 사용해서 분석해도 됩니다. 그럼 여기에 어떻게 하면 확률효과를 더 참가할 수 있을까 하는 문제입니다. 다음과 같이 하면 됩니다. 자기효능감=(b00+b01)+(b10+b11)*변혁..

혼합모형을 이용하여 Baron & Kenny 조절효과 검증하기

이번에는 석사논문이나 저널논문에 자주 나오는 Baron & Kenny(1986)의 조절효과 검증을 혼합모형에서 어떻게 하는지 보겠습니다. 지난번에도 이야기했지만 여기서는 확률효과는 없고 오직 고정효과만 있습니다. 먼저 혼합모형 메뉴에 들어가면 첫 번째 메뉴가 뜹니다. 여기는 그냥 넘어갑니다. 이 메뉴는 패널데이터나 또는 반복측정, 또는 군집추출을 해서 아파트 단지, 병원, 또는 학교나 학급을 랜덤으로 선택할 경우만 이 메뉴를 사용합니다. 연구모형은 다음과 같습니다. 자기효능감=b0+b1*카리스마리더십+b2*연령+b3*(카리스마*연령) 여기서 성별같은 이진더미변수이면 별 문제가 없는데 연령같이 다범주, 즉 1=20대, 2=30대, 3=40-50대, 4=60대 이상 이렇게 코딩되어 있는 경우 조절효과를 보려..

혼합모형:이원분산분석하기

지난번 글에서 고정효과와 확률효과에 대해서 설명을 했고요. 또 혼합모형은 기존의 통계 방법론의 확장된 분석 방법이라고 이야기했습니다. 즉 기존의 분산분석, 회귀분석, 조절효과 분석도 혼합모형을 이용해서 할 수 있습니다. 그래서 오늘은 좀 구체적으로 기존의 통계 방법을 혼합 모형에서 어떻게 할 수 있는지 구체적으로 설명하겠습니다. 그래서 혼합모형 이야기만 나오면 쫄아버리는 현상을 줄여볼까 합니다. 데이터는 흔히 여러분이 하는 설문조사 데이터입니다. 즉 횡단면 데이터입니다. 분석목적은 성별과 연령에 따라 자기효능감이 달라지는가이고 이원분산분석을 할 겁니다. 즉 자기효능감=성별+연령+성별*연령 입니다. 먼저 SPSS에서 혼합모형을 클릭합니다. 그럼 다음과 같은 메뉴가 뜹니다. 이 부분은 그낭 넘어갑니다. 즉 ..

혼합모형의 이해1

혼합모형을 이해하기 상당히 힘든데요. 제가 공부할 당시 통계 교과서에서 나오지 않아서 체계적으로, 또는 학술적 권위가 있는 내용으로 배우지를 못했습니다. 그래서 여기서 쓴 내용은 제가 100% 옳다고 장담은 못하겠습니다. 저도 인터넷에서 자료 찾아보고(학술적 권위면에서 조금 약하죠), 저 나름대로 이리저리 시도해 보고 쓰는 내용입니다. 혼합모형이 왜 어려운가? 먼저 첫째, 이론적으로 이해를 해야 합니다. 둘째, 혼합모형은 기존의 대부분 모형, 즉, 분산분석, 회귀분석 등 또는 SPSS에 있는 repeated measure, variance component 등을 포함하는 매우 포괄적인 모형입니다. 그럼 이런 의문이 생길 수 있습니다. 기존에 내가 했던 방법은 틀린 것인가? 그럼 도대체 언제 이 혼합모형을..

이원분산분석:실험효과검증

이번은 이원분산을 이용해서 사전-사후, 실험-통제집단의 실험효과를 검증하는 방법을 설명하겠습니다. 이 경우는 데이터는 공변량 분석과 다르게 하나의 변수로 처리해야 합니다. 즉, 공변량 분석에서는 집단 사전측정값 사후측정값 0 3.5 3.7 0 3.25 3.19 1 2.85 3.25 1 3.41 3.54 0은 통제집단, 1은 실험집단이고요. 그러나 이원분산분석에서는 시차 변수를 추가하고 측정변수는 하나로 만들어야 합니다. 집단 시차 측정값 0 0 3.7 0 0 3.19 0 1 3.7 0 1 3.19 1 0 2.85 1 0 3.41 1 1 3.25 1 1 3.54 이원분산분석 식을 쓰면 Y=u+a+b+a*b+e 이렇게 됩니다. 원래 a와 b는 그리스 문자로 쓰는 것이 관례인데 여기 네이버 블로그에서는 수식편..

공변량 분석:실험효과 검증

사전-사후, 실험집단-통제집단 실험계획에서 가장 많이 사용하는 공변량 분석에 대해 이야기해보죠. 모형식은 Y=b0+b1*X+group+e 사후측정값=bo+ b1*사전측정값+ 집단효과(실험집단과 통제집단)+ 오차 이 모형을 어렵게 생각할 필요가 없습니다. b1=1로 고정하면 사후측정값-사전측정값=bo+ 집단효과(실험집단과 통제집단)+ 오차 하면 우리가 일상생활에서 많이 하는 방법이 됩니다. 즉 어떤 사건이후 사건 전 값과 사건 이후 값하고 차이를 구한 다음 이게 집단별로 차이가 있는지 검증한 것에 불과합니다. 통계학에서는 b=1로 놓지 않고 좀 더 정교하게 분석한 것에 불과합니다. 사실 이 공변량 분석은 통계학 입장에서는 이론적으로 별 문제는 없습니다. 사전측정값이 독립변수로 들어갔는데 이 경우 통계학에서..

실험계획 기초개념:실험효과 검증

실험계획(Experiment Design)은 용어는 좀 생소한데 흔히 하는 사전-사후, 실험집단-통제집단을 설정하여 실험(treatment)의 효과를 검증하는 방법입니다. 이 분야가 현실에서는 매우 중요함에도 불구하고 논문이나 아니면 학계에서 별 인기가 없는 분야입니다. 기본적으로 이론이 분산분석(ANOVA)이기 때문에 통계학 전공하는 사람도 별 관심이 없죠. 요새 같으면 통계 전공하는 학생은 다 인공지능 이런 것 하려고 하지 이런 분야 안 하거든요. 예를 들어 어떤 비료가 농작물 수확에 더 좋을까, 또는 어떤 토양에서 나무가 더 자랄까 이런 것을 실험한다고 해보죠. 그럼 농작물이 다 자라거나, 아니면 나무가 충분히 성숙할 때까지는 최소 1년에서 몇 년까지 걸립니다. 한번 실험 하는데 몇 년씩이나 걸리고..