데이타코딩및 변형팁/추가사항

설문지 코딩시 주의사항 추가

학위논문통계 2013. 3. 7. 02:59

 

1. 설문지 코딩을 하다 보면 응답을 안하거나 분명하게 체크를 안 하는 경우가 있습니다. 그럴 경우 엑셀에서 빈칸으로 놔 두면 됩니다. 그러면 SPSS에서 자동으로 결측값으로 해석합니다. 이럴 경우 해당분석에서 케이스 별로 자동적으로 제외해서 분석합니다. 구조방정식의 경우 결측값이 있으면 AMOS에서 못 구하는 통계량이 있습니다. 그래서 결측값이 있는 케이스는 사전에 모두 제거하는 것이 좋습니다.

 

구조방정식을 하지 않는 경우는 결측값이 그냥 있어도 됩니다. 통계는 평균적인 경향을 보는 것이기 때문에 결측값이 좀 있다고 해서 큰 문제가 있는 것이 아닙니다. SPSS에서는 결측값도 다양하게 구별해서 어떻게 코딩하라고 되어 있지만 전혀 신경 쓰지 않아도 됩니다.

 

만약 응답을 굉장히 불성실하게 한 경우, 즉 굉장히 많은 문항에서 제대로 응답을 하지 않는 경우는 이 때는 그 설문지를 제외하는 것이 낫습니다.

 

 

2. 설문지를 코딩한 다음 제대로 코딩했는지 설문지와 일일이 다시 체크하시는 분이 있는데 이런 필요가 없습니다. 물론 하면 좋겠지만 시간과 돈이 문제지요. 악의적으로 불성실하게 코딩하지 않는 이상 어느 정도 실수는 통계 결과에 거의 영향을 못 미칩니다. 앞에서 이야기 했지만 통계는 평균적인 경향을 보는 것입니다. 한 두 개 실수한 값이 들어간다고 해서 그 평균적인 경향을 바꾸지는 못합니다.

 

300명 대상으로 설문문항이 50개라고 하면 전체 셀 수는 300*50해서 전체적으로 만 오천개 문항이 됩니다. 여기서 한 10개 정도 실수한다고 해서 통계 결과가 달라지면 안되지요.

 

 

그러나 분석 전에 꼭 해야 할 것이 있습니다. 빈도분석을 해서 설문보기 문항을 벗어나는 코딩값은 결측값으로 처리해줘야 합니다. 특히 리커트 척도의 경우 빨리 코딩하다 보면 34, 45 등으로 코딩하는 경우가 종종 생겨납니다. 5점 척도의 경우 1에서 5까지 값을 갖는데 34, 45라는 값을 가진 경우가 들어가면 통계 결과에 심각한 영향을 미칩니다. 이상치(outlier)로서 작용하는 경우이죠.

 

결론적으로

1. 아주 불성실하게 응답한 설문지는 제외해라

 

2. 몇 개 부적절하게 응답한 문항는 엑셀에서 빈칸으로 놔둬라. SPSS에서 결측값으로 처리해 준다. SPSS에서 있는 다양한 결측값 종류는 전혀 신경 쓸 필요가 없다.

 

3. 구조방정식의 경우 결측값이 있는 케이스가 없도록 해라

 

4. 설문지 코딩을 다시 확인할 필요까지 없다. 그러나 분석 전에 빈도분석해서 설문문항 보기 값을 벗어나는 것은 수정해라.