통계프로그램 , S-plus 소개 이번에는 이쪽에 관련된 프로그램을 간단히 소개하겠습니다. 먼저 흔히 이야기하는 수학 프로그램입니다. 대표적인 것이 mathematica와 maple 등이 있습니다. 이건 우리가 중고등학교 수학 문제 푸는 것과 같은 문제를 해결해 주는 프로그램입니다. 적분값이 어떻게 되는지, 미분하면 어떤 함.. 기타통계이야기/통계프로그램 S-plus소개 2013.05.06
다변량 정규분포에 적용 행렬 이야기를 계속 해보죠. 다변량에서 많이 나오는 다변량 정규분포식을 한번 보죠. 앞의 K는 지저분한 것으로 신경 쓸 것이 없고요. 그리고 (x-u)'=((x1-u1), (x2-u2), (x3-u3), ..., (xk-uk))입니다. 평균을 원점으로 이동하면 지수 위 부분은 결국 이 됩니다. 이걸 Spectral Decomposition 정리인 A=P'DP 를 .. 기타통계이야기/행렬,고유값(eignevalue),다변량통계 2013.05.06
행렬의 개념, 고유값, 고유벡터, 회전행렬 1. ER 지난번 equivalence relation에 관해서 썼는데요 이거 사실은 다 아는 이야기입니다. 한국사회의 가장 큰 문제의 하나인 혈연, 자연, 학연이 다 ER입니다. 이 ER은 세가지 조건을 만족해야 합니다. 먼저 자기는 자기와 “어떤”관계여야 하고, 자기와 A와 “어떤 관계”이면 A와 자기와 “어.. 기타통계이야기/행렬,고유값(eignevalue),다변량통계 2013.04.30
partition, function, equivalence relation, sufficient, 행렬 우리가 생각하는 어떤 집합 S가 있을 때 이 집합이 자연스럽게 분할(partition)되는 경우가 있습니다. 그 대표적인 것이 그 집합 S에 정의되는 함수, 또는 equivalence relation(이후 ER이라고 하죠)이 있을 경우입니다. 이 경우 집한 S가 함수 T에 의해 분할된다. 또는 ER에 의해 분할된다고 합니다. .. 기타통계이야기/행렬,고유값(eignevalue),다변량통계 2013.04.24
주류통계학과 베이지안, 자꾸 산으로 가는구나.... 1. 앞서 이야기한 바대로 주류통계학에서 모수에 대한 확률의 개념을 거부하기 때문에 가능성(우도)함수 설명하는데 온갖 어려움이 생깁니다. 그래서 주절주절 이상한 이야기들을 많이 하고요. 아마 이걸 공부하신분도 가능성함수를 이해하려고 머리 좀 써 쓸 겁니다. 저도 학부 때 당연.. 기타통계이야기/베이지안 생각하기 2013.04.10
행렬, 고유값(eigenvalue), 다변량 통계 1. 들어가면서 행렬, 고유값, 통계, 특히 다변량분석과의 관계에 대해서는 몇 편의 글을 써야 할 것 같네요. 글 하나로는 부족할 것 같고요. 들어가기 전에 먼저 언급할 사항은 1) 2차원에서는 원, 타원, 그리고 3차원에서 생각하면 구, 타원체(럭비공 모양)에 대해 이야기 할 겁니다. 따라서 .. 기타통계이야기/행렬,고유값(eignevalue),다변량통계 2013.04.06
베이지안 생각하기 1. 베이지안 공식의 의미 베이지안에 대해서 조금 더 이야기해볼까요? 베이지안 정리 공식입니다. f(세타|x)=f(x|세타)*f(세타) 여기서 f는 확률분포를 전반적으로 가리키는 일반적인 표시로 보시면 됩니다. f(세타)를 사전(prior)확률이라고 하고 f(세타|x)를 사후(posterior)확률이라고 합니다. 그.. 기타통계이야기/베이지안 생각하기 2013.04.05
확률분포와 우도함수(가능성 함수) 이해하기 지금 옛날에 공부한 것이 제대로 기억이 안나 정확한지는 모르겠고요. 확인할 시간이 없어서요. 나중에 잘못된 것이 있으면 수정하겠습니다. 일반적으로 확률공간(Probability Space)라면 세 개의 요소가 들어 있는 집합공간입니다. 로 정의됩니다. 여기서 시그마는 표본공간(sample space)라고 .. 기타통계이야기/확률분포와 우도함수 2013.04.01
성적취향과 인권감수성, 해가 뜰 확률... 1. 성취향과 인권감수성의 관계 최근 모 인권운동교수 사건으로 좀 시끄러웠죠. 그 사건에 대해 이야기를 하려고 하는 것이 아니고요. 거기에 관련해서 통계문제를 좀 생각해보자는 것이죠. 사람의 성적 취향을 SM, 비SM 등 이진 변수로 취급하고요, 인권감수성도 인권적, 비인권적 이진변.. 기타통계이야기/성적취향과 인권감수성의 관계 기타 2013.03.30
표본수와 이상치 그 응용 일단 표본수(설문응답자수)가 많으면 중심극한정리나 대표본 성질에 의해 정규분포로 가지 때문에 이론적으로 좋습니다. 그런 문제를 떠나 직관적으로 이해를 하면 표본수가 적으면 일단 이상치(outlier)에 의해 통계결과가 심각하게 왜곡될 수 있습니다. 조사한 사람이 10명 미만인데 유.. 기타통계이야기/표본수와 이상치 2013.03.26