통계이론/주류통계

조건부확룰4

학위논문통계 2013. 10. 2. 23:38

1. 앞의 조건부 확률3에서 법정에서의 조건부 확률 틀린 부분 수정했고요.

 

 

 

여기서 조건부 확률이나 조건부 기댓값을 계속 이야기하는 것은 첫째. PET 프로젝트에서 조건부 기댓값이 많이 나오고요. 둘째, 금융공학 수학적 이론에서 기초부분을 이야기하기 위해서입니다. 금융공학에서 수학 이론 부분은 제가 공부를 좀 더 한 다음 여기 블로그에서 올리기로 하죠. 여기서는 간단하게 소개 정도, 이쪽에 공부하려고 하는 사람들이 초반에 헤매는 부분에 대해 간단하게 언급하겠습니다.

 

 

 

조건부 확률 문제 중 가장 유명한 문제가 Monty Hall 문제입니다. 미국의 천재 칼럼니스트의 글로 인해 유명해졌다고 하는데요, 전도 옛날에 그 칼럼을 한번 본 적이 있습니다. 그 당시 그냥 조건부 확률을 구하면 되지 하고 넘어갔는데 최근에 다시 보고 간단한 문제가 아니라는 것을 알았고요. Monty Hall 문제는 검색해서 한번 알아보시기 바랍니다.

 

 

 

사실 이 문제는 확률쪽에서는 이미 알려져 있는 문제입니다. 저는 간수의 고민이라고 이름 붙였는데요. Ross의 가장 기초적인 확률 책에 연습문제에 나와 있습니다. 제가 학부때 숙제로 풀은 기억이 납니다. Ross 기초확률책 조건부 확률이나 베이지안 부분의 연습문제에서 한번 찾아 보세요. 이 간수의 고민 문제가 조금 생각해보면 Monty Hall 문제랑 똑같은 유형의 문제임을 알 수 있습니다.

 

 

 

아마 그 당시 숙제 할 때 저도 틀렸을 겁니다. 통계하는 사람도 이 문제가 꽤 골치 아픈 문제라고 생각한 사람들이 별로 없었을 것 같고요. 그래서 처음 Minty Hall 문제가 나왔을 때 통계하는 사람이 많이 헷갈렸다는 이야기도 있고요. 나중에 시간 나면 한번 쓰겠습니다.

 

 

 

 

 

2. 조건부 기댓값에서는 이론적으로 접근할 때 두 가지를 명심해야 합니다. 하나는 조건으로 들어오는 확률변수의 함수, 즉 조건부 기댓값 역시 확률변수라는 것하고요. 둘째는 조건 Y가 들어왔을 때 E[X]Y]는 원래 변수 X에 대해 가장 비슷하게 근접하는 확률변수라는 것. 앞에서 피타고라스 정리에 의해 X와 가장 짧은 거리를 가지고 있다고 했죠. 그러나 원래 X 보다는 좀 엉성한 확률변수라는 것이죠.

 

 

 

1)

 

좀 더 구체적으로 생각해보죠. X는 고3 학생들의 키라고 하고, Y는 성별이라고 하죠, 그리고 E[X|Y=남자]=173, E[X|Y=여자]=162라고 하면 조건부 기댓값을 일반인은 162와 173 두 개의 값으로 생각한다는 것이죠. 그러나 이론적으로 공부할 때는

 

E[X1Y]=162, Pr(여학생)

           =173, Pr(남학생)

 

이와 같이 뒤의 확률까지 생각한다는 것이죠. 그래서 E[X|Y]도 확률변수가 된다는 것이죠.

 

 

 

2)

 

두 번째로 이 E[X|Y]는 X와 비슷한 확률변수이지만 X보다는 좀 엉성한 확률변수라는 것이죠.

 

이걸 설명하기 위해서 좀 다른 예를 들어보죠. 주사위를 던지는 실험입니다. X는 주사위를 던져서 위에 나오는 숫자입니다. 그래서 X=1, 2, 3, 4, 5, 6의 값을 가집니다. 한편 Y는 주사위가 1, 2, 3가 나오면 2이라는 값을 주고, 4, 5, 6 이 나오면 5라는 값을 준다고 생각해보죠. 그럼 Y는 분명히 X의 어떤 함수입니다. 이걸 그림으로 그리면 아래와 같습니다. 즉 Y는 X보다 좀 엉성한 함수가 됩니다.

 

 

 

 

 

 

  

이젠 고3학생의 키 문제로 돌아가보죠. 아래 그림을 보시죠. 위의 그림처럼 가상적으로 그리면 다음과 같습니다. 원래 파란색은 키 X를 나타낸다고 생각하고 빨간색은 E[X|Y]로 생각하라는 것이죠. 그럼 E[X|Y]는 원래 X보다 상당히 엉성한 함수가 된다는 것이죠. 

 

 

 

 

 

 

  

이 이야기를 왜 하는가 하면 시그마-field를 이야기하기 위해서입니다.

 

조건부 기댓값을 구하는 공식은 책에 다 나와 있습니다.

 

 

 

 

 

여기서 실제 계산하는 과정에서 어려운 점이 있을 수는 있지만 공식은 간단합니다. 그럼 위 공식만으로 충분할까요(공식이 맞나?)

 

만약 이런 경우를 생각해보죠

 

E[X|X^2] 반대로

 

E[X^2|X] 이런 경우는 어떻게 될까요

 

좀 골치 아프죠. 위의 경우 X^2의 값을 알면 X는 +, - 두 개의 값을 가집니다. 그래서 따져 봐야 합니다. 그러나 아래는 X의 값이 주어지면 X^2는 바로 결정됩니다.

 

 

E[X^2|X]=X^2

 

이 됩니다. 그래서 일반적으로 Y=g(X). 즉 X의 함수인 확률변수라 하면

 

E[g(X)|X]=g(X)

 

가 되고 앞의 조건부 기댓값에서와 마찬가지로

 

E[E[X|Y]|X]=E[X|Y]

 

가 됩니다. 왜냐하면 g(X)는 X보다 좀 엉성한 확률변수이고 앞에서 설명한 바와 같이 E[X|Y]도 X보다 좀 엉성한 확률변수이기 때문입니다.

 

위의 공식은 전에 나온 E[E[X|Y]=E[X}란 다른 공식입니다. 더 복잡하죠.

 

 

그럼 앞의 이야기를 이론적으로, 수학적으로 엄밀하게 전개해 나갈 수 없을까 하는 생각이 듭니다. 여기서 나온 것이 시그마-field입니다.

 

 

 

따라서 이 개념을 알면 조건부 기댓값의 어려운 이론도 좀 쉽게 알 수 있고, 또 여기서 martingale이라는 새로운 확률프로세스 개념이 나옵니다. 이 martingale를 소개하는 이유는 금육공학에서 옵션 가격 때문에 그렇습니다.

 

 

금융공학의 앞부분은 주식가격 모형과 옵션가격 결정에 관한 이론입니다. 이 옵션 가격을 결정할 때 주식의 수익률은 전혀 도움이 안됩니다. 즉, 전에 주식이 얼마나 상승했는지, 또 여기서 구한 주가 수익률을 가지고 앞으로 주식가격의 예측이 현재 옵션가격 결정에는 전혀 영향을 못미친다는 것이죠. 주가 수익률 대신 무위험 이자율을 사용합니다. 즉 국채나 망할 가능성이 없는 대형은행의 복리 이자율을 사용한다는 것이죠. 만기가 1년 후인 옵션의 가격 결정에서 1년 후 주식이 어떻게 될 것이다하는 예측은 아무런 도움이 안된다는 것이죠. 좀 놀라운 사실이죠.

 

 

이와같이 실제 주가수익률을 사용하지 않고, 무위험 자산 수익률을 사용하는 것을 risk neutral 확률분포(measure), equivalent martingale 확률분포(measure)라 합니다.

다음 시간에는 시그마-field에 대해 간단히 소개하고 옵션가격 결정하는 과정에서 간단히 소개하겠습니다.

 

 

'통계이론 > 주류통계' 카테고리의 다른 글

가능성함수(우도함수)와 MLE2  (0) 2013.12.30
가능성함수(우도함수)와 MLE(최대가능성추정량)  (0) 2013.12.28
조건부확률3  (0) 2013.10.02
Rao-Balckewll정리, 조건부 기대값  (0) 2013.08.05
불변  (0) 2013.07.24