○The Gambler's Ruin Problem

 ▷Gambler와 Casino의 확률 계산

 

 ▶규칙

  ▷Gambler의 돈 i, Casino의 자산 N

  ▷Gambler의 승 (p): i+1 / Casino의 승 (1-p=q): i-1

  ▷Gambler의 돈이 0이 되거나 N이 되면 게임을 더 이상 진행할 수 없음. (1의 확률로 loop)

 

 ▶확률

  ▷Pi = pPi+1 + qPi-1

   ▷Pi+1 - Pi = q/p (Pi - Pi-1)

   ▷P0 = 0

  ▷등비수열의 합 공식( a(rn) / (r-1) )에 의해 다음과 같이 정리 가능하다.

 

○Mean Time Spent in Transient State

 ▷Transient State에서 머무는 시간

 

 ▶s_ij : State i 에서 시작해서, j에서 머무는 평균 시간

  ▷P_T : Transition -> Transition State으로 이동하는 확률들

  ▷δ_i,j = 1 (i = j) / δ_i,j = 0 (i ≠ j) - 처음에 있는 1번 계산

  ▷S_ij = δ_i,j + Σ_k (P_ik s_kj)

   ▷이를 Martix 계산으로 풀면 다음과 같다.

 

 

 

○Time Reversible Markov Chains

 ▷| (i -> i+1로의 transition 수) - (i+1 -> i로의 transition 수)| ≤ 1

 

'수학 > 확률통계' 카테고리의 다른 글

Poission process  (0) 2020.12.09
Exponential distribution  (0) 2020.12.03
Markov Chains Theorems  (0) 2020.11.17
Markov Chains  (0) 2020.11.03
Computing by Conditioning  (0) 2020.10.28

+ Recent posts