수학:확률

두 가지 관점

  • 모집단의 특성을 나타내는 매개변수는 고정된 상수로서 우리에게 알려져 있지 않다.
  • 확률은 장기간에 걸친 상대적 빈도로 해석된다.
  • 통계적 절차는 실험을 무한히 반복했을 때의 결과를 통해 평가된다.
  • 매개변수의 실제 값이 우리에게 불확실하므로 이를 확률변수로 취급한다.
  • 확률 법칙은 매개변수에 대한 추론을 위해 직접 사용된다.
  • 매개변수에 대한 확률적 진술은 “믿음의 정도”로 해석되어야 한다. 사전(prior) 확률은 주관적이어서 각자는 자신의 사전 확률을 다르게 가질 수 있으며 이는 개인이 매개변수의 가능한 값들에 얼마만큼의 가중치를 주는지에 해당한다. 즉 데이터를 관찰하기 전에 매개변수의 값이 이 정도라는 게 얼마나 그럴 듯한지 생각하는 정도이다.
  • 데이터를 수집하면서 베이즈의 정리를 따라 매개변수에 대한 우리의 믿음을 고쳐나간다. 이를 통해 사후(posterior) 확률을 얻는다.

확률론의 반례들

$\mathbb{P}(A_{i_{1}} A_{i_{2}}\cdots A_{i_{k}})=\mathbb{P}(A_{i_{1}})\mathbb{P}(A_{i_{2}})\cdots\mathbb{P}(A_{i_{k}})$가 $k=2,\ldots,n$인 모든 $k$와, $1\leq i_{1}<i_{2}<\ldots<i_{k}\leq n$인 모든 $i_{1},i_{2},\ldots,i_{k}$에 대해 만족된다면 $A_{1},\ldots,A_{n}\in \mathcal{F}$는 상호독립이라 한다. $k=n=2$인 경우에는 짝독립이라 한다.

상호독립과 짝독립의 관계를 보기 위해 다음과 같은 상황을 생각하자.

겉보기에 차이가 없는 $16$개의 바구니가 앞에 놓여 있다. 바구니 안에는 $1$ 또는 $0$이 적힌 쪽지 하나씩이 들어 있는 공 $3$개가 각각 $1,2,3$이라고 표시되어 있다. 이 때, 우리가 바구니 하나를 열어서 $1$번 공에 $0$이 적힌 쪽지가 있을 지 $1$이 적혀 있을지 확인할 수 있을 것이다. 이러한 상황은 아래와 같이 표기될 수 있다.

$A_{i}=$ $\{$ $i$번째 공에 $1$이 적혀있는 경우 $\}, i=1,2,3$

그렇다면 \begin{equation}\notag P(A_{1})=P(A_{2})=P(A_{3})=\frac{1}{2} \end{equation} 이 되고 \begin{equation}\notag P(A_{1}A_{2})=P(A_{1}A_{3})=P(A_{2}A_{3})=\frac{1}{4} \end{equation} 이 되어 $A_{1},A_{2},A_{3}$은 짝독립이 된다.

하지만 $P(A_{1}A_{2}A_{3})=\frac{3}{16}\neq\frac{1}{8}=P(A_{1})P(A_{2})P(A_{3})$인 사실로부터 상호독립은 아니라는 것을 알 수 있다. 하지만 역으로 상호독립이면 짝독립을 만족한다.

함께 보기

참고문헌

  • W. M. Bolstad, Introduction to Bayesian statistics (Wiley, Hoboken, NJ, 2007).
  • J. M. Stoyanov, Counterexamples in Probability, 3rd edition(Dover, 2013)
  • 수학/확률.txt
  • Last modified: 2021/02/08 22:26
  • by minjae