개요
시간에 따라 어떤 형질이나 유전자의 빈도가 어떻게 변화하는지를 기술하는 정확한 식.
유도
어떤 군집 혹은 집합이 있고 각 원소에 인덱스 $i$가 매겨져 있다고 하자. 인덱스 $i$를 가지는 원소들의 빈도를 $q_i$라고 하고, 인덱스 $i$를 가지는 원소는 어떤 특성 $z_i$를 가진다. 확률 변수 $X$에 대해 그것이 취할 수 있는 값을 $x_i$라고 놓는다면 괄호 $\left< \right>$는 평균 $\left< X \right> \equiv \sum_i q_i x_i$을 가리킨다고 볼 것이다. 따라서 이 군집에서 특성의 평균은 $\left< Z \right> = \sum_i q_i z_i$처럼 계산된다. 또 $i$에 대응하는 적합도(fitness)가 $w_i$라면 그 평균값은 $\left< W \right>$으로 표기될 것이다.
그 자손 세대로 가면 빈도가 $q_i'$, 특성은 $z_i'$으로 표기한다. 그런데 여기에서 주의해야 할 점은, $q_i'$은 인덱스 $i$를 가지는 자손 세대 구성원의 빈도가 아니다. 그것이 아니라 인덱스 $i$를 가지는 부모로부터 태어난 자손들의 빈도를 말한다. 이러한 정의 하에서, 인덱스 $i$를 가지는 부모들이 자손 세대에 기여하는 빈도는 $q_i' = q_i w_i / \left< W \right>$이다.
$z_i'$에서도 마찬가지로 $i$는 부모가 가지고 있던 인덱스를 가리킨다. 그러니까 자손들이 실제 가지고 있는 인덱스는 $i$가 아닐 수 있으므로 $z_i'$ 자체도 가중평균을 통해 구해져야 하는 값이다. $\Delta z_i \equiv z_i' - z_i$로 정의한다.
이제 특성의 평균 $\left< Z \right>$가 얼마나 변화했는지를 다음처럼 적자. $$\Delta \left< Z \right> = \sum_i q_i' z_i' - \sum_i q_i z_i.$$ 앞의 관계식들을 사용해 이 식을 적절히 고쳐적으면 다음과 같다: \begin{eqnarray} \Delta \left< Z \right> &=& \sum_i q_i' z_i' - \sum_i q_i z_i\\ &=& \sum_i q_i (w_i / \left< W \right>) (z_i + \Delta z_i) - \sum_i q_i z_i\\ &=& \sum_i q_i (w_i / \left< W \right> - 1) z_i + \sum_i q_i (w_i / \left< W \right>) \Delta z_i. \end{eqnarray} 이제 양변에 $\left< W \right>$를 곱하자: \begin{eqnarray} \left< W \right> \Delta \left< Z \right> &=& \sum_i q_i (w_i - \left< W \right>) z_i + \sum_i q_i w_i \Delta z_i\\ &=& \sum_i q_i w_i z_i - \left< W \right> \sum_i q_i z_i + \sum_i q_i w_i \Delta z_i\\ &=& \left< W Z \right> - \left< W \right> \left< Z \right> + \left< W \Delta Z \right>\\ &=& \text{Cov}(W,Z) + \left< W \Delta Z \right>. \end{eqnarray} 이것이 프라이스(George R. Price)가 유도한 방정식이다.
첨언
자손이 가지는 실제 인덱스를 가지고 표기한 것을 $\tilde{q}_j$, $\tilde{z}_j$라고 해보자. 부모가 인덱스 $i$인 조건 하에서 자손이 인덱스 $j$를 가지는 확률을 $p_{ji}$라고 써서 $\tilde{q}_j = \sum_i p_{ji} q_i$라고 하자. 이 때 $\tilde{q}_j$의 전체 합을 1로 보존하기 위해 $\sum_j p_{ji} = 1$을 만족해야 한다. 자손 세대의 평균 특성은 $\sum_j \tilde{q}_j \tilde{z}_j$일 텐데 이것이 위에 적은 $\sum_i q_i' z_i'$과 같으려면 아래 두 식이 언제나 같아야 한다. $$\sum_j \tilde{q}_j \tilde{z}_j = \sum_{ij} p_{ji} q_i \tilde{z}_j$$ $$\sum_i q_i' z_i' = \sum_i \frac{w_i q_i}{\left<W \right>}z_i'.$$ 이는 $z_i'$이 다음처럼 계산되어야 한다는 뜻이다: $$z_i' = \frac{\left<W \right>}{w_i} \sum_j p_{ji} \tilde{z}_j.$$
$w_i/\left< W \right> = q_i' / q_i$이므로 위 식을 다시 고쳐서 쓰면 $$q_i' z_i' = \sum_j p_{ji} q_i \tilde{z}_j$$ 이다. 이는 인덱스 $i$인 부모가 자손 세대의 특성에 기여하는 정도를 다음처럼 풀어서 적는 것과 같다: 즉 비율이 $q_i$인 부모가 $p_{ji}$를 거쳐서 자손 세대에는 $j$라는 인덱스를 주게 되는데 그 자손의 특성이 $\tilde{z}_j$이다. 이를 모든 $j$에 대해 합한다.
선형 회귀법을 사용한 표기
적합도 $W$를 설명변수 $Z$로 기술한다고 가정해보자. 즉 $w_i = \alpha + \beta z_i + \epsilon_i$로서, 최소제곱법을 사용하면 $\beta = \text{Cov}(W,Z)/V_Z$를 얻는다 ($V_Z$는 $Z$의 분산). 프라이스 방정식은 따라서 다음처럼 고쳐 적을 수 있다. $$\left< W \right> \Delta \left< Z \right> = \beta V_Z + \left< W \Delta Z \right>.$$
피셔의 "자연선택 근본정리"와의 관계
$Z$는 임의의 특성이므로 만일 $Z=W$라면 다음의 식을 얻을 것이다: $$\left< W \right> \Delta \left< W \right> = V_W + \left< W \Delta W \right>.$$ 이 때 설명변수와 종속변수가 동일하므로 $\beta$는 단순히 1이 된다. 우변의 첫 번째 항은 자연선택에 의한 효과, 두 번째 항은 환경의 변화에 의한 효과로 해석된다. 두 번째 항이 0이 되는 경우, 혹은 자연선택에 의한 변화량만을 볼 경우, 적합도의 변화는 $$\Delta \left< W \right> = \frac{V_W}{\left< W \right>}$$ 처럼 쓰여져서, 해당 시점의 적합도의 분산에는 비례하고 평균에는 반비례한다.
죄수의 딜레마에서
죄수의 딜레마와 같은 게임에서는 선택에 의해 참가자 모두의 보수가 낮아지는 결과가 빚어지기 때문에 근본정리가 말하는 바와 어긋나게 된다. 일반적으로 적합도가 빈도에 의존하는 경우 근본정리가 적용되지 않으며 (Nowak, 2006) 특별히 보수 행렬이 완전히 대칭적인 경우에만 적용이 가능하다 (Harms, 2011).
참고문헌
- Steven A. Frank, Foundations of Social Evolution (Princeton University Press, Princeton, NJ, 1998).
- Bruce Walsh and Michael Lynch, Evolution and Selection of Quantitative Traits (Oxford University Press, Oxford, 2018).
- Martin A. Nowak, Five Rules for the Evolution of Cooperation, Science 314, 1560 (2006).
- William Harms, Evolutionary Games and the Modeling of Complex Systems, in Philosophy of Complex Systems, edited by Cliff Hooker (Elsevier, Oxford, 2011), pp. 163–176.