読者です 読者をやめる 読者になる 読者になる

Life is Beautiful

主に進化生物学の理論のブログです。不定期更新予定。

グループ淘汰と血縁淘汰の形式的な等価性?その5 : ペイオフ行列ダイナミクスの補遺

さて、前回書きそこねた補遺です。

「確率\( p_C \) で戦略 \( \mathcal{C} \) をとるタイプ」を協力者、「確率\( p_D \)で戦略\( \mathcal{D} \)をとるタイプ」を裏切り者と呼ぶことにします。戦略ごとのペイオフを行列表示すると

です。

  • 戦略\( \mathcal{C} \):相手が\( \mathcal{C} \)をすると\( R \), 相手が\( \mathcal{D} \)をすると\( S \)だけ利得がある。
  • 戦略\( \mathcal{D} \):相手が\( \mathcal{C} \)をすると\( T \), 相手が\( \mathcal{D} \)をすると\( P \)だけ利得がある。

という意味でした。ということは、協力者は確率\( p_C \)で\( \mathcal{C} \)を選択し、裏切り者は確率\( p_D \)で\( \mathcal{D} \)を選択するということです。以下では、\( q_C:=1-p_C\)および、\( q_D:=1-p_D\)と定めます(ただし、\( p_C-p_D=q_D-q_C=\delta \))。

ということで、自分が協力者であるなら、協力者を相手どった場合の利得の期待値は \begin{align*} a_{C|C}=\pi_{0}:=Rp_C^{2}+Sp_Cq_C+Tp_Cq_C+Pq_C^{2} \end{align*} となります。第1項は、自分も相手も\( \mathcal{C} \)をした場合、それは確率\( p_C^{2}\)で起こり、そのときの利得は\( R \)であるということから従い、第2項は、相手が\( \mathcal{D} \)をして自分が\( \mathcal{C} \)というのは確率\( p_C(1-p_C)\)で起こり、そのときの利得は\( S \)である。そして第3項相手が\( \mathcal{C} \)をして自分が\( \mathcal{D} \)をするのは同じ確率\( p_C(1-p_C)\)で起こり、そのときの利得は\( T \)である。最後は、相手も自分も\(\mathcal{D}\)をするのは確率\( q_C^{2} \)でおこり、そのときの利得が\( P \)ということです。

同様に、自分が協力者のときに裏切り者を相手どった場合の利得の期待値は

\begin{align*} a_{C|D}:=R p_Cp_D + S p_Cq_D + T q_Cp_D +P q_Cq_D \end{align*}

となります。したがって、\( p_D \)とか\( q_D \)とかを、\( \delta \)を用いて消去するのですが、代入して\( \delta \)の項を括って…というのはあまり楽しくないので、高々\(\delta\)の2次式というのを見越した上で、ちょっとした工夫をしましょう。 \( \partial p_D / \partial \delta = -1\)かつ\( \partial q_D / \partial \delta = 1\)というのをふまえ、\( a_{C|D}=a_{C|D}(\delta) \)を\( \delta \)の関数として、代入操作や偏微分を実行しましょう。このとき、

\begin{align*} a_{C|D}(0)=Rp_C^{2}+(S+T)p_{C}q_{C}+Pq_{C}^{2}=\pi _{0} \end{align*} が得られます。さらに、チェイン・ルールから、

\begin{align*} \frac{d a_{C|D}}{d \delta}&=& \frac{\partial a_{C|D}}{\partial p_{D}}\bullet \frac{\partial p_{D}}{\partial \delta}+ \frac{\partial a_{C|D}}{\partial q_{D}}\bullet \frac{\partial q_{D}}{\partial \delta} \\ &=& (P-T)q_C-(R-S)p_C=:\pi_{1}. \end{align*}

ゆえに、1次式だったので\( a_{C|D}= \pi_{0}+\pi_1 \delta \)であると定まります。他の項も同様に書き下すと、\( a_{D|C}(0)=\pi_0 \)や、 \begin{align*} \pi_{2} &:=& \frac{da_{D|C}}{d\delta}(0)=q_C(P−S)−p_C (R−T), \\ \pi_{3} &:=& \frac{1}{2} \frac{d^{2}a_{D|D}}{d\delta^{2}}=(R-S-T+P) \end{align*} と求まります。これから、最終的に、混合戦略として望ましい表式である

が得られます。テンソル計算(クロネッカー積での計算)を利用すれば、もう少し形式的な表示が可能やと思います。