Life is Beautiful

主に進化生物学の理論のブログです。不定期更新予定。

WrightのFST

いま、先日紹介したRoussetの赤本で、合祖理論(Coalescent Theory)を勉強しています。僕の解析している数理モデルはWrightの島モデルという、ノードの定めるフローがすべて等しい、空間的に一様な完全グラフ上の移動分散の進化モデルなんですが、その解説が豊富にのった数少ない教科書の1つです。

島モデルは、個体群に空間構造を簡単に定義できる便利なモデルですが、他にも代表的な空間構造には飛び石モデルがあります。2次元の飛び石モデルのことを格子モデルとか呼んだりします。飛び石モデルにしろ島モデルにしろ、解析的都合で突飛な都合を敷いてしまって、移動分散が引き起こす集団の遺伝的分化の解析や、移動分散の進化傾向を予測するという試みが営まれています(Hamilton & May, 1977; Frank, 1986; Taylor, 1988; Frank, 1998; Gandon & Rousset, 1999; Rousset & Billiard, 2000; Rousset, 2004; )。

そういった特異的な集団(Population)における合祖理論というのは非常に発展していて、古くはMauyama(1970)が2次元トーラス(2次元飛び石構造の集団;格子モデルと同じ)の上でフーリエ解析を用いて合祖確率の計算に着手していたりします。Malécot (1975)なども同様で、古典的とはいえ金字塔的な数理的研究として、集団遺伝学では花形的扱いを受けています(理論的に)。なお、両研究、そしてTaylor (1988)はTheoretical Population Biologyというジャーナルに掲載されていて、僕はそれらジャーナルにちょっとした憧れを抱いています(IF自体はそんなに高くありませんが、大好きなジャーナルなんです)。

さてさて、WrightのF_STというのは、「集団全体(Total Population)の異なる2つの分集団から1つずつランダムサンプリングした時に比べて、分集団(Subpopulation)内で2つランダムサンプリングされた2つの遺伝子が同祖的である確率が、期待されるに比べてどれだけ高いか」という量を定めます。以下、「分集団」を「ディーム」、「同祖的」を"IBD"と呼ぶことにしましょう。このF_STをバーバルではなく、きちんと定義すると、




です。ここで、Q_1は、同一のディーム内でサンプリングされた2つの遺伝子がIBDである確率、Q_2は、異なるディーム間で1つずつサンプリングされた2つの遺伝子がIBDである確率です。分母を見てみると、「異なるディーム間で1つずつサンプリングされた2つの遺伝子が"IBDではない"確率」であり、分子は、「異なるディーム間で1つずつサンプリングされた2つの遺伝子がIBDである確率に比べて、同一ディーム内で2つサンプリングされた2つの遺伝子がIBDである確率はどれほど高いか」を定める。分母は「IBDではない下で」を定めるので、条件確率だと思ってもよろしいです。

しかし、これらは統計量として不十分です。何故かというと、遺伝子の頻度に関する情報がExplicit(陽)ではないからです。Wrightは、きちんと定義しています:




ここで、pはディームごとの遺伝子頻度の平均値、Varは分散、Eは期待値を表します。
これらは分集団間の移動分散、すなわちGene Flowに依存して定まる量です。島モデルの場合は、「共通祖先が存在する確率Q=FST」であることが知られています(これは非自明、しかし計算は簡単です;大槻久 氏からご教示頂きました)。ここでQを計算するためには漸化式を用いましょう。基本的に興味が有るのは定常状態ですので、漸化式の定める平衡点を計算すればよさそうです。

Mを、ディームの収容人数とします。登場する唯一のdemographic parameterです。Q'を、次世代において「共通祖先が存在する確率」とします。mを、migration rate(⇔移動分散後、ディームに存在する個体のうち、割合mは外から入ってきた個体で、1-mは在来個体である)とします。すると、Q'の従うべき漸化式は




と書けます。

全体を括るという項は、M匹の中からランダムにサンプリングされた遺伝子が在来である確率を示しています。

中括弧{}の第1項、は、もう一つ選ばれた個体が自分である場合の数(=1通り)に、それが在来である確率(=1-m)を乗じており、もう一つランダムサンプリングされた遺伝子が自分自身であるという「場合の数」を示しています(別の解釈は図)。

{}の第2項、は、もう一つは他個体が酸ップリングされておりかつ在来である場合の数 (N-1)(1-m) に、それが注目の世代でIBDである確率Qが掛けられています。これが漸化式を定めます。


あとはQ=Q'を解き、平衡条件を解析しましょう。これは一次関数で定まる力学系ですので、局所安定性はQの係数の絶対値が1未満であることを見るだけでよいのですが、それは自明です。したがって、Q=Q'=Q*へ(安定な条件下、つまりmとMが一定という仮定の下では)収束します。その値は




と判ります(計算してみましょう)。こういった計算に慣れておくと、Coalescent Theoryでは便利かも知れません。