包括適応度理論の限界

Allen, Nowak & Wilson (PNAS)
Limitations of Inclusive Fitness
http://www.pnas.org/content/early/2013/11/22/1317588110.abstract

また包括適応度理論を攻撃する論文が出ていたので、ぼちぼち読んでいました。アブストは下のような感じ。

Until recently, inclusive fitness has been widely accepted as a general method to explain the evolution of social behavior. Affirming and expanding earlier criticism, we demonstrate that inclusive fitness is instead a limited concept, which exists only for a small subset of evolutionary processes. Inclusive fitness assumes that personal fitness is the sum of additive components caused by individual actions. This assumption does not hold for the majority of evolutionary processes or scenarios. To sidestep this limitation, inclusive fitness theorists have proposed a method using linear regression. On the basis of this method, it is claimed that inclusive fitness theory (i) predicts the direction of allele frequency changes, (ii) reveals the reasons for these changes, (iii) is as general as natural selection, and (iv) provides a universal design principle for evolution. In this paper we evaluate these claims, and show that all of them are unfounded. If the objective is to analyze whether mutations that modify social behavior are favored or opposed by natural selection, then no aspect of inclusive fitness theory is needed.

ネタバレですが、この論文による包括適応度の批判焦点は、「因果性を検出できない」こと、そして「BやC, Rをデータから推定しても、これまでの包括適応度の理論予測にあてはまらないことがある。従って包括適応度理論はミスリードである」ことです。

Until recently, inclusive fitness has been widely accepted as a general method to explain the evolution of social behavior. Affirming and expanding earlier criticism, we demonstrate that inclusive fitness is instead a limited concept, which exists only for a small subset of evolutionary processes.

earlier criticismというのはNowak et al. (2010): Evolution of eusociality のことでしょう。後半は、進化プロセスを説明する上で非常に限られた文脈でしか包括適応度理論は機能しない、という意図なのでしょうが、これに関しては不服です。包括適応度理論は、性比、分散、誘導防御、多細胞性の進化など、様々な現象に関して適用され、理解されてきました。

Inclusive fitness assumes that personal fitness is the sum of additive components caused by individual actions. This assumption does not hold for the majority of evolutionary processes or scenarios. To sidestep this limitation, inclusive fitness theorists have proposed a method using linear regression.

適応度が足し算の場合にしかできへんのやろ?
という指摘のように思いますが、これも勘違い（彼らほどの大御所に言わせると、"勉強不足"）です。包括適応度理論によるアプローチには、おおまかにいってneighbor-modulated approachとinclusive fitness approachがあります（Taylor & Frank 1996; Frank 1998; Rousset 2004、その他たっくさ〜んの理論研究）。後者は（直感的に言えば）Nowakたちの言う適応度の足し算です（単純加重和；粕谷1990）が、前者は、個体の適応度を、（周囲の個体との、戦略的相関≈遺伝的相関を考慮して）直接的に計算するものです。そして、非対称な場合の血縁度の定義や"B"や"C"の定義をしっかり明確に行えば、両者は等価な結果を与えます。

そのうえで、前者のneighbor-modulated approachというのは、きちんと「個体の」適応度になっているのです。足し算ではありません。そして（マージナルな）包括適応度というのは、その適応度を野生型の表現型値のまわりでTaylor展開をして（そこに弱い選択という仮定が必要になる）、でてきた一階微分の項の和のことなのです。

Taylor展開をおこなって1次の項の符号を調べるというのは力学系の安定性解析における初歩的な、実に初等的な作業です。力学系の局所安定性に関しては基本的に（フルランクの限りは）完結します。一般論はありません。大域安定性に関しては数学の発展すら追いついていないのです。だから様々な方法が提案されてきました。リアプノフ関数の構成はその1つの方法ですし、ランクが落ちたら中心多様体を構成してみようとか標準型normal formに変形するとか、サドルがでてきて構造不安定になったらメルニコフの方法を使うとか。。その「脆弱さ」を攻撃したい"ならば"、力学系の数学の未熟さ"も"攻撃しないといけないのではないでしょうか?もちろん、尤もそんな必要性はそもそもにしてありませんが。*1

On the basis of this method, it is claimed that inclusive fitness theory (i) predicts the direction of allele frequency changes, (ii) reveals the reasons for these changes, (iii) is as general as natural selection, and (iv) provides a universal design principle for evolution. In this paper we evaluate these claims, and show that all of them are unfounded.

包括適応度理論家は、包括適応度理論によって、次のようなことが可能であり事実であると説明する：
(i): アリル頻度の変化の方向を予測する。
　その通りですし、実際、包括適応度理論家である彼ら（いや、私たち?）はそう主張しています。もちろん、適切な仮定の下で。
(ii): なぜその変化が起きたのかを解き明かす。　その通りです。ハミルトン則で記述すると、どういった項が適応度上のコストやベネフィットを形成するのか、見通しがよくなります。
(iii): 自然選択と同じくらいに一般的である。　オカシイでしょう。包括適応度理論は自然選択理論とパラレルに扱われるものではありません。どちらがジェネラルか、という比較はそもそものロジックが破綻しています。しいていうなれば、自然選択（による適応進化）理論とパラレルに扱われる（べき）ものは、中立進化理論でしょうね。
(iv): 普遍的な進化の原理を提供する。
　ここで一般だとか普遍的だとか彼らが言うものって、一体何なのでしょう?包括適応度理論で全てが説明される、というのは聞いたことがありません。もちろん、繰り返しますが、適切な仮定の下では、あるクラスの現象を説明することに成功します。そもそも、理論（やその中で展開される数理モデル）というのは「常に間違い」なのですから、厳密に全ての項を取り込んだりするというのは数理モデルが数理モデルである意義を失わせるものとすら思います。その想定があれば、1つの現象をより見通しよく予測できる理論や数理モデルが見つかったなら、（まずは）その中で議論する、というのは科学的な姿勢として非常に自然だと思うのですが。彼らNowakの提唱した数理モデルって、Nature2010の中で全て、完全に全て！補遺に押し込められていて、ややこしい式でシミュレーションを行なっているだけでした。そしてそれを、真社会性の進化を説明する際には引用すらしない。いったい誰がどうやって査読したんだと呆れるばかりの内容でしたよね。結局、共通の目標（「協力行動や社会性の進化を説明する」）があって、その上で異なるアプローチが提案され、同じ帰結を与え、それも（数値的でなく）「数学的に」深い洞察を提供するものがあったとしたら、そちらを採用したくありませんか？もちろん、全てを厳密に説明するという究極的な目標もあるわけなのですが、「全てを厳密に説明するのは真のモデル、すなわち"現象そのもの"しかそうあり得ない」はずですし、彼らの立ち位置は非常に中途半端だと思います。少なくとも進化生態学の中での彼らのモデルの意義は、僕には理解できません。

以上のような(i)〜(iv)を吟味すると、事実無根（unfounded）であったとのことですので、じっくり読み解いていくとにしましょう。アブストの最後は

If the objective is to analyze whether mutations that modify social behavior are favored or opposed by natural selection, then no aspect of inclusive fitness theory is needed.

と書かれていますが、必要のない理論かどうかはこの論文からは解りません。個人的な感想として、この論文は大学生のレポート程度の内容しか含まれていないように思います。

イントロ

イントロは、包括適応度理論の幕開けとハミルトンによる包括適応度の定義から始まっています。ハミルトンが1964年に提唱した包括適応度理論というのは、現代ではより（彼の文脈において）正しいように是正されていますし、それはハミルトン自身も「最初は間違ってた」というのは認めているところです（特に、血縁度はMichodとのδ-グラフ理論で彼自身がきちんと再定義している）。Nowakたちは、「その定義は間違っていたので後から再定義が繰り返されたものの、ハミルトンの筋道自体は踏襲されている」と述べます。

ここから批判が始まります。「適応度は、和にpartitionされると仮定されている」、「一般にそんなはずがないだろう」、「たとえば明らかに他の個体の形質値に非線型な影響を受ける」。最後の主張はまったく正しいですが、上でも述べたように、そんな仮定は必要ありません。ただ、テイラー展開（つまり、式を「和で近似する」操作。数学において一般的に行われる）したら、それっぽい項が結果的に出てくるだけです。それは近似です。ただの近似。強い選択がかかったら、テイラー展開の1次の項までじゃ不十分だから、高次の項までチェックするか…　というのが数理科学者としては通常の感覚でしょうね。ここを読む限りは、彼らの批判のポイントは（的外れであるが）additivity（相加的；適応度は、血縁個体の適応度の和である）というものに集約されることがわかります。実際、適応度が相加的でない例が引き合いに出されていますが、これはちょっと読んでみないとなんとも言えません。

包括適応度への、2つのアプローチ

アプローチが紹介されています。突然変異は表現型値に弱い効果しか持たない。それによって相加性が保証される。
これはその通りですが、Adaptive Dynamicsでも敷かれるスタンダードの仮定のはずです。

さて、具体的に包括適応度によるアプローチを詳解していくことになるのですが、根底にあるのはPrice方程式：

$E[w]\Delta E[g]=\mathrm{Cov}[w,g]+E[w\Delta g]$
E[ ]は、の中身の平均値、Cov[ ] はの中身の共分散をあらわします。この表式のもとでは、適応度に関して少し注意が必要ですが、Nowakたちはそれに関してノーコメントです。それは、適応度w_iは「タイプiの個体が、タイプiの子どもをいくつ残せるか」ということです。これについては、Frank(1998)の本で説明されています。もしw_iの解釈を「タイプiの個体が、子どもをいくつ残せるか」という量に変換すると、後ろのE[ ]の第二項はなくなります。そのとき、適応度は遺伝子の適応度ではなく、遺伝子ののった個体の適応度、ということになります。無性生殖の場合には前者の解釈のままでいいのですが、たとえばマイオティック・ドライブがある場合、第二項は無視できません。しかしNowakたちはそのコメントもなく、展開を進めていきます。さて、共分散の定義

$\LARGE \mathrm{Cov}[x,y]=\frac{1}{N}\sum_{i=1}^N x_iy_i-\frac{1}{N^2}\sum_{i=1}^N\sum_{j=1}^N x_iy_j$

を導入しておきましょう。x_iとかy_jとかは任意の統計量ですが、ここでは集団からサンプルされたときの各個体i=1,2,...,Nの遺伝子型値とします。そのラベルは任意ではあるのですが、カンタンのため以降は、x_iは「第i個体が利他的なアリルを持っているなら1,そうでないなら0」とわりあてることにしましょう。ハプロイドの場合、これはもちろん個体内の遺伝子頻度を表します。そして以降は、その遺伝子型値をgとしましょう。

さて、進化の必要条件の1つは適応度wと遺伝子型値gとに相関があることですから、線形回帰させておきましょう：

$\LARGE w_i=W_0-Cg_i+Bg_i'+\varepsilon_i$

CとかBとかは線形回帰の係数で、 $\LARGE g_i$ は第i個体の遺伝子型値、 $\LARGE g_i'$ は、第i個体が相互作用をもつ個体の遺伝子型の平均値です。

そして、具体的に相互作用のカタチを想定して、血縁度やBやCやW0を求めていくことになりますが、ε^2の和は最小二乗法で最小になるので、ε^2の和が、BやCやW_0で偏微分を行なうと0になること（極小性の必要条件）を利用して、BやCを"推定"します。図1をそのまま抜粋するのはイケナイので、下に貼ります。なお、ε^2を最小にすることによって、εの和がゼロになる、という事実が得られます。

色は遺伝子型、数字は次世代に残せる子供の数、両矢印は相互作用があったことを表します。このなかで、Nowakたちは血縁度の計算を行なっていくことにします*2：

f:id:lambtani:20140104214450j:image:w360

しかしこのシナリオで、適応度に変異が大きく、淘汰の弱さが仮定されていないことは非常に大きな問題です。が、一応ここでは計算の確認だけすませておきましょう。彼らの主張としては、「Hamilton則が成立しており（RBーC>0）、確かに青色のアリルは頻度を高めることができた。しかし、だからといって、もたれた相互作用が協力だったりスパイトなのか、わからないではないか。つまり、ハミルトン則から生態学的な相互作用のとられかたを推定することはできないし、そんな相互作用が協力行動であると結論づける科学的根拠など存在しない」というものです。

ここの指摘自体は正しいのですが、私は「Hamilton則が成立する⇔相互作用のありかたがわかる」といった主張を見たことがありません。相互作用のありかたによる相互作用のありかたの推論、たとえば、「R, B, Cすべて>0でRBーC>0⇒コストのかかる協力行動が進化する」といった主張は（適切な仮定のもとでは）正しいでしょう。実証研究者がハミルトン則を用いて相互作用を推定するときには、サンプル数の大きさが十分である状況で、選択が弱いという仮定のもとで、おこなわれると理解していたので、ここは私には疑問でした。繰り返しますが、ここでの彼らの指摘自体は正しいと思うのですが、私はそういった逆の推論を行なっている系を知りません（知らないだけかもしれない）。

そういった点に注目して、Nowakたちは3つのシナリオを具体例として挙げます。

Hanger-on

子沢山の個体に対して優先的にペアを持とうとするタイプのことを彼らはHanger-onと呼んでいます。「すねかじり」とでも呼ぶべきでしょうか*3。ただしここでペアを組んで相互作用をもっても適応度に影響がない、と彼らは仮定しています。計算するとRBーC<0でR<0、B>0, C<0が得られるので、「包括適応度理論家たちが呼ぶところの、協力行動として評価されてしまう」と結論づけています。

この計算などはすべてチェックして正しいのですが、問題は、なぜ黒の個体間でそこまで適応度に大きな差があるのかということでしょう。つまり、彼らは恣意的に黒いタイプが同一であると表現していますが、生態学的なシナリオによって子どもを残せる数に違いが見られているのだとすると、それらは（可塑的ないかぎり）違うタイプであるとかんがえるのが自然なのではないでしょうか？つまり、僕なら下のように考えます：

つまり生態学的/遺伝学的な要因によって、子どもを残せる数に変異があると考えるのが妥当なのではないでしょうか?そうすると、「ジェノタイプ」をバイナリーに恣意的に振ることはできないのではないでしょうか?そもそも、Price方程式というのは、「同じタイプ⇒残せる子供の数は等しい」という仮定にもとづき、そのもとでハミルトン則は導出されるべきものです。

もちろん、環境的な要因によって、子どもを残せる数に非常に大きな違いが見られることもあるでしょう。（相対適応度が1というのを考慮すると）ある個体は3のこして、かたや別の個体（ただし同じタイプ）は0というのは、非常に考えにくいことです。もちろん、別の生態学的なシナリオによって適応度の変異が生じたのだとすると、こういったことは起こりうることでしょう。しかしそのときには、その側面に応じて適応度やタイプを定義すべきなのであって、同一タイプ内にこうした形で変異を（天下り的に）定義することはできません。あるいは、特定で共通の確率分布から産仔数をランダムに取り出す（つまり、独立同分布に従う産仔数を考える）ことを考えるべきでしょう（これは個体ベースモデルと云われます）。彼らはここに関しては実証研究でハミルトン則を用いていることを批判しているのかも知れませんが、なんとも焦点のぼやけた批判であるという印象です。

なお、このHanger-onモデルで彼らは、「多くの子供を残すタイプに対して選好的に相互作用をもつ」というタイプをhanger-onと呼んでいますが、これはどうなんでしょう…これ自体が（非常に有利な）形質なのではないかと思うのですが…。ここでも彼らの、「血縁選択には血縁認識が不可欠」という誤解が現れているように思いました。*4

他にも、Nowakらは"jealous"（適応度の高い個体を、自身の産仔を犠牲に攻撃する）、"nurse（コストを払って他個体を治療する）"といったシナリオを考えていますが、これらもうえと同じ理由で、ダメです。

しかしNowakたちは少し勉強を進めたようで、「適応度は個体ではなく遺伝子に対して適用される概念である」ということは理解してくれたようです。ただ、適応度にここまで強い変異がある時点で、選択は非常に強いし、そもそもなぜそんなに違うのかを考える別の側面が必要です。

さて、その選択の強さがどうワルさをするのか、もう少し考えてみましょう。Nowakたちは、Cov[g,g']/Var[g]という表式からRを求めていますが、遺伝子頻度がわかっているのであれば、もう少しストレートに計算が可能です。そこで、次のような状況を考えてみましょう。

集団中に、部分集団（deme）がたくさん並んでいます。そのdemeは、きっちり二個体だけを収容でき、相互作用はそのdeme内でのみ起こります。集団は、2つのジェノタイプAとBとだけで占められていて、集団レベルでは、Aは割合p、Bは割合q（=1ーp）だけ在るとします。つまりp（ないしq）はA（ないしB、resp.）の遺伝子頻度です。そして集団をくわしく見てみると、demeはAA、AB、BBといういずれかの構成になっていて、その頻度はp[AA]：p[AB]：p[BB]であったとしましょう。"Hardy-Weinberg配列"的には、それらはp^2、2pq、q^2であってほしいところです（このような配列をもつ集団は、「集団構造が無い」と呼ばれます）。が、実際にはズレがみられることでしょう。そのズレを（なんとも回りくどいやりかたですが）次のように書きましょう：
p[AA]＝p^2+αpq
p[BB]=q^2+βpq
p[AB]=2pq-(α+β)pq.
このとき、p[AA]+p[AB]/2=p（=Aの頻度）であるはずなので、これを解くとα=βが得られます。そこでα=Fと置いてみましょう。すると
p[AA]=p^2+Fpq
p[AB]=2pq(1ーF)
p[BB]=q^2+Fpq
となります。どこかで見たこと在るなあ…と思われた方は鋭くて、これはdiploid無限集団におけるヘテロの減少に関する式ですね。

さてこのもとでこのFにきちんとした解釈を与えましょう。Fは集団構造の（ない場合からの）ズレを表した量ですので、F-統計量（っぽいもの）と考えられます。このp,q,Fを用いて、Grafenの秤を用いて血縁度を計算してみましょう。Grafenの秤とは、血縁度Rを計算するための次のような式です。

R=(sーt)/(1ーt)

ここでtは、集団から期待される場合に、AがA（ないしBがB）とペアを組む（＝相互作用をもつ）確率で、sは実際にAがA（BがB）と相互作用を持つ確率です。ランダムな相互作用の場合に比べて、どれだけ高い確率で、AがAと（利他性の文脈では、利他個体同士が）相互作用を持つか、という量です。この場合、Aに注目するとt=pです（集団にはpだけAがいるので）。ところが実際は、Aはどれくらいの頻度でAと相互作用をもつかというと、

s=p[AA]/(p[AA]+p[AB]/2)

です（条件付き確率；Aが相互作用を行なうというもとで（＝「分母の割合に対して」）、AがAと相互作用をもつ確率）。2で割られているのは、「AA」にはAが2個体含まれているために2度カウントする必要が有るためです。これを真面目に計算してみると、
s=(p^2+Fpq)/(p^2+Fpq+pq(1-F))=p+qF.
よって、t=p（⇔1ーt=q）に注意して
R=(sーt)/(1ーt)=(p+qfーp)/(1ーp)=F
となります。つまりR=Fです。Bに着目して計算しても（当然）同じR=Fが得られます。*5

このことを覚えておくと、Nowakたちの行なったRの計算はもっと簡略化されます。たとえばHanger-Onの場合、
集団にはAは1/8、Bは7/8だけあって、
BB、AB、BB、BB
という配列が得られています。つまりp[AB]=1/4、p[BB]=3/4です。上の議論からp[AB]=2×pq×(1-R)と判ったのですから、これを適用すると
1/4=2(1/8)(7/8)(1ーR)⇔R=ー1/7
となります（つまり、ランダムなAとBとの混合の場合に比べて、AはAと相互作用を持つ確率が、低いということ）。これはNowakたちの計算に合致しますね（Hanger-onの図参照）。

さて、近交係数FでRが計算できるということはつまりcov/varで血縁度を計算する時には、家系図に依る計算が（背後で）行われているということです。そしてこの家系図による計算をおこなうときには、選択は非常に弱いという要請が課せられます（どの遺伝子が確率XXでYYにいく、などの計算をするから）。それが今回のNowakたちのモデルでは非常に強い選択を仮定していて（ある個体は4個体も子供をのこせる、かたや別の個体は0個体）、血縁度の計算が実は破綻しているのです。このことはたぶん古くはMichod & HamiltonのΔグラフ理論、Grafen(1985?86?)などで指摘されてきていたことなのですが…。

Hanger-on以外のモデルも同じ理由で破綻しています。しかし彼らは高らかと、「Hamilton則は破綻した」と宣言してしまい、最終的には包括適応度理論は不必要だと結論づけてしまっています（なにも洞察を与えない、とかなんとか）。

あのNatureの論文もそうですが、査読者はいったい何をしていたのでしょう。

*1:non-additive gameにおける包括適応度理論は、Ohtsuki 2010, Evolutionで、triplet relatednessにより解析可能です。Nowakの一番弟子の彼の論文を読んでいないはずはないのですが。

*2:血縁度とは、相互作用の構造の指標とかんがえることができます。R=0の時は完全にランダムな相互作用で、R<0の時は、ランダムな相互作用から期待されるよりも高い確率で遺伝的に縁の薄い個体と相互作用を持つということです。R>0はもちろんその逆であり、ランダムな相互作用から期待されるよりも高い確率で遺伝的に近い個体と相互作用を持つということです。ただしこれは、空間が一様な場合の定義としては正しい（今回のPNAS論文ではいずれのシナリオにおいても移住は考えないので一様な構造を持つと解釈することは可能なのですが、相互作用のもたせ方がランダムではない（恣意的）なので、ロジックが複雑に見えます）が、非一様な空間、特にクラス構造が実在する集団においては、正しくありません。繁殖価の計算と、血縁度の計算が、クラスごとに必要になります

*3:どうやら「脛かじり」そのまんまの意味のようです

*4:たとえば緑髭効果

*5:なおここで、「自分とも相互作用をもつ」という解釈を加えると、別の血縁度の表式R=(1+F)/2が得られるが、これはNowakたちの値と当然合致しなくなってしまう。それは、彼らがモデルの中で「自分との相互作用」をカウントしていないためだ（それは別に問題はない）。しかし一般に包括適応度理論の文脈ではそれらは必然的に区別されるべき血縁度指数となっていて、Rousset2004やOhtsuki2010では、きちんと説明されている。友人のAntonio Rodoriguesは、「whole-group relatedness(自分との相互作用もカウントした血縁度)」と「others-only relatedness（他者との相互作用のみをカウントした血縁度）」と述べている。とうぜんこれからの違いは、選択が十分弱い場合の、近交係数と親縁係数との違いと、集団遺伝学的に完全に等価である。

Life is Beautiful

主に進化生物学の理論のブログです。不定期更新予定。

包括適応度理論の限界