Life is Beautiful

主に進化生物学の理論のブログです。不定期更新予定。

ElsevierとMathTypeの相性の悪さ

Elsevier社が編集を担当するジャーナルを投稿する際には、EES(Elsevier Editorial System)を利用し、オンラインでWordファイルからpdfへのビルドを行なうのが普通です。

当然、pdfビルドというのは、Wordファイルに含まれる文字情報を落とさずに「拡張子をコンバート」する作業ですので、(ただのスクリーンショットとは異なり)内的な変換プロセスが伴います。つまり、内的なエラーがつきものです。

私が経験したエラーは次のようなものです:

EESを用いて、wordファイルをpdfにビルドすると、MathTypeで挿入した一部の数式が消える。

僕の経験上で消えたのは…

また、MathTypeの根本的エラーも:

埋め込んだ数式が画像形式になってしまって、編集できなくなる

さて、こういうエラーが起こった場合はいつも泣き寝入りし、文章を作りなおしたり、あるいは記号を変更したりしていたのですが、解決策を見出しました。

MS WordにMathTypeで数式を埋め込むなら、.doc形式にする!

まず、画像形式になってしまうのを防ぎましょう。MathTypeのDesignScience社に、こんなノートを見つけました。

Equations have become non-editable “pictures” in Microsoft Word

ここでは解決策が呈示されていますが、そうなる前に、Word2011/2008などの使用は諦め、2004のdoc形式を採用するとよいでしょう。目下、.doc形式で、そのような事態に陥ったことはありません。

MS WordにMathTypeで数式を埋め込むなら、MathType独自のフォントの使用を避ける!

昔、投稿論文の中で、bullet(クロマル)記号を用いていたのですが、Elsevier Editorial Systemを利用してPDFビルドしたところ、bulletが見えなくなるという事態に陥ったことがありました。そして注意してよく見てみると、全てのギリシャ文字も消えているのです。なんどビルドしても、ダメ。これは困った。ということで試行錯誤してみたのです。

その結果、どうして行き着いたのか、この解決策。

ツールバーの「スタイル」→「スタイル設定」で見えるはこのような設定。よく見ると、ギリシャ文字のタイプセットが設定できます。

f:id:lambtani:20140815191946p:plain

いまは、ギリシャ/数式フォント:Symbol and MT Extraとなっています。MTとは実は、MathTypeの略なのです。そう、MathTypeは独自のタイプセットを用いていたのです。そこで…

f:id:lambtani:20140815192045p:plain

Euclid Symbol and Euclid Extraという設定に変えてやります。全体的に、数式・記号・ギリシャ文字が細く表示されるようになります。可読性は確かに、MTのほうがよさそう。

でも、解決策はじつはこれ。このように設定しておくことで、EESを経由してPDFビルドしたときに、ギリシャ文字が消失するトラブルを回避できます!これ、Design Science社に伝えたのですが、対処されたのかなあ〜。

エディターが新規性を判断してリジェクトするのはヤバい!

科学論文というのは通常、投稿後にまずエディター(=原稿をレビュアーに送ったり、査読者の査読コメントを投稿者に送る業務に充てられた人)の手元に届いた後、御眼鏡に適えば査読者に回されます。もしエディターが、査読にかける必要すらないと判断した場合、エディターリジェクトと言って、改善コメントはほぼ何もなく(?)投稿者の手元に原稿が戻ってきます。もし原稿の完成度に自信がある場合は、短時間で結果がわかるのでアリガタイこともあるかも知れません*1

僕は幸か不幸か、まだエディターリジェクトを食らったことはありませんが、その基準とは一体、何なのでしょうか?TREEにこんな論文を見つけました:

Arnqvist 2013 "Editorial rejects? Novelty, schnovelty!"

Schnoveltyとは著者による造語なのでしょうか。ちょっと調べても意味が分かりませんでした。*2

本旨を大雑把に言うと、「エディターの手元で新規性を重視しすぎると、科学の価値自体を貶めることに繋がりかねない」というものでした。アブストはこんな感じ:

Because many journals are currently increasing the rate of pre-peer-review editorial rejects, the editorial criteria upon which such decisions are based are very important. Here, I spotlight ‘novelty’ as a criterion and argue that it is a very problematic decisive factor at this stage of the editorial process.

本文
  • この10年で、大手ジャーナルへの投稿数は2倍かそれ以上に増加している
  • それによって単にリジェクト率が高まるだけでなく、有能なレビュアーを探す仕事にも負荷が増す
  • これを解決するための方法が、エディターによるリジェクト
  • とはいえ、それがエスカレートすると、結局、エディターの総合的な手腕がますます要求される一方
  • サイエンスにおける「門番」は必要かつ重要なのだが、狭き門になればなるほど、門番の仕事は難しくなる
  • 主要なジャーナルの一部は、次のような規準を設定している:(1)ジャーナルにとって適切なトピックかどうか;(2)新規な研究かどうか。
  • 1つめの、ジャーナルへの適合性は問題がないであろう
  • しかし、エディターが「新規性」を判断するのには非常に多くの問題があることを、3つの理由を挙げて述べる

1. 新規性の査定というのは、読者の知識や価値観に依るものである!

  • 読者が決めるべきことであって、新規性の度合いというのは、エディターが判断材料とする他の項目に比べて、要求されるものが大いにあることだろう
  • 1人のアソシエイト・エディターがあらゆる領域のプロたりえるはずがないのだから、新規性の欠如によるエディターリジェクトは、精通性を欠く*3誤った判断に陥りがちである
  • エディターによる決定における恣意性というのは投稿率が高まるごとにその程度が増すものであるから、掲載可否の重要な判断規準として「新規性」を考慮してエディターが決定を下すというのは、そういう悪しき傾向をさらに悪化させかねない

2. エディターと著者は、共進化する!

  • エディターの判断に応じて著者が対策を練るというのは自然なこと
  • 新規性に基づくエディターリジェクトという風習が悪化すると、研究者たちが科学の中に自分の勝手な輪郭を描くようになることに繋がる
  • これは、二流のサーカスがバケツに片足を突っ込んで3つのゴルフクラブでジャグリングをし、高々と「こんなことができる人はこれまでいなかった!」と叫び、オールド・ラング・サインをヨーデル調に歌うようなものだ…だがそれはよく言ってもただのマヤカシだ

ここの記述には、笑いました。大きな研究プロジェクトのタイトルに見られる傾向と、まったく同じだと思いました。研究費の申請は"ニホンゴ"で書くようにせねば。

3. 真に新奇なものというのは科学においてほとんどない!

  • 科学の進み方というのは先行研究によって形成された基盤(=巨人の肩)の上に立つものであり、関連する研究は正しい科学的営みの礎となるものだ
  • 先行研究を引用して、自分の研究と対比させるなどがそれに当たる
  • しかしだからこそ、自分の研究というのはそれに対する貢献が微量であり、新規性がないと感ずるに至る
  • その結果、著者には、知ってか知らずか、自身の研究の印象をふくらませて誇張し、先行研究をしぼませたり、無視したり、あるいは貶めたりすることになる

すべての研究は、巨人の肩の上で行われるべきものです。

  • エディターが判断すべきは新規性ではなく、この段階では問題が生じにくい規準(トピックの妥当性、科学的・技術的な質)にもとづいて行われるべきだ
  • 当該の研究の新規性や、それがどのくらい科学の発展に寄与するかは、エディターによる最終判断に基づくべきではあるのだが、それはそのフィールドに長けたレビュアーに任せるべき仕事だろう
  • エディターが新規性を判断するなどという悪しき風習は排斥されてしかるべきだ
  • それは科学を破壊してしまいかねない。掲載可否の判断の恣意性が高まり、貧弱な科学的営みを助長するばかりだ

なかなかおもしろい論文でしたが、身につまされる思いでもありました。自信を持って、ほそぼそと自分の研究を続けていこうと思います…!

*1:でも、査読者に審査され、改善案や問題点を指摘された経験のある原稿のほうが、客観性と完成度の高い論文になりやすい、ということも有り得るかも知れません。とはいえこれは、後付のポジティブな考え方でしかありませんが

*2:後記:shnookという、「馬鹿者」を意味するスラングとの洒落なのかもしれません

*3:less informedという表現が用いられていた。特定のブンヤに対する無知に基づく、といった意味だろう

科学論文を投稿するときに、やること、やってはいけないこと

Walsh et al. 2008: The do's and don't's of submitting scientific papers Comparative Biochemistry and Physiology Part B: Biochemistry and Molecular Biology

やるべきこと

投稿する前に、ジャーナルのスコープとそれに関する記述を吟味すること!

:そのジャーナルの読者層がズレている場合、アクセプトする価値がそもそもないわけです。

様式をきちんと整える!

:「アクセプトされたら整える」なんて言う人もいるが、不要な落ち度をつくるべきではないでしょう。

コストを確認すること!

:ページ制限を越えたら?カラー処理は?別刷りチャージは?

カバーレターを丁寧に書くこと!

:重複投稿がないこと。データは他のどこにも掲載されていないこと。共著者全員の了承がとれていること。新規性を紹介する。なぜこの研究には価値が有るのか。なぜこのジャーナルに適していると考えられるのか。

査読者の候補、エディター候補を提案すること!

:ジャーナルのスタッフは忙しいので、余計な手間をかけさせるくらいなら、研究背景を理解している著者自身が適切な査読者やエディターを指定したほうが、お互いのためでしょう。

やってはいけないこと

submitボタンを押したら全てがスムースに進む…などと考えてしまうこと

:査読者のレポートは〆切が2〜4週間程度。そして査読者とエディターのやりとりもある。投稿後6週間〜2ヶ月音沙汰がないなら、問い合わせてみよう。しかし、フィールドのシーズン、グラントの〆切、ホリデーなどによっては対応が遅れることもある。

エディターからのコメントを文字通りに解釈すること

「査読者は全員アクセプトといっているよ!」とか「リジェクトにきまっているだろう」などという解りやすいレターはそうそうない。むしろ、「アクセプトするならメジャー・リヴィジョンが必要」、「このままではアクセプトできない。リバイズするかしないか、決めてくれ」といった定型的な書き方が多く、その場合には門戸は閉ざされたわけではない。

査読者のコメントを過度に個人的に受け止めること

:エディター自身、査読者が個人的にコメントを入れ込んでも深刻に受け止めない。エディター側は、誰が査読したかもちゃんと知っているのだから。

そして再び、やること

改定後の原稿はアクセプトせざるを得ない、という状況に持ち込むこと!

:査読者への返事は丁寧すぎるほどに。礼儀正しく。

そしてアクセプト後には…

栄誉を享受すること!

:ウェブサイトのpublication listで、「submitted」を「in press」に書き換えてしまおう。

印刷の進捗を確認すること!

プルーフを確認し、入念にチェックする。値、小数点、表、図やその軸、などなど。

勝利のダンスを踊ること!

:そのために研究者は生きているようなものである。

ウェブサイトにリンクを貼る(PDFを載せる)こと!
家族に別刷りを送ること!
レビューを書いてみようと考えてみること!

「シミュレーションモデル」の結果に、仮説の有意性検定を行なってはならない!

White et al. 2014: Ecologists should not use statistical significance tests to interpret simulation model results Oikos

ちょっと前の論文ですが。生態学モデリングにはいくつかの方法があります。近年は、個体ベースモデルを含むstochatsticな計算機的手法が多く取り入れられています*1。それ以外にも、確率過程を何らかの形で内包するモデル、より一般に確率モデルは、シミュレーションすることで"しか"結果が得られません。そんなモデルを、シミュレーションモデルと呼ぶことにします。*2

で、そんなシミュレーションモデルでは、1回のシミュレーションを1つのサンプルと扱います。しかしたとえば100回まわした場合には、それらの結果に「統計的な」解釈を与えたくなってくるわけです。とくに、「頻度主義」的に、「P 値」を計算したくなるが、頻度主義者の心。しかしそれに対して「ちょっと待ったぁ!」というのがこの論文。アブストを訳すと:

シミュレーションモデルは、生態系のダイナミクスを表現するために随所で用いられている。シミュレーションモデルに関するよくある疑問は、モデルに現れるパラメータの値や関数形を変えた場合に、結果はどのように変わるかというものだ。研究者の中にはこれに対して、ANOVAなどの頻度主義的な仮説検定法を用いている者もいるようだが、これは2つの理由で不適切だ。まず、P 値は、統計学的な検出力(つまり反復)によって決められるものであり、それはシミュレーションの文脈においてはいくらでも高くなりうるものであり、したがって効果量によらずいくらでも小さいP 値を吐き出せるのだ。第二に、処理(たとえばパラメータ値の変更)間で結果に差がないとする帰無仮説はア・プリオリに誤りである、と調べている人は知っているのだから、そもそも検証の前提とすべきものが間違っているのだ。P 値が小さいことによって、観察された差異に対する誤解・過大評価/過小評価が生ずる*3ことがある以上、P 値を用いるのは(単なる正誤の問題ではなく)厄介な問題なのである。この論文では、モデルを組み立てる人はこのような慣習を捨て去り、シミュレーション結果間の差異の度合に注目するべきである、ということを論ずる。

イントロ
  • 生態学的なシミュレーションモデルの結果を解析するために統計的な手法を用いるというのは非常によく観られる光景だ。
  • たとえばパラメータ値、あるいはモデルの関数形(線形から二次へなど)を変更した時に、その結果がどう変わるかの応答を調べるためにANOVA(分散分析)を用いることもあるだろう。
  • 我々の考えでは、シミュレーションモデルの結果に有意性検定(以下、検定と呼ぶ)を行なうのは、統計理論の誤用だ。
  • そうではなくて、シミュレーション間の差異の度合(効果量)に注目することを推奨する;それと同時に、検定が適切であり得る場合ーーーというのが存在するならば、の話だがーーーに関する議論を展開する。

この"discussion regarding when – if ever – statistical significance tests could be appropriate"の、"if ever"に、著者らの並々ならぬアンチ頻度主義的なスタンスが看取されて興味深い。

  • 検定に対して過度な強調を置くことの危険性は、生態学ではよく知られているものだ。
  • P 値というのは効果量や検出力を以て初めて意義があるものであり、生物学的な重要性を必ずしも示唆はしない、ただの閾値であることは繰り返し注意喚起されている。
  • それに加え、シミュレーションモデルの結果を検定することには2つほど問題がある:1つ目は検出力。検出力というのは反復によって決まる量であるのだから、サンプルサイズ、すなわちシミュレーションを回す回数によって決まる。2つ目は、帰無仮説の設定。通常の仮説検定においては、帰無仮説が「真」かどうかを知らない。しかしシミュレーションモデルでは、少なくともプログラマーはパラメータ*4を知っているのだから、「パラメータや関数を変更した場合に生ずる差異に統計的な意味がない、という命題が偽であるとア・プリオリに判っているような帰無仮説」を検証する価値はない。

1つ目の話は、P 値が有意水準を上回った場合にも、改めてシミュレーション結果(=サンプル)を追加すれば簡単に有意差は出せる(ことがある)ので、そもそも0.05とか0.01という水準の意味がそれこそなくなってしまうというもの。2つ目は、後出しジャンケンということだ。あるいは、論理上はトートロジーに近いという話でしょう。差を設けたのだから差があるのは当たり前なのです。

また、この次のパラグラフにおいては、「統計的有意性に注目するのは不適切である一方で、効果量の違いを評価することには意味がある」と述べており、また、ANOVAや回帰など、頻度主義的な方法によって、そういった評価が可能なこともあるということが断られています。次のセクションからは、実際の論文のデータや解析を例示することで、上のような問題が現れることを示していきます。

MANOVA with n=24,000

Marzloff et al. 2013: Sensitivity analysis and pattern-oriented validation of TRITON, a model with alternative community states: Insights on temperate rocky reefs dynamics Ecological Modelling

  • ロブスター Jasus edwardsii、ウニ Centrostephanus rodgersii、海藻2種 Ecklonia radiataおよびPhyllospora comosaの群集ダイナミクスモデル(特に、alternative-states dynamics model*5)。
  • ロブスターの捕食行動の機能的応答(Hollingのタイプ1〜3)を変えた場合にどういった違いが生まれるか、群集ダイナミクスの感度分析。
  • 機能的応答1,2,3の3通りのそれぞれに対して、8000回のシミュレーション(初期条件のみ異なる)をまわし、MANOVAで、群集組成の多変量解析に関する指数に生じた差異を解析。
  • 結果、機能的応答には、有意な効果が認められた; \( p <10^{-15}\), \( F_{2,23997} = 67.5\).
  • しかしその有意性は、F検定で約24000に近い自由度があることに起因することをMarzloffらも認めている。
  • そのため、統計的な有意性にもとづいてではなく、ダイナミクスのグラフを用いて結果を視覚的に比較。すると、「統計的有意性」は強いにもかかわらず、視覚的にはほとんど違いがないと結論づけられた;つまり機能的応答はダイナミクスに大きな違いをもたらすわけではない。

最後の「視覚的に結論をつけた」あたり、著者が途方に暮れた感が見て取れる。

  • この論文での解析は、著者らが最初に述べた、シミュレーションモデルへの仮説検定の孕む2つの問題をうまく例示してくれている。
  • Marzloff et al. (2013) が答えようとした問題は「ロブスターの機能的応答は、群集の平衡状態に関するモデルの予測に影響をあたえるか?」だったが、これは、帰無仮説の検証には不適切だ:機能的応答の関数形(1〜3)を変えれば群集ダイナミクスに違いが生まれるなんてのは初めから知っていることだ。
  • 従って知りたいのは、「違いが生まれるかどうか」ではなく「どの程度違うのか」というものだ。
  • 帰無仮説は暗に次のように立てられている:「model results using each of the three functional responses are drawn from populations with identical distributions」(「3つの異なる機能的応答から得られた結果」が実は同一の確率分布からサンプルされたものである)
  • その帰無仮説が偽なのは調べずとも明らか。なので、わざわざ統計的な有意性を論ずる事自体、無意味である。
  • なので、生ずるとすれば過誤は第二種のみであり、それを回避できるような検出力がありさえすれば十分だ。
  • 第二にそもそも、この研究の枠組みにおいては有意水準はどんな値でもいい。
  • 0.05だろうが0.01だろうが\( 10^{-15}\)だろうが、24000もありゃ、生物学的な効果量に関係なく、そりゃー有意差は出る。
  • それはシミュレーションモデルだけではなく、フィールドデータや実験データの解析においても通有する性質である。
  • 特にシミュレーションモデルでは反復する(サンプルを新しく得る)のは簡単だし非常にロウコストであり、この一般的な原理の、おろかしいまでの極例と言える。
  • 視覚的に違いを論ずるというやり方をとったのには納得しないものの、Marzloff ら2013がMANOVAにおいて小さいP値を重視しないという点は正しい:視覚的なやり方ではなく、直接にMANOVAにおいて効果量を直接算出するか、あるいは単に群集の状態の従う確率分布(平衡状態が従う確率分布)を主成分分析によって比較すればよかった。

主成分分析をすることで、どのパラメータが強く効いているか、というのをある程度は量的に評価できるわけです。

  • なにも、「帰無仮説は偽であることがア・プリオリに判っている」というのは、生態学のシミュレーションモデルに限った話ではない:Johnson (1999)は自明に棄却される帰無仮説をまとめている*6
  • たとえば、人が踏み込んで伐採をおこなった森林と踏み込まれていない森林とで、樹木の密度は同程度である、など(明らかに異なる)。
  • 一般に異なる2地点で何らかの変数(魚の個体数など)を比較した場合、差がみられるのが、観察に基づく研究においては普通である(e.g. Johnson 1999)。

これはまさに、統計的な有意性が、生物学的な重要性を保証するわけではないという好例と言えましょう。

  • 2つの地点が全く同一の確率分布に従う(あるいは全く同一の母集団に属する)とは考えにくい。
  • これは、操作実験において処理をランダムに割り当てるという状況とは対照的なものだ(処理がランダム効果の場合には帰無仮説の成立が理にかなった期待といえよう)。
  • シミュレーションモデルはある意味で数値実験を行なうことであるのだから、操作実験と同様の解析を行ないたくなるのだろう。
  • しかしシミュレーションモデルというのは、真のモデルが解っている;処理(パラメータ値や関数形の違い)とそれへの応答の間の関係というのは、あってアタリマエですでに知っているものなのだ。
  • 問題は単に「そういった関係を統計的に検出するためには、反復数はいくら必要なのか」というものでしかなくなってしまっている。
  • 実証生態学では、生物学的な意義と統計的な有意性とが普通はある程度、対応づくことは認めよう。
  • しかしその対応は、膨大な反復回数を稼げるシミュレーションモデルにおいては完全に損なわれるのである。

シミュレーションモデルというのは、自分でパラメータなどの操作をセットした上で行えるので、推論の様式がそもそも野外実験研究とは異なるわけです。なるほど、確かにそうですね。シミュレーションモデルというのは、予測をするための実験なのでしょう。

査読者の問題なのか?

解析方法というのは査読者たちの責任の一部でもあるわけですから、査読のプロセスがまずいこともあるのではないか、というのは自然な発想です。

  • 著者らがMarzloff et al. 2013を仮説検定のバカバカしさの好例として用いたことには、Marzloffら自身が彼らの研究の中でのP値の無意味さを認めていたからという理由もある。
  • 現にMarzloffらがそういった解析に乗り気でないことから、おそらく査読者につっこまれたから、という事情がありそうだ。
  • 著者ら自身も査読者からそういった(ナンセンスな)指摘をうけたことがあるし、よくある困った出来事なのではないか。
  • こういった問題(シミュレーションモデルでのP値の算出)は、査読者に突っぱねられた場合を考慮すると、文献検索で明らかになるよりももっと一般的なものなのではないか。
  • 査読者にそういうP値算出のナンセンスな指摘をされるという経験もある。

最後のことは最近、友人から実際に話を聞きました。本当にあるのです。そういったナンセンスな指摘へのrebuttalには、この論文を引用したいところです。なお著者ら個人個人も逆に査読者として、そういった解析をした論文をつっぱねたことがあるようです。

  • Samhouri et al. 2009 :生態系のキーとなる"性質"(多様性、生産性、平均栄養段階など)を表現するシステム特異的な"インジケーター"(特定の機能群のバイオマス)を特定するモデルを7つ構築。
  • 各モデルにおいて、漁業範囲の摂動をシミュレートし、各シミュレーションにおいて"インジケーター"と"性質"との関係を調べる。
  • その解析の中で、著者らは相関係数の算出こそ行えど、その有意性は論じていない。さらには、サンプルサイズ(シミュレーションの回数)が大きいので、生物学的に重要でない相関が有意と判定されうることを断っている。
  • この「欠陥」は査読者とのやりとりで指摘された点であろう;査読者にとっては、P値がわからない限りは、そういう相関は不確かだからだ。実際、そのようにインジケーターの使用への支持/不支持をP値で以て決定している論文などやまほどある。
  • 結果的にSamhouriら査読者との議論に勝利したものの、いったいそういう不適切な解析を主張する「誠実な」レビュアーがどれだけいることだろうか。
  • P値の重要性と厳格な仮説設定は若い生態学*7に早い時期に頻繁に教えこまれているはずなのだから、こんな誤りは理解し難い。

そして最後に著者らは、本論文がレビュアーの理解にもモデルを建てる人の理解にも繋がることを願っている、とこのセクションを締めくくっています。

頻度主義的な統計学を、生態学のシミュレーションモデルで使うことはあるのか?
  • 異なる真のモデルをもつシミュレーションの結果に仮説検定を実施することは意味が無い、ということをこれまで見てきたが、頻度主義的な統計解析がシミュレーションモデルの役に立つ状況もある。
  • たとえばANOVAは、分散を分解して多変数をふくむシミュレーションで効果量を算出するのに便利でよく知られたフレームワークだ。
  • ・・・P値の算出などしなければ、ね。

ではどのように役立つのかの具体例を。

  • Corell et al. 2012バルト海でプランクトン性の海洋生物の幼生の移動分散距離に影響する要素を検証するために流体力学的な物質循環モデルを構築。ラグランジアン粒子(目に見える擬似的な「幼生」体)を流し、3Dの海流による漂流を追跡。そのなかで、幼生の軌道はランダムな乱流に影響をうけるという意味で、移動分散は確率的な挙動を示す。
  • 一度のシミュレーションでは216通りの処理コンビネーション*8。シミュレーション回数は3回(パラメータのチョイスは3通りということ)。

いくら計算時間がかかるとはいえ3回というのには驚きですが、どのように解析するのでしょうか。

  • CorellらはANOVAを用いたが、P値を計算するのではなく、ANOVAで吐き出される分散成分を解析し、どの要因が移動分散の変異に最も強く貢献するかを調べている。
  • この用法は極めて正しい!(Legendre and de Cáceres 2013
  • ほかにも、コルモゴロフ・スミルノフ検定を用いてもよいが…とにかくここで言いたいのは、単純にP値を計算するのではなく、効果量や検定統計量そのものに注目すべきだ!ということ。

他には、どういう時に役立つのか:

Another context in which hypothesis testing is usefully applied to simulation results is when one desires to simulate the empirical measurement of a system. This might be done to test alternative statistical or experimental approaches in a system with known dynamics, or to determine how the output of a simulated process compares to observed data. In the first case, models are used to simulate both process and measurement error, and model analysis focuses on determining the level of empirical replication needed to detect a process (Hoban et al. 2012) or validating a new statistical method for detecting certain phenomena (Dakos et al. 2012). These studies are essentially statistical power analyses in which the known falsehood of the null hypothesis is taken as a given.

ここはよく解らなかった。Dakos et al 2012, Hoban et al. 2012が参考文献として挙げられていました。目を通さねば…。

  • あるいは、シミュレーション結果と実証データを比較する時にも有効である。
  • Walker & Cyr 2007は群集の中立モデルをシミュレートし、観察されている種の個体数分布とマッチするかを調べている。
  • 一般に、観測データとシミュレーション結果との比較は、ここでの焦点にはないが、頻度主義的なアプローチも有用であることを注意喚起しておきたい;ただベイズ的なABC法などのほうが信頼に足るが。
結論
  • 生態学者たちも、確率的変動性、時空間的な非一様性、複雑な非線形性が、野外のシステムでは重要であることを認め始めている
  • それがさらに大規模シミュレーションのモチベーションを掻き立てる
  • 限られたサンプルサイズで実施される仮説検定の枠組みを、膨大に結果を吐き出してくれるシミュレーション結果に適用するのがいかに不適切かを論じた。
  • 頻度主義的な仮説検定の枠組みが役に立つこともあることをいくつか例示した。他の例もあるだろう。
  • しかし、やはり有意性という考え方をシミュレーションモデルに適用するのはまずい、というのを、論文の著者、そして査読者に、注意喚起したい
  • 生態学のデータにおいて、統計的な有意性ではなく、生物学的な重要性を見出すことがキーとなるはずだ

以上でこの論文は締めくくられています。全体的に非常にクリアーな論調で解りやすいコメンタリーでした。進化生態学の研究を行なっている立場としては、なかなか身につまされる思いでした。特に、個体ベースモデルでパラメータを変えたあとに統計処理を行なうことの不味さも知りました。

またこういった「統計的な有意性」の「意味のなさ」は、実証研究にも偏在的だと思います。たとえば、この論文では、個体のパーソナリティを人為的にカテゴリ分けするときに、とある行動のスコアにもとづいて個体をランク付けし、上位30個体をグループA、下位30個体をグループCとして決め、それらのグループ間に、スコア平均値に差があるかを調べていました(んなもんはあるに決まっている…)。まあでも、著者も査読者もP値があると安心する、という可能性は考えられそうです。ほぼ信奉に近いでしょう。*9

有意水準というのは、各サンプルが独立同分布に従っていて、そこからランダムに選ばれてきたデータの断片である、という頻度主義的な考え方にもとづいています。そして反復数が稼げる限りはいくらでも満足できる、あくまでヒトの決めた規準に過ぎず、質的な違い情報呈示することしかできません(違うとしたらどのくらい違うのか、は基本的に問わない)。しかし伝統信奉的に用いられてきた規準だけに、払拭するのは非常に困難と言えましょう。

*1:この個体ベースモデルには多くの誤解と誤用があるのですが今回はそれには主眼を置くつもりはありません。とにかくIBMの本質は、注目する集団において、各個体に"サイコロ"を握らせ、突然変異を許して、何世代も生活史をまわすことにあります。

*2:ただ、ブートストラップ法や、ランダマイゼーションはちょっと違いますね。。そこはお断りを入れておきます。

*3:small P-values lend a false sense of importance to observed differences; 観察された差異に対して、その重要性に対する誤った量的な解釈が与えられることを指すのだと思う。

*4:もっと精確には真のモデル

*5:生態系、たとえば群集の経験する平衡状態というのは離散的に複数あり、摂動下ではその離散的な状態が構造安定で、パラメータの大きな変化によってのみ、別の平衡状態へとシフトする、というモデル。

*6:竹中さんによる解説

*7:budding ecologists;これから花開かんとする若い生態学者たち。粋な表現だ

*8:[They] created a factorial design to examine each of 216 individual treatment combinations;216通りある要因配置解析を行なったということでしょう

*9:僕がいちど査読した論文では、SPSSにデータ突っ込んで有意差だった、とだけ書かれていたことがあり、ひじょうに厳しいコメントをしたことがあります。しかし著者らには(英語で)「査読者様は統計処理にお詳しいようですが、…」といった皮肉を返され、幻滅しました。

論文を「読みたい」ならプリントアウトはするな

僕はフランスの研究室に在籍している時、幸か不幸か、論文をプリントアウトできない環境に置かれました。それでは論文が読めないのではないか?

と結論付けるのは、あまりの順応性の低さと言えます。じゃあ、プリントアウトせずに読めるようになればよいのです。

多くの方々はラップトップを(も)用いて研究に取り組まれていることと思います。僕の場合はMacBook ProAirを併用し、かつiPadを用いて読み物をしています。

インターネット環境に置かれていることを前提として言わせて頂くと、論文はプリントアウトして読むよりも、電子媒体上でそのまま読んだほうが、何十倍もオトクです。

1. すぐに読める

PDFとしてダウンロードしてすぐ読んで内容を把握してしまえばよいのです。アブストだけ読めばいい論文、というのも現実的には多く存在するからです。

2. いくらでも書き込める、すぐに調べられる

悪筆な人でも、なんらかのPDFビュアーを用いれば、すぐにきれいなメモが取れます。だいたいのOSには辞書機能が備わっているわけですから、「辞書で調べる」「読む」という作業を一貫化させることが可能です。

3. 読む速度があがる:読める本数が増える

読む速度が格段に上がります。具体的には、何本もナナメ読みする場合には、いちいちプリントアウトするまでもなく一気に読めてしまうので、一本あたりにかける時間が短くなります。

論文を速く読めるようになるコツは、数をこなすことだけです。それ以外にはありません。一本あたりにかける時間を「減らせる」ことで、読める本数が原理的に増えます。内容が完全には理解できずに読み終えてしまった場合にも、もう一度読み直すことがすぐ可能になります*1

4. プリントアウトする手間が省ける

プリンターで印刷が完了するまでには多くのステップが存在しますが、それらをすべてスキップできます。プリンターに到達するまでの労力も時間も、トラブルも、紙補充も、紙ストックの補充も、プリントアウトに必要なインク類含むプリンター内部の部品に関するメンテナンスも、全てです。

5. クラウド化:データの所持方法

PDFでの保存に徹することで、引っ越ししてからも論文を所持可能となります。僕は「読んだ論文」はすべてevernote、「読んでいる論文・これから読む論文」はdropboxにすべて突っ込んでいます。紙媒体での保持は考えられません。劣化はするは、重いは邪魔だはで、いいとこなしです。

6. 地球にやさしい

ゴミを減らしましょう。

しかし、具体的にはどうやってパソコン画面上で読めるようになるか。

慣れです。練習をしましょう。

*1:同じ論文を二度読みするのが「愚行」とは全く思えません

PolymorphとHeteromorphの違い

「多型」という表現を英語で書く時、表現には迷うことがとても多くありました。

Steven Frankは、移動分散の進化モデルを解析した"Dispersal polymorphisms in subdivided populations"という論文で、Polymorphという単語を、「無翅型と有翅型とが、単一のジェノタイプによってコントロールされている」という意味で用い、「無翅型と有翅型という多型を生産する割合」という形質が進化するとして、議論を進めました。そのモデルの中では、集団がESSによって単型(monomorph)化した状態を追跡しています(進化ゲーム理論の標準的な仮定)。つまり、polymorphicな個体たちによって集団がmonomorphismを呈する条件を求めたわけです。

しかし、進化ゲーム理論では、Polymorphicというのは別の文脈でも用いられます。それは、注目している形質の表現型が2つあり、異なる遺伝的な背景を持つ場合。すなわち、集団が「互いに異なるジェノタイプによって支配されている複数の表現型」によって専有されるというシチュエーションを考察する場合です。つまり、Polymorphic populationとは、異なる表現型を呈する遺伝子型Aと遺伝子型Bとが固定している集団のことなのです。

一方、Heteromorphという言葉もあります。Google Scholarで調べるとやたらアンモナイトに関する文献ばかりがヒットするは経緯が少し謎ではありますが、「異型」という訳語があてられます*1。このheteromorphという言葉は、たとえばHeterocarpy(異型果実)などに見られるように、単一のジェノタイプが複数の表現型を作り出すケースに多く見られます。なので、Frankが呼んだ所のPolymorphに対応する言葉だと考えられます。

以前、共同研究者(彼は植物学者)と議論をしていたとき、HeteromorphとPolymorphという言葉を僕が混用していたら、注意(?)を受けました。

「集団がheteromorphによって専有されている、という言葉遣いはmake senseでない。集団がpolymorphicである、というなら解る。heteromorphというのは、個体レベル・遺伝子レベルで観察される表現型のバラツキのことだと私は思うよ」。

この議論をしたとき、ああなるほど、これはとても真摯で植物学のターミノロジーと深く合致するなあ、とすんなり理解できたことを覚えています。

たとえば、

(◯) The evolution of seed heteromorphs (heterocarpy) in a monomorphic population.

(◯) The evolution of seed heteromorphs (heterocarpy) in a polymorphic population.

(×) The evolution of of seed heteromorphs (heterocarpy) in a heteromorphic population.

ということです。異型果実(という資源投資)がそれぞれ、その形質に関する単型集団で、多型集団で進化するというのが1つ目と2つ目。最後のは、意味をなさない(doesn't make sense)ということです。

で、なぜこういうエントリーをわざわざ書いたかというと、Readershipを意識して論文を書く必要があるということをメッセージとして伝えるためです。少なくとも、植物学の分野では、多くの研究者は上の◯×で書いたような言葉遣いを採用しています(という印象…)。で、植物の形質進化の数理モデルを構築するのであれば、その読者層を意識した言葉遣いに徹することで、読者や査読者のストレスを軽減することが可能だと考えられるためです。たとえば進化生態学ではhost–parasiteと書くべきであって、parasite-hostとは書かないほうがいい、ということです。

しかしいずれにせよ、こういった見識は論文や教科書を通じた座学と、研究者との(英語を用いた)議論を通じて初めて実感として身に沁みるはずで、好色な追い剥ぎや、飛行機乗り遅れを経験してまでフランスに渡ってよかったなあ、と思うのです

*1:おそらく、アンモナイトのまさに形morphのバラツキについて考察を深めているのでしょう。そういう意味で、ここでのheteromorphという言葉は狭義的な引用をされていると考えられます

勉強の習慣

僕は中学生の頃、(英語以外の)勉強が大嫌いでした。中高一貫校の弊害だったかもしれません。一方、兄は同じ中高の3つ上の「先輩」で、成績は学年トップでした。親からも先生からも、いつも兄と比較をされていました。

まあそりゃ仕方なくて、僕は「特進クラス」のほぼドベ。兄は「非特進クラス」なのに、学年トップ。「出来の悪い弟」と認識されるのも、今となっては納得です。

父には、ずっと「勉強する習慣を身に付けろ」と口を酸っぱくして言われていました。意味不明でした。

しかしその僕も、少しずつ勉強するようになりました。まず、高校の数学が難しかった。「軌跡・領域」という項目は僕にとって鬼門で、高1の中間テストは、ゼロ点でした。満月。

これはさすがにまずいと自覚しました。漠然とした、大学受験への恐怖をいだきました。

とはいえ、どうすればええのか分からん…ということで、「毎日、学校が終わったら一時間だけ図書館に残って、座る」ということから始めました。あまり記憶がありませんが確か、数学の予習と、英語の予習をしていたのだと思います。

すると、当然、一時間では済まない。それは二時間になりました。期末では満点をとりました(非常に印象的だったのでよく覚えています)。

高校の化学も、僕には鬼門でした。たしか、中間テストで37点とかだったはず。じゃあどうしようか、ということで、教科書傍用の問題集を、徹底的にやり込むことにしました。

化学は「モル」という概念に苦労し続け、1年かけてようやく、80点を安定してとれるようになりました。

高校2年になってからは、学校が終わってから毎日6時間は勉強していました。何故か当時は阪大を目指していましたし、世界史、物理、古文、といった他の科目の勉強にも必要性を感じたからです。

ここまで書くと自慢のようですが、実際は、「勉強の習慣」というものが、実は研究者にとっても本質的な部分だと思うのです。僕は学部の間は友人たちと面白そうな数学の本を輪読するという勉強を毎日のように開催し、勉強・発表していました。朝から晩まで図書館に篭もる毎日でした。

僕にとっては、勉強は研究より楽しいものです。何故なら、責任が伴わないし、必ず実になるからです。勉強は知性の肥やしであり、人生のアクチベーターです。それは通常のことと思っていましたが、確かに「勉強の習慣」が身についていなかったら、苦しいことかも知れません。

ということで、一日一時間の勉強の習慣は、いまでも捨てていません。もちろん、物理的にかなわない日もあるのですが、きっと人生が充実します。一時間だけ、本を手にとって椅子に座るだけでも、まったく違うと思います。難しい本でも、易しい本でもいいので。

…ただ、その自由が許されるのは学生の間だけでしょうか。実質。

「一生勉強してはいけない」というルールが決まったら、研究をやめ、死を選ぶと思います。研究に殉じ、学修に殉じたい。