Life is Beautiful

主に進化生物学の理論のブログです。不定期更新予定。

LaTeXのワードカウントにはSublimeプラグインを使おう

Sublime Textというテキスト・エディタがあります。ファイル形式(そして言語)に従って、様々なカラーでのハイライトを行なってくれるエディタです。

Sublime Text 2 - Sublime Text

.texを含め、だいたいのプログラム言語のファイルを開いて、快適に編集することが可能です。

さて、最近になって、Sublime TextではLaTeX コンパイルのためのPlugin(拡張機能)が利用可能で、その立ち上げは非常に簡単であることを学びました*1

Windows:

SublimeText3でUTF-8のLaTeX環境を構築する(Windows) - Qiita

Mac:

SublimeText3でUTF-8のLaTeX環境を構築する(Mac) - Qiita

その方法については、上のQiita参照で。

そのような、「Sublime TextでLaTeXコンパイル」を(面白半分な気持ちで)利用し始めたのがつい先週のことなのですが、驚くべきPluginを発見したので、それもついでにインストールしました:

GitHub - SublimeText/LaTeXTools: LaTeX plugin for Sublime Text 2 and 3

なんと、どうやらWord Countできてしまうらしいです。Microsoft Wordでは簡単に可能なword countでも、LaTeXではそれなりに労苦があるのです。

早速、試してみました。

スピード:一瞬!

従来は、TeXCountというPerlスクリプトが利用可能でした*2し、web interfaceでも行なうことができました*3。 しかし、ファイルをアップロードしたりPerlスクリプトを(ターミナルから)打ち込んだりする労苦に変わりはありませんでした。

しかしこのSublime Textプラグインでは、一瞬。例文では、

The quick brown fox jumped over the lazy dogs

を用いることにしましょう。

まず、Command(WindowsではCtrl) + Shift + Pで、プラグインを利用するためのパレットを呼び起こします:

f:id:lambtani:20171218090714p:plain

つぎに、現れるWord Countをクリック。すると:

f:id:lambtani:20171218090946p:plain

これより

  • 単語数は9
  • 空白スペースを除いたキャラクターの数(日本語で言う文字数)は37
  • 空白スペースを含んだキャラクターの数は45
  • スクリプト上の)行数は45

ということが分かります。

試しにMicrosoft Wordでも確認。

f:id:lambtani:20171218091513p:plain

当然ながら一致しますね(単語数9)。

Wordでのカウントの仕方との違い

どの程度まで、精度は保たれるのでしょうか。次の例文を利用してみましょう。

Joey: All right, all right, let's play one more time, ok? And remember, if I win, you do not move to Paris.

これは何を隠そう、ぼくの大好きな"Friends"というドラマの一幕。まずはSublime Textでカウントすると:

f:id:lambtani:20171218091858p:plain

単語数は23らしい。

MS Wordでカウントしてみました。すると:

f:id:lambtani:20171218092112p:plain

おや、22?この違いやいかに?

アポストロフィ

犯人の正体は、let'sのlet usを1とカウントするか2とカウントするかの違い。どうやら、Sublime Textでは、短縮形をセパレートしてカウントしてくれるみたいです。なるほど。たとえばo'clock(=of clock)やO'brien(=of Brien)は、ともに単語数2とカウントされるようです。

ただ、論文では普通は省略形は(人名以外)用いないので、問題なさそうですね。

引用文献や定義されたコマンドでのテキスト入力はカウントしない

ただ、このSublime Textカウントの欠点は、コンパイルしてPDFに現れる単語数をカウントすることはできないということ。たとえば、\usepackage{lipsum}をもちいて本文で\lipsumを命令したときのラテン語たちをカウントすることはできないし、引用文献に現れる単語たちをカウントすることもできない。そして、今のところ\caption{}や\footnote{}内の単語をカウントすることもできなさそう。

欠点こそあれど

TeXCount.plは有用なperlスクリプトですが、コンパイルしながらカウントできるという、閉じたシステムを利用するうえで、Sublime Textを利用するのは良いのではないでしょうか。

*1:とはいえもちろん、TeXLiveなどを事前に利用できる環境が確立されていたほうがよいと思います

*2:http://app.uio.no/ifi/texcount/

*3:http://app.uio.no/ifi/texcount/online.php