福祉・心理・看護のテキストマイニング入門

科研費で買った。

福祉・心理・看護のテキストマイニング入門

福祉・心理・看護のテキストマイニング入門

タイトルを見ると「福祉・心理・看護」べったりな感じがするが、実際に「福祉・心理・看護」なのは論文の執筆事例について書かれた第8章ぐらい。それ以外の章では、「ラーメン」とか、一般的な日本語の例を使って説明しているので、小説なんかでテキストマイニングをやってみたい人でもそのまま使える本である。また、ChasenやExcel、WordMinerなどのソフトウェアの使い方について丁寧に解説しているので、教科書として便利かもしれない。

もっとも、WordMinerはアカデミック版で15万円ぐらいするみたいなので、ほいほいと気軽に試せるわけではない。しかもこいつはUnicodeが通らないらしいし、Chasenも漢文の形態素解析をしてくれるわけではないので*1、中国古典とか漢字仏典などには使えそうにない。また、WindowsのGUIなソフトウェアばかりなので、非Windowsな人(私だ)や、スクリプト一発で一括処理が好きな人(これも私だ)には不満かもしれない。

ただ、そういう人にとっても、テキストマイニングの方法論的な基盤について「科学の目的」から説き起こし(第1章)、χ2値や数量化III類などについてわかりやすく解説している(第4章)部分は、入門書として役に立つと思う。

*1:漢文の形態素解析と言えば、守岡さんのこの論文でしょうな: [http://fw8.bookpark.ne.jp/cm/ipsj/search.asp?flag=6&keyword=IPSJ-CH08079003&mode=:title=「MeCab を用いた古典中国語の形態素解析の試み」]