MacOSX*MeCab
今形態素解析で最も熱いと授業でTAが力説していたMeCab(ver0.95)をMacOSX(ver10.4.9)へインストールしてみた。そのログっぽいやつ。
0.MeCabとその仲間をダウンロードする
まずは準備としてMeCabとそれに使用する辞書をダウンロードする。
http://downloads.sourceforge.net/mecab/mecab-0.95.tar.gz
http://downloads.sourceforge.net/mecab/mecab-ipadic-2.7.0-20060707.tar.gz
IPA辞書が推奨らしいのでおとなしくしたがってみた。
気分によってJUMANを使ってもいいと思う。。。使ったことないけど。
ダウンロードしたやつは適当なフォルダに入れとく。
ちなみに自分は/usr/local/src/mecabに入れたのでご承知を。
1.MeCabのインストール
ということでMeCabのインストール作業開始。
$ sudo tar zxfv mecab-0.95.tar.gz $ cd mecab-0.95 $ sudo ./configure --prefix=/usr/local/mecab/mecab-0.95 $ sudo make $ sudo make install
これでMeCabのインストールは完了したと思われる。
/usr/local/binにmecabとmecab-configがあるのではないだろうか。
自分は不安だったので確かめてみた。
$ /usr/local/bin/mecab tagger.cpp(138) [load_dictionary_resource(param)] param.cpp(71) [ifs] no such file or directory: /usr/local/lib/mecab/dic/ipadic/dicrc
なんかダメだしされてるけど、恐らく「辞書がねーぞ!」ってことだからOK。
2.IPA辞書のインストール
ついで先ほどダメだしされた辞書のインストールをする。
編集の都合上改行しているのでコピペはしない方が良いと思います。
$ cd /usr/local/src/mecab $ sudo tar zxvf mecab-ipadic-2.7.0-20060707.tar.gz $ cd mecab-ipadic-2.7.0-20060707 $ sudo ./configure ... configure: error: mecab-config is not found in your system
といった感じでストップがかかるので以下のようにやる
$ sudo ./configure --prefix=/usr/local/src/mecab/mecab-0.95 --with-mecab-config=/usr/local/bin/mecab-config $ sudo make $ sudo make install
これでバッチリMeCabが使えるようになったはず。
ということで使ってみる。
$ /usr/local/bin/mecab明日は晴れるでしょう。 明日? ????,????,*,*,*,*,* ?? ̾??,??ͭ̾??,?ȿ?,*,*,*,* ??れる? ????,????,*,*,*,*,* ?? ̾??,??ͭ̾??,?ȿ?,*,*,*,* ??ょう。 ????,????,*,*,*,*,* EOS
3.文字コードの変更(EUC-JP→UTF-8)
ターミナルのウィンドウ設定画面でEUC-JPにすれば文字化けは解決するが、
それは男として情けない解決方法だと思うのでちゃんとUTF-8対応にします。
$ sudo /usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t utf-8 $ cd /usr/local/src/mecab/mecab-ipadic-2.7.0-20060707 $ sudo make install
これでバッチリOK。
では動作確認。
$ /usr/local/bin/mecab 明日は晴れるでしょう。 明日 名詞,副詞可能,*,*,*,*,明日,アシタ,アシタ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 晴れる 動詞,自立,*,*,一段,基本形,晴れる,ハレル,ハレル でしょ 助動詞,*,*,*,特殊・デス,未然形,です,デショ,デショ う 助動詞,*,*,*,不変化型,基本形,う,ウ,ウ 。 記号,句点,*,*,*,*,。,。,。 EOS
と今回は問題なく使える。
お疲れさまでした。