Mecabをリポジトリからインストール

バイナリ版の辞書の文字コードEUC-JPなのでUTF-8に変換する。

% sudo apt-get install mecab mecab-ipadic libmecab-dev
% sudo /usr/lib/mecab/mecab-dict-index -d /usr/share/mecab/dic/ipadic -o /var/lib/mecab/dic/ipadic -f euc-jp -t utf-8 -p

Mac OS Xでは

% sudo port install mecab +utf8


試してみる。

% mecab
貴社の記者が汽車で帰社した
貴社    名詞,一般,*,*,*,*,貴社,キシャ,キシャ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
記者    名詞,一般,*,*,*,*,記者,キシャ,キシャ
が      助詞,格助詞,一般,*,*,*,が,ガ,ガ
汽車    名詞,一般,*,*,*,*,汽車,キシャ,キシャ
で      助詞,格助詞,一般,*,*,*,で,デ,デ
帰社    名詞,サ変接続,*,*,*,*,帰社,キシャ,キシャ
し      動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS

TeraTerm使うとエンコード違ってても頑張って表示しちゃったりするのでPUTTYで確認した。