mecabが結構使えそう

日本語の形態素解析にはこれまでchasenを主に使ってきたのですが、最近になってmecabの調査を始めました。ざっと調べた感じではかなり使えそうです。

今回の目的は漢字仮名混じり文から点字に変換するための処理を実装することが目的なので、発音まで返してくれるmecabのほうがよさそうです。欲をいえば、分かち書きが単語単位ではなく、文節単位にしてほしいのですが、まあ、各単語の品詞がわかれば何とでもなります。

もうひとつうれしいのは、今回のプラットフォームはWindows Mobileなので、Visual C++にポーティングする必要がありました。その点、mecabであればMakefile.msvcも付いていますので、ARMの環境でもどうにかなるでしょう。辞書についてはまだ調査中です。バイトオーダーぐらいは変わると思うので、おそらくはターゲット用にビルドした辞書生成プログラムで辞書のバイナリを作り直すしかないでしょうね。

すでに外部のデバイス(点字ピンディスプレイ)への接続部分は動いているので、あとはmecabによる変換処理ができればかなりのところまで到達できます。もちろん、アプリケーションは別途作らなければなりませんが...

この記事のトラックバックURL:

http://www.kijineko.co.jp/trackback/819
このエントリーを含むはてなブックマーク