漢字の詳細読み
春からずっと開発を行っている点字出力のソフトウェアでは、入力した文字列を漢字に変換するとき、変換候補がどんな字なのかを点字で知らせるために「詳細読み」を出力します。詳細読みは(仮名の)点字で出力するので、ユーザーには音しか伝わりません。その状態で正確にどんな文字であるかを伝える必要があります。
今回対象にしている点字ピンディスプレイは16マスしかないので、同時に16文字しか表示することができません。そのため、詳細読みも(空白や読点を含めて)16文字以内におさめなければなりません。デバイスに制限以前に、詳細読みが長ったらしいと嫌になってきますので、なるべく最初のほうの何文字かを読むだけで、どんな漢字か判別できるようにしたいわけです。
というわけで、漢字に対応する詳細読みの辞書を作る必要があります。この辞書自体は、必ずしもプログラマが作る必要はないわけですが、だからといって誰でも作れる代物ではありません。JIS第一、第二水準すべての辞書を作るとなると途方もないので、最低限、教育漢字(小学校で習う漢字)、できれば常用漢字まで網羅したいと考えていました。
あまり検討ばかりしていてもキリがないので、何とか頑張って辞書の一部を私が作りました。教育漢字すべてと、漢字能力検定4級相当の文字を網羅しました。常用漢字を網羅するには、漢字能力検定準2級あたりまで作業しなければなりません。ところが、教育漢字はスイスイ進んだのですが、漢検4級(中学生程度)になるとかなり難しくなってきます。
例えば、「壱」をどう説明するかですが、正攻法でいけば「大字の壱」ということになります。点字の出力では「ダイジノ イチ」になるわけですが、そんな説明をされて分かるユーザーが果たしてどれだけいるでしょうか? 「大字」という語彙自体を知らない人も少なくないはずです。
他には「肪」も難しかった記憶があります。この文字単独で訓読みさせると「アブラ」ですが、これでは「油」と区別がつきません。「脂肪の肪(シボーノ ボー)」とすると、「死亡の亡」や「志望の望」、あるいは「子房の房」など、いくつも同音異義語があります。結局両方併記するしかないわけですが、どちらを先に書いてもそれだけでは文字を特定できず、最後まで読まなければならなくなります。
あと、「郎」も結構難しいですね。普通に考えると「太郎の郎(タローノ ロー)」ですが、「太朗」や「田老」といった同音語があります。「一族郎党の郎(イチゾクロートーノ ロー)」だと長くなります。結局、「金太郎の郎」か「桃太郎の郎」にするしかなかったわけですが、そもそも金太郎や桃太郎をユーザーが知っているかどうかがよく分かりません。先天的に盲ろうの人は、そういった文学に触れる機会がどの程度あるのか分からないからです。
といった感じで、かなり苦戦気味ですが、来年の春までには何とか完成させる予定です。今はWindows Mobileでやっていますが、その後はAndroidやiPhoneでもやれたらと思います。予算が取れればですが...
