国語
おに子の自由研究。
知人がブログを始めたということなので、多少なりともアクセスアップに貢献すべく、その紹介をさせていただくとともに、そこで得たネタを自分のブログにも流用したいと思います。
今回紹介するブログは「おに子の自由研究。」です。「おに子」という名は日本鬼子(ひのもとおにこ)から取ったという、なかなかの強者です。
漢字の詳細読み
春からずっと開発を行っている点字出力のソフトウェアでは、入力した文字列を漢字に変換するとき、変換候補がどんな字なのかを点字で知らせるために「詳細読み」を出力します。詳細読みは(仮名の)点字で出力するので、ユーザーには音しか伝わりません。その状態で正確にどんな文字であるかを伝える必要があります。
漢字仮名まじり文から点字への変換処理を開発中
先日から、mecabを使って日本語の形態素解析を行い、点字出力のための変換を行う処理を作っているという話をしました。そこで、すべての文章をカタカナだけで表記し、文節ごとに分かち書きする処理を自動化し用としているわけです。UNICODEでは点字にもコードが振られているようですが、今回はあくまでもカナ表記とし、各カナ文字を点字ピンディスプレイに出力するためのビットパターンに置換する方法を考えています。
mecabが結構使えそう
日本語の形態素解析にはこれまでchasenを主に使ってきたのですが、最近になってmecabの調査を始めました。ざっと調べた感じではかなり使えそうです。
続・「漢字開き&&表記統一ツール」は作れるか?
先日の話題の続きです。前回は kakasi で試してみましたので、今回は chasen で試してみることにします。前回と同じ例文である
「漢字が多過ぎても読み辛く成ってしまう」
を chasen を使って解析すると、次のようになります。
「漢字開き&&表記統一ツール」は作れるか?
実装者さんのブログで話題になったのですが、「漢字開き&&表記統一ツール」が作れるかどうか少し検討してみました。結論としては、100%の精度は無理だけれども、「ここは開いた方がよいのでは」とアドバイスしてくれるツールぐらいなら作れそうな気がしてきました。なお、漢字を"開く"というのは、かな表記になおすということです。
開くこと、開くもの
日本語の文字体系というのは非常に贅沢で、少なくとも、ひらがな、カタカナ、漢字を使い分けることができます。さらにはローマ字を混ぜることもできるわけで、これほど豊かな文字体系を持つ言語というのは他に類を見ません。
小学校で漢字を習っているころは、最初は"かな書き"ばかりだったのが、国語学習が進むにつれて、少しずつ漢字が増えていきます。そのためか、漢字を多用している文章のほうが、かな書きの多い文章よりレベルが高いかのような誤解をしている人が少なくありません。
実際には、日本語の文章というのは、特別な理由がなければ、かな書きしても意味を取り違えることがないのであれば、かな書きをするほうが読みやすいのです。とくに、形式名詞、例えば「〜こと」や「〜もの」のような語を漢字で書く必要はほとんどありません。「開く事」、「開く物」ではなく、「開くこと」、「開くもの」とすべきなのです。
ところで、「こと」や「もの」はよいとして、今回なぜタイトルに「開く」を用いたかといえば、出版物では漢字をかな書きにすることを"開く"というからです。だから、「開くこと、開くもの」としました。
「等値」と「等価」
「プログラマーの力量を見極める--面接官になったら尋ねるべき質問実例集」が話題になっているようです。そのうちの、
- 「等値」と「等価」の違いを説明してください(この質問はTechRepublicのTony Patton氏に教えてもらったものである)。
については、私も気になってので少し反応しておきます。
まず、国語的には、「等値」は「値が等しいこと」であり、「等価」は「価値や価格が等しいこと」ですが、実際のところそれほど厳密な区別はありません。もちろん、特定分野において、それぞれに明確な定義を行った場合は別です。ここではそれを正確に把握できるほどの情報がありませんので、何ともいえません。
2級にも挑戦しようとしたけれど...
前回に引き続き、2級にも挑戦してみようと考えました。3級は問1しかやっていないじゃないかといわれるかもしれませんが、細かいことは気にしないでください。例によって2級のサンプル問題を覗いてみました。
ざっと見た感じでは、問1は3級より簡単そうです。ソースコードの穴埋め問題もそれなりの数があるのですが、穴埋めだけでは特定の処理系を過程しないと、とても動きそうにありません。問題点は移植性だけではなく、明らかな不具合も含まれています。全部消して新規に作りなおすのであれば、まだ何とかなりそうな気もしますが、穴埋めだけではまともなプログラムにできそうにありません。
例えば、問7の四文字熟語の問題では、四文字熟語のうちの1文字を伏字にして、その文字が何かを当てさせる簡単なクイズを作る問題です。ところが、問題作成用の四文字熟語のテーブルには、どういうわけか「絶対絶命」という言葉があったりします。これをもとに「絶?絶命」と出題して、「体」と答えると結果は×になるというのです。そんな動作は到底納得のいくものではありません。
「おられる」は誤用か?
「おる」は謙譲語であり、「れる」は尊敬の助動詞であるため、これらを組み合わせるのは誤用であるという話をときどき耳にします。しかし、本当にそうなのでしょうか? 今回はそのことについて考えてみることにします。
「おる」には、自分の動作を卑下したり、相手の動作をさげすんだりする意味があります。これが謙譲語の元になっています。一方で、(通常適当な助動詞をともなって)「いる」の丁寧語としても使われます。また、本来の意味は動作や状態が継続していることを表します。
私の場合は、姫路の出身であり、その後、京都や大阪で暮らしてきましたから、「おる」は「いる」の同義語としての用法が普通でした。ですので、謙譲や丁寧の意味があるといっても、それらは非常に軽く、申し訳程度の敬語としか感じません。一方で、「おる」を多用しない地域では、謙譲の意味が強くなっているのだろうとは思います。
辞書的には(つまり標準語では)、「おります」は「いる」の丁寧語であり、「おられる」は尊敬語です(大辞林 第二版による)。ですので、「おられる」が誤用などということは一切ありません。
