2009年08月15日

日本語大シソーラス+明鏡国語辞典=?!

盆休みの課題は日本語大シソーラスに明鏡国語辞典の語義があったらいいのに……、という試みでしたが、ようやくβ版が完成いたしました。

公式ページにある「→ 「本文」組見本を見る」から「0020 美醜 / 01 美醜」の成果を確認してみます。
# fisrt, secondは分類体系
# thirdは小分類
# contents_subは改行+セミコロンで区切ったものを一単位

pic_090815.jpg


類義語それぞれに対して、明鏡国語辞典の語義を与えてみました。表示イメージとしてはこれでいいんです。講談社の類語大辞典を意識していましたし(本当は語義をさらに分類する必要があるのですが)……。

ですが、マッチングの結果はいまいちです(泣)。中辞典という役割からすると、納得のいくものですが、もうちょっと楽して語彙の比較ができたらなーと思いました(笑)。

認知意味論を勉強したことがある人ならニヤリとする記述があり面白いのですが、泣く泣く(?)収録されない語彙が出てくるところですね。

美醜 醜美 醜麗 妍醜(けんしゅう) 妍蚩(けんし)
このうち、明鏡国語辞典に収録されているのは「美醜」だけでしたが、他の辞書ではどうなっているのでしょうか。手持ちの辞書とWeb辞書で確認してみました。
# 有(多):辞書に登録され、意味記述が分類されている
# 有(単):辞書に登録され、意味記述は分類されていない
# 無:辞書に登録されていない

語彙 広辞苑 岩波国語辞典 精選版日本語大辞典 大辞林 大辞泉
美醜 有(多) 有(単) 有(多) 有(単) 有(単)
醜美 有(単) 有(単) 有(単) 有(単)
醜麗
妍醜 有(単) 有(単)
妍蚩 有(単)


こういう結果が出ると、複数に辞書を参照したいなーという衝動に駆られます(笑)。見出し語に登録されていないものは仕方ないとして、語義を区分している辞書があるというのは興味深いです。

広辞苑では次のような記述でした。
  1. うつくしいこととみにくいこと。よい事物とわるい事物。
  2. 容姿のよいこととわるいこと。また、うつくしい人とみにくい人。
これは一つに集約してもいいじゃないかとも思えますが、形容すべき対象が「容姿」「人」となっているところが考えさせられます(選択制限が具体的でよいという見方)。

大修館様には、『明鏡国語大辞典』を企画してもらえると嬉しいです(笑)。

盆休みの課題はこんな感じですが、自分の語彙のなさにも困っているので、辞書の記述を見ていこうと思います。自分で辞書を編集しつつ、国語力を鍛えたいです。

『理想の国語辞典』のように、いろいろな辞書を比較したいですね。本業ではないので、本格的にはできませんが(泣)。
posted by unendedchaos at 18:39 | Comment(0) | TrackBack(0) | 辞書 | このブログの読者になる | 更新情報をチェックする

2009年08月13日

日本語大シソーラス

盆休みの課題である「“私の”理想の類語辞典」の作成ですが、ベースとなるのは大修館書店の『日本語大シソーラス』にします。公式ページに書いてあるように、分類が細かいところが決めてになりました。

本書では、まず言葉は1,044のカテゴリーに分けられ、さらにそのカテゴリーの中は「意味の近さ」によって小語群にまとめられています。小語群の数は1カテゴリーにつき、1〜30数個まであり、総計14,000語群を数えます。さらに、小語群の中でひとまとまりになるものはセミコロン「;」で区切りました。

語彙の微妙な違いを確認したいとこです。共通する意味としてどのような語彙を用いて語彙記述をしているのかにも関心はありますが、違いにも関心があります。

また、セミコロン「;」で区切ったら何項目になるんだろう?というも関心もあります。この一番細かい分類は類似性が高いと言えそうです。

次に、連想関係を重視しているというところが興味深いと思います。

3.意味の同一性よりも連想関係を重視

文章の作成においては、「良い」→「結構」「グッド」のような類似表現の入れ換えだけでなく、より発展的な言い換えが効果的なことがあります。シソーラスは、厳密な意味の類似性よりも連想関係を重視しているので、「良い」→「旬」「三拍子揃う」「御見事」のような、頭で考えていたときには思いつかない言い換えが可能です。

確かに、市販の類語辞典(たとえば、岩波日本語表現辞典)にはない記述ですね。「シソーラスと類語辞典、ここがこんなに違います。」というのも惹かれます。類似性は上述のセミコロン「;」を参考にすればいいので、この発想は興味深いです。

あと、品詞分類は廃止です。

4.品詞別を廃しました

言葉を実際に使うときには、品詞は区別されません。シソーラスでは「簡単」「イージー」「楽勝」「分かり易い」「話が早い」「初歩」のように、連想の順に従い語句を並べてあるので、言葉探しがスムーズです。

これは面白いと思う反面、品詞ごとに並び替えたらどうなるのかという欲求も出てきました(笑)。文法(品詞)にも意味があるという学者さんもいるので、品詞は異なるけど、実際の使用する場面ではほとんど同じという語彙に着目したかった……。語彙数が多いので、形態素解析をかけて品詞付与するしかないでしょうか。人手による修正が必須ですが。

最後に、この記述に対して、引用およびコメントしておきます。

5.索引が決め手

本文987頁に対して、索引はなんと552頁に及びます。それは<1>ひとつの語句を連想に基いて丁寧に分類し、<2>語群の番号だけでなく語群名も表示したためです。索引を見ただけでその語句の意味の広がりが実感でき、簡単な国語辞典としても使えます。

簡単な国語辞典ではなく、大修館の辞典なので、意味記述が明鏡国語辞典とリンクしていたらどんなに嬉しいだろうかと。大修館がそのような辞典を編集していただければ購入したいのですが、そんな企画はないと思いますので(?)、可能な範囲で自分でやってみようかと思いました。

とりあえず、Epwing形式のテキスト化したところです。
# これって個人でひっそり利用するとしても、リバースエンジニアリングになるのでしょうか?

posted by unendedchaos at 09:27 | Comment(0) | TrackBack(0) | 辞書 | このブログの読者になる | 更新情報をチェックする

2009年08月11日

お盆休みの課題

今年のお盆休みは未曾有の金融危機というわけで、いかに無駄遣いをしないで過ごすかが問題です。無駄遣いしないというだけなら楽勝なのですが、GWの過ごし方を反省して、何かひとつ課題を設けようと思います。

日本語の語彙不足に悩んでいるので(日本語だけでなく英語もですが)、類義語辞典をベースに語彙力強化を計りたいところです。
講談社の『類語大辞典』のように、シソーラスと意味が一緒になっているのが嬉しいのですが、パソコンで使える類語辞典は持っていません。だったら自分で作ってみようかと……。
# 講談社の類語大辞典がCD-ROM販売してくれれば、嬉しいのですが。
# 書籍の辞書は持っていますが、賛否両論のようですね。

「“私の”理想の類語辞典」の作成を盆休みの課題とします。

もっとやらなきゃいけないことがあるのですが、現実逃避したいと思います。
posted by unendedchaos at 22:35 | Comment(0) | TrackBack(0) | 辞書 | このブログの読者になる | 更新情報をチェックする
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。