2009年08月23日

国会会議録検索システム

来週は総選挙なので、以下のサイトで議員の発言を見てみるのもいいかもしれませんね。

国会会議録検索システム

私は政治的な関心よりも、日本語の方に関心があります(笑)。というわけで『国会会議録を使った日本語研究』を斜め読みしました。

国会会議録を使った日本語研究

国会会議録を使った日本語研究

  • 作者:
  • 出版社/メーカー: ひつじ書房
  • 発売日: 2008/07
  • メディア: 単行本



ひつじ書房紹介ページから引用すると、次のとおりです。
要約
ここ数年、インターネットで公開された「国会会議録」をデータとして用いた日本語研究が注目されている。インターネット版「国会会議録」は、過去60年にわたる、出身・在外歴までほぼ判明している日本各地出身者による議論を文字化した資料である。本書は、多種多様な分野の日本語研究者が、この空前ともいえる膨大なデータを使って、それぞれの分野で何ができるかを追究、あわせて将来的研究を展望したものである。研究者のみならず、卒論テーマを探す学部生にもお薦めの1冊。

過去60年というのはすごいですよね。これからも増え続ける会議録ですし。何より、Web検索できるというのはほんと便利な世の中になったなと思います。入力するのにどれだけのコストがかかったのでしょうか……。

執筆者は次のとおりです。

[執筆者]
第1章 国会会議録検索システム総論  (松田謙次郎)
第2章 国会会議録はどれほど発言に忠実か?─整文の実態を探る─  (松田謙次郎・薄井良子・南部智史・岡田裕子)
第3章 連体修飾となる《具体》について―国会会議録からの推測―  (荒尾禎秀)
第4章 国会会議録における行政分野の外来語  (茂木俊伸)
第5章 東京出身議員の発話に見る「ら抜き言葉」の変異と変化  (松田謙次郎)
第6章 「が/の」交替における個人内変化の研究  (南部智史)
第7章 国会会議録によるさ入れ言葉の分析  (佐野真一郎)
第8章 国会「討論」における反対意見表明  (薄井良子)
第9章 国会会議録における気づかない方言―「あっている」についての一考察―  (香月真由美)
第10章 自然言語処理での国会会議録の利用  (山本和英)

第1章と第2章は国会議事録の特徴がコンパクトにまとめられているのがありがたい。残りの章は様々な研究ですね。自分が興味あったのは、第10章の「自然言語処理での国会会議録の利用」です。「統計処理事例」と「言語処理事例:要約の試み」が挙げられています。統計処理は自分でも何かしらテーマを決めてやってみようかと目論んでいます。

6節にある以下の記述はなるほどと思いました。

国会会議録は、どの程度多くの人がどのような目的で検索、閲覧しているのか、正直なところ我々にはまだ実感として把握できていない。すなわち言語的な資料価値以外にどのような利用がなされているのかがはっきりしないため、それに対して何かやろうという研究が出てこないのは、むしろ自然かもしれない。


ナレッジマネジメントとして情報の共有ができて政治家としては万歳のはずですが、政治家(秘書なども含めて)がどれだけこのシステムを利用しているのかは興味がありますね。といっても私の場合は言語的な興味の方が圧倒的に強いのですが(笑)。

ただ、この国会会議録を扱ったコーパスがありますね。

KOTONOHA「現代日本語書き言葉均衡コーパス」
デモはこちら

デモの制約は残念ですが、国研の試みは素晴らしいと思います。モニターになりたいところですが、基本的に会社での活動ではなく個人の活動になるから、利用条件には当てはまらないかもしれませんね(泣)。
# 問い合わせてみる価値はあるかもしれませんが……

追記:
このブログアップロードする際にひつじ書房を見ましたが、以下のニュースに驚きました。
月刊『言語』12月より休刊

月刊『言語』はひつじ書房ではなく大修館なのですが、不況がこんなところにまで……。厳しい現実です……。

posted by unendedchaos at 09:49 | Comment(0) | TrackBack(0) | 言語処理 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。