2010年11月13日

入門 自然言語処理

『入門 自然言語処理』を購入しました。O'Reilly Japan - 入門 自然言語処理 - には次のように書かれています。

本書では、NLPの理論的な基礎、理論、応用をバランスよく解説。本書の例から学び、実際のプログラムを書き、そして実装することを通して、読者はNLPを始めるための実用的な知識と技術を得られるでしょう。

幅広い読者層を想定しているようですね。私のような言語学畑の人も読者対象に入っています。言語学といっても幅広いのですが、大学で学ぶ言語学の授業の大部分は人文科学ですからね(もちろん自然科学の言語学もありますけど)。自分自身が学生だった頃よりも学際的になってきているように感じます。

最近では英語コーパス学会でもシンポジウム「コーパスにおける言語的注釈と自然言語処理技術」が催されていました(参加はしなかったのですが)。コーパス学会に参加する言語学研究者は元々そういう本面に興味のある方が多そうですけど。なんらかの注釈が付与されたコーパスが利用できると嬉しいのですが、自分が求めるコーパスがなかったらいっそ自分で作ってしまおうという方もいるかもしれない。機械学習をさせてというのは難しいかもしれないが、できるところからやってみるというのはいいことである(自分に言い聞かせているわけですが)。

英語コーパス学会のサポートサイト(英語コーパス学会 第36回大会 Workshop & Symposium サポートサイト)が設立されていました(感動!)。

話がそれましたが、日本語版に特筆すべきは日本語を対象に新たに書き起こした「12章 Pythonによる日本語自然言語処理」ですね。英語学を学んでいた私は対象言語を英語に絞っても面白いのですが、やっぱり実用という観点からも日本語の方をやりたいところです。

興味あることはたくさんあるのですが、自分として「12.4 日本語意味解析」かな。特に学生時代からFrameNetは注目していたので、「12.4.1 格フレームとその獲得」と「12.4.5 述語項構造解析」は興味惹かれます。学生時代当時はさすがにタグ付けをしようとまでは考えていませんでしたが、今の自分ならいろいろとやってみることはできそう(たぶん)。

あと、「12.4.2 日本語LFG」。LFG(Lexical Functional Grammar:語彙機能文法)はとある人の影響で興味はあったのですが、やらずじまいでした。学生の頃にもう少しやっておけば……と後悔の念が強いのですが、そのときやるべきことがいろいろとあったので、それはそれで割り切るしかない……。企業だと、ゼロックスの独壇場なのでしょうか?どのように実用化されているのかはわかりませんが、企業で研究してるというのは非常に魅力的ですね。ゼロックスで働きたい(笑)。

最後に一言。本書は「Pythonによる〜」ということで、Pythonにも触れてみようかなと思っています。某試験が終わったら勉強を開始しよう。

入門 自然言語処理 [大型本] / Steven Bird, Ewan Klein, Edward Loper (著); 萩原 正人, 中山 敬広, 水野 貴明 (翻訳); オライリージャパン (刊)
posted by unendedchaos at 11:40 | Comment(0) | TrackBack(0) | 言語処理 | このブログの読者になる | 更新情報をチェックする

2010年08月13日

「検索の未来はどうなるの?」見逃しましたが……

観た感想ではなく、備忘録です。ついさっき知ったので……。

タイトルの「検索の未来はどうなるの?」ですが、NHK教育の『ITホワイトボックスII』という番組で放送されました。「ホワイトボックス 3 : 自然言語検索」で、京都大学で研究されている「TSUBAKI」が取り上げられたようです。残念!これは観たかったなーと思っていろいろと調べていたら再放送があるそうです(わーい)。

再放送日時

8月15日(日)午後3:00〜 教育

とのこと。

この日は休日出勤しているかもしれませんが、いまのうちに録画設定をしておく。ちなみに、サイトにはリンク集というページがあって、詳しい情報もあります(例えば、今回の番組内容は第18回::検索にあります。トップは最新のものが来るようになってます)。

次回の「世界最大!百科事典“ウィキペディア”の秘密」も面白そうですね(8月19日(木)午後11:30〜)。忘れないように注意しておこう。
タグ:検索
posted by unendedchaos at 08:12 | Comment(0) | TrackBack(0) | 言語処理 | このブログの読者になる | 更新情報をチェックする

2010年07月13日

検索エンジン Bing

7月13日よりBingのサービスを開始するとのメールをいただきました(トップページ格好いいです!)。もちろんDMです。残念ながら関係者からのお知らせではありません(笑)。とりあえず試したことを書いてみる。

  • 天気

Bingで「天気」を検索すると、自分がいる場所の天気予報を教えてくれます。

おお!すごい!。IPアドレスから特定しているのかな。「○○県△△市□□区」と表示されます。ですが、自分がいる場所は間違っています……。「○○県△△市」までは合っているのですが、「□□区」は隣の区かな(惜しい!)。

でもこの試みは面白い。私の場合はWindowsのサイドバーで天気予報を表示してるので、自宅から検索することはないと思いますが(申し訳ない)。調べる手間を考えたら、ポータルサイトのトップページに設定しておく方がいいかも。

  • テレビ番組

  • テレビ番組を検索すると、こんな感じです。「テレビ番組: 現在放送中の番組」というのが出てきます。テレビをあまり見ませんが、これも便利ですね。ただ、リンクが不親切かな……。例えば、

    21:54 - 23:10 テレビ朝日 報道ステーション

    報道ステーションをクリックすると、報道ステーションのサイトに飛ぶのかと思いきや、飛びません(泣)。Bingの検索結果となります(こちら)。

    これは改善されるのかしら?クリックの一回や二回いいじゃないか!とも思いますが、一回ですむなら一回にしてもらえると嬉しいかも。

    他もいくつか使ってみましたが、とりあえずこんなところで。

  • 調査

  • ユーザーがどういうものを望んでいるのかは下記のサイトにまとめられています。マクロミルの調査のようですね。

    かんたん、みつかる Bing - 知りたい、でも見つからない…こんなことありませんか?/検索結果に欲しい情報が見つからない

    いろいろな意見があって興味深いです。ネットユーザーもいろいろいますからね。これはあとで読んでおこう。

    突然ながら図々しくも自分の意見を述べてみると、次のとおり(どうしても取り入れて欲しいとは一言も言っていません(笑))。

  • 辞書

  • 辞書ページジャンプできると嬉しいかな。ツールバーを入れればいいじゃないかという意見も出てくると思いますが、実際Yahoo!やgooはWeb検索か辞書検索か選べるようになっていますからね。なぜBingは入れていないのか?検索と辞書検索は一緒にするのは反対という意見があったのか!?MSNのサイトからは引けるのだからそれも選択できればいいのに……。使う使わないはユーザー次第ということで。

  • 百科事典

  • あと、MSNならエンカルタを引けると嬉しいのですが、さすがにそれは無理だろうな……。Wikipediaよりも上位に出てきたら、間違いなく先にそっちを引くんだけど……。ちなみにYahoo!にはYahoo!百科事典Betaがあります。辞書→百科事典(エンカルタ)という検索の流れでもいいから、引けるようにならないかな……。

  • レビューサイト

  • あとあと、著作権的には無理だろうけど、Amazonや価格込むや楽天などのレビューを横断的に読むことができたらなーと思います。それができたらテキストマイニングの勉強が捗りそうです。自分で収集……。これが面倒なんです(苦)。分析するのは苦じゃないんですけどね。

    以上です。偉そうに書いてしまいしたが(笑)。次世代検索エンジン(?)の発展を心よりお祈り申し上げます。陰ながら私もお手伝いはしたいところです……。

    posted by unendedchaos at 22:38 | Comment(0) | TrackBack(0) | 言語処理 | このブログの読者になる | 更新情報をチェックする
    ×

    この広告は1年以上新しい記事の投稿がないブログに表示されております。