2013年06月21日

機械翻訳文献リスト

機械翻訳についてざっくり知りたいと思い、手元にある文献を片っ端から読む予定です(正確には再読となるのですが、記憶に残っていないな……)。機械翻訳は応用研究なので、言語学畑の自分にとってはさっぱりな所もあるのですが、専門外の立場から熟読したい。



最近のトレンドは統計的機械翻訳とのことですね。上記のリストには入れていないが、『言語と情報科学 (シリーズ朝倉「言語の可能性」)』にはこんなことが書かれていました。

コーパスが大規模であれば言語モデルの性能も上がるのは自然な結論であり,実際,Google翻訳では,5-gramまでの言語モデルを用いて,統計的機械翻訳の精度を大きく改善させたという報告がある.


ここで言われている「Googleの報告」のソースは確認していないが、質のいい対訳コーパスがあれば、さらに精度は向上しそうですね。ですが、言語学畑の自分としてはルールベース機械翻訳も捨てがたい……。機械翻訳では扱いにくいものを対象を切り口にしてみようかな。

「翻訳学」をテーマとして、機械翻訳について何かしらアウトプットしたいところです。

言語と情報科学 (シリーズ朝倉「言語の可能性」)
言語と情報科学 (シリーズ朝倉「言語の可能性」) [単行本] / 中島平三 (監修); 松本裕治 (編集); 朝倉書店 (刊)

単行本: 216ページ
出版社: 朝倉書店 (2011/7/11)
言語 日本語
ISBN-10: 4254515669
ISBN-13: 978-4254515664
発売日: 2011/7/11
タグ:翻訳
posted by unendedchaos at 21:56 | Comment(0) | TrackBack(0) | 言語処理 | このブログの読者になる | 更新情報をチェックする

2013年06月14日

総合診療医 ドクターG

総合診療医 ドクターG』というNHKの番組を観ました。症状から病名を当てるという番組で、病名を当てるのは研修医です。

新感覚!病名推理エンターテインメント番組「総合診療医ドクターG」。
病名を探り当てるまでの謎解きの面白さをスタジオで展開する!
あなたの症状も解き明かされるか!


観た切っ掛けは21時のニュースを観ていた所、寝ていまい、気づいたらこの番組がされていたので、観たというもの……。普段あまりテレビは観ないので、このような番組がされているなんて全く知りませんでした。

この番組を書き起こしたモノってありませんよね……。病名やら症状やらのアノテーション済みのデータが欲しい!アノテーションは自分で付けてもいいので(笑)。

○○だから、△△が疑わしいとか、□□だから、△△の可能性はないとか、症状と病気の因果関係を知識ベースとして、質問に答えるだけで、病名を当てるというエキスパートシステムがあればなあ。もちろん判定は絶対ではないので、信用しすぎてもいけないのでしょうけど。

あと、以前から興味があるのはオントロジーかな。病名だけでなく、「肩が痛い」とか「喉が痛い」とか、症状も関連づけたデータがあればな。

この番組を気に入ってしまったので、もしやと思い、Amazonで検索したら、ありました!DVDではなく、書籍(Kindle書籍も)でしたが、これは要チェックですね。

やっぱり医療情報学を勉強したいなと思い、このブログに備忘録を残しました。『総合診療医 ドクターG』は毎週観られるかわかりませんが、心に留めておきましょう。この番組はかなり気に入りましたので、是非毎週観たいのですが……。

医者は病気をどう推理するか
医者は病気をどう推理するか [単行本] / NHK「総合診療医ドクターG」制作班 (編集); 幻冬舎 (刊)
単行本: 213ページ
出版社: 幻冬舎 (2012/6/27)
ISBN-10: 4344022041
ISBN-13: 978-4344022041
発売日: 2012/6/27

posted by unendedchaos at 23:49 | Comment(0) | TrackBack(0) | 医療 | このブログの読者になる | 更新情報をチェックする

2013年06月09日

同じ分野の本を読む

個人的に行っていた読書術として、同じ分野の本を複数読むということをしていました。これはもちろん興味のある分野であったり、仕事で必要に迫られてであったりします。同分野の多読というのはコンサルタントが行っている方法のようですね(もちろんコンサルタント以外の人もしていると思いますが)。

読書力 30分で読んで覚える! ビジネス速読入門講座
コンサルタントの読書術 確実に成果につながる戦略的読書のススメ / tyk publishing
すべての仕事を紙1枚にまとめてしまう整理術

それぞれどんなことが書かれているのでしょうか。備忘録として引用しておきます。

同じテーマの本を10冊集中して読む、というのがポイントです。(中略)。10冊読んで、同じことが出てきているものは、その分野のスキル習得にあたって、肝となる部分なのです。もう一つのポイントは、理解のスピードです。1冊の本を丁寧に読むより、10冊の本をラフに読んだほうが、理解のスピードは実は速いのです。10冊の本を読むということは、10人の講師から、別々の形で授業を受けるようなものです。10冊に本には、幹となる同じような概念が10通りの表現で解説されているわけです。


別の形による説明をされ、記憶にも残りそうですね。忘れそうになったときに、説明を受ける。これを繰り返しておけば、長期記憶につながるかな(忘れる前に詰め込めよ!という考え方)。

結論から言ってしまうと、ビジネスパーソンにとって大切なことは、「同ジャンルの本」を「多読」することです。知識を身につける上では、同じジャンルの本を3冊程度読むことが、一番いいのです。なぜなら、3冊も読めば、その道のノウハウはだいたい網羅することができるからです。


こちらの本はビジネス本を対象にしていたこともあり、3冊でいいよというお話でした。一つの指標にしておきますか。実際には一冊読んだら、もう十分ってこともありそうですし。

僕が住宅メーカーのクライアントの新規の案件を担当することになったときのこと。さっそくクライアント先でのヒアリング、経営陣とのミーティングをセッティングしました。そのため、事前に住宅業界やそのクライアントに関する資料や書籍に目を通し、リサーチをしておく必要がありました。そのとき目を通した書籍の数は60冊以上でした。


60冊ってすごいなー。こちらの本は読んでから内容をアウトプットの仕方について書かれております。そのやり方については触れませんが、著者がキラーリーディングと読んでいる方法があります。調べてたら、『必要な知識を15分でインプットできる速読術』という本(Kindleは必要な知識を15分でインプットできる速読術)も出版されているのですね。『すべての仕事を紙1枚にまとめてしまう整理術』の「キラーリーディング」のアウトプットに満足していた私は早速購入します!「紙一枚で〜」というのも身につけたいんですよね(課題が多く、欲張るのはよくないかな……)

以上、引用しつつ、簡単なコメントを入れました。部分部分抜き出しているので、著者が一番言いたいこととは限りませんが、同じ分野の本をたくさん読むという方法は広く知られているのかな。何冊読むかと言うことに関しては個人の目的によるというところでしょうね。

ここで、今後の予定(野望?)について触れておきます。

「翻訳学」という学問をつまみ食い程度に勉強していたのですが、機械翻訳についてある程度勉強しておきたいと思いました。別に機械翻訳の分野で最先端の研究そのものを行うのではないのですが、業界の動向ぐらいは知っておきたい。できれば歴史的なことも知っておきたいというのがきっかけですね。上記の本に書いてあるようなまとめ方ができればよいのですが、そこは難しそうだな……。

必要な知識を15分でインプットできる速読術
必要な知識を15分でインプットできる速読術 [単行本(ソフトカバー)] / 高橋 政史 (著); クロスメディア・パブリッシング(インプレス) (刊)

単行本(ソフトカバー): 191ページ
出版社: クロスメディア・パブリッシング(インプレス) (2011/12/13)
言語 日本語
ISBN-10: 4844371363
ISBN-13: 978-4844371366
発売日: 2011/12/13


タグ:読書術
posted by unendedchaos at 22:51 | Comment(0) | TrackBack(0) | 読書 | このブログの読者になる | 更新情報をチェックする
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。