2010年12月29日

Wikipedia日英京都関連文書対訳コーパス

怒濤の連日出勤でしたが、年末年始休暇を無事取れました。なんとか生きています(満身創痍)。今年は何かを達成したというのが何一つないような気もするので、休暇中に計画を立てようかと思います。結構、自己嫌悪に陥っていますが、このようなネガティブ思考はよろしくないですね。

さて、話は変わって、Wikipedia日英京都関連文書対訳コーパスですが、Ver. 2.0になったと聞いて早速ダウンロードしてみた。

1.人手翻訳による約50万文対を収録した精密かつ大規模なコーパスです。
◦高性能な多言語翻訳、情報抽出システムの研究・開発等にご活用いただけます。

2.翻訳の過程(一次翻訳→流暢さ改善のための二次翻訳→専門用語チェックの3段階)が記録されています。
◦訳文が精緻化されていく過程を観察できるため、翻訳支援ツールの開発、人手翻訳における誤り分析等にもご活用いただけます。

3.京都に関する内容を中心に、日本の伝統文化、宗教、歴史等の分野をカバーしています。
◦各種観光情報の英訳や通訳ガイドのための用語集作成、英語学習などにもご活用いただけます。

4.本コーパスに含まれる日英対訳用語約5万語対を収録した『日英京都関連対訳用語集』が付属しています(Version 2.0以降)。


個人的には3段階というのが嬉しいです。単語の修正や構文の修正を調査してみたいな……、と考えてはいますが、いったいいつになることやら。とりあえず対訳コーパスをデータベースに入れてみようかと。

この対訳コーパスは通訳案内士の試験にも役立ちそうですね。これだけじゃ合格は難しいとは思いますけど……。

学生の頃は通訳士になりたいって思った時期もあったけど、とてもとても……という感じですね(笑)。副業で通訳・翻訳をやりたいという夢は捨てたくはないのですが、現実には厳しそうです。ここ最近の忙しさを考えると、副業なんて無理無理でしたね。でも不可能を可能にしたい(そういう若さもなくなってきているような)。

本業だけというのは視野が狭くなるので、見聞を広めよう、というのは毎年の抱負。さてさてどうしたものか。
posted by unendedchaos at 08:11 | Comment(0) | TrackBack(0) | 言語処理 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。