2011年08月28日

計算言語学とは……

2011年8月14日のブログ
CCGについては全くの不案内なので、そのうち勉強したいな

と書きましたが、CCG(組み合わせ範疇文法)は難しい(涙)。計算言語学は文系出身の私には本当に難しいです。これをすらすら読めるようだったら、私は今の職には就いていないのである。

(日本語研究叢書24) 日本語文法の形式理論 - 活用体系・統語構造・意味合成 [単行本(ソフ...
(日本語研究叢書24) 日本語文法の形式理論 - 活用体系・統語構造・意味合成 [単行本(ソフトカバー)] / 戸次 大介 (著); くろしお出版 (刊)

今後のことに備えて少し備忘録を残しておく。

戸次大介.2010,「CCG による日本語文法記述の進捗と展望 〜活用体系・統語構造・意味合成〜」(PDF)
矢田部修一.2011,「書評(戸次大介『日本語文法の形式理論――活用体系・統語構造・意味合成――』)」(PDF)

前者の「CCG による日本語文法記述の進捗と展望」については本書の「文科系言語学と理科系言語学の乖離」について簡潔にまとめられています。後者は書評です(理解の助けになります)。

今回は前者について触れてみます。これは自分が学生時代の頃から言われていたことなんで、「だったら私が文系と理系の架け橋になる!」と意気込んだものの、現実はそんなに甘くありませんでした(現在の週末研究者=ただの社会人に至る)。私の場合は、挫折してしまったのですが、細々と情報収集したり、文献を読んだりしている程度です。ですが、世の中にはすごい人がいるもんで、こういう問題に真っ向から挑むという人もいるものです。両方勉強するのは大変なことだと思います。

言語学を学べる学部というのは、典型的には文学部や外国語学部であり、いわゆる文系学部です。文系学部のカリキュラムを見ると、理科系言語学はほとんど含まれていません。ただ、昨今の学際領域の風潮もあり、他学部の授業を聴講できる大学は文系学部に所属しながら、理科系言語学を学ぶことができるかもしれませんね。ただ、文科系言語学と理科系言語学の両方学べる大学というのは少ないと思います。古い友人が単科系の大学だと、どっちかしか学べないので、よくないと言っていました(その友人は自分で勉強できる人だったわけですが)。とにかく両方勉強しようとなると、かなりのエネルギーを必要することは確かですね。

このような本が出版されることにより、学生以外も学ぶ機会が増えることは嬉しい限りです(内容を理解するのは用意ではありませんが……)。理科系言語学の本ってあまりないですよね。計算言語学という分野はありますが、「計算言語学入門」なんて本あまり見かけませんね……。そもそも計算言語学って何なの?この本のまえがきに分野を定義するのは難しいと次のように書かれていますね(この前書きは辻井先生によるものですが)。

計算言語学(Computational Linguistics)という分野を定義するのは、簡単ではない。関連する国際学会にACL(Association for Computational Linguistics)があるが、最近の会議では計算機を使って言葉を処理する技術に関する研究発表が大半をしめ、計算言語学は言語学の一分野というより、計算機科学・情報科学の一分野の印象がある。ただ、これは、過去20年間に徐々に顕著になってきた傾向で、その前の、やはり20年の間は、形式性の高い言語学の理論に関する発表も多く一つの格を形成していた。計算言語学は、形式性を重視する言語学の一分野であった。


時代によって流行り廃りはあるから仕方が無いにしても、少し寂しい気がしますね。ですが、計算言語学は終焉を迎えたわけでなく、この本の著者のように精力的に研究をされているものもいるので、今後の展開が楽しみです。私も何か一石投じたいところですが……。

手元にある本にも計算言語学の記述があるものもあるので、紐解いてみますか。
posted by unendedchaos at 13:16 | Comment(0) | TrackBack(0) | 言語学 | このブログの読者になる | 更新情報をチェックする

2011年08月14日

生成文法

お盆休みは読書もやりたいと昨日の日記に書いたとおり、早速読書を行いました。言語習得の本でも……と思ったのですが、その前に「生成文法」を軽く復習した。生成文法に関する本はいくつかあるけど、今回読んだ本は『生成文法 [単行本] / 渡辺 明 (著); 東京大学出版会 (刊)』です。

生成文法 [単行本] / 渡辺 明 (著); 東京大学出版会 (刊)

ページ数も少ないし、読書の対象者が「大学学部レベルの諸学者に理解させることを目標とする。」と書いてあるので、ブランクを埋めるにはちょうどよいかと。内容も統語分析の基礎なので。

一通り読んで、頭の片隅の残っている記憶がよみがえってきた感じです。欲張れば、この本を使って自分で講義ができるくらいに理解し、説明できるとよいのですが、そこまでは今のところ無理です(苦笑)。ですが、大学(大学院)で「言語学やっていました」というと、「言語学ってどんなことしてるの?」と、よく話題になるので、誤解を与えないような説明をしないといけないなーと気をつけたい。適当にこの本を読んで理解してね♪というのもあれだし(笑)。

内容ですが、生成文法は自然科学的なアプローチであることを強調し、分析を行っています(仮説→検証→修正)。特に2.2.1節の「英語疑問文における主語と助動詞の語順転換」が丁寧に書かれていますので、置いてけぼりになることはありません(ただ、なんでこんな間怠っこしい説明をするんだと思う人もいるかもしれませんが……)。また、各章の終わりには文献案内があるので、興味が出てきたら、そちらも読むといいですね。私も時間があったら読みたい(読み直したい)ぐらいです……。

言語学って人文科学じゃないの?文学研究と同じようなものなんでしょ?と訊かれることもあるが、いやいや自然科学なんですよと説明している。今度からもう少し丁寧に説明しようと思いますが、以下の自然科学的なアプローチを参考にしたい。

自然科学的なアプローチとは,データの観察・分析に基づいて仮説を立て,それをさらなるデータの観察分析によって検証・修正していくという手続きをとる.このようにして提出された仮説の総体を理論といい,それは現実に対応してその本質を捉えているモデルとして扱われる.だからこそ、現実世界の一部を形成する形で生じてくるデータの観察・分析が、仮説の検証の意味を持ってくるのである.

生成文法は「反証可能性(Falsifiability)」というのがキーワードになっていますからね。本書は結果を押しつけるだけでなく、仮説を立て検証をしてという形式で書かれています。仮説と検証は学問だけでなく、他にも応用できる(したい)と思います。

ちなみに自然科学的なアプローチといっても様々なものがあります。次のようなことにも触れています。

また,自然科学的なアプローチをとるということは.コンピューターによる言語処理といったような工学的関心とは研究の指向性が異なるということでもある.工学的目標を視野に入れた生成文法モデルの理論モデルというのも確かに存在するのだが,本道からは少しずれていると言わざるをえない.入門レベルでは考える必要のないことがらである.


確かに。工学的な言語学(計算言語学)は違うような気がしますね。ちなみに工学的な言語学アプローチにはHPSGLFGがありますね。あと、最近知ったのですが、CCGですね。CCGについては全くの不案内なので、そのうち勉強したいな(「CCG による日本語文法記述の進捗と展望」(PDF))

あと、ちょっとドキッとしたことも……。

説明できないデータが存在するということは,仮説を捨て去る理由には必ずしもならないのである.よりよいアイデアが登場してはじめて,古い仮説は捨て去られる.この点を理解していない言語研究者はかなり多い.自然科学研究のセンスを持ち合わせていないからだが,こうした輩は要注意である.


ほんと、注意しないといけませんね。著者によると、「優れた仮説を出す重要性がわかっていない」との注がありましたが、できるところまでやってみるという姿勢は重要です(あえて一部のデータには触れないという考え方)。その説明できないデータを説明できる仮説を誰かが立てればいい(他力本願という意味ではありません)。焦ってはいけないですね。

まとめに入ると、知的好奇心がそそられる本だと思います。この本がというより、生成文法がといった方が適切なのかもしれませんが……。
タグ:言語学
posted by unendedchaos at 09:34 | Comment(0) | TrackBack(0) | 言語学 | このブログの読者になる | 更新情報をチェックする

2011年04月30日

「高い穴に落ちちゃったよ」という表現

結構前の読売新聞の内容ですが、以下の記事がありました。出典は読売新聞の『4月15日付 編集手帳』です。

幼い子供が二人、原っぱで遊んでいた。一人が誤って穴に落ちてしまう。もう一人の子は家に駆け戻り、大人の助けを求めた。「××ちゃんが高い穴に落ちちゃったよ…」。深い穴、ではない

「高い」と「深い」は視点が逆転してるのが認知言語学的には興味深いものである。認知の営みとして、客体をどのように見ているのか、そしてそれをどう言語化するのか。認知言語学ではしばしば「捉え方」(construal)と言われてるものである(例えば、陽が昇るという表現は、人は太陽が動いていると知覚して「昇る」と言っているが、動いているのは地球の方である。太陽系とか銀河系とかそういった専門的な話は抜きにしておきます)。「高い穴」は自分自身ではなく、相手の視点から見た言語表現ということなのが興味深いところである。

教師の知人からずいぶん昔に聞いた話でうろ覚えだが、実話という。知人いわく、助けを求めた子は穴を上から見下ろすのではなく、友だちと一緒に穴の底にいる気持ちでいたから、“高い穴”になったのだろう、と

ただの誤用表現と片付けないのが、言語学(心理学)の面白いところです。「高い穴」は「穴が高い」という構造(Junction)になっていて、「高い」の主語はどういうものがあるのか?ということになると辞書の話になって、言語学だけでなく、言語処理の観点からも面白いと感じる人も出てくるかもしれません(こういうマイナーな事例は辞書登録させたくないと考えるのが一般的ですが)。

こういう表現を見つけようとしてもなかなか見つけることができないので、子どもに日記を書かせるといいかもしれません(笑)。小学生のころ、学校で日記(グループになって)を書かされましたが、今考えると面白いデータだったのかも。

小学校の卒業文集をデータベースにして言語分析をしたら面白いかもしれませんね(でも小学校6年じゃしっかりした文章を書くか。先生の添削も反映されてるからやっぱり無理があるか)。今はそういうのもパソコンで記録できて便利な時代になったものです。昔の作文なんて人には見せられないって人が多そうですが(笑)。
posted by unendedchaos at 12:44 | Comment(0) | TrackBack(0) | 言語学 | このブログの読者になる | 更新情報をチェックする
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。