2019年 8月 31日

現在のAIは「ことばの意味を理解できない」と言われている。それでは、「意味を理解する」とは、どのような事態で、どのような仕組みなのか? 今回は認知言語学の切り口から考えてみた。
参考にしたのは、「はじめての認知言語学」(吉村公宏:著、研究者)という認知言語学の入門書である。認知言語学は、人間の認知のはたらきと言語が密接に関係しているという立場の言語学である。
はじめに、認知とは物を見たり感じたるする感覚のはたらき(いわゆる五感に、運動、平衡、内臓感覚を加えた八感)と、それを基に記憶、学習、判断をする精神のはたらきのことである(本書の定義より)。
この定義から明らかなように、感覚器官を含む「身体」を持たないAI(人工知能)が「ことばの意味を理解する」のは不可能に近い気がしてくる。
それならば、センサーと身体を持つAIロボットIなら可能だろうか?
いや、人間の精神活動には、喜びや怒り、悲しみなどの「感情」が含まれているから、AIロボットでも難しそうだ。具体例として、「怒り」、「立腹」、「憤怒」、「憤激」、「逆上」という言葉(記号)を考えてみる。人間は、これらの言葉(記号)を見たり聞いたりしたときに、その記号に対応する概念(イメージ)を想起することができる。この例では「怒り」が上位概念で、それ以外の「立腹」以下は下位の概念である。
人間は、これらの記号の違いを、概念の違いとして、感情の違いとして、認識することができる。しかし感情を持たないAIロボットがこれらの記号から概念(およびそれぞれの違い)を形成するのは難しそうだ。 

もう一つの例として、頭を使い過ぎて疲れを感じたときの表現を考えてみる。(本書にある例として)「頭がさび付いて回転しない」や、「(忙しくて)目が回る」などの表現がある。
これらの表現はメタファーである。本当に頭や脳がさび付いたり、回転するわけではないし、目玉が回るわけではない。これをAIロボットに教えるには、まずメタファーという概念を教えなければならない。
しかし、それでも、コンピュータであるAIは、原理的に頭を使い過ぎて疲れるという「感覚」を知ることは出来ないだろう。AIの場合、その頭脳であるCPUをフル回転すれば電力を消費するだけである。よって、AIロボットは「頭を使いすぎて疲れる」とは、「CPU使用率の高い状態が続き、電力を異常に消費する状態」だと理解するかもしれない(これは半分冗談であるが・・・・)。
このように、AIロボットが感覚や感情に関わる「ことばの意味」を理解することはかなり難しいだろうと推測できる。

本書には「意味」の定義が出ている。
「あるものの意味とは、人間が主体的にその環境を解釈することによって得られる精神活動の所産である」
これと同じような考え方として、アフォーダンス理論が紹介されている。アフォーダンス理論は「人間は、対象が提供する情報をキャッチして、環境を意味づける存在である」とする立場である。
どちらも少々難解な説明なので、(本書の例を参考に)具体例をあげてみる。
貴方が、プールの中にいる人物を見かけたとする。この時貴方はこの状況(あなたという主体と対象との関係)から、どのような意味付けを行うだろうか?
誰かが「泳いでいる」と思う(意味付ける)かもしれないし、誰かが「浮かんでいる」と思う(意味付ける)かもしれない。あるいは、誰かが「溺れている」と思う(意味付ける)かもしれない。
「泳ぐ」、「浮かぶ」、「溺れる」は、それぞれ異なる概念であるが、主体である貴方が対象をどう解釈したか(意味づけたか)によって結果が異なってくる。
AIロボットがことばを話すためには、対象や環境を自らが解釈して、言語という記号に置き換えるという操作が必要になる。これとは反対に、ことばの意味を理解するためには、記号の羅列から環境との関係性を推論する必要がある(言語という記号の羅列から、対象と主体との関係を解釈(概念化)する必要がある)

「合成性の原理」というのも興味深い。合成性の原理とは、「文の意味は各単語の意味を足したもの」という考え方である。認知言語学では、表現の意味を考えるとき、この原理は採用しない。
「意味とは、言葉のたし算を超えた知識(フレーム知識)に支えられ、対象や事態を主体的に概念化したものである」という。全体は部分の総和を超えたものだと考える点において、還元論に対する全体論のようで興味深い。
これはAIロボットを考えるうえでも重要な観点になりそうだ。すなわち、意味を理解するためには、単純な語彙辞書と構文辞書(あるいは構文を解釈する機構)だけでは不足する可能性を示唆している。

AIロボットが「ことばの意味を理解する」うえで障壁になるものの一つが、「ことばの多義性」である。本書にも、「コンピュータは多義語が苦手である。一方、詩人は多義語が得意である」旨の指摘がある。
本書では多義語の一例として「走る」をあげている。「マラソンランナーが走る」、「道が東西に走る」、「背中に痛みが走る」、「夫を棄てて愛人に走る」、「悪事に走る」。
「走る」の意味も色々だ。このあたりは文脈(あるいはフレーム知識)から意味を選択する必要があるだろう。多義性が厄介なのは、基本的な動詞ほど多義な傾向になるからだろう(英語でもget、make、haveなど基本的な動詞に多いようだ)。

構文のなかにも多義と類似したものがある。
本書には、所有を意味する「の」(所有構文)に関する説明がある。「太郎の車」は、太郎が所有する車という意味である(所有を意味する「の」が使われている)。しかし、「の」は必ずしも所有を意味するだけではない。「花子の友人」、「犬の餌」、「電車のドア」、「イラクの侵攻」。
「の」の意味が持つ多義性も、AIが意味を理解するうえで障壁になりそうだ。(このあたりは、人間の場合は無意識のレベルで意味付けができているように感じるのだが、どうなのだろう)

多義語とは異なるが少々厄介なものにメトニミーがある。例えば、「ヤカンが湧いている」がそれである。これは正しくは「ヤカンの湯(または水)が湧いている」であるが、私たち人間はフツーに「ヤカンが湧いている」で通じてしまう。
メトニミーもAIにとっては厄介だろう。単純に単語と構文だけで解釈すると「ヤカンそのものが湧いている(焼けている?)」というおかしな話になってしまう。人間は無意識のうちに言葉を補完して解釈しているのだろう(AIにも人間のような柔軟性が求められる、ということだろう)。

多義語でもメトニミーでもないが、少々厄介にみえるものもある。本書では色彩名(名詞)と、その形容詞化が紹介されている。「赤い」や「白い」とは言うが、「緑い」や「茶い」とは言わない、という類の話である。
本書には、カテゴリー転換の柔軟性という観点からの説明がなされている。別の書籍(「はじめて学ぶ言語学」(大津由紀雄:編著、ミネルヴァ書房)では、これと同じような話を、心的レキシコンと語彙的ギャップという観点から説明している。
このあたりは、人間が特に意識していない部分だろう。私たちは意識していなくとも「語感」が働く。「赤い」は自然だと感じるが、「緑い」は不自然だと感じる。
この「語感」というのも、それが何であるかを考えると奥が深そうだ。

結局、意味を理解する仕組み(意味解釈の機構)はまだ良く分からないけれども、本書を読んで、自然言語が持つ奥深さと、意味を理解する上で何が問題になるのかが少しは分かってきた(気がする)。

 

INDEX

Update

2019年8月
« 7月   9月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

Navigation