意味理解、知性、とは何か

2019年1月27日2023年9月4日

現在のAIは、書き言葉や話し言葉の「意味を理解できない」というところから始まり、では、「意味を理解する」とはどういうことなのか、どういう仕組みなのか、を考えた。（→　「意味を理解する」とは何か）
前回のブログ記事では、主に言語学の入門書を参考に、意味とは何か（形式意味論）、ヒトにおける言語獲得の仕組み、普遍文法や統語解析の分野を参考に考察した。しかし、（残念ながら）納得のいく解答は得られなかった。というか、いまのところ「意味を理解する仕組み」は依然として未解決の課題ということだろう。
今回は、脳科学の分野から「意味を理解するとは何か」を考える。

参考にしたのは、「脳科学からみる子どもの心の育ち」（乾敏郎、ミネルヴァ書房）である。
本書にはズバリ、意味理解に関する仮説（乾敏郎　2010）が出ている。以下本書から引用する。
「私は文の意味は人の脳内で次のように理解されるという仮説を提案した。これはミラーニューロンが意味役割の中の動詞の項に対応するような、ある種の「手」を持っており、動作主など項の具体的な値を頭頂葉や側頭葉から一時的に受け取ることで、誰が何をどうしたのかという意味が理解できるというものである。このような下前頭回ー頭頂葉、下前頭回ー側頭葉などの情報の結合は比較的長距離であるが、文の意味を即時に理解するにはオンライン的にごく短時間で行われる必要がある。
これを実現する機構（しかけ）の有力な候補として、ニューロン間の活動の同期があげられる。つまり動作主を表すニューロンと対象物を表すニューロンが、ある動作を表すミラーニューロンと一時的に同期して活動することで文の意味が理解されると考えられる」
正直なところ、この仮説にはあまり納得感がない、というのが個人的感想である。そもそも意味を理解するという仕組みのなかで、脳の各部位のニューロンが発火するという現象は、それが原因なのか結果なのかが私には良く分からない（おそらくある部分は原因であり、ある部分は結果なのかもしれない）。
また、大きく2つの疑問がある。それは階層（レイヤー）とアルゴリズム（手続き、計算式）である。
脳（こころ）はいくつかの層（レイヤー）で構成されており、最下層がニューロンのレベル（ニューロンの発火）ではないのか、という疑問である。
もしも意味を理解するために、いくつかのアルゴリズム（手続き、計算式）が動いていると仮定したら、このアルゴリズムはより高次のレイヤーで動作しているのではなかろうか。さらに、「同期して」ということに着目すると、いくつかのアルゴリズム（あるいはその集合としてのモジュール）が並列して動き、同期を取りながら働いているのかもしれない。
そして、これらのアルゴリズムの中身（内容）が分からない限り「意味理解の方法」を解明できたとは言えないだろう。そもそも、脳で働く仕組み自体をアルゴリズムで記述できるのか否かも不明である。
層（レイヤー）という考え方は目新しいものではない。ダグラス・R・ホフスタッターは「高レベルの法則が低レベルの記述の用語では表現できないことは注目に値する」として、「PV＝ｃT、圧力と温度は新しい用語で、低レベルの経験だけでは表現できない」という例をあげている。
これを脳に当てはめると、低レベルではニューロンの発火しか見えなかったものが、高レベルでは別の法則が見えてくる、といえるだろう（あくまで推測ではあるが）。（経済学でもミクロ経済学とマクロ経済学があるように）
これは、還元論と全体論という立場の違いに帰着する。還元論的な立場では、「全体はその部分とその総和の性格を理解すれば完全に理解できる」となる。一方、全体論では、「全体は、その部分の総和よりも大きい」となる。
著者は全てを脳に還元できると考えているわけではない。
「認識という脳の機能を、脳だけの問題として解明しようとする考え方が間違っており、脳と身体、さらには体と環境の相互の関係のなかで認識というものを考えないといけない」と述べている。
また、「言語はさまざまな感覚と運動を統合して成り立つ働きである」という。
本書にはコミュニケーションや、他者の行為を認識することに関して興味深い論理が展開されている。
他者の行為（例えば他者がボールを投げる行為）を「認識する」というのは、単に視覚的なパターンとして理解しているのではない、という。AIであれば画像認識の技術を用いて動きのパターンを識別すると思われるが、ヒトの認識はそのような仕組みとは異なる。
ヒトの場合は、ミラーニューロンを使用して自分に対応付けて理解しているそうだ。すなわち、ヒトの脳（こころ）のなかには他者の行為（この例ではボールを投げる行為）と同じもの（イメージ？）が存在しており、それを通して認識している、ということのようだ。
このミラーニューロンは音声の理解でも重要な働きを果たしているという。私たちは、「音声を単なる聴覚信号パターンとして分析・識別するのではなく、一連の構音運動として理解している」という。

言語獲得を脳科学からみた場合には以下のモデルとなる。
「単語が次々と時系列的に入力される。このとき、機能語（閉じたクラスの単語）は47野に、内容語（開いたクラスの単語）はブローカ野の45野に伝えられる。そして、44野と6野の境界付近では、次々と入力される単語を適切なθ役割に対応付けるように学習が進められ、単語の使い方が学習される。
・・・十分に学習が進むと、文が入力されただけで格関係を正しく理解して、44野と6野の境界付近で各単語に正しいθ役割を与えられるようになる。また、47野には再帰結合（出力が自らへの入力として戻されるように設計された結合）があり、閉じたクラスの単語を系列順に一時的に保持しておく役割があると仮定されている」
言語学では、言語の獲得は先天的要因と後天的要因の相互作用だと考えている。これらの機能が脳のどの部分に対応しているのかは（本書に記載がないので）良く分からない。また、内部言語（I－言語）との関係も不明である。
本書にはイメージスキーマに関して簡単な示唆がある。
「ジーン・マンドラーは、乳児は知覚的な分析によりイメージスキーマを獲得し、これを用いて外界における事物の関係、すなわち意味を抽出しているのではないかと考えた。そして、このイメージスキーマをもとに乳児は様々な概念を形成していく」
このイメージスキーマというのは、「意味を理解する」うえでも関係してきそうだが、このあたりは、かなり専門的で（今のところ私には）良く分からない。
日経電子版（2019/1/1）におもしろい記事が出ていた。
「日本経済新聞社は2050年の将来に関するアンケート調査を実施した。18年12月に20～40代の若手研究者男女約300人を対象に調査し、200人から回答を得た。50年までにAIが人間の知性を超えるとされる「シンギュラリティ（技術的特異点）」が来るかという質問に対しては「どちらかといえばそう思う」（33%）も含めると9割が「そう思う」と回答。時期については30年が18%と最も多く、40年が16%で続いた。」
一般人ではなく研究者の約9割が、2030年～2050年までに「AIが人間の知性を超える」と考えているのは驚きである。研究者というのは楽観的なのだろうか？
そもそも知性とは何か、という知性の定義が必要かもしれないが、少なくとも「言葉の意味を理解する」ことができない現状では（門外漢の私でも）楽観的過ぎると感じる。
進化論的には、ヒトは道具を使うようになったときから知性が飛躍的に発達したと考えられている。英国の心理学者であるリチャード・グレゴリーは、言葉（言語）は「こころの道具」であると指摘している。
すなわち、言葉の意味を理解する能力（はたらき）は、知性が発達するための最初の第一歩だと考えられる。この第一歩はAIにとって想像以上の難問であるように思う。

e-雑感

Posted by kondo

月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31