「大規模言語モデルは新たな知能か」(岡野原大輔:著)
「大規模言語モデルは新たな知能か ーChatGPTが変えた世界」(岡野原大輔:著、岩波書店) 一般向けといえど、大規模言語モデルの主要な「技術」や技術的課題も丁寧に書かれている。 私が前々から疑問に思っていた「意味を理解するとは何か」 記号接地問題とは、人間はどのようにして言語(記号の連なり) 結論からいうとこの課題は未解決のままであるが、 「私たちは無意識下で言語を獲得し、 私たちが相手の話(母語)を聞く時を考えてみると、 他の書籍では、意識は直列処理(並列処理ができない)に対して、 さらに意識下の処理よりも無意識下の処理の方が処理量は多いよう すなわち、 著者は大規模言語モデルの仕組みを解明するなかで、 確かにニューラルネットワークは人間の脳を模したものだそうだか しかし、 本書には、言語(および言語学)に関しても解説がある。 言語の獲得には遺伝的な部分があるという研究者が多くいる一方で 著者は「言語は学習しやすい特別な性質をもったデータであり、 と考えているようだ。 人間が言語を獲得する(または学習する)過程を考えると、 もし人間の脳に汎化の学習器があるとすると、 いや、 大規模言語モデルが訓練データを使って学習する過程を人間と比べ 本書を読んで驚くのが「創発」や「自己注意機能」の能力だ。 先に大規模言語モデルと人間の(主に脳の) 本書は(私のように)AIに関わったことがないIT技術者にとっても、大規模言語モデルの全体像(概要)が分かる良書といえるだろう。 |
補記)
・言語の起源「言語の起源 -人類の最も偉大な発明」(ダニエル・L・エヴェレット:著、 ・言語脳科学「チョムスキーと言語脳科学」(酒井邦嘉:著、集英社インターナショナル) ・強化学習と人間の脳強化学習も人間の脳の仕組みをまねたものだと思われる。人間の強化学習では大脳基底核ループが使われている。 ・予期しない成果ヴェンキ・ |
ディスカッション
コメント一覧
まだ、コメントがありません