囲碁のAIは何を学習したのだろう

2023年9月7日

囲碁のAI(人工知能)と世界トップレベルの棋士の勝負が話題になった。
私は囲碁に関しては全くの素人であるが、Webの実況中継ではプロの棋士が解説を行っていて、それを聞いているだけでも十分に緊迫感や興奮が伝わってきて楽しめた。
AIと棋士の対局は2016年3月9日から15日にかけて全5局が行われた。前評判では、囲碁はチェスや将棋よりも手数の組み合わせが格段に多いことから、いくら計算機が高速でも、力ずくで組み合わせを評価することは不可能であり、よって、AIが人間のトップレベルに並ぶのはまだまだ先の話である、というのが大勢であった。
ところが、第1局の対戦がAIの勝利で終わると、プロ棋士らの評価は一変した。予想以上にAIの進歩は速く、全5局のうち棋士は1勝できるかどうかのレベルだという。訂正後の予想通り、AIはトップレベルの棋士に3連勝し、トータルでは4勝1敗という好成績であった。このAIシステムは、米グーグル傘下の英グーグル・ディープマインド社が開発した「アルファ碁(AlphaGo)」である。
アルファ碁は深層学習(多階層のニューラルネットワークを用いた機械学習)を使用しており、Web上の情報では、使用しているCPUの数(コア数?)は1200との情報もあった。(並列処理をおこなっていると思われるが詳細は良く分からない)
第1局の解説を聞いていて興味深かったのは、前半から中盤くらいまでは棋士の方が有利という雰囲気だったのに、後半では一転してAIの方が有利だと、評価が変わった点である。
また対局後の解説や記事では、人間では考えられない指し手であるとか、感性や大局観が人間とは異なるなど、AIが人間とは異なる学習をしているように思われる点も興味深い。
これは何を意味しているのだろうか?
人間の経験則や直感が、必ずしも最適解でないということだろうか?
むしろ経験則に従わない、突飛に思える発想がむしろ最適解である場合があるという、一種のイノベーションであろうか?
もしこれをイノベーションと考えるのであれば、将来は経営戦略やマーケティング戦略、あるいは経済政策などへの応用(人間の意思決定をサポートするアドバイザーとしてのAI)はかなり現実的で、かつ有効かもしれない。
話を囲碁に戻す。
この対局の解説の中には、「AIが人間に近づいた」という趣旨のものがあったが、この指摘はあまり適切とは思えない。
以前にも書いたように、人工知能という曖昧な言葉(人がこの言葉を聞いて想像する範囲が恐ろしく広範囲で、さらに人によって想定する範囲がバラバラ)を使うことで、人々に誤解を与えているように感じる。
AI(人工知能)は、欲望や感情を持たない。モチベーションも不要である。従って、人間の棋士に勝利したいという欲望や、勝利して世間の注目を集めたいという欲望などないだろし、勝利して喜ぶことも、反対に負けて悔しがるということもない。
この点は人間との根本的な違いである。
例えば、計算問題について、計算機(コンピュータ)と人間の対決を考えてみよう。人間は暗算か筆算、あるいは算盤などのツールを使うだろうが、どう頑張っても計算機にはかなわない。これをもって、「計算機は人間に近づいた」などと思う人はいないだろう。
AI(人工知能)の場合も同じはずだ。同じでないとすれば、それはAIの技術的な内容を正しく理解している人が少ないからだろう。そういう私も機械学習については素人であるが・・・・。

多くの報道は深層学習(ディープラーニング)をセンセーショナルに伝えているが、雑誌「Web+DB PRESS Vol89」の記事「はじめての深層学習」によれば、深層学習は決して新しい技術ではない。
パーセプトロン(3層構造のニューラルネットワーク)の発明は1957年まで遡る。
その後冬の時代を経て、1986年に多層パーセプトロンを使用して学習する方法が研究されたようである。
さらに2度目の冬の時代を経た2006年、深層ニューラルネットワークが再び注目を集めるようになった。この入門(の入門)記事を読んで感じることは、この技術にもまだ経験則や手探りの部分がありそうだということと、ブラックボックスの部分があるようだということである。
ブラックボックスに見える部分とは、「多層パーセプトロンが何を学習したかを説明することは難しい」という点である。
機械学習といいながら何を学習したのか説明し難いとは、どういうことだろうか?
入門レベルですでに良く分からなくなってくるのである・・・。
深層学習について、多くの報道はAIが自力で学習して成長していくようなニュアンスで報じているが、実は技術者が試行錯誤でチューニングする部分も多いのではないか、すなわちエンジニアの腕の見せ所がまだ残っているのではないか、と想像する。果たしてどうなのだろう。
また、学習の部分がブラックボックス化しているとすると、それに関わるソフトウェアのバグはどのようにして抽出しているのだろうか。

さて、チェスの世界では、1997年に世界王者を破ったIBMの「ディープブルー」が有名である。
この当時のIBMは、汎用機「 Enterprise System/9000 (ES/9000)」や、RISCマシン「 RISC System/6000 (RS/6000)」などの名機を擁し、世界のコンピューターメーカーの頂点にあった。
ディープブルーはRS/6000をベースとした並列処理コンピュータで作られていたという。計算機の性能が向上し、チェスの手数の読みが深くなったことが勝因の一つではないかと思われる。
すなわち、ハードウェアの性能向上が計算機の勝利に大きく寄与したといえる。
その後、将棋の世界でもコンピューターが人間に勝利するようになった。盤面の評価と手数の読みの深さがコンピューター将棋のポイントのようだ。
その中でも盤面の評価は多数のパラメーターのチューニングが重要なポイントであり、当初はプログラマーの腕の見せ所であったが、その後チューニング自体をコンピュータが行うようになったようだ。
今回の囲碁のAIを開発したのはグーグル傘下の企業である。グーグルは世界を代表するソフトウェアベンダー(あるいは情報ベンダー?)である。IT業界の覇者がハードウェアベンダーからソフトウェアベンダー(あるいは情報ベンダー、サービスベンダー)に変わったことを象徴する出来事だといえよう。

雑感
「雑感」のINDEX

e-雑感

Posted by kondo