(新聞記事のもとになったエッセイです。筆者の経験などの記述あります。3496字)
10月8日、人工知能(AI)の基礎研究でノーベル物理学賞が米プリンストン大のジョン・ホップフィールド名誉教授とカナダ・トロント大のジェフリー・ヒントン名誉教授に授与されると発表された。受賞業績は「人工ニューラルネットワークによる機械学習を可能にする基礎的発見と発明」だ。
翌9日、こんどはAIの応用研究で化学賞が米ワシントン大のデイビッド・ベイカー教授と、英グーグル・ディープマインド社のデミス・ハサビス最高経営責任者、同社のジョン・ジャンパー上席研究員に授与されると発表された。業績は「コンピューターによるたんぱく質設計と、構造予測」だ。
2日連続でAI関連の研究がノーベル賞に輝いた。筆者は、物理学賞と聞いたとき、おどろいた。AIは情報処理関連の内容であり、受賞者も筆者がよく知っている名前だったからだ。翌日の化学賞もAI関連であり、さらにおどろいた。
筆者は最近、AI関連の入門書(「音声言語処理入門―図解・音声・動画でわかる」(研究社、2024年4月))を出版したので、この本に書いてある内容(<_>で示した)も交えながら雑感を述べたいと思う。
これまで工学系の研究ではノーベル賞は取れないと言われていた。ノーベル賞は基礎的研究の「発見」に対して与えられるが、応用的研究の「発明」には与えられない。発明王エジソンが最たるものだ。ノーベル賞級の発明を次々と世に出した天才だ。また筆者の専門分野では電話機を発明したベルがそうだ。
工学系で最初のノーベル賞受賞は、トランジスタの発明だった。1956年 「半導体の研究およびトランジスタ効果の発見」でノーベル物理学賞を受賞した。半導体の研究だから物理学賞にふさわしい。2番目のものは、CT(コンピュータ・トモグラフィ)で、1979年度のノーベル医学生理学賞だ。現在では、多くの人になじみの装置で、医学に大いに貢献して、ノーベル賞にふさわしい。最初の電子顕微鏡は1931年にクノールとルスカが開発した。ルスカは性能を高め、この功績で1986年にノーベル物理学賞を受賞した。20世紀の物理学上の新発見に関することなので、物理学賞にふさわしい。最近では青色ダイオードがある。2014年のノーベル物理学賞は、青色発光ダイオード(LED)を開発した赤崎勇、天野浩、中村修二の3氏に与えられた。半導体が対象なので、物理学賞にふさわしい。
今年の化学賞はAIの化学への応用なので、化学賞にふさわしい。これらに比べると、物理学賞はAIの基礎研究なので、きわめて異色だ。
AI研究には過去に2回ブームがあった。現在は3回目のブームだ。1回目のブームは1960年代にあり、記号処理によるAIである<ELIZA>が開発され、最初の<学習>機械である<パーセプトロン>が発明された。しかし、パーセプトロンの限界が理論的に証明され、記号処理によるAIもあまり進展せず、ブームは去った。
2回目のブームは1980年代で、「エキスパート・システム」と脳のモデルである<ニューラルネット>が開発された。そのころ日本では第5世代コンピュータとしてAIに巨額の研究費が投じられ、21世紀は日本がAIコンピュータをリードすると言われた。
ニューラルネットには、パーセプトロンのような限界は理論上なかった。筆者の専門分野である<音声認識>の研究では、1985年ごろから1995年ごろまでニューラルネットと確率統計的音声認識システムの<マルコフモデル>が二大勢力となり優秀さを競っていた。
筆者もニューラルネットやマルコフモデルを応用した音声認識の研究を行い、論文を書いた。また、「エキスパート・システム」を応用して<琉球語翻訳>の研究をした。
しかし、第5世代コンピュータ・プロジェクトはうまくいかず、ニューラルネットには学習しすぎともいえる<過学習>によって性能が低下するという問題があった。音声認識の分野ではマルコフモデルが優勢となり、ニューラルネットの研究は下火になっていた。このようにして2回目のAIブームは去った。
その間も下積みの研究を続けていたのが、ヒントン氏のグループだった。
2010年ころから3回目のAIブームになった。その主役は、大量データによる<深層ニューラルネット>の学習だ。
以下は筆者の体験だ。筆者は年に2回の音響学会に出席する折には必ずプログラムに目を通して、新しいテーマがあるかを確認している。それまで、いつも筆者の知らないような目新しいものはなかった。だが、2013年秋の音響学会の発表プログラムを見ているとき、見慣れない言葉に出会った。深層ニューラルネット(DNN)だ。4つの研究機関が発表していた。その前年、この分野でトップの論文誌にヒントン氏らの論文が出ていたのだ。おどろいてその追試をするような研究だった。
知人の研究者に聞くとDNNは原理的には1980年代のニューラルネットと変わりがないとのことだった。以前のものよりネットの深いところまで、学習が浸透する実用的工夫がされているだけだ。また、2回目のブームの時に比べて、使用できるデータが著しく多く、それを処理できるほどにコンピュータの速度が著しく向上したのが、成功の要因だった。ブームになってはいるが、理論的には目新しいことはない。このブームもいずれは去るだろうと思われた。
このころから、ニューラルネットを用いたAIの研究が大ブームになった。音声認識における成功のきっかけは、ヒントン氏の研究室の学生が音声認識システムの開発会社の<インターンシップ>で行った実験結果だったとのことだ。
最近は<ChatGPT>など生成AIの話題で持ちきりだ。このブームがノーベル賞のきっかけになっているとも言われている。生成AIにもニューラルネットが使われている。ChatGPTは人間以上の立派な文章を生成するので、これを利用して論文・レポートを書くことを禁止している大学もある。
AI研究の初期のころから、AIを評価するためにチューリングテストというものがあった。対話の相手が人間かAIか区別ができなくなったとき、人間と同等の知能として合格というものだ。ChatGPTは、人間と同等どころか、普通の人間より立派な文章を生成する。筆者の著書「音声言語処理入門」には、<ChatGPTとの会話「イリオモテヤマネコを発見した伯父さん」>と題したコラムを掲載してある。これを読むと、ChatGPTがいかに優れた文章を生成するかが分かるだろう。
しかし、学習用データがない場合は、ChatGPTは「うそ」の文章も生成するので、注意が必要だ。昔からコンピュータは、速くて正確であることが売りだ。だがChatGPTは不正確どころか、真赤なうそもつく。これは、自分がよく知っていることでChatGPTが知らないだろうと思われることを話題にして、確かめることができる。最近は、ChatGPT自身が「ChatGPT の回答は必ずしも正しいとは限りません。重要な情報は確認するようにしてください。」という注意書きを出している。
また、ChatGPTには解けない種類の問題もある。筆者が確かめた例は、インターネットに書かれている文章を組み合わせるだけでは正答にならないような論理的な問題だ。ChatGPTの生成する文章はすばらしく立て板に水だが、論理はパッチワーク(継ぎはぎ細工)なのだ。
真偽の判断ができない子供にChatGPTを使用させるのは危険だ。ChatGPTには年齢制限が付いている。「13歳以上である必要があり18歳未満のユーザーは保護者の同意が必要になります。」となっている。注意が必要だ。
現在のニューラルネットの計算原理は、1967年に東京大学の甘利俊一氏が証明していた。彼は、2019年、文化勲章を受章している。甘利氏もノーベル賞受賞者の一人にすべきだったと考えているこの分野の人は多いと思う。日本のノーベル賞推薦委員は、AI関連の研究がまさか物理学賞になるとは思わなかったので推薦しなかったのだろう。
ヒントン氏は一時下火になっていたニューラルネットの研究を再び燃えあがらせたので、大いにノーベル賞に値すると思う。ヒントン氏は、AIの研究を推進するためグーグル社に引き抜かれた。だが、現在はAIの行く末を憂慮して会社を辞めている。ヒントン氏がAIから一歩引いた後にノーベル賞を受賞するとは皮肉なものだ。
<_>で示した用語について、さらに深く調べたい方は以下の著書で。
高良富夫:「音声言語処理入門―図解・音声・動画でわかる」(研究社、2024年)