この講演は、匠のワザをめざす大学校の校長をしていたころに、学生向けに行われました。一般の方にも役に立つたいへん興味深い話が含まれていますので、最後までご覧ください。最後に、まとめの歌があります。講演時間は約30分です。
大学校長のタカラです。本日はプロフェッショナルの無意識と題してお話しします。この学校の教育成果の目指す先は、いわゆる「匠のワザ」であると考えられます。私自身は、大学生のころに経験した内容から、これは、「無意識」がなせるワザではないかと考えていました。そこで私は、これまでの人生の中から、本校の学生の参考になる内容を抽出して、「匠の技」につながる話を構成することにしました。
この準備をするうちに、ますますこの無意識のチカラについての考え方は正しいと確信するようになってきました。そこで今回、これを示そうと思います。講義の内容は以下のとおりです。「1.私のプロフェッショナル分野:音声認識・合成」では、デモを交え、私のキャリアパスを紹介します。「2.意識と無意識」では、私の最後の研究内容を紹介するとともに、日常的な無意識のチカラを体験させます。「3.大学生時代:手作りコンピュータATOM8」では、現在の私の基盤となった、自分自身をほめたい話を紹介します。「4.プロの無意識:無意識を動員した能力」では、人工知能研究の観点から、「プロの無意識」について考察します。
これは、音声認識のデモの様子です。このデモは、Webサイト「オト・話ことばの実験室」にありますので、それを見てください。私は、音声認識の研究で工学博士の学位を取得しました。大学における最後の時代は、赤ん坊のように言語を獲得するロボットを研究しました。なぜ人間は言葉を通して意思疎通ができるのかという根源的なことを、モデルを構成することによって考察しました。
これは、音声合成のデモの様子です。これも、Webサイト:「オト・話ことばの実験室」に置いてありますので、それを見てください。この音声合成システムは、汎用のものであり、音声を表すデータを与えることにより、さまざまな言語・方言のシステムに変えることができます。
私のキャリアパスである大学教授という職業を紹介します。大学の使命は教育と研究です。すなわち、人類の知識の限界までの教育を行います。それ以上は人類には知識がないので、自ら研究を行い、知識を開拓します。人類の知識の限界を打ち破ることが、プロの研究です。工学と技術には違いがあり、工学は科学です。私の言葉でいえば、「人工科学」です。この言葉の中に「工学」という文字が含まれています。工学部長のころに、以上の内容を詩にして、コンピュータで作曲しました。では、歌をお聞きください。
次は意識と無意識の話題です。
まず「意識」について考察します。「意識」とは、広辞苑によれば、「今していることが、自分で分かっている状態」です。また、近代西洋哲学の祖といわれるデカルトは、哲学の根本原理として「われ思う、ゆえに我あり」と言いました。意識は、自分が存在していることの証明でもあります。とすれば、無意識は、「今していることが、自分でわかっていない状態」です。脳の働きで、自分がわかっていないことが起こると、錯覚として感じられることがあります。錯覚の中には有用な錯覚もあります。
この図は、言語音声の生成と知覚における情報処理を表しています。日常生活では、話し手が言語を発して、聞き手が言語を受け取るように思いますが、実際には、伝わってくるのは物理的な音波にすぎません。図のような生理的、心理的、言語テキな情報処理が行われているので、言語としてとらえられます。この「心理」の部分は、私の独自のものです。これは無意識の処理を表します。このような処理の連鎖であるので、音声の物理的な性質と心理・言語テキな性質には、多少ずれがあります。そしてそれは無意識に起こります。
このようなずれを表す例として、音声「ひまわり」を取り上げ実験します。これは、私の著書「音とことばの実験室」の中で、専門家も認める面白い部分です。
それでは、動画を見てください。
この不思議な現象は、「わー」の前にある「まー」と、後ろにある「りー」にも、「わー」の一部が重なって残っているから起こるのです。単語などで一部重なった部分が生じるのは、調音結合と呼ばれています。聞き手がこの部分の情報を無意識に使っているのです。このような調音結合を処理する能力は、赤ん坊の時の言語獲得において、模倣による発音練習で習得されていると考えられます。
このような現象は、調音結合の逆処理(補正)としてとらえることができることを、最近明らかにしました。この図に示すように、逆処理の副作用として予測音が聞こえています。例えば音声「アウ」の場合、「ア」の部分だけを切り出して聞かせると、「ア」に続けて「ウ」も聞こえます。これは、行き先の音が予測されて聞こえているからといえます。切り出した音の最後の部分は物理的には、「オ」です。「himawari」の「w」は「オ」ですが、予測値として「ウー」(つまりw)が聞こえているのです。
次は、大学生時代に手作りしたコンピュータATOM-8の話です。
面接などでは、「自分で自分をほめたい話」を持っていると有利です。これは、私自身をほめたい話です。私は、大学3年生のころ、デジタルICでコンピュータを作りました。コンピュータの5個の基本機能部を持っている、プログラム可能なものでした。図のように、図面と記事が残っているので、作りたい人は作ったらどうでしょうか。
実は、そのころ私は留年していました。ありがたいことに、指導教員が研究室に来るよう誘ってくれました。2年生で研究室に入室を許可されたので、私は、留年どころか、飛び級と解釈することにしています。1か月で演算部はできましたが、偶数マイナス奇数だけ、答えが1だけ多かったのです。他は正確に動作していました。製作記事を書いた著者に会う機会があったので、2人で2時間ほど考えましたが、解決しませんでした。最終的には、接続を1か所変えることで解決しました。原因は、記事にしたときの設計図の誤植でした。著者も気づかなかったわけです。同様なことは、5回ほどありました。つまり、このコンピュータの5か所は、私が設計したと言ってもいいわけです。
東工大大学院の面接入試で、ディジタル回路が得意で、確実に動作する回路を設計製作できる自信があると言ったら、高名な試験官教授に、それは君の能力ではなく、コンニチのディジタルICの性能である、と返されました。試験は、合格でした。大学院に入学して、研究室の助手の先生がフロッピーディスク駆動回路を作製しましたが、うまく動作していませんでした。私が見て、回路を修正したらうまく動作しました。私は研究室の先生を越えたと、自分で自分をほめました。その後、放射能測定器のセンサ部分の製作のアルバイトをしました。これは製品になり、原子力発電所に納められました。
次はプロの無意識についての話です。
大学生のころ、研究室の実験装置を設計製作して、その内容を「パーソナル・コンピュータの使い方」として、一般雑誌「インターフェース」に投稿しました。ここでパーソナル・コンピュータとは、今で言えばプログラム可能の電卓です。それから10年ほどたって、世界最大の電気部品店街である秋葉原で、私の記事が付いた、同じ型の中古電卓が売られているのを見たときは、プロになったようで、うれしかったです。これからお話しするのは、実験装置を製作していたころに経験したことです。
ある日、ディジタル回路を接続・製作している途中に、突然手が動かなくなりました。よく見ると、接続誤りをしようとしていたのです。手が教えてくれたのです。誤りであるかどうかの判断を、手ができるはずはありません。当然、脳がやったのです。無意識がやったのです。ふつう、これは「慣れ」とも言います。例えば、キーボードで私は、Aがどこにあるか分かりません。しかし、手は正しくAを押します。この場合、手が覚えていると言います。このように、誤りを見つける知能テキな「判断」まで、無意識にできるというのは驚きです。
将棋や囲碁のプロは、なぜその手を打つのか説明はできないけれど、その手が絶対いいという「カン」、自信を持っているといわれます。これが、私のいう無意識のチカラです。将棋や囲碁の「手」は、無数といってよいほど存在します。特に勝負がかなり進んだ頃は、ほとんど常に、カツテ経験したことのない状況のはずです。過去の経験を思い出すだけでは、対応できません。このような時に、勘や自信という形で無意識のチカラが現れます。かつて経験したことのない事態は、人生において社会生活をする中でよく起こります。自分の意識的な能力を超えた領域が、プロフェッショナルの無意識です。
スポーツでは、飛んでいる球が打てます。変化球も打てます。この時、勘・イメージで打つといわれます。勘は、無意識を動員した総合的能力です。弓矢で的に当てようとするとき何かを考えること、すなわち意識は雑念になります。意識をなくし、身についた無意識のチカラを発揮せよということです。よく無心になれと言いますが、無心だと手も動かないはずです。これは「無意識のチカラに任せよ。」という意味です。練習のときと同様、目標点をイメージする。それ以外は、無意識に任せる。
無意識の仕組みは、工学テキには、脳のモデルといわれるニューラルネットでモデル化できます。ニューラルネットでは、訓練します。訓練の結果、各Xアイに似たベクトルが入力されると、それに対応するYアイに似たベクトルを出力できるようになります。総合的能力は、ベクトルで表現できます。Xアイを問題の状況と動作、Yアイを目標として、次々に与えれば、ついには目標にかなり似た動作を出力できるようになるのです。どうしてできるのかは説明できなくても、繰り返し学習により、できるようになるのは「技能」に似ています。英語を母国語とする人が普段オコナっているように、英語の文法は説明できなくても、それを使うことは無意識にできます。
スポーツ科学になぞらえて「技能科学」が提唱されています。その入門書「技能科学入門」によれば、技能は暗黙知です。暗黙知は、広辞苑によれば、「M.ポランニーの用語。顔の認知・自転車の運転のように、明確に言葉で表現することが困難な直観テキ・身体テキ・技能テキな知識をいう。科学的創造において重要とされる。」また岩波新書「術語集」によれば、「科学上の発見、芸術上の創造、名医の診断技術などの技芸的な能力は、みなこれに拠って」おり、「非言語的で啓示的な知覚でありパターン認識のようなもの」です。
「技能科学入門」の8ページに、ラスムッセンの「人間の制御に関する3つの階層」の図があります。この図には私が、「物理、生理、心理、言語」と書き加えました。この図と、音声言語の話し手と聞き手の図とを比べます。
この音声生成・知覚のモデルとよくカサなっています。これは偶然ではないでしょう。人間の知能を深く考えていくと、同様のモデルに至るのだと思います。また私は、もともと音声の「パタ-ン認識」の研究者です。従って、私はこれまで技能科学の研究者でもあったのです。
「ひまわり」という音声を例として、音声研究の視点から、日常の音声会話でも活用されている、役に立つ無意識の能力について説明しました。言葉が使える者は皆、プロフェッショナルの無意識を活用しているのです。私が学生時代に体験した回路接続における無意識の能力を紹介しました。ディジタル回路の分野で、私はプロフェッショナルの域に達していたのです。これを一般化して、プロの無意識について考察しました。プロが活用している無意識の能力について、人工知能研究の立場からニューラルネットでモデル化して説明しました。プロの無意識のチカラは、専門ごとに異なります。皆さんも、自分の専門性を高めて、これを無意識にまで鍛え上げ、無意識の能力を発揮できる、プロフェッショナルになってもらいたいと思います。
以上をまとめまして、歌を作りました。字幕を見ながら聞いてください。
以上です。ご清聴ありがとうございました。
