INTERVIEW / PROFESSOR 2014年10月4日

人工知能50年来の革命、ディープラーニングとは? 松尾豊准教授インタビュー1

最先端のITは、私たちの社会を、ビジネスを、そして未来をどのように変えていくのか?
今回のテーマは、いま最もホットな分野のひとつ、「人工知能(AI)」。Gunosy創業者も輩出した研究室を率いる、東京大学の松尾豊准教授に話を聞いた。

matuo yutaka.JPG

人工知能50年来の革命、ディープラーニングとは?

「いま、人工知能はかなり面白い時を迎えている」。そう語るのは、東京大学大学院工学系研究科・松尾豊准教授だ。Web工学・人工知能を専門に研究を続け、2012年より人工知能学会の編集委員長・理事も務めている。

そもそも、人工知能は実現することができるのか? これまで、完璧な人工知能を作ることは不可能であるとみなされてきた。ただこの考えは、端的に言って「間違いである」と、松尾教授は主張する。

「そもそも、人間の脳も電気信号と化学変化によって動いています。原理的に言って、コンピュータで再現できないわけがない」

では、なぜ今まで人工知能はできないと思われていたのか? それが、なぜ今はできると考えられるのか? すべての答えは、人工知能研究における、50年来のブレークスルー「ディープラーニング(深層学習)」にある。ディープラーニングがもたらしたイノベーションは、「人間を介さずに、機械だけで、人間の知覚メカニズムを模倣できる」点にある。

人工知能の分野では、現在、「第3次AI(Artificial Intelligence)ブームが訪れている」と松尾教授は話す。松尾教授の話をベースにして、簡単に人工知能研究の歴史を振り返ってみよう。

限界があった第1次・第2次AIブーム

第1次AIブームは、「人工知能」という言葉が誕生した1956年にまでさかのぼる。この初期の人工知能に与えられた役割は、「推論と探索」だ。例えば、迷路の解き方を調べる、プロに勝つ将棋プログラムを作る、こういった簡単な問題を対象として、人工知能の研究が進められた。

この段階では、解きたい問題を「正確に記述する」ことさえできれば、コンピュータに処理させることができた。何をすれば何が起きるのか、可能性をすべて記述できれば、あとは単なる計算問題として答えを出すことができた。裏を返せば、「正確に記述する」ことができなければ、問題を解くことができない。例えば、「自分が所属する企業は、これからどのような戦略を実行すればよいか」という問題は、問題自体を記述することができないので、解くことはかなわなかった。

こうして、1970年代に「冬の時代」を迎えた人工知能研究だが、1980年過ぎに第2次AIブームが訪れる。この時に人工知能に与えられた役割は、「知識を入れる」ことだった。そのきっかけとなったのは、ELIZA(イライザ)という対話システムだ。対話にあたってのルールを記述し、ある程度の対話を可能にするシステムだ。例えば、「頭が痛い」と言えば、「なぜ頭が痛いと言うのですか?」のように返答することができる。これを繰り返すと、人間の会話に極めて近くなる。つまり、ある程度のルール(知識)を決めておけば、人間に近い知能を生み出せると考えられたのだ。最近の例で言えば、Twitterのボットや、iOSのSiriも、この原理を引き継いでいる。

この延長で、人間の知識をすべて記述しようとして1984年に始まったのが、Cycプロジェクトだ。同プロジェクトは、「ビル・クリントンは、アメリカの第43代大統領だ」「人間は、哺乳類だ」といった知識を記述し、人間と同等の推論システムを構築することを目的とするプロジェクトだ。難点は、人間が知っていることが多すぎて、知識を書ききれないことだ。同プロジェクトは、30年経った今も、未だに終わる気配を見せていない。

人間の知識をすべて記述するよりも実現可能性が高い手法として、概念の関連性を体系立てるオントロジー研究が始まる。この研究は、近年のWebデータのマイニングや、IBMが2006年に開発したWatsonに応用されている。

1990年前半まで高まりを見せた第2次ブームは、「知識を入れればコンピュータは賢くなる」が、「人間の持つ知識すべてを書ききれない」という結論に至り、収束していく。単に時間がかかるというだけならまだしも、そもそも、「『人間の知識』なるものをすべて表現できるのか?」という壁にぶつかったのだ。

「表現の壁」を超えたディープラーニング

そしていよいよ、2000年代後半より現在の第3次AIブームに突入する。この時の人工知能の特徴は、「機械学習」、そして「表現学習」にある。機械学習とは、人間が自然に行っている学習能力と同様の機能を、コンピュータで実現しようとする技術のことを指す。

この機械学習の難しさは、変数の設計にある。適切な変数データを学習させることができれば、高い学習成果を得ることができる。しかしながら、この「変数の設計」という作業自体を人間が行う必要があるため、不適切な変数を設定してしまうと、予測精度が低くなってしまうのだ。

人工知能の歴史を振り返り、松尾教授は、「すべての問題は根本的に同じ」であると主張する。3回のブームでそれぞれ難点となった「問題を正確に書けない」、「知識を書ききれない」、「適切な変数を設定できない」という問題は、つまるところ「データから、適切な表現を書くことができない」という問題に帰結する。すなわち、人工知能を実現する上での壁は、適切な表現を獲得する壁であったというわけだ。

そこに登場したのが、ディープラーニングだ。この手法の特徴を一言で言えば、「データをもとに、『何を表現すべきか』という問い自体を、自動的にコンピュータに獲得させる」点にある。例えば、手描きの「3」という数字をコンピュータに入力する。従来の人工知能では、ここから「3」という「概念」を出力できるような工夫を重ねていた。これが、ディープラーニングでは、入力は同じで、そこから同じ「3」と描かれた画像を出力するという、一見すると意味のない計算を行わせる。しかし、何度も「3」という画像を入力することで、機械が「3」という数字の特徴を判別し、自動的に「3」という抽象化ができるようになる。これこそが、ディープラーニングの真骨頂だ。実際、画像を認識させるコンペティションでは、この手法を用いた研究が圧勝している。

「ディープラーニングの発想そのものは、昔から存在していました。しかし、今までは技術的に実装することができなかった。現在のコンピュータのスペックをもってして、ようやく実装できるようになったのです」

松尾教授は、そう指摘する。

ディープラーニングの先に広がる世界

とは言え、人工知能に実現に向けて、まだまだ多くのハードルが残されているのも事実だ。現状としては、画像、それに加えて音声やセンサーといった複数の感覚の抽象化が実験されている。将来的には、言語データが抽象化されることで、機械が言葉を理解できるようになる可能性が高い。この段階に来て、例えばNewsPicks上のニュースを機械に読み込ませることにより、機械がニュースの意味を理解できるようになる。ニュースの意味が理解できるようになれば、今何が起きているのか、これから何が起きるのか、高次の社会予測ができるようになると、松尾教授は語る。

要約すれば、「ディープラーニング自体がすごい」わけではなく、「ディープラーニングの先に広がる世界がすごい」のだ。

コンピュータが人間の知能を超える境目を、シンギュラリティ(技術的特異点)と呼ぶ。少なくない研究者が、2045年頃には、機械が人間の知能を超えると予測している。未来の人工知能の可能性について、松尾教授はこう結論づけた。
「シンギュラリティを超えないと言うのは、もはや難しいだろう」
SFで語られる未来予想図が、現実のものとなる日は近いのかもしれない。

(文責 荒川拓)

この記事は、NewsPicksとの共同企画です。

2015.8.10 タイトルを変更いたしました。

第二回はこちら→日本の人工知能が、Googleに勝つ唯一の方法

同じ記者の記事

関連記事

合わせて読みたい

NEWS 2015年11月06日

ボーイング社ビジネスコンテスト、東大のチームが優勝 業務の改善法提案

EVENT 2017年10月31日

「未来授業」開講 東大で描き出す、AIと歩む未来

INTERVIEW / PROFESSOR 2014年11月14日

「より人間らしく」進化を続けるロボット研究 稲葉雅幸教授インタビュー1

NEWS 2015年06月19日

接客行動を分析し「おもてなし」概念の数値化目指す

COLUMN 2017年11月24日

【東大2018③】東大教員の受験体験記 浪人は努力を学んだ、かけがえない1年

TOPに戻る