渥美 雅保 教授

人工知能(AI):深層学習に基づく知能情報処理研究が創り出す未来の情報処理基盤

日進月歩の人工知能(AI)革命

今年は、画像生成、文章・対話生成、プログラムコード生成など、生成系の人工知能(Artificial Intelligence(AI))が大きく進歩し、これから、まさに、人の働き方、さらには生活にまで大きな変革をもたらそうとしています。最近の人工知能の進歩はこれらにとどまらず、様々な手法が立て続けに登場しています。私の研究室では、本学に工学部情報システム工学科が誕生した1991年から「人工知能」の研究をしています。ここ数年、「AI」、「人工知能」という言葉をよく耳にしますよね。そう、現在は2010年代に始まった人工知能の飛躍的進歩が巷で第3次ブームと呼ばれて続いているのです。第3次ブームというからには第1次ブーム、第2次ブームの時期があったわけですが、第1次ブームは人工知能という用語が誕生した1956年頃から、第2次ブームは1980年代に起こりました。私が人工知能の研究を始めたのは、第2次ブームにあたる1980年代です。今では人工知能という言葉は誰でも知っていますが、私が高校生の頃はほとんど耳にすることはなく、人工知能という分野について知ったのは大学に入ってからでした。

第2次ブームの人工知能の主要な研究課題は、専門知識を持った「エキスパートシステム」と呼ばれるコンピュータプログラムを作成する方法を探求することでした。私たちが最初に作ったエキスパートシステムは、都市計画の助言をするルールベース型のエキスパートシステムです。ルールベースというのは「もし~ならば~である」といったルール形式の知識を、問題解決のための推論ができるように集めたものです。つまり、あくまで人が書いたルールを元に推論を行うわけです。エキスパートシステムを構築する際には、「知識獲得ボトルネック」と呼ばれる問題に直面します。専門的な知識をコンピュータによる問題解決で扱えるルール体系として記述していくのが難しいのです。機械学習の研究は当時も行われていましたが、実用できる範囲は限られていました。私たちも都市計画の知識をルールベース化することに苦労しました。そのため、知識情報処理に関する研究がひと段落した後で、視覚知能、言語知能を実現する機械学習の研究を始めました。

人工知能の研究を加速させた
「深層学習(ディープラーニング)」とは

現在、私たちの研究室では人工知能の研究として「深層学習に基づく知能情報処理」の研究をしています。まず、「深層学習(ディープラーニング)」について、簡単に説明しましょう。

深層学習とは、人間の脳の仕組みを模した人工ニューラルネットワークによる機械学習手法です。コンピュータに大量のデータを与えることで、自動的かつ高精度な学習を行います。2012年、ILSVRC(ImageNet Large Scale Visual Recognition Challenge)という画像認識の競技会で、AlexNetという深層学習に基づく畳み込みニューラルネットワークがそれまでの機械学習手法を大きく上回る精度で優勝しました。これが一つの契機になって深層学習の研究が非常に活発になり、いろいろな種類の深層学習手法が日進月歩で研究されています。そして、画像認識、音声認識・合成、自然言語処理をはじめ、さまざまな情報処理の分野で用いられるようになってきています。

映像、言語、医療……
幅広い分野への応用を研究

続いて、私の研究室で学生と行っている研究をいくつか紹介します。まず、画像認識における深層学習の研究を紹介します。異なる時に異なる場所でカメラに映った人が、同じ人かどうか見分けることを「人物再同定」といいます。私たちは移動ロボットに搭載したカメラに映る人の顔や姿から人物再同定を行う研究をしています。さらに、誰であるかを認識するだけでなく、その人が何をしているのかを認識する研究も行っています。また、ロボットがカメラに映る周りの景色から自分がどこにいるのかを認識する研究も行っています。このような研究により、移動ロボットが巡回しながらいつどこで何をしている誰と出会ったかといったことがわかるようになるのです。
深層学習による画像認識の研究をもう1つ紹介します。画像認識の技術が重要な役割を果たしている分野に、自動車の先進運転支援や自動運転があります。自動車が周りの道路・交通状況の認識から自ら運転を支援したり代わりに運転をしたりする技術です。私たちは車載カメラの映像から交通状況の危険性を推定する研究をしています。まず映像から車・バイク・歩行者といった動くものを検出し、次にそれらの動きの特徴から危険度を推定するのですが、これら物体検出・動き特徴解析・危険推定に深層学習手法を用いています。

次に、自然言語処理における深層学習の研究を紹介します。自然言語処理といってもピンとこないかもしれませんが、機械翻訳、文書要約、対話、質問応答、感情分析などが自然言語処理の応用分野になります。例えば文書要約においては、元の文書に含まれる文をそのまま用いるだけでは要約として機能しません。複数の文を1つにまとめたり、わかりやすく言い換えたり、指定された長さで要約することが重要です。私たちの研究室ではニュース記事などを対象に、このような要求を満たす要約を生成するための深層学習手法を研究しています。

ここでお話しした研究の他にも、深層学習に基づくマルチモーダルコミュニケーション、感情認識、スポーツ映像解析の研究、医療への応用として、糖鎖タンパクと薬剤の相互関連を予測する深層学習モデルの研究、画像処理や言語処理の基盤となる深層学習モデルの学習手法の研究、ニューラルネットワークを自動的に設計する手法の研究など、様々な研究を行っています。興味を持っていただいた方とは何らかの機会にお話しできればと思います。

人と共生する情報システムの構築に
向けた人工知能(AI)研究のこれから

深層学習に基づく人工知能技術により、コンピュータによる情報処理は人間のレベルに近づきました。もはや人間の能力を凌ぐレベルに達しているものもあります。しかし、それらは基本的に与えられた1つの問題を解くことしかできません。このような人工知能を「特化型人工知能」といいます。

我々人間は、いろいろな問題を自発的に解くことができます。今後の人工知能研究の1つの方向は、このような多様な問題をより自律的に解くことができる「汎用型人工知能」の研究に進んでいくと考えられます。また、人工知能が適切に問題を解決しているように見えても、実際には、まだ課題が残されています。例えば、対話や要約等の自然言語処理タスクにおいて、文の意味を理解して処理をしているかというと必ずしもそうではありません。今後の人工知能研究のもう1つの方向として、より深い意味の理解の研究にも進んでいくと考えられます。

まだまだ発展途上で研究課題はたくさんありますが、人工知能の技術は、これからの情報システムにとって不可欠の技術です。また、今後はあらゆる分野の仕事をしていくうえで必要な情報リテラシーになっていくでしょう。皆さんも、ぜひ人工知能の勉強をしてみてはいかがでしょうか。

未来を予測するのではなく、
創り出す発想を学ぼう

パーソナル・コンピュータの父と呼ばれる科学者のアラン・ケイは「未来を予測する最良の方法は、それを自分で発明することだ」という言葉を残しました。エンジニアリングとは、現在実現されていないことを新しく創り出そうという試みです。新しい技術を創り出す実験の場に身を置く楽しさ。それこそが理工学系の学部・学科で学ぶ楽しさだと思います。

その点で言えば、本学部は幅広いカリキュラムを取り揃えており、ゼミや研究室では多種多様な分野を研究対象にしています。つまり、あらゆる分野の「最先端」に身を置くことができる環境だと言えるのではないでしょうか。例えば情報システム工学科では数学系の授業も充実しており、数学の教員を目指すことだって可能です。人工知能からネットワーク技術、センサー技術、ロボットまで、あなたが学んでみたいと思う分野がきっと見つかるはずですよ。

研究を漢字一文字で表すと?

「究」

研究者としてありきたりかと思いますが、研究の「究」、「きわめる」でしょうか。人工知能の研究者として、知能を実現する仕組みを構成論的、計算論的、システム論的に「究める」ことが目標です。

<経歴>
1981年 東京工業大学工学部社会工学科 卒業
1983年 東京工業大学大学院総合理工学研究科システム科学専攻 修了
1987年 東京工業大学大学院総合理工学研究科システム科学専攻 単位取得満期退学
1996年 東京工業大学博士(工学)
  • 理工学部|創価大学 受験生サイト
  • キャンパスガイド2023理工学部
  • 理工学部公式Facebook