- PDF:PDF版をダウンロード
- DOI: https://doi.org/10.15108/stih.00253
- 公開日: 2021.06.25
- 著者: 鎌田 久美、佐藤 博俊
- 雑誌情報: STI Horizon, Vol.7, No.2
- 発行者: 文部科学省科学技術・学術政策研究所 (NISTEP)
ナイスステップな研究者から見た変化の新潮流
日本アイ・ビー・エム株式会社 東京基礎研究所
シニア・テクニカル・スタッフ・メンバー
恐神 貴行 氏インタビュー
生物の脳を再現した機械学習の新技術開発
-確率的な環境における意思決定技術に関する、
科学への貢献から産業応用まで-
総務課 係長 佐藤 博俊
「ナイスステップな研究者2020」に選定された恐神貴行氏は、生物の脳における神経回路網を再現した機械学習の新技術「動的ボルツマンマシン」を開発して世界的な注目を集めた。「動的ボルツマンマシン」は時系列データをリアルタイムに学習することで、変化する環境においても予測や異常検知を可能にする技術で、恐神氏は銀行と共同で本技術を活用した「市場予兆管理ツール」を開発するなど産業応用も進めている。また、心拍、血圧、体温などの時系列データに対し体調に悪い変化があったときに、異常を検知するといった応用にも期待されている。
これらの時系列データの学習技術を発展させることで、逐次的な意思決定の最適化に応用することができるが、恐神氏は特に、リスク考慮型逐次意思決定に関する人工知能技術の研究にも取り組まれている。本領域における恐神氏の研究成果は、特に迅速な判断を要する不確実な環境においても大きな損失を避けられる合理的な意思決定を、学習や探索によって導くための基礎的な枠組みを示すものであり、自動運転などの分野への応用が期待される。
今回はこれらの研究の概要を始め、研究者を目指す学生へのキャリアパスや人工知能関連の国際会議でプレゼンスを発揮するための方策などについて伺った。
シニア・テクニカル・スタッフ・メンバー
(恐神氏提供)
- リアルタイムの時系列学習を可能にする技術、「動的ボルツマンマシン」の研究内容とその可能性について教えてください。
「動的ボルツマンマシン」は、生物の脳における学習の仕組みを摸した人工ニューラルネットワーク(人間の脳の情報処理の働きをモデルにした人工知能のシステム)ですが、従来の人工ニューラルネットワークと比べて、生物における学習のある側面をより精密に模倣しています。この研究は1949年頃に提唱された「ヘブ則」注1に遡ります。「ヘブ則」は、脳内における2つの神経細胞が同時に発火するとき、それらの結合が強化されるという法則ですが、この法則に基づいて人工ニューラルネットワークに学習をさせる研究が1950年代から行われてきました。1980年代には「ボルツマンマシン」という人工ニューラルネットワークが提案され、学習という目的を達成するように数理的に導出されたその学習則がヘブ則の性質を帯びていることが解明されました。これによりヘブ則の理解が進み、深層学習の研究へとつながりました注2。 そして、2015年この「ボルツマンマシン」を進化させた「動的ボルツマンマシン」を開発しました。「動的ボルツマンマシン」注3の学習則を、学習という目的を達成するように数理的に導出すると、ヘブ則に時間的な要素を付加してより精緻化した「スパイク時間依存可塑性」注4の性質を帯びていることがわかります。この学習則により、時間の経過とともに刻一刻と変化する「時系列データ」をリアルタイムに学習し、予測や異常検知をすることが可能になるという工学的に優れた特徴も持っています。これまで、この「動的ボルツマンマシン」に、複数のパターンを同時に記憶させたり、音楽を学習させたりできることを実証してきましたが、さらに、金融市場における将来予測や、工場や各種機器における異常検知など、産業への応用を目指しています(図表1)。
産業応用については、いろいろな企業と協力していますが、金融では「市場予兆管理ツール」に動的ボルツマンマシンを応用する研究開発を行いました。具体的には、過去20年間の市況データ等を用いた複数の予測モデルを活用し、現在と類似度の高い過去日付(類似日)を抽出の上、それぞれの類似日のその後の価格推移を用いて、将来の価格推移や変化(ボラティリティ)を予測する新たな予兆管理ツールを開発しました。
https://www.nistep.go.jp/wp/wp-content/uploads/nicestep2020_press.pdf (恐神氏提供資料)
- 御自身の研究への思いをお聞かせください。
人が苦手な意思決定を助けたいという思いで研究に取り組んでいます。
私たちはいつも様々な意思決定をしていますが、全ての情報を処理できなかったり、認知バイアスがあったりして、余り合理的な意思決定はできていません。人がより良く意思決定できるように、AIが助けられることは多いと思います。具体的には、人は①大量の情報を考慮するのが苦手、②無数の候補の中にある少数の良い解を探し出すのが苦手、③過去の経験が十分にない不確実な状況で直感を働かせるのが苦手、④「相手」を考慮するのが苦手だったりします。適切な数理モデルに基づいて最適化することで、このような人の意思決定を助けることができます。
最近注力しているのは、他の意思決定者がいる環境すなわちマルチエージェントの環境で、学習によって良い意思決定方策を見つけるための研究です。ここでは、相手に合わせて協調するように行動したり、相手に負けないように行動したりすることが必要になります。これまでにも取り組んできた意思決定最適化技術や人の行動モデルの学習技術などを発展・融合していくことを目指しています。
- 人工知能に関する最難関の国際会議「第32回Conference on Neural Information Processing Systems 2018(NeurIPS 2018)」で行われたAIゲームコンペティションに御参加されたときについて、お聞かせください。
意思決定最適化技術の研究の一環として、2018年12月8日にカナダ・モントリオールで開催された人工知能の国際会議「第32回Conference on Neural Information Processing Systems 2018(NeurIPS 2018)」で行われたPommerman(ポンマーマン)コンペティションに参加し、1位と3位に入賞しました。Pommermanコンペティションでは、2つのエージェントで構成されたチームが11×11の碁盤目状のボード上で別のチームと対戦します(図表2参照)。各チームの目標は対戦相手を全滅させることです。Pommermanは、日本発のゲームであるボンバーマンを模したAI研究用のオープンソースのゲームで、2017年12月に開発が始まりました。私たちはその前から、株式会社コナミデジタルエンタテインメント様とボンバーマン・シリーズの最新作であるスーパーボンバーマンRを用いた共同研究の話を進めていたこともあり、Pommermanコンペティションに参加することにしました。
Pommermanの難しさは、味方と協力して敵を倒す必要があること、相手を倒すという目標に向けた長期の戦略を考える必要があること、爆風から逃げるなど短期的な戦術が必要であること、観測できない情報があること、そして0.1秒以内という制約でリアルタイムに意思決定を下さなければならないことにあります。制限時間がなければ、囲碁などで成功を収めたモンテカルロ木探索などの技術も有効になるのですが、限られた時間で、様々な可能性を考慮して良い行動を探すのは極めて困難です。
そこで私たちは少数の悲観的シナリオ(図表3参照)を体系的に生成して、その中で最適な行動を選ぶ手法を考えました。シナリオをごく簡単に説明すると、AをしたときBが発生する、というような行動の連鎖で、悲観的シナリオとは結果として自分が負けてしまうような不利な行動が次々出てくるような連鎖です。多数の短いシナリオをランダムに生成するのではなく、少数でも十分に長い悲観的なシナリオを生成することで、かなり先に発生する可能性のある重大なイベントをも考慮することができるようになりました。
ゲームは、実世界の何らかの側面を持っていたり、スコアや勝敗など評価指標がはっきりしていたり、AI研究にとって望ましい性質を備えています。従来のAI技術には難しいPommermanで高い性能を出した「悲観的シナリオに基づく実時間での木探索技術」はAI技術を発展させるもので、自動運転など高い安全性が要求される状況での、リアルタイムの逐次的意思決定に有効だと期待しています。
- コロナ禍において情報科学技術が果たす役割や将来の可能性についてのお考えを教えてください。
コロナ禍においてリモートワークが進んで、オンライン会議やイベントの仕組みが高度化されました。また、個人的には、この1年間でオフィスに出勤したのは2回だけで、リモートワークによって通勤時間(3時間30分)が大幅に減りました。オンライン会議は余り不自由を感じることはなく、突っ込んだ議論もできています。また、学会もオンライン開催の評判が良く、私自身も自宅から気軽に参加できることに大きなメリットを感じています。
ただしこれは、コロナ禍で全員がオンラインでの参加であるために、声が聞きやすいことが大きいと思います。コロナ前も自宅から会議室の会議に参加することがあったのですが、そのときは不自由を感じることが多かったです。
コロナ後は、ハイブリット会議(会議に参加するメンバーのうち、一部は会議室に集まり、一部は自宅や営業所等からオンラインで参加する場合)が多くなるのではないかと思いますが、今後は、ハイブリット会議でも不自由がなくなるような技術が進歩することを願っています。
- データオープン化、国立研究開発法人科学技術振興機構(JST)戦略的創造研究推進事業(CREST)の研究について紹介ください。
企業が取り組んだ実社会における課題に関わるデータの公開は難しいことが多いです。また、EU一般データ保護規則(GDPR:General Data Protection Regulation)や利用条件など様々な観点から厳しく審査され、公開されているデータを利用することも簡単ではありません。
一方で、公的資金等の事業・研究における成果の公共化には積極的に取り組んでおり、例えば、科学技術振興機構(JST)戦略的創造研究推進事業(CREST)で行った、研究領域「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」研究課題「複雑データからのディープナレッジの発見と価値化」においては、積極的に論文発表を行うとともに、オープンソースを公開しました。また、国際会議でチュートリアルを実施するなどして、成果を広く使っていただくことを目指しました。
- 入社後に外国の大学へ留学されたきっかけやエピソードをお聞かせください。
学生時代から留学に関心があり、就職してからも留学できる企業を探していました。幸いなことに理解のある企業に就職でき、米国のカーネギーメロン大学の博士課程に留学しました。
留学前は、無数の候補の中にある少数の良い解をいかに早く見つけるかが意思決定における難しい問題だと考えていて、そのような意思決定を助けるための量子計算などの技術に興味を持っていました。留学していろいろな人の研究の話を聞く中で、過去の経験が十分にない不確実な状況における意思決定の難しさを知り、特に自分の直観が全くうまく働かないことに衝撃を受けました。それが今の研究につながっています。
留学先では、チューリング賞注5を受賞した研究者も身近にいましたが、そのような研究者がどのように物事を考えているのか、肌で感じることができたことはとても刺激となりました。また、今活躍している当時の同級生も多いのですが、そのような同級生と自分との差がどこにあってどれくらいなのかも何となく知ることができたのもとても良い経験です。
- 企業の研究所に所属する立場から修士・博士課程の研究者を目指す学生のキャリアパスや支援への思いをお聞かせください。
私の学生時代には、留学の情報が少なかったため、どのようにすればよいのか全く分かりませんでした。留学に関する情報に学生が触れる機会を多くしていけるとよいと思います。留学から帰国した際には、留学経験をいろいろな大学で話す機会を作りました。自分の経験はもう古くなり、話をする機会がなくなりましたが、これから留学される方、留学を終えたばかりの方が積極的に情報発信しているのをSNSで見かけます。そのような情報をきっかけにして、選択肢の幅が広がるとよいですね。
企業の研究者としては、アカデミアで研究をしていくことと企業で研究することの違いについて、就活イベントなどでお話しするようにしています。採用につながらなくても、キャリアを考える上での参考になったという感想を聞けるととてもうれしいです。
- 人工知能関連の国際会議では日本からの投稿・発表が少ないと聞きます。日本が国際会議でのプレゼンスを向上させるための方策などについてお聞かせください。
論文投稿数が少ない要因の一つに、論文の書き方の訓練が不足していることが考えられます。指導教官が熱心だったり、優秀な学生であれば自分で身に着けたりすることも少なくないと思いますが、カーネギーメロン大学のコンピューターサイエンス学科では系統的な教育が行われていました。学位論文、単位取得、ティーチングアシスタントのほかに、論文執筆と研究発表に関する審査を通過することが学位取得の要件になっていました。これらについて徹底的に鍛えられたのは研究者として役立っていますが、ほかの道に進んだ人もきっと役立っていると思います。
本日はお忙しい中ありがとうございました。ますますの御活躍をお祈りしております。
(2021年3月9日オンラインインタビュー)
左:恐神 貴行氏。右:NISTEP佐藤、鎌田(科学技術・学術政策研究所 (NISTEP)撮影)
注1 ヘッブ則(ヘブ則)
ヘッブ則は心理学者のドナルド・ヘブ(Donald Hebb)が1949年に提唱した、脳のシナプス可塑性に関する法則。神経細胞(ニューロン)Aの発火と連動して神経細胞Bが発火するという動作が繰り返されると、それらA、B神経細胞間の接合部であるシナプスの伝達効率が増強されるが、長期間発火が起こらなければその伝達効率は減退する、という説。
繰り返し行う動作は強化され、行わない動作は減退することから、上記の動作を数理的にモデル化した人工ニューロン(形式ニューロン)では、入力の強化=重みの数値を大きくする、入力の減退=重みの数値を小さくする、と定義している。
注2 深層学習の発明者と称されることも多いヒントン氏も元々ボルツマンマシンに関する研究者で、深層学習が注目を集めた契機も制限付きボルツマンマシンを用いたDeep Belief Networkという論文だった。
注3 動的ボルツマンマシン(DyBM)
IBM東京基礎研究所が2015年に発表した時系列データを扱うことができる人工ニューラルネットワークで、神経細胞の学習の仕組みを数理的にモデル化したもの。
注4 スパイク時間依存可塑性(STDP)
ヘブ則における神経細胞間の結合強度の変化量が、2神経細胞の発火する時間差に依存するという現象である。
注5 チューリング賞
《ACM A.M.Turing Award》米国コンピューター学会(ACM)が毎年授与する、計算機科学分野で顕著な業績を上げた人物をたたえる賞。1966年に創設。コンピューターの理論的原型を考案した英国の数学者A=M=チューリングの名を冠し、計算機科学分野のノーベル賞ともいわれる。ACMチューリング賞。