全脳アーキテクチャ解明ロードマップ

「人間のような知能の実現」という大きな目標に大勢で取り組むには、途中の達成度が判断できるようなわかりやすいロードマップが必要です。全脳アーキテクチャを拠り所としたアプローチは、構成要素となる脳の器官がはっきりしているため、純粋に思弁的に知能を目指すアプローチと比べて、ロードマップが作りやすいという利点があります。脳の主要な器官のモデルが不完全ながら出そろっているので、次は各器官がどう連携するかを解明していくことになります。

取り急ぎ、たたき台として以下ようなロードマップを考えてみました。私が考える優先度順に並べてみましたが、ある程度は同時並行で取り組める課題だと思います。

教師なし学習・認識（大脳皮質モデル）
階層型強化学習（皮質・大脳基底核連携モデル）
思考・ナビゲーション（皮質・大脳基底核・海馬連携モデル）
言語理解・発話（言語野モデル）
滑らかな運動（皮質・小脳連携モデル）
情動（扁桃体モデル）
人間のような知能（全脳アーキテクチャモデル）

それぞれの項目について、工学的目標と神経科学的目標があるのですが、まずは工学的目標について以下に説明します。

教師なし学習・認識（大脳皮質モデル）

大脳皮質は知能をつかさどる重要な器官です。認識、意思決定、運動制御、思考、推論、言語理解など脳のさまざまな高次機能が、おそらく単一の大脳皮質の動作原理の上で実現されています。全脳アーキテクチャの他のすべてのモジュールが、大脳皮質モデルに依存しているため、これを安定動作させることは最も優先度の高い課題です。

私が開発中の BESOM と呼ぶ大脳皮質モデルは、簡単なパターン認識程度は動くようになってきました。しかし、認識に用いる loopy BP (belief propagation) の振動がときどき問題になります。 loopy BP がどのようなときに振動しやすいかについては、過去にある程度は研究されているようなので、それが対策のヒントになると思います。また、大脳皮質内にはまだ役割のわかっていない回路があります。大脳皮質と視床の間にも、興味深い回路があります。これらが、実は loopy BP の振動を抑える工夫のヒントを与えてくれるかもしれません。

BESOM はＳＯＭとベイジアンネットを組み合わせて deep learning と同じ構造を持たせた機械学習アルゴリズムです。他の deep learning アルゴリズムとは違う、ベイジアンネットならではの視覚機能の動作のデモを行うことが重要な到達目標です。

もっとも重要だと考えているのが、脳の視覚野が持っていると思われる バインディングの機能の実現です。具体的には以下のような機能です。まず物体の画像を where （物体の位置）と what （物体の形などの属性）という２つの情報に分離して表現するネットワークを構築します。また、ネットワークには短期記憶の機能を持たせておきます。このネットワークに色のついた２つの物体を見せ、色を消してから物体を動かして追跡させたあと、それぞれの色が何だったかをネットワークに答えさせます。もしこの課題が実現できれば、このネットワークは、複数の物体の位置と属性を異なる場所で記憶しつつ、物体の位置と属性の対応関係も保持する機能を持つことになります。

このような機能が実現できれば、視覚野の上に保持される短期記憶をワーキングメモリ、 where の情報をアドレスレジスタ、 what の情報をデータレジスタのように使うことで、コンピュータに似た動作を大脳皮質モデルが行えるのではないかと私は考えています。この機能は単なる神経科学的な現象の再現にとどまらず、思考や言語理解のメカニズムの基礎になる重要な機能であると思われます。

階層型強化学習（皮質・大脳基底核連携モデル）

階層型強化学習は、強化学習における deep learning と言ってよいと思います。層を深くすれば、状態行動対の表現効率が指数関数的によくなります。

脳は、解剖学的特徴から考えて、少なくとも M1 → SMA/PM → DLPFC → ACC という４階層程度の階層構造をしているのではないかと私は考えています。上の層ほど抽象度の高い情報を表現するなどの性質が、 deep learning と一致しています。

運動野周辺の各領野の役割は同一ではなく、むしろ非常に個性的です。おそらく、局所解・過適合が起きないように、各領野に事前知識が作り込まれているのでしょう。神経科学的知見からヒントを得た事前知識を各階層に作り込むことが、階層型強化学習を成功させるためにはおそらく不可欠だと思います。

BESOM を用いた強化学習の実現に向けた第一歩として、隠れノードが１つだけのもっとも簡単なケースでは、なんとか動作を確認しています。

Yuuji Ichisugi, A Computational Model of Motor Areas Based on Bayesian Networks and Most Probable Explanations, In Proc. of The International Conference on Artificial Neural Networks (ICANN 2012), Part I, LNCS 7552, pp.726--733, 2012.
[ paper ]

今後はこのモデルを拡張していく必要があります。最初の到達目標は、まずは複数の隠れノードを持つ２層構造の BESOM を用いた「ポピュレーション強化学習」の実現です。ここでポピュレーションとは、多数のニューロンによる分散表現を意味しています。ポピュレーション強化学習では、分散表現のまま状態認識し、分散表現のまま意思決定し、分散表現のまま行動価値が更新されます。並列処理が容易であり、大規模化可能な強化学習アルゴリズムになると期待できます。

その次に、これを多層構造に拡張します。 PM（前運動野）が学習した到達運動や把持運動のような「運動の汎用部品」の組み合わせ方を、 DLPFC（背外側前頭前野）が学習する、という動作を実現することが階層型強化学習の最初の到達目標となります。 DLPFC の学習は思考のメカニズムの実現に不可欠な重要なステップです。

BESOM を使った運動野のモデルは、おそらく小脳損傷患者の「滑らかでない運動」を再現するでしょう。また、複数のアクチュエータの協調動作の学習には性能的な困難があるでしょう。これらの問題の解決には、皮質・小脳連携モデルを実現する必要があります。

思考・ナビゲーション（皮質・大脳基底核・海馬連携モデル）

思考はいわば脳内シミュレーションであり、生物が実際に行動を起こす前に、行動の結果がどうなるかをあらかじめ検討するために存在する機能ではないでしょうか。

この機能の実現には、教師なしで外界のシミュレータを獲得する機構と、「思考モードと行動モードの切り替えの機構」の設計が必要になります。また、階層型強化学習が動作していることも必要になります。

参考：研究構想説明資料：「脳における思考の役割とその実現機構についての考察」

ネズミのように、迷路を覚えてエサを効率的に見つけられるような機能（ナビゲーション）を再現することが、思考の機構のわかりやすい到達目標です。動物らしく「この道に行ったら行き止まりになるはずだ」などと考えながら迷路を移動するには、過去の行動のエピソードを記憶する海馬の機構と、脳内シミュレーションの機能が関わっていると思われます。

海馬と皮質がどう連携するかについては、最近検討を始めたばかりなので、私にはよく分からないことが多いです。皮質はある程度意図的に海馬に対して情報を読み書きできるように思うのですが、その機構がよくわかりません。それだけでなく、意図したタイミングで自動的に想起するように、海馬に書き込むことも可能なようです。たとえば「仕事の帰りに牛乳を買おう」と（おそらく）海馬に書き込めば、どういうわけか仕事の帰り道に「牛乳を買わなければ」と思い出すわけです。このような海馬の複雑な振る舞いを実現する機構を明らかにするためには、まず海馬が生物（動物、幼児、大人）にとってどういう役割を果たすべき器官なのかという要求分析を十分に行うことが重要だと私は考えています。

ここまでの機能が実現されれば、かなり動物らしい動きをするロボットが実現可能になるでしょう。例えば盲導犬のような仕事を低コストで代替できるようになるかもしれません。また、道具の使用を学習する能力があれば、工場内で簡単な作業を行うことができるかもしれません。

言語理解・発話（言語野モデル）

言語野の機能の再現の第一歩は、簡単な文の意味を視覚イメージに変換したり、逆に視覚イメージを文に変換したりする機能を、大脳皮質モデルだけを用いて実現することです。例えば「黒い猫が白い魚を食べた」というような文の入力を、正しい係り受け構造のまま視覚野等の発火パターンに翻訳することが、最初の到達目標になります。

参考：研究構想説明資料：「BESOMを使った言語野モデルの構想」

単なる視覚的イメージに対応付けられない、より抽象度の高い文の扱いは、その次のステップになります。そのような文の「意味」も、おそらく大脳皮質の発火パターンと海馬のエピソード記憶パターンとして表現されるものと思われます。しかし現時点では、どのような表現になるのかよくわかりません。その解明に先立ち、皮質・大脳基底核・海馬連携モデルがある程度形になっている必要があるでしょう。

逆に、言語の意味に関する考察が皮質・大脳基底核・海馬連携モデルの解明に役立つ可能性もあります。特に幼児における言語の発達過程は、脳の構造に関するよいヒントを与えてくれるかもしれません。

滑らかな運動（皮質・小脳連携モデル）

運動を滑らかにすることを示すことが、皮質・小脳連携モデルの到達目標です。なお、小脳はヒトの知能に不可欠な器官ではないものの、運動だけでなく、高次機能にも関係しているらしいことがわかっています。

情動（扁桃体モデル）

ロボットが赤ん坊のような状態から自律的に知識を獲得していくためには、ロボットに好奇心を持たせる必要があります。好奇心はたくさんの作り込みの情動の機構によって実現されているのかもしれません。幼児の発達過程をよく知ることが、好奇心の機構の解明のよいヒントになるでしょう。

人間のような知能（全脳アーキテクチャモデル）

以上の到達目標をすべてクリアし、すべてを１つのシステムとして統合すれば、人間のような知能が実現できることになります。

実際にはここに書いたロードマップはたたき台にすぎません。解決すべき重要な課題は、おそらくまだあるでしょう。 今後、重要な課題をもらさず把握し、優先度付けして解決方法を探っていく必要があります。 そのためには、様々な分野の専門家の方々と意見交換していく必要があると思います。

コメント、質問などお待ちしております。

一杉裕志のページ