> 産業技術総合研究所 > 一杉裕志 > 脳のアルゴリズムに関する取り急ぎメモ > . 2012-11-02 更新)

脳とBSS(ブラインド信号源分離)



脳が網膜に映った画像だけから外界にある「実在」そのものを
鮮やかに認識できる秘密、
それはおそらくBSS(blind source separation, ブラインド信号源分離)です。

BSSとは、センサーの観測データから、その原因となる「信号源」を
推定するという、手品のような技術です。
手品にはタネがあります。「事前知識」というタネです。
タネが必要にはなるものの、
BSSは、うまくいけば驚くほどの効果を発揮します。

大脳皮質の各領野は巧妙な方法でBSSを行っているようです。
大脳皮質がBSSを行う方法を深く知ることは、
既存の情報処理技術の限界を打ち破る強力なヒントになります。


◆一見、解けそうにないBSS
BSSという問題は手品のタネがないと解けません。

BSSがなぜ一見解けそうもない問題に見えるのかを、
もっとも簡単な線形の例で説明します。

時刻 t において信号源 x1(t) と x2(t) の値が下記のように
線形和で混合されて、
センサーの観測値 y1(t), y2(t) になるとします。

	y1(t) = a11 x1(t) + a12 x2(t)
	y2(t) = a21 x1(t) + a22 x2(t)

aij (i,j=1,2) は時刻 t に依存しない定数です。

この場合においてBSSとは、
時刻 t = 1,...,T における
2T 個の観測値 (x1(1), x2(1), x1(2), x2(2),... , x1(T), x2(T) ) が
与えられた時に、4 個の値 a11, a12, a21, a22 と
2T 個の信号源の値 (y1(1), y2(1), y1(2), y2(2),... , y1(T), y2(T) )
を推定せよ、という問題です。

一見、連立方程式を解けばよいように思えます。
しかし、未知の変数の数が 2T + 4 個、
方程式の数は 2T 個なので解けません。(式が4個足りません。)

そこで、信号源や混合行列に何らかの仮定(事前知識、バイアス)を置くことで、
未知の変数の値を「推定」するわけです。
その「何らかの仮定」が手品のタネということになります。

真の信号源や混合行列の性質が、その仮定を満たさない場合は、
BSSは失敗します。
つまり、推定された信号源や混合行列は真の値と程遠いものになってしまいます。
「信号源はこういう性質のものであるに違いない」というバイアスが正しければ
よい推定ができますが、間違ったバイアスを持っているとかえって悪い結果になるわけです。


◆BSSと知能
人間の知能の高さの秘密を解く重要なカギが、BSSであると私は思っています。

パターン認識を例にとりましょう。
「認識の対象」とは信号源に他なりません。
信号源として「認識の対象」となる物体があるからこそ、
そこから光の反射や音波などを通じて様々な情報が感覚器に送られてきます。
感覚器から得られた観測データのみから、
その観測データの原因となる信号源を推定する問題は、まさにBSSです。
BSSが成功すれば、視点の移動や照明条件などの様々な変動に対して強い
認識が行えます。

パターン認識に限らず、BSSは既存の多くの情報処理技術と
深く関係しそうです。

強化学習でいうPOMDPでの隠れ状態の推定はBSS。

人工知能でいう帰納推論はBSS。

ベイジアンネットの構造学習はBSS。

自然言語の文法獲得もBSS。

手の動かし方と「手を動かそう」という意思の関係の獲得もBSS。

「高い知能」の実現を阻んできた問題の多くが、
BSSに帰着できます!

別にBSSが知能の秘密をとく万能薬だと主張するわけでありません。
「多くの問題がBSSに帰着される」と認識することで、
はじめて問題解決のスタートラインに着けるのだ、という主張です。



◆森羅万象に対する事前知識
脳は汎用性の高い機械学習器で、未知の環境に放り込まれても
外界の性質を教師なしでうまく学習するように見えます。

未知の環境に対する事前知識が持てるはずがないのに、
どうしてそのようなことが可能なのでしょうか?

現実には、脳はどんな奇想天外な世界にも対応可能なようにはできておらず、
比較的「常識的な世界」にしか対応できないのだろうと思います。
そして、その「常識的な世界」とは何かという事前知識が進化により獲得され、
脳に作り込まれているのでしょう。

最新の神経科学的知見は、脳に作り込まれている事前知識が何かを
知るための、膨大なヒントを与えてくれます。


◆BSSとICAの関係
BSSとICA(Independent component analysis, 独立成分分析)は、
厳密にはそれぞれ違う問題です。

BSSは観測データから信号源を推定する問題、
ICAは観測データを独立な成分に分解する問題です。

信号源どうしは独立であると仮定できることが多いので、
BSSを解く手段の1つとしてICAがよく使われます。

脳の学習の目的はBSSなのかICAなのかというと、
領野によって、両方のこともあれば、どちらかのこともあるのではないかと
私は最近考えています。

例えば低次視覚野が学習するガボールフィルタは、
実世界に対応する「信号源」があるわけではありません。
単にICAによって高次視覚野のための特徴抽出をしていると
解釈した方が素直なように思います。

一方、高次領野では、信号源の推定こそがより深い知識の獲得のために重要で、
信号源どうしは必ずしも独立である必要はないように思います。

詳しいことは今後の研究の進展で明らかになってくるでしょう。


◆BSSとベイジアンネット
大脳皮質はBSS(ICA)を解いて、その結果をベイジアンネットで表現する、
というのが私の主張する大脳皮質のモデルです。

BSSを解く数々の手法を1つの「大脳皮質の学習アルゴリズム」として
統合するのが、私が今している仕事です。


◆脳がBSSを行っている証拠
脳がBSS(ICA)をしている証拠はいろいろあります。
下記テクニカルレポートの第6章をご覧ください。

一杉裕志、「脳の情報処理原理の解明状況」
産業技術総合研究所テクニカルレポート AIST07-J00012, Mar 2008.
[ AIST07-J00012.pdf ] 


◆BSSとフッサールの現象学
BSSは、フッサールの現象学の用語とうまく対応が付くように思います。

	ヒュレー(現出、地平、射影):知覚素材 = 観測データ
	ノエマ(現出者、基体):構成された対象 = 推定された信号源
	ノエシス:知覚を志向的に統一する働き = 
		BSSを解く教師なし学習アルゴリズムと認識アルゴリズム

というかんじでしょうか?
下記解説を読むかぎり、そんなかんじです。(他の解説ではまた違いますが。)

参考:フッサールの現象学#3 ノエマとノエシス - 知識の積み木 - 楽天ブログ(Blog)

機械学習技術どころかコンピュータも存在しない時代に、フッサールは思索だけで
よくこんな考えに到達できたものだと感心してしまいます。

先人も「脳がBSSしている」に近い考えに到達していた(?)というのは
私にとっては心強い限りです。


◆物理的実在のない信号源
脳がBSSをしているならば、いろいろ面白いことが起きます。

BSSが「物理的な実在のない信号源」を獲得してしまい、
そこに物理的な実体と同じほどの存在感を感じることが起こり得ます。

分かりやすい例は、テレビゲームの中の敵のキャラクターです。
ディスプレイに映っているものは光の点の集合にすぎません。
しかし、その光の変化の仕方がある法則にしたがっているので、
プレイヤはその変化の根本原因となる何かの実在を感じます。
キャラクターは、画面上にではなくプログラム中の変数として実在しているのでは、
と思う人がいるかもしれませんが、変数もまた、
メモリ上の1と0の集合、つまり物理的にはコンデンサーの中の電荷にすぎません。
にも関わらず、比較的簡単な法則に従って動くキャラクターは、
プレイヤにとって、限りなく実在そのものになるのです。

この「物理的に存在しないのに存在感を感じる」という現象は、
古くからある数々の哲学的問題への解決の糸口になるかもしれません。
人間は意識、自由意志、心、感情、善悪などに対し、
物理的実在がないのに関わらず強く実在を感じます。
生命もまた、実際にはとても複雑な化学反応の集合体であるにも関わらず、
もっと単純明快な「いのち」という実在を感じます。

例えば「悪」とはなんでしょう。
幼児にとって「悪いこと」が何かを考えてみましょう。
	怒られるようなこと。罰を受けるようなこと。
	何かが壊れること。他人がいやがること。
	自分がけがをすること。不健康につながること。
	まわりの人から笑顔が消えるようなこと。
「よいこと」は、
	ほめられること。
	健康になること。よろこばれること。
	まわりの人が笑顔になるようなこと。
行動の結果自分におこる様々なフィードバックを繰返し学習しBSSすれば、
あらゆる行動の独立成分として
「善悪」という座標軸が脳の中に獲得されるのではないでしょうか。


コメント、質問などお待ちしております。
一杉裕志のページ