2009年3月25日水曜日

神経科学における検証に再構成を使う.

 
(※kazuhi-sさんからのコメント,その返答コメントもあわせて読んでもらえたら嬉しいです.)

学部,修士と工学部にいたときは,実験が多少精密でなくとも実験から得た知識を土台に適当に飛躍してうまい技術応用ができちゃえばOKという感覚がありました.技術は目的とする精度が実現できればOKでした.

神経科学に足を踏み入れて以来,科学ってのは精密な行為なんだなとことあるごとに痛感しています.自然を理解しようということに「目的とする精度」なんてものはなくて,真のモデル※に限りなく近づこうととする試みだからです.

僕なんかが実験をすると,訓練が足りないので生理学者や心理物理学者のような精密な実験にならないことがあったり...そもそも僕が興味をもつ高次の脳情報処理を考えると精密な実験になりにくかったり...

とはいえ,精密な実験ができなければ,生理学者や心理物理学者に負けた感じなので,良い実験はしたい.でも普通に実験して解析したのでは,あちらの(生理学者や心理物理学者)の土俵で勝負する
ことになって,敗北の第一歩.こちらの土俵にひきづりこむのが勝負の定石というもの.

高次の脳情報処理も対象していながら精密な実験系ができないかなと思っていました.います.

 ##

突然ですが,
脳活動から脳内で表現されている情報が再構成できれば,少なくとも再構成できた程度には脳内にその情報が存在していることを示せます.再構成といっているのは,Miyawaki, Uchida, et al.,2008.でやっている事です.一般のデコーディング研究,BMI研究でやられているようにクラス識別するだけ
ではなく,再構成する.再構成って強力な方法論だと思います.

相関する脳活動の領域を特定しただけより,ずっと強い主張ができます.電気生理実験で神経活動を詳細に分析するよりも強い主張ができる場合もあると思います.

ところで,素朴に「良い符号化モデルを利用して,良い再構成ができる」と考えます.なので脳の符号化(encode)もしくは情報表現(represenation)を考えます.再構成するためには,それは必然的に数理的な表現になります.つねづね,モデルはできるだけ数理的表現であるべきだと思っているので,再構成を試みれば自然とその要請に答えることになります※2.

さらに脳内の情報表現を再構成したら,どれだけ良く再構成しているか評価することも必要です.ここで,再構成した画像を見せた画像と比較して誤差を考えても意味はない.なぜなら再構成したのは,脳内の情報表現だからです.仮にぼやっとしか再構成できなかったとしても,脳内でもぼやっとしか表現していなければ良い再構成です.逆に2次元の画像を見せているのに,高次の領野によっては事前知識とかを使って,3次元情報が符号化されているかもしれない.その場合は3次元情報が再構成できなければ,ダメな再構成です(再構成はむずかしいので,当分の間は「見せた画像により近い再構成画像が良い再構成」ということですむと思いますが).

では,脳内の符号化の再構成をどのように評価するか,というか,どの様な基準で最適化するかといえば,ヒトの行動が最もよく説明できるように最適化する必要があります.この様に書くと,当たり前の,これまでも生理学実験,心理物理実験で行われてきたことです.ところが,再構成して終わりと考えてしまいがちな気がします(少なくともBMIを目的にしている人達はそうなるでしょう).なので,仮に再構成には必要なくとも識別課題など運動・行動が必要な課題を被験者に課して,脳内の情報表現を再構成した情報から始めて,その識別行動をこれまた再構成して,実際の行動と比較する必要がある.これは,つまり,脳内の復号化の数理モデルを考えて,運動もしくは行動を再構成するということです.

 ##

脳の符号化モデルを考えて再構成,さらに脳の復号化モデルを考えて行動と一致するかで再構成(符号化モデル)を評価をする.ここまでやれば,生理学や心理物理学で行われている実験の精密さを保ちながら,高次視覚情報処理で扱うような数理的に高度な問題を扱えそうな気がします.

神経科学において再構成することがの検証の水準になったら,再構成するのには多変量解析なども必要だし,こちらの土俵にひきずりこんでの勝負になるなぁ※3,


と酔ったアタマで考えてみました.

今日は以前にいた研究室の追いコンがあり,
今日の午後,進捗報告も兼ねてしゃべりに研究室に伺ったので,
そのまま追いコンにも参加.
あいかわらず活気のある研究室でした.

※1
僕は真のモデルが存在すると信じているわけですけどね.

※2
自然言語で正確に表現できないとは思はないですけど,やはり計算処理を表現するのに最適化された表現は数理的表現です.あと,(たぶん,前にも同じ事を書いたけど)僕みたいに自然言語で説明したり説明されたりして,理解したつもりになってしまう人間にはちゃんと定式化するという作業は自分をだまさないのにいい方法だと思います.そんなことを考えると,数学が得意じゃない人ほど数理的に表現してみるということをしないと正確に理解できないじゃないのかしらんと思ったり,思わなかったり.

※3
統計学習とか多変量解析を自分の土俵とするべく,もっと勉強しないと.
 

2 件のコメント:

匿名 さんのコメント...

大事な議論だと思います。
ただ、再構成ができるという段階から、脳の情報表現についてのよいモデルを得るという段階に行くには、原理的にいくつか壁があるのではないかと理解しています。
  #以下はほとんど神谷さんからの受け売り。鹿内くんの文章について理解が間違っていたら指摘してください

まず、感覚刺激を再構成するというのは、脳活動から感覚刺激への復号化モデルを作るということです。
単なるt検定ではなく、訓練データとテストデータを分ける(Cross validation)ことで、復号化モデルの汎化性を保証しながら、脳活動パターンに刺激についての情報が含まれているかどうかを検証できるのですよね。

一方脳の情報表現とは、感覚刺激が与えられたときにどのような脳活動が生じるかを記述する、符号化モデルです。
われわれが最終的に知りたいのはこちらですが、感覚刺激が再構成できるからといって、脳の情報表現についての正確な知識が得られるとは限りません。
符号化モデルと復号化モデルは異なることがあります。
Keyらの仕事は、(1)どんな刺激ならどんな脳活動を得られるか(符号化モデル)をあらかじめ作っておく、(2)新しく得られた脳活動がどの脳活動にもっとも近いか計算して、それを判別の結果とする、という手順を踏んでいます。
一方ご存知のとおり、宮脇さんと内田くんの仕事は、復号化モデルです。

最近のミーティングなどを通して僕なりに得た理解を元にして考えると、脳の情報表現についての知識を得るということは、よい符号化モデルを作るということに対応します。
よい符号化モデルというのは、感覚刺激から脳活動を予測できるモデルということです。
脳活動をよく予測するモデルができれば、それを使ってよい再構成(復号化)ができる可能性がありますから、脳活動と感覚刺激の両方をちゃんと予測できる符号化、復号化モデルを両方作るというのが、脳の情報表現に迫るよい方法なのかなと思っています。
  #最後の段落に関しては、僕もまだ理解が不十分だと思うので、間違いや不明瞭なところがあったらごめんなさい

mnbStag さんのコメント...

Kazushi-sさん,酔っぱらいの戯言につきあってくれてありがとう.

ほんとは,Kamitani & Tong, 2005, Kay, et al., 2008, Miyawaki, Uchida, et al.,2008の3つを紹介して,それぞれの研究を僕がどう考えているか述べてから,今回の話題に入りたかったのですけど,はしおりました.改めて言うと,僕が念頭に置いているのは,上の3つの研究.

それで,今回の話に出てくるモデルは以下3つ.
1.感覚刺激を脳の情報表現へと変換する
  脳の「符号化モデル」,Encoding model
2.脳の情報表現から運動などへと変換する
  脳の「復号化モデル」,Decoding model
3.実験者が脳の情報表現を取り出す
  「再構成モデル」,Reconstruction model

で,一般にデコーディング研究と呼ばれるのは,実験者が脳の情報表現を「解読」しようとするから,そう呼ばれるのだと思います.クラス識別(Kamitani & Tong, 2005以来ほとんどの研究でこれがされている),特定(Kay, et al.2008がやっていること),再構成のいずれもデコーディングと呼ばれていますけど,再構成が重要で,ここでの話題.

> 一方ご存知のとおり、宮脇さんと内田くんの仕事は、復号化モデルです。

これは3の再構成モデルを考えたと言うことですよね.
今回の話では,脳の復号化モデルもでてきて,ややこしいのでここでは再構成モデルと呼びますね.たしかに,そう説明するが正しいと思います.とくにKayらとの研究の比較においては,そのように強調するのが正しいと思います.ただ,再構成モデルは符号化モデルの逆問題を解いているということなので,最初に考えるべきは符号化モデルなのだと思います.Miyawaki, Uchida, et al.,2008でも明に暗に符号化モデルが仮定されているのはわかります※1.

> 脳活動をよく予測するモデルができれば、...
そうです.(上で書いたことはKazushi-Sさんが言ったことの繰り返しです.)符号化モデルにせよ,復号化モデルにせよ,生成モデルをちゃんと考えるという出発点は,計算論的神経科学が「強調」していた出発点とおなじかなと(基本的に科学はみんなそうだと思うのだけど).

 ##

> #最後の段落に関しては、...
実験者が観測できるのは,「脳活動」と運動・行動・意志決定などの「ヒトの出力」の2つです.「脳活動」の情報表現を調べようとしているので,脳活動をその精度評価には使えない.なので「ヒトの出力」を使いましょうということです.そのために,脳の復号化モデルが必要です.

ただ,Miyawaki, Uchida, et al.,2008のように画像認識だと純粋な復号化モデルにならないので,ちょっと注意が必要です.

運動視標をみて,眼球運動(サッカード)するという実験課題を被験者に貸した場合は,「位置」という情報が脳の神経活動の空間に符号化されて,眼球を動かす筋肉活動の空間に符号化される,というふうに「位置」情報が文字通り符号化,復号化される.この場合は,「再構成した運動視標の位置」と「眼球運動の位置」の差をとればいいと思います(被験者がちゃんと視標を見ているという仮定はもちろん入っています)※2.

で,画像認識の課題では,再構成には必要ないけど,たとえば被験者に「n」を見せたときに,アルファベット26文字のどれであるかという識別課題を行わせて,「再構成した画像」と「その識別行動」と差を取る(こんな単純な課題だとあまんまりうまくいかないでしょうけど).この場合,最初に述べた3つめの「復号化モデル」は,識別モデルを考える.純粋に復号化モデルではないと言ったのはこういう事です...というような感じでしょうか.これ以上は...w.

ロボット業界とかで構成論的方法と叫ぶのが一時期はやったけど,こちらの方が真に構成論的方法w


※1
ところで,再構成モデルにベイズなどを使ってしまうと,符号化モデルへと解釈するのが難しくなってしまうので,再構成モデルでつかうアルゴリズムは選択する必要があるのかとも思っています.

とはいえ,繰り返しですが,再構成モデルが何であれ再構成できた結果程度の情報は脳に存在しているという,実験過程ではなく結果によって仮説が保証されるというのがこの方法論の利点な気がします.普通の実験だと,仮説通りの結果が出てきても,見たくない要因が入っていないか,実験のデバッグ作業をしなくちゃいけない.ここ強調したいところです.

※2
余談ですけど,脳の領野のどこを再構成するかによっては運動視標の位置だったり,眼球運動の位置だったりするわけですよね.その領野を切り分けるのにも,再構成が使えたりしないかな.