Lingua Franca: モデル

Looking for cognition in the structure within the noise.
Johnson A, Fenton AA, Kentros C, Redish AD.
Trends Cogn Sci. 2009 Jan 7.

上の論文で，神経活動に関する研究が，符号化研究，復号化研究，生成モデル研究に分けらて，生成モデルを考えることが重要だとか．この方たちが言っている，符号化研究，復号化研究，生成モデル研究ってのをたたき台に自分が考えていることを整理．今回はこの論文の要約というわけではないので悪しからず．

まず実験では，感覚刺激，被験者・被験動物の行動，神経活動の3つが観測できる．

符号化研究では，感覚刺激もしくは行動と神経活動が，時間的に相関しているかを見ている．ウェスリー・C. サモンという人が，「統計的関連性を調べ，因果的説明を加えるという手続きをとること」が科学的説明だと言ったらしい．この言説の何が新しいかと言いうと，あたりまえに聞こえるけれど，因果的説明，つまり原因をつきとめることが科学だといったわけ．この手続きでいくと，符号化研究は統計的関連性を調べていることになる※2．相関を調べる研究はたくさん研究されているし，確かに相関がなければその先に研究のしようがないような気はする．大半のfMRI研究もこの類でしょう．

　##

復号化研究では，神経活動から感覚刺激もしくは行動が復号化する．復号化できたとすれば，その神経活動に少なくとも復号化できただけの情報量が存在することを示している（情報が存在することの十分条件になる）．これは，符号化研究よりは情報が存在していることを強く言える．

復号化研究で課題となる技術を考えると，まず1つ目が，復号器（デコーダー）の作成．
電気生理学の分野だと神経細胞に刺激を与えて，例えば電気刺激をして活性化させたり，逆に冷却して鈍らせたりする．動物なので，直接神経細胞に刺激を与えることが出来て，ある領野の神経細胞を電気刺激したら，動物の眼球が実際に動いたりということが検証できる．つまり，脳に備わっているデコーダーをそのままに利用できるのでデコーダーを作成する必要がないのだけど，人の場合はそうもいかない．技術的，倫理的に問題があるから，ある領野に電気刺激をして見えた画像を報告してもらうわけにはいかない（TMSという方法はあるが，簡単のためその話しはどこかへ置いておく）．なので，人で復号化研究をするならば，デコーダーを作成して，計測した神経活動から感覚刺激を再現しなくちゃいけない．めんどくさい．ただ，どんなイビツなデコーダーだとしても復号化さえできれば復号化できた程度には情報表現がそこにあることになるから，強力な武器だ．

で，仮にデコーダーがうまく作成できたとして，脳の情報表現の話しなので，情報表現がどんなモデルになっているか考えなくちゃいけない※3．視覚の表象がJPEG方式かどうかを研究するのは，JPEGモデルがなけりゃできない．ちなみにモデルを考えるときのヒントの1つは計算論．どんな最適性が必要で脳が計算しているか考える．画像を思い出すことに最適性をおけば
PCA（Principal Component Analysis，主成分分析）で，画像を区別することに最適性を置けばLDA（linear discriminant analysis，線形判別分析）だとか（←あくまで例え）そんなことを考える．もう1つは，脳というハードウェアの制約．つまりその表現をニューラルネットワークで表現できるかとか考える．ニューロンの発火特性などもヒントになるかもしれない．

　そして，脳の情報表現モデルの仮説がたって，それを実験的に検証しようとする．例えば画像は形や色などなど高次元の情報を持つことになる．仮に脳の情報表現を知っていたとしても，それを検証実験するためには多変量解析が必要になる．動画なんてなったら，多変量に時間発展まで入ってくる．質点の動きだったら，位置，速さ，方向なんていう程度の次元ですんでいたが，大抵の情報は高次元だ．画像の情報表現が高次元であると同時に，とうぜん脳も集合的符号化（Population code）されているだろうから，高次元と高次元の情報の変換を考えなくちゃいけない．

（実際，デコーダー作成，情報表現のモデル作成，実験検証が順にできるわけでなく，各工程をいったりきたり試行錯誤するわけですけど．）

　復号化するのは結構ハードルが高いと思うのだけど，復号化技術を使えば，統制のとれていない刺激をつかって，例えば散歩しながら脳活動を計れたとして，ある領野から散歩しているときに見える画像がデコードできればその領野では見ている画像が表現されていると言っていい．統制がとれていない刺激でも実験はできるのかなと思う※4．

　##

生成モデル．．．
Johonsonらは，符号化研究，復号化研究だけでなく，さらにある神経活動（情報）がどのように生成されるか，生成モデルを用いて予測すること（当然，「モデル」がなきゃ予測できない）が有用だと言ってます．ここで有用と言っているのは，この人達は，ニューロンに含まれるノイズをどのように扱うかという文脈で言っていて，一見するとノイズのように見えけど刺激を反映している信号は生成モデルを用いると区別できるでしょ，ということ言っています．この文脈でなくても，対象としている神経活動を活動を理解するためには低次からの入力や高次からのフィードバックなどなど回路（Network）を考える必要があるし，領野毎に独立に機能しているわけじゃないのは自明なのだから回路のモデルは必要．回路を考えなければ，環境との双方向的な機能は考えられないし．

もちろん，回路を調べることが難しいのはわかる．眼球運動の研究で閉回路系の実験は，フィードバックの実験統制をとるのが難しかったりするので，厳密性に欠けるとして嫌がる人もいるみたいですし．なので，やはり反射系など開回路系の方が研究しやすいといえば研究しやすい．開回路だと回路とはいっても回っていない回路．僕はその点はいい加減でも進める質なので，閉回路にしてある程度の実験統制で研究して，分かったことをもとに実験統制を強めていくということでもいいと思っています．徐々に囲みを小さくして精密さを高めていくというか，らせん階段状に発展していくというか，そんな感じでも良いと．

脱線しましたが，Johonsonらは生成モデルを使って，予測することで科学的検証を試みようということのようですが，予測は科学的検証になるのですかね※5？演繹で話しを進めていくことが科学ゲームのルールだと思っいます※6．サッカーで手を使っちゃいけないくらい根本的なルールかなと，例外はキーパーくらいで．なので，「このモデルだ」って言いたければ適当に対立するモデルを持ってきて仮説検定をする以外には示しようがない．本当はモデルは無限に考えられて，無限個のモデルと比較するのは無理だから，考えられる範囲のモデルと比較して進んでいくしかないと思っているのですが，どうなんでしょう．

以前，思いつき的にデータ同化が良いんじゃないか！？と書いたことがあったのですが，今では，あの時直感したほど有用ではないなぁという気がしています．データを逐次更新して，モデルパラメータをフィッティングしていくだけかなと．ただ，短期と長期のトレンドがあるようなダイナミクスを持つモデルの場合，データ同化で逐次更新していき，後から実験では観測できないパラメータの時系列を観察したら新しいことが分かるかもしれない，というような使い方はできるかと思っています．

どうまとめていいか分からなくなってきたのですが，冒頭の論文の生成モデルのくだりはアタリマエのことなんじゃないかと思う，という結論．アタリマエでも，やっている人は多くはないと思いますけどね．それと，神経科学において，全脳計測実験技術（fMRIとか多細胞計測とか）と情報学的素養（多変量解析とか確率的な制御回路理論とか）は使えるので，使います，と自分の研究方針を確認して，おわり．

あ，あと，前にも書いたけど，やはり脳という対象は方法論とかいろいろ考えなくちゃいけないから，おもしろいと思う．

※1．
何が科学的説明かってのは難しい．
カール・ヘンペル（Carl Gustav Hempel）らは演繹的法則的モデル（DNモデル，被服法則モデル）という科学的説明のモデルを提案したのだけど，2つの事象は無関係なのに論理的に正しければ科学的説明となったり，明らかにおかしい点がいくつかある．

※2
ホントは，相関しか調べてない，という事を強調したい．

※3
神経活動の生成モデルは，言ってみればネットワークのモデルが必要だと言っているのだと思うのだけれど，モデルはネットワークのモデルだけでなくて，情報表現自体のモデルだって必要だ．モデルは到るところの水準で必要で，これまでの研究だって，モデルと言えないほど簡単な情報表現のモデルだから，自然言語ですまされきただけだと思っている．
　例えば，質点の動きだけなら，古典物理で扱われている位置，速さ，方向（速さと方向を合わせたら速度）という表現が，世界を表現するに（たぶん）最適な表現になっていて，脳でもそういう表現があるかといわれたら，位置，速度が発火率で表現されていることが知られている．脳も古典物理で使われる表現で表象されていそうってことがわかる．方向に相関のある神経活動なんかもたくさん調べられてきた．位置，速さ，方向も動きの情報表現のモデル．アタリマエで単純なだけでモデルは必要だったわけ．一方で画像の表現についてはいくつも考えられるし，数理的に単純じゃないので理論家が必要になったり，モデルが意識される．
　視覚認知に比べると，地味なのだけれど眼球運動研究では神経回路モデルが古くから考えられていたし，実験検証できる範囲でモデルの検証はされてきている．ここで生成モデルとことさらいうことのほどなのだろうか．

※4
ただ，刺激に関係する領野がどこであるかまでを同時に探すのは結構大変な気がする．散歩しているときには様々な刺激が同時に入力されるわけで，刺激同士にも相関があって，複数の領野が同期的に活動しているのだろうから，根本的に分離できないことが大半だと思う．情報表現モデルの検証をするのに，デコーダー作成，領野探索が同時に入ってきては，まぁ，不可能かなぁ．ある程度，特定の領野に特定の情報が存在することがわかっているときだけなら．

※5
予測モデル（予測に最適なモデル）は生成モデル（真のモデル）に一致しないのですが．．．

※6
「仮説Hが正しいならばPである．実験結果はPであるからHである．」
これは間違った演繹であり，帰納が含まれているので，このような形で検証できない．
「仮説HならばPである．PではないのでHではない．」
こちらが正しい演繹．仮説検定．
cf．
「仮説検定型」(hypothesis-driven)研究の是非：Yes/Noが言えれば全ては丸く収まるのか
@ 大脳洋航海記

cf．
「ノイズ」の中の脳機能 @ The Swingy Brain
ビジョン，デビッド･マー著
科学哲学の冒険，戸田山和久著
　

Lingua Franca

2009年2月2日月曜日

モデル

0 件のコメント: