今回紹介する論文のような,新しい方法をとりいれると研究が進展していくのだと思います.ひとくちに科学と言っても,分野によっていろいろな科学のあり方があって良いと思うのですが,採用する方法がその分野の科学を特徴づけるのは間違いないです ※1.
ということで,この科学の住人なので,自分の考え整理してみる.
Shibata et al. 2011.
Perceptual Learning Incepted by Decoded fMRI Neurofeedback Without Stimulus Presentation.
Scienc 334 (6061):1413–1415.
この研究の主な論点は下記の2つです.
1.fMRI ニューロフィードバック による因果性
2.傾きの知覚学習は,V1/V2が関与している
まず1つ目の因果性について
自然現象の因果性にせまろうとする場合,対象に介入する必要があります.脳の研究ならば,まさしく脳の活動に介入する必要があります.例えば,動物実験などで神経細胞に電気刺激をして脳活動を起こすような方法です.
少し脱線しますが,脳で難しいのはいたるところで結合があることです。一部の領野を刺激したつもりでも方法によっては、他の領野も刺激されていたり,情報が伝達されている場合があります。例えば,O'Doherty, et.al., 2011. Active tactile exploration using a brain-machine-brain interface. Nature. では猿の感覚野を刺激して、触覚に基づいたらしき課題を行わせてます.ただ,刺激した感覚野から他の領野へ刺激が伝わっているかもしれないので,本当に猿が触覚に基づいて判断しているかはわかりません.
今回紹介する論文に戻ります.研究のプロトコルは順に
- Pre-test stage:被験者の知覚判別能力を行動指標によって計測する.
- Decoder construction stage:脳活動データを計測し,Decoder(翻訳機)の学習を行い,視覚刺激を見ている時の脳活動パターンを特定する.
- Induction stage:視覚刺激提示によるニューロフィードバックを行い,被験者にV1/V2の脳活動を制御させる.
- 提示する視覚刺激は1,2で用いたのとは異なり,さらに提示した刺激では知覚学習は進まない
- 被験者は,後頭葉の脳活動をもとにしたフィードバックがある事は知っているが,後頭葉が視覚に関わる領野だったり,最初に行った知覚判別にかかわる領野である知識は持っていない ※2
- フィードバックは,2で特定した脳活動パターンに類似性が高ければ大きな円が表示され,被験者は円が大きくなるようにする.脳活動結果のグラフで指標とされている Likelihood(尤度) はこの類似性です(尤度を類似性と言いかえた深い意味はなし.尤度という言葉は情報科学の人以外にはなじみがないと思って.ちなみに,尤度が何を算出したモノなのか詳しくはわかりません).
- Post-test stage:ニューロフィードバック実験終了後に,再度1と同じ実験課題を用いて,知覚判別能力を計測する.
- 1の時の比較して,知覚判別能力が向上していた.つまり知覚学習があった.
対象とする知覚学習に関係しない視覚刺激提示でニューロフィードバック(Decoding neuro feedback)を行って脳活動を操作した結果,知覚(厳密には知覚にもとづく行動)に変化(学習)があることを示しました.この事より,視覚刺激の入力がなくても,脳活動を変化によって知覚を変化させることができる,という結論を得られました.
簡単に「によって」と書きましたが,今回の方法は電気刺激をするように脳活動自体に直接介入したのと同じと考えられるので,「得られた結論は,相関するというだけでなく,因果性がある」と言及できる方法です.さきほどのをもっと明示的に書くと,「脳活動の変化が原因で知覚学習は生じた」と言えるわけです.
ヒトのfMRI研究で,もしくは健常者で脳の情報処理について因果性に言及しようとすると,不可能と言いたいくらいに難しいので,画期的な事です.fMRIを使わなければTMS という方法を使ったり,健常者でなければ脳損傷患者に協力してもらうなどの方法で,因果性について言及するという研究が考えられます.
この結論について,ここまでのところでは,
(神経科学では当然ですが)学習は脳のどこかで行われている
という仮定があってはじめて,脳活動の変化によって知覚学習は生じた,と結論できます.上の議論は仮定があって成り立つ事ですから,やはり,その仮定である「知覚学習が行われている脳の領野」を示さないといけない※3 ※4.
この論文は単に方法の提案をしたいわけではありません.論文でも, ”The main purpose of our study was to test whether early visual cortical areas are sufficiently plastic to cause VPL of a specific orientation as a result of mere repetitive inductions of activity patterns corresponding to that orientation. ” と書かれています.そこで次の論点です.
2つめの論点,知覚学習に関与している領域について
1つめの論点で書いた検証だけでは,脳のどこが学習に関与しているかは自明ではありません.簡単に考えると,V1/V2の脳活動をフィードバックして被験者に制御させているのだから,学習自体もV1/V2だろうと結論したくなりますが,それは自明ではありません.
なぜなら,ニューロフィードバックで使った脳活動はV1/V2ですが,V1/V2は他の領野とつながっていて,V1/V2の脳活動は他の領野の活動を引き起こしていると考えられるからです.そして,V1/V2で表現された視覚刺激の情報を他の領野が受け取って,他の領野の脳活動変化によって学習が行われているかもしれないからです.また,Fig. 2 で脳の活動変化の指標となる尤度が学習日数におうじて上昇していますが,他の領野の学習による脳活動変化がV1/V2へ影響しているだけかもしれません ※5.
この研究ではV1/V2の活動変化によって学習が生じた事を検証するために,まず,
V1/V2の脳活動変化と知覚(にもとづく行動変化)に相関があること(Fig. 3E)
を示しています.サンプル1つは被験者1人を表しています(たぶん).
少し脱線しますが,サンプル1つが被験者1人を表す相関図は,fMRI研究でよく使われます.例えば,「領野Aと領野Bのの結合性を示すために使われたりもします.最近気づかせてもらったのですが,被験者1人を1つのサンプルとする相関図だと「領野Aの活動が大きい人は,領野Bでも高い」ということまでしか言えません.もっと単純にいうと,「脳活動が平均的に大きい人や小さい人がいる」というだけです.ほとんど情報はありません.この相関図を出すならば,サンプルは試行にして作るべきです.そうすれば,「領野Aの活動が大きい時には領野B も大きい,Aが小さい時にはBも小さい」と言えて,領野Aと領野Bの活動は同期していそうですし,結合性があると言えるでしょう.行動と脳活動の相関図,感覚刺激と脳活動の相関図でも同様です.
今回の研究の場合,1人の被験者で学習した時としなかった時など複数のサンプルをとることはできないので悩ましいところですが,同じ批判はあると思います.
V1/V2の活動変化によって学習が生じた事の検証として,他に Supplementary のFig. S9 があります.説明を論文の順序と逆にしますが,
Fig. S9 B
まず,fMRI decoder construction 時の脳活動データを用いた場合は,他の領野でもV1/V2と同様の判別率を得られた.このことから,他の領野も,傾きの情報表現は持っていることがわかります(「情報表現を持っている」かについては後述の議論を読んでください).
Fig. S9 A
次に,試行毎に尤度(「ニューロフィードバック時(Induction stage) の V1/V2 脳活動パターン」と「翻訳機学習したV1/V2の脳活動パターン」との類似度,ニューロフィードバックに使っている値) を他の領域の脳活動から予測しました.「コントロールとして」V1/V2の脳活動からの予測もしています.
その結果.尤度は,他の領域の脳活動と比較して,V1/V2でよく予測できています.V1/V2が学習に関わっているという十分条件が示しています.論文には ”the V1/V2 itself as a control” と書かれていますが,どちらかというと他の領域と比較して,V1/V2ではよく予測できたと言うべきところなのでしょう.これが逆になっているのは,「他の領域が学習に関わっていない」と言いたい事の表れかな(ちゃんとフォローできていませんが,著者らによる先行研究から考えると).もちろん,仮説検定で「帰無仮説である」ことを検証できないのと同じ論理で,「他の領域が学習に関わっていない」ことは検証できません ※5.
翻訳機が選択したボクセルは情報を表現しているか?
fMRIの脳活動のデコーディング(翻訳)を用いて,科学的な知見を得たいという試みはたくさんされています.
今回の研究でも,述べられている結論を言うためには,選択されたボクセルが傾きを表現している,ことが必要だとは思います.今回は,multinomial sparse logistic regression(Yamashita et al., 2009)をつかって,3つの傾き刺激をクラス分類しています.....えっと,表現を持っているか,僕にはわかりません ※6.
たとえば,Taget以外の視覚刺激2つを変えて翻訳機を学習させても,Targetについては同じボクセルが選ばれるのだったら,選択されたボクセルは特定の傾きの情報表現をもっていると言って良いのでしょうか.
例えば,Hassabis et al., 2009では,海馬傍回からは2つの部屋についてクラス分類できていて,海馬からは各部屋の位置についてクラス分類できています.つまり,一見,海馬と海馬傍回で階層的な位置表現になっていることを示唆するような内容です.ただ,たぶん著者らこの方法と結果からはそんなことは言えないことをわかっていて,「位置情報は1つのニューロンで表現されるのではなく,集団で表現される」という結論を述べるにとどまっています.
Dosenbach et al. 2010 では,SVR(Support Vector Regression, Support Vector machine for Regression)によるクラス分類で選択された領域が情報表現を持つと仮定して,さらに解析を進めていますが,おそらく間違いでしょう.Fig. 2 以降は間違えている.
一般に分類に最適なボクセルだからといって情報表現を持つとは限りません.前者のHassabis et al., 2009は,情報表現を持つ とは言わずに踏みとどまりましたが,後者の Dosenbach et al. 2010 は情報表現を持っていると解釈して解析を進めました.
SVMは,特徴空間の中で分類境界に近いところのサンプルのみを用いて境界が更新されます.なので,境界から離れたところのサンプルが加わっても境界が変更せず,分類するという点で汎化性はあります.ただ,境界を決めるのに使われているサンプル,つまりクラス分類に有用なボクセルを持ってきても,それは情報表現を持っていないと解釈するのが自然ではないでしょうか.各クラスの特徴を持っている,つまり情報表現をもっているは,境界から離れてクラスの中心にあるボクセルだと思うのです.もしくは,他のクラスから離れたところにあるボクセル.また,致命的なのは,カーネルにより写像変換された特徴空間でクラス分類しているので,どのような特徴空間でクラス分類しているか解釈するのが困難です.
確実なのはクラス分類するのではなく,例えば Miyawaki, Uchida et al., 2008 のように,情報表現のモデルを用いて表現して見せてくれれば,選択されたボクセルの総和として再構成できた程度に情報を持っていると言えるでしょう(Miyawaki, Uchida et al., 2008 でも,局所的な表現としてはクラス分類しています.ただ,それは得られた結果を基底表現として全体を再構成しています).その辺の議論はコチラ.
ですから,これを使ってニューロフィードバックを行い.....因果関係を検証するのに,この研究をプロトコルの1つに組み入れなければいけないとなると,目眩がしますねぇ....
最後に,ここまでスクロールしてくれた奇特な方に.次の論文を紹介します.マイナーな雑誌なだけに,あまり知らないと思うので挙げておきます.僕も友人に教えてもらいました.
Boulay, C. B. et al. 2011. Trained modulation of sensorimotor rhythms can affect reaction time. Clinical neurophysiology 122 (9):1820-1826.
今回紹介した論文と方法の点で似たような事が脳波で行われています.この論文では脳活動を抑制することまでも行っています.アイデアはかなり面白いです.ただし,いかんせん荒削りです.ちょっと理解しにくいし,科学として詰め切れていないのがかなり残念な論文.でも,方法のアイデアだけはすごい.
おわり.
※1
採用する方法によっては,ろくな科学にならない.fMRIによる認知科学の研究は,まだまだ科学になるかならないかの瀬戸際なところ.そんな風に感じています.
※2
僕は,被験者が視覚野からフィードバックされていること知っていてもいいように思うんですよね.明示的にガボール図を想像してても,この研究の論理は破綻しないような気がする.視覚刺激の入力がなければ同じだと感じてしまう.でも,それではダメだという人がいるのも想像する.なんでだろう?
※3
ちなみに,この研究では(ほとんどの神経科学者もそう考えていると思いますが),研究で対象となっている知覚学習は特定の領野で行われているだろうという仮定があります.つまり,学習の局在性が仮定されています.領野間での結合性変化によって学習するのなら,また別のことを考える必要はあるかもしれません(←あまりちゃんと考えていないので,本当に別の事を考える必要があるのかはわかりません).
※4
正直に言うと,僕は,脳の情報処理が知りたいだけで,どこの領野で情報処理されているかはどうでもいい,ただ,脳の情報処理である事を言うためには,やはり脳のどこで行われているか(もしくは複数の領野間のネットワークとして実現されている事を示さなければならないわけです.だから,好きでもない実験をやるわけです.実験を考えるのは好きですが,実験するのは大嫌いです.でも,必要だから実験します.
※5
「他の領域が学習に関わっていない」と言ってしまうと,Nieuwenhuis et al, 2011. Erroneous analyses of interactions in neuroscience: a problem of significance. Nature Neuroscience 14 (9):1105–1107 で批判されているリストに挙げられることになります.厳密性だけが科学だとは思いませんが,神経科学は解析などで使われる数理の仮定(制約)を無視する傾向にはあると思います.Nieuwenhuis et al, 2011のTable 1の結果を見てください,ひどすぎ.今回紹介した論文では正確に,”The results of these two offline tests indicate that influences of the neurofeedback on VPL were largely confined to early visual areas such as V1/V2. ” と書かれていて,それ以上の言及はありません.
※6
この議論するには,論文に書いてあるだけの情報でそれは断定できないというのが正直なところです.fMRI研究は,古典的な方法ですら随分と解析が込み入っているわりに,分析方法の記述は多くない.典型的な方法を採用しているにしても,当事者に話を聞くと,結構ヒューリスティックスだらけだったりします.このへん,fMRI研究の信用ならないところです.かといって,事細かく書けといわれたら,あまりに面倒だしな..分析のプログラムコードをSupplementとして挙げとくしか方法はないかなぁ.