2008年9月15日月曜日

バケツバケツバケツ

 
先週は生理学研究所での研究会に参加.その中で,研究の方法論についてバケツ型研究,サーチライト型研究という話題が1つ挙がりました.以下のような「対照的」な2つの研究方法についてでした.

  • サーチライト型研究:研究者の持つ仮説を検証するために理想化された実験課題(サルやヒトに行わせる認知もしくは行動課題)を作成し,データをとり,解析する.特定の仮説にサーチライトを当てた研究.
  • バケツ型研究:研究者は仮説をもたずに,実験課題もできるだけ自然な状態をつくり,データをとり,解析する.仮説はデータから発見(もしくは発明)される.とりあえずデータをバケツに入れるような研究.

特に,人文科学の方の講演では,バケツ型研究が必要だ,という事でした.言うまでもなく,現在の研究は一見するとサーチライト型研究です.研究会が終わった後にバケツ型研究に対する反発を耳にしたので,ちょっと不思議に思っていました.その時は,「仮説ナシ」ってのが引っかかったのかなと思っていたのですが.バケツ型を言い出す問題意識は理解できる事だと思いましたし,それ以上に2つの点であたりまえに思えて,タイミングを逃し,この時は発言できなかったのですが,ここで備忘録のためにもまとめておこうかなと,メモします.あたりまえに思えた理由の

1つ目は,サーチライト型研究はバケツ型研究の過程を経ているという事.
2つ目は,仮説がなければ検証もできないが,仮説をデータから探索する事は可能である事.


1つ目ですが,
サーチライト型研究者も仮説を作るために,多かれ少なかれ研究対象の観察があるはずで,試行錯誤があるはずです.研究者なら過去の論文をたくさん読みますし,それも間接的には対象を観察している事になるんじゃないかなと.それがデータ(情報)をひたすらバケツに入れている過程になっていて,それを経て,はじめて仮説が発見(発明)されるのだと思うんです(仮説は発見か発明かという議論もありますが,ここでは区別しない).バケツ型→サーチライト型という循環があるのが研究かなと.つまり,さきほど「対照的」と書いたのですけど,研究の裏表にある対称的な関係だと思うのですよね.論文を書く時はサーチライト型な風にやったと書きますけど,実はバケツ型の作業もやっている.

2つ目は,
検証する,というレベルまできちんと調べるためには,やはり研究者は仮説を持って,できるなら仮説を検証するための実験課題を組む必要があるでしょう.ただ,単に1つの実験だけを持ってきて,検証するのは困難な研究もたくさんあるので,時にはいくつかの実験を重ねて検証する必要もあるのだと思います.

一方で,高次元で膨大なデータから,仮説を探索する事は可能です.もしこれに否定的なんだとしたら,それはおかしいと思う.

仮説を探索することが可能というか,すでにたくさんやられている.統計学習とか機械学習などの統計数理を道具として使えばできる.最近では,統計的性質だけでなく,データの構造(系統樹型,多次元空間型,...)を推定するなんていう研究もある(データから「構造」を発見する:より人間に近づく人工知能WIRED VISION ,記事のネタ論文The discovery of structural form by Charles Kemp and Joshua B. Tenenbaum).脳科学でだってfMRI解析に使うSPMというソフトウェアや阪大で視覚研究をされている大澤さんがモザイク刺激を用いて行っている研究も,そういう思想なはず.特に珍しくはないはず.

ただし,その手の研究を聴いていて,良くないと思うのは,検証にはなっていない事がある点.現象を「説明」にはなっているけども,他の可能性を棄却する「検証」には到っていたないことがあるのです.同時に複数の事が起こって,それを切り分けたい場合に解析だけではそれはできない.解析の中に不良設定問題が入っちゃっている場合なども,得られた説明が局所解であるかもしれない.そういう場合がほとんどなはずなので,そこはちゃんと実証実験しなくちゃいけない.他のすべての可能性を棄却する事は原理的に出来ないのですけど,考えられる範囲については明示的に棄却しておくべきでしょう.

もし,大量のデータを持っていて,研究者が持つ仮説(heuristics)だけで解析しているとすれば,それは確かに賢くない(高次元なデータなのに,検定以外で統計的解析を使っていない研究は結構目にする事があるので,それは残念).

 ##

理研の藤井さんが,バケツ型はサーチライト型を内包しているんだとブログに書かれています.
バケツ型とサーチライト型の研究は異なるものではないという事です。違いは、自然とか自然じゃ無いとかということではな くて、対象としている次元の数が増えているというだけです。それ以外に何も変わりません。(途中省略)バケツ型研究は、サーチライト研究を内在しているのです。つまり、バケツ型研究のプラットフォームで次元を絞れば、従来のサーチライト型研究と同レベルの制限を加えた実験も出来るし、それを複数行 う事で異なる文脈間での比較も出来ます。そういう自由度は、体験しないとわからないので、抵抗する人が沢山いるのは良く分かります。
単細胞記録の電気生理研究と比較すれば,確かに飛躍的に高次元なデータ.バケツに抵抗がある人もいるのかもしれません.

 ##

個人的に,東京大学の池谷さんの研究などは,統計解析したらおもしろいと思えるくらいに大量の神経細胞を同時計測できるし,興味津々です.fMRIも計測として比較的悪くないと思うのですが,やはり,空間・時間解像度など,こころもとない部分があります(それでもヒトを計測するには確立した方法です).

PS.
唯一,バケツ型を経ないサーチライト型があるとすれば,計算論を考える事でしょうね.脳ではなく,脳が情報処理している環境について思考して,その最適性を考えて,仮説を発見(発明)する.

PS.PS.
藤井さんはこうも書かれていて,
例えばワーキングメモリー課題の実験はそのことしか議論できません。つまり他人の実験と直接比較が出来ない。だから、専門外のヒトから見れば玉虫色に見えるんでしょう。
この文脈でバケツ型の必要性も書かれていました.こちらが重要な問題だと思うのですが,ただ,バケツが解決になるのか僕にはよくわからないところです.

4 件のコメント:

mmrl さんのコメント...

いえね、私がいいたかったのは、仮説を与えることが研究なのであって、バケツはたんなる作業だよ、ってことだよ。実験科学者がデータとるだけで、まるなげしたらいかんよ。そこは藤井さんも納得してるはず。

それに、すべての可能性をつくす実験状況をつくらないと検証できないようなやりかたは、不可能です。実験とは操作をくわえることだけど、操作する対象を決めないと無限に可能性が広がって検証は不可能です。なんか検証しないと論文は載らない、つまり科学的知識として人類の記録に残らない。

SPMに説明変数というは何をしていることになるの?大澤さんのだって刺激のある側面が系列無相関になるように仕組んでいるでしょ。それは仮設をもった実験だと思います。

ShIka さんのコメント...

ありがとうございます.

> バケツはたんなる作業だよ
ぼくもそう思っています.作業した後,それを解析する技術も今ならありますね,ということを書いたつもりだったのです.

> 実験科学者がデータとるだけで、まるなげしたらいかんよ。
もちろんです.そう書いたつもりはなかったのですが,僕の文章が悪かったみたいです.

> すべての可能性をつくす実験状況をつくらないと検証できないようなやりかたは、不可能です。
原理的に不可能であることは理解しているつもりなんです.ただ,現状もしくは以前と比較すれば,操作する対象を大きくしてもできる事があるんじゃないかと思うんです.

mmrl さんのコメント...

そうか、仮説として設定する自由度が、解析技術の進歩によって広がった、という意味ですね。それならわかります。藤井さんのところでの、どっちもそうかわらない、次元が増えただけ、というのもその意味ですよね。

ただし、それは仮説ナシ、というのではないですよね。

それと、やっぱり有限な時間しか実験できないので、観測はすくなくなるのではないかと。一回性の観察から有用な仮説が本当に得られればいいですけど、本当にそんなことができるのかなぁと疑問に思います。

それでも「やってみなきゃわかんないじゃん」という藤井さんの行動力はすごいと思います。

それと、すみません、Shikaさんは、「まるなげしてはいかん、検証は必要」とかかれていましたね。ごめんなさい、失礼しました。

ShIka さんのコメント...

> 一回性の観察から有用な仮説が本当に得られればいいですけど、本当にそんなことができるのかなぁと疑問に思います。

僕にしても,これっぽっちのアイデアもあるわけではなく...今のところ頭の片隅において,できるだけ背伸びして届くところをやっていきたいかなと.行動が伴わないと軽薄になってしまいますから.

コメントしていただいて,このエントリが良くなりました.ありがとうございます.コメントの議論を読むと,端的にわかりやすい.

本文は長く書きすぎで,読みづらいかも^^;