春の方法論セミナーに参加してきました


日本社会心理学会の第3回春の方法論セミナーに参加してきました。
第3回のテーマは「統計的因果推論への招待」で、過去回と同じく、説明がわかりやすくてとても楽しかった。
以下は感想。これから勉強。

統計的因果推論では、「AがBの原因である」ということの条件に、AがあるときのBの確率(p(B|A))とAがないときのBの確率(p(B|¬A))で、「p(B|A) > p(B|¬A)」ということがある (ようだ)。この条件が必要条件と考えられているのか、十分条件と考えられているのかはわからない。

でも、「p(B|A) > p(B|¬A)」だけだと、「AがBの原因である」場合と「BがAの原因である」場合の区別がつけられない。なので、「p(B|A) > p(B|¬A)」は「AがBの原因である」ことの必要条件であって、十分条件ではない 。ということで、「AがBの原因である」というためには、「p(B|A) > p(B|¬A)」とは別の基準を満たす必要がある。たとえば、時間的先行性で、AがBよりも時間的に先行している必要がある、とか。あとは、AとBの共通原因の影響を排除できているかどうか、とか、だろうか。とりあえず、僕が持ってる素朴な因果概念はこの3つが満たされていたらOKだと思う。

個人的に目から鱗だったのが、星野先生のトークで出てきた「割り当てられなかった条件のデータは欠測データになる」ということ。

大塚先生のトークにあったように、「(Aさんは) 予防接種したからインフルにかからなかった」は「予防接種してインフルにかからなかった」と「予防接種しなくてインフルにかかった」を観察しないといけない。けど、現実ではどちらかしか観察できない。個別事象の因果についてはその検証をするために可能世界を想定しないといけない。心理学のように、個人レベルではなく個体群レベルで考えるなら可能世界を想定する必要はないのかもしれないけど、個体群レベルで考えてもやはり、割り当てられなかった条件のデータは (観察したいけど) 観察できず欠測データになる、というのは同じ (だろう)。

実験で無作為割り付けが重要なのは、実験操作のみが群間で異なるようにするため。だからこそ、従属変数の差を操作に帰属できる。もちろん、これは当たり前のことなんだけど、知識としてもっていただけというかなんというか、まぁ、「無作為割り付けしてるからいいじゃん」みたいな感覚だった。無作為割り付けは交絡要因を統制する消極的な方法、これも知識としてもってる。でも、「本当に実験操作のみが群間で異なるのですか?」といわれたら「せやかて!」と思うレベルには正当化している。

前置きが長くなったけど、要は、「割り当てられなかった条件のデータは欠測データになる」と聞いた時に、観測データを欠測セルに代入している操作が頭に浮かんできて (それ自体は間違ったイメージだろうけど)「うげっ」となった、という話です。傾向スコア万歳。積極的に共変量を除去していこう。

とはいっても、共変量を統計的に除去する、というのには昔から何か引っかかるものがあって、もうちょっと自分の考えを整理しないといけないなぁと思っているところ。でも、たぶん、実際の使用に引っかかってるだけのような気がする。共変量として何を入れるべきかということについて、従属変数と関連が強いが欠測と関連が低い変数を、といった基準もあるのだろうけど、概念的に共変量として考えられるか、ということも重要だろう。媒介変数として機能しているものを共変量として扱っちゃったらまずいんでしょう?「共変量」って言葉の (個人的) イメージが悪いのかもしれない。あと、共変量をめちゃくちゃ除去するという方法は、因果関係があるかないかの判断には使えると思うけど、そこで推定される値に心理学的な意味はあるのだろうか、という疑問。

あと思ったことは、
1) 測定の信頼性についてちゃんと勉強しよう、
2) 林先生のトークであった「理が知りたい」と「介入がしたい」の違いがわかってない、
3) 講演概要にあった「因果推論と統計推論とは、そもそも世界と認識についての考え方 (パラダイム) が根本的に異なっている」というのがわかってない、
の3本。

昨年のGLMMに引き続き、わかりやすく説明してもらったので、関連本を読める気がしてきた。
ありがとうございました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です