ベイズ推定と偽陽性

統計の落とし穴的な話で、こんな問題がある

ある致命的な感染症にかかる確率は1万分の1である。あなたがこの感染症にかかっているかどうか検査を受けたところ結果は陽性であった。この検査の信頼性は99%である。実際にこの感染症にかかっている可能性はどの程度であろうか?

(行動経済学 経済は「感情」で動いている より)


答えはこのページを参照
http://teamsato.jugem.jp/?eid=137


昔も上の本で読んで分かったような分からないような感じだったが、今読んでる本でまた出てきて、やっぱり何か分かったような分からないような感じだ。


問題をこう変えてみると分かる

全員に検査をした結果、陽性の人が9999+99人いました。その中で、本当に陽性の人の確率は?


多くの患者を検査する検査側から見た場合の意味はわかる。
99%信頼性のある装置でも、入力データが、アタリ(陽性の人)がほとんどなくて、スカ(陰性の人)ばっかだと、超めずらしい本当のアタリが出る前に、スカの数×1%の頻度で出る間違ったアタリ(偽陽性)がたくさんでそうだ、ってのはわかる。スカスカスカ....ときて、アタリときたからって、それが本当にアタリかどうかは慎重に検討しましょう、という意味はわかる。


同様に
「スカばっかりの母集団から無作為に一人を選んで検査をした結果の陽性」は、擬陽性の確率が高い、ってのはわかる。


でも単に「自分が検査した結果、陽性だった」ってんなら、99%陽性なのでわ。自分が自分である時点で、スカだらけの母集団から1人を選ぶフェイズは終わっているわけで、選んじゃった後の1回こっきりの試行の結果に、基準率なんて関係じないじゃんかと思うのだけど。。。うーん???

検査前に自分が陽性の確率が(1/2でなく)1万分の1って考えると、普通に解答どおりでいい気がしてきた。