こんにちはネルです!
今回は、「【見かけの相関に注意!】「識字率が高い国はがん死亡率が高い」は擬似相関!」というテーマで話をまとめていきます!
参考にした本は、小坂井敏晶『社会心理学講義』です!
- 「一見Aが原因でBが発生したと見えても、実はAとBには関係がないもの」を「疑似相関」という
- 「識字率が上がると、がんの死亡率が増える」は疑似相関の一例
- データがあるからといって、そこに必ずしも相関があるとはいえない!
それでは、順番にポイントをまとめていきます!
【目次】
見かけの相関=疑似相関とは
見かけの相関=疑似相関という言葉はご存知でしょうか。
これは、「一見Aが原因でBが発生したと見えても、実はAとBには関係がないもの」のことです。
言葉だけでは意味が分かりづらいと思うので、早速本文で紹介されていた面白い例を紹介します!
「識字率が高い国はがん死亡率が高い」というデータ
「文字を読める国民が多い国は、がん死亡率が高い」というデータが公式にあるそうなんです。
どの国でもこの法則が成り立ち、逆に識字率が低いとがんで死亡する人は少ない、ということが分かっています。
このデータを見て、どのような印象を受けたでしょうか。
「文字を読めるようになると、何らかの影響が脳に及ぼされ、がんが発生しやすくなる」などもっともらしい因果関係を考えつきたくなりまよね。
実はこれこそまさに「疑似相関」なんです!
識字率が高い国は豊かで寿命が長い
実は、以下のような因果関係が隠されていました。
- 「識字率が高い国は、国民に教育ができるぐらい豊かである」
- 「豊かな国は、医療が充実する」
- 「医療の充実によって、結核などの感染症で命を落とす人が減る」
- 「感染症が治るようになると、寿命が伸びるため、今度はがんで死ぬ割合が増える」
こんな背景を聞くと、納得できるのではないでしょうか。
よって、「識字率が高い国はがん死亡率が高い」というデータ自体は間違いではないものの、この2点が直接影響しあっているわけではないんです!
このような、「一見2つのことが関係しあっているように見えて、実際の真因は全く別のところにある」という関係のことを「擬似相関=見かけの相関」と言い、科学者の間でも注意されているこの一つだそうです!
人体実験をできない以上、疑似相関の疑いは晴れない
そして面白いのが、「人体実験をしない以上、ある関係性が疑似相関なのか、真に相関があるのか、区別できないものがある」というのです!
続いての例は、本文よりそのまま引用します。
喫煙と肺癌の因果関係は厳密には証明されていません。癌を発生させると同時にニコチンを欲する遺伝子がいつか発見されるかも知れない。もしそんな遺伝子Xが存在すれば、タバコの消費と肺癌発症率の因果関係が崩れます。Xを持たない人はタバコを吸わないし、癌にもならない。対してX保有者は癌発症率が高いと同時に、タバコを吸いたくなる。しかし両者の間に因果関係がないので、Xを持たない人はタバコを吸っても癌にならないし、X保有者は辛い思いをして禁煙しても癌の危険性は減りません。
引用:『社会心理学講義』
遺伝子Xなんて聞くとなんともデタラメに聞こえますが、将来科学が発展したときにそういったものが発見される可能性は否定できません。
よって、上記の論が正しく、「タバコを吸う人はがんになりやすい」というデータ自体はあっても、「タバコを”吸うと”がんになりやすい」とは言えない、ということになるんです!
ランダムに人を選んで実験すれば・・・
この論理が正しいかどうかを調べる方法はあります。
それは、「ランダムに人を選んで、一方にはタバコを吸わせ、もう一方にはタバコを吸わないようにして、将来のがん死亡率を調べる」という方法です。
実験対象者をランダムに選び、タバコを吸うかどうかを強制しているため、この実験では「遺伝子X」の効果は関係がなくなります。
そして、もしこの実験で、「タバコを吸っていた組が、がんになる人が多かった」という実験データが得られれば、「タバコとがんの真の相関」が証明できるというわけです。
しかし、もちろんこれは倫理的にアウトですよね。
こういった人体実験をできない以上、「タバコとがんの因果関係」は正式には証明することができず、あくまで「タバコを吸う人はがんになりやすい”可能性が高い”」という結論になるんです!
まとめ
今回は、『社会心理学講義』より、「【見かけの相関に注意!】「識字率が高い国はがん死亡率が高い」は擬似相関!」というテーマで話をまとめていきました!
世の中のデータをそのまま受け入れてしまうと、疑似相関には引っかかりやすい。
そこに本当にきちんとした因果関係があるのか、よく注意するようにしていきたいですよね!
- 「一見Aが原因でBが発生したと見えても、実はAとBには関係がないもの」を「疑似相関」という
- 「識字率が上がると、がんの死亡率が増える」は疑似相関の一例
- データがあるからといって、そこに必ずしも相関があるとはいえない!
最後まで読んでいただき、ありがとうございました!