「かなりの研究から、性的な傾向は指の長さで判断できることが判明」。これは英エセックス大学の高名な研究者による査読された研究をもとにした最近の記事の見出しだ。
統計になれた人の目から見れば、それはナンセンスの塊だろう。
査読された論文であるか、サンプルサイズは十分か、誰から助成を受けているのか――こうしたことを知ることは騙されないためには必要なことだ。
このケースでは、信頼区間が鍵となる。普通なら素人が懸命に学ばなくてもいいはずの統計用語だ。しかし、数字が嫌いな人にとって統計の数字の裏を読むことは至難の業だ。
だが次にあげる統計の3つの原則を知ることで、ニュースの数字に隠された真実を見つけることができる。
スポンサードリンク
1.本来のリスク「相対リスク」を考える
たとえば、「8年間におよぶ研究で、フライドポテト好きは死亡率が2倍」というニュースを挙げよう。
ポテトをつまみながら飲んでいたビールを思わず吹き出しそうになってしまうだろう。「嘘だろ!」って感じに。
『American Journal of Clinical Nutrition』に掲載された査読済み研究によれば、これは本当のことだ。
フライドポテトを多く食べれば死亡率が2倍になるらしい。
だが、いったいどのくらい食べるとなのだろうか? それから、そもそもその人の元々の死亡リスクはどのくらいなのか?
それによると、1週間以上あたりで3倍のフライドポテトを食べると、死亡リスクが2倍になるらしい。
ちなみにこの研究に参加した被験者は、平均年齢60歳の男性だ。
ポテトを食べなかった場合の死亡率は1パーセントである。すなわち60歳の男性が100人いたとしたら、その翌年には99人に減っているだろうということだ。
その100人が全員、週に3倍以上のフライドポテトを食べたとすると、死亡率は2倍――2パーセントになる。よって翌年の生き残りは98人だ。
なお、彼らが生涯その状況に陥るためには一生涯フライドポテトを3倍食べ続けねばならないことになる。
istock
これは統計学でいう「相対リスク」の話だ。
仮にある病気にかかる確率が10億人に1人だったとして、何らかの要因によってそれが4倍になったとする。すると10億人に4人が病気になる。ほぼそんなことにはならない。
したがって今度、リスクがどうだといった記事を見かけたら、まず「増減がある前の本来のリスクは?」と考えるべきだ。
2.相関関係は因果関係を含意しない
新しく赤ちゃんを授かろうとしている夫婦に、赤ちゃんが安心して眠れるグッズのセットが贈られる。このベビーボックスは、1930年代末に睡眠中の乳幼児の突然死を防ごうとフィンランドで始められた制度だ。
フィンランドの乳幼児の死亡率は、これが広まるようになってから急激に低下。今では同国は世界有数の赤ちゃんが死なない国である。よってベビーボックスには、乳幼児の死亡率を大きく改善したという手柄が与えられている。
だが、ほかにも何か変化はなかったのだろうか?
それは妊婦健診だ。
ベビーボックスを手にするための条件として、妊婦は妊娠して最初の4ヶ月の間に検診を受けねばならない。
1944年、フィンランドでは、妊婦の31パーセントが妊婦教育を受けた。1945年、それは86パーセントに急増。乳幼児の死亡率が改善したのは、ベビーボックスではなく、むしろこの教育と早期の健診のためだった。
これは「相関関係は因果関係を含意しない」ことを示す古典的な事例だ。ベビーボックスと死亡率の改善には相関があるが、片方が片方の原因になっているわけではない。
フィンランド政府から贈られるベビーボックス image credit:Kopu/Flickr, CC BY-NC-ND
しかし、このちょっとした事実によって、ベビーボックスの人気に歯止めがかかることはなかった。フィンランド生まれのこの贈り物はアメリカでも大流行し、新しくお母さんになる人への人気のギフトである。
だからもし、「寝る前にチーズを食べると、シーツに絡まって死ぬ」といった見出しを見つけたら、「ほかに何か原因になることがあるのでは?」と疑ってみよう。
3.許容誤差によって結果が曖昧になる
アメリカ労働統計局が最近発表したデータは、8月から9月の失業率がの3.9パーセントから3.7パーセントに減少したことを示している。
もちろん、統計局はこの数字を得るために一人一人に仕事があるかどうか訊いて回ったわけではない。ほんの一握りの人たちに質問し、その結果を一般化して全国の状況を推定したのである。
それは優れた推定であるが、推定は推定だ。そのときに生じる誤差は、統計学でいう「信頼区間」というものによって定義される。
先ほどのデータは、アメリカ全土で失業者が27万人減少したということだが、そこには信頼区間によって定義される「許容誤差」というものがある
――現実はこれを中心とした26.3万人の誤差の範囲があると考えられるのだ。
1つの数値をはっきり提示できればいいのだが、統計の結果はある範囲を表していると考えた方が正確だろう。失業率の事例で言えば、最大で53.3万人減った可能性もあるし、最低では7000人しか減っていない可能性もあると統計学者は考える。
冒頭で述べた指の長さで性的な傾向が分かるという問題もこの類のものだ。これらの推定値に関係する範囲のことを考えれば、それが確かな結論であるなどとはとても言えないのだ。
istock
信頼区間が混乱を与える格好の事例が投票の世論調査だ。
調査会社は、人口全体を代表すると考えられるサンプルを抽出し、サンプルとして選ばれた人に誰に投票するかと尋ねる。
そして、その結果から、投票日に有権者全体が誰に票を入れるだろうかと推定する。もし結果が接戦と出れば、誤差があるために誰が当選するのかほとんど分からないも同然だ。
だから関係者一人一人に質問できるはずがない規模の人口に関する数字を見たら、許容誤差について思い出そう。
References:Numbers in the news? Make sure you don't fall for these 3 statistical tricks/ written by hiroching / edited by parumo
あわせて読みたい
統計学者の4人に1人が、科学者が望む研究結果になるようにデータの操作、改ざんを求められたことがあると回答(アメリカ調査)
情報改ざん・隠ぺい・ねつ造、冤罪はこうして起きる。杜撰で悪質な10の犯罪調査
ニュースを読むにあたって注意しなければならない10のこと(アメリカの場合)
フェイクニュースや意見の偏りがあるウェブサイトを見破るAIが開発される(米研究)
独断的な人、原理主義者の方がフェイクニュースを信じやすいという研究結果(米研究)
この記事が気に入ったら
いいね!しよう
いいね!しよう
カラパイアの最新記事をお届けします
「知る」カテゴリの最新記事
「料理・健康・暮らし」カテゴリの最新記事
この記事をシェア :
人気記事
最新週間ランキング
1位 1642 points | 5655カラット!重さ1.1キロの巨大エメラルドが発見され、ネット民ざわつく(ザンビア鉱山) | |
2位 1466 points | 「入ってます」ハリケーンが接近中のある日、3匹の小鹿たちが家の中に入り込み部屋の隅で固まっていた件 | |
3位 1111 points | なんだ、ガラスの破片か。一応拾っとくか。で持って帰ったら、実は大きなホワイトダイヤモンドだった件(アメリカ) | |
4位 1107 points | 大親友の牛が売られることに。悲しみで涙を流す犬だったが、それを見かねた飼い主が | |
5位 1093 points | いとしい私の愛犬。ウルフドッグにそっと手を添え、美しい自然の風景を撮影し続けるカメラマン(チェコ) |
スポンサードリンク
コメント
1. 匿名処理班
統計よりひどい確率で彼女ができないんですけどどうしたらいいんでしょうか…
2. 匿名処理班
テレビ局が都合の良いように報道するもんね。
街頭アンケートがまさにそう
3.
4. 匿名処理班
正確に言うと統計学者は範囲ではなくて分布で考えるね。
良い記事だと思うけど普通の人にはなかなか伝わらないだろうなぁ。
5.
6. 匿名処理班
たとえば、
”病院の滞在時間が長い人ほど死亡のリスクが高いので、長生きするには病院に行かない方がよい”
とかそういうのではなく、グラフに単位ついてないとか、n=いくつだよとか、個人的にはそっちのほうがモヤッとするんだよね
7. 匿名処理班
真実は揺るがないが、統計は融通がきく。
8. 匿名処理班
統計学はわかれば面白そうだな
9. 匿名処理班
統計って正しく使うとすごく便利なんだけど、現実には相手を騙すために使われる場合がほとんどなので、まずは疑ってかかるのが正解。
10. 匿名処理班
統計屋です。こういう記事、わかりやすくてイイネ!
大体のマスメディアや”煽り”商売は、こういった統計詐欺を使って
危機感を捏造するからねー
みんな冷静に数字見てねー
11. 匿名処理班
これは良い記事。両親に百回読ませたい。
12. 匿名処理班
100%がMAXの棒グラフで統計の最大値(20%とか)を画面端に持ってきて
20%と15%みたいな誤差レベルの差を大差に見せかけるやっすい手法すら
マスメディアのみならずネットニュースでまで使われてるの溜息しか出ない
またそれに踊らされるユーザーが一定数存在するっていうのがさあ…