戻る

このページは以下URLのキャッシュです
http://karapaia.com/archives/52267230.html


ニュースの数字に騙されないために。3つの統計原則を知りデータを見抜く方法 : カラパイア

entrepreneur-1340649_640_e

 「かなりの研究から、性的な傾向は指の長さで判断できることが判明」。これは英エセックス大学の高名な研究者による査読された研究をもとにした最近の記事の見出しだ。

 統計になれた人の目から見れば、それはナンセンスの塊だろう。

 査読された論文であるか、サンプルサイズは十分か、誰から助成を受けているのか――こうしたことを知ることは騙されないためには必要なことだ。

 このケースでは、信頼区間が鍵となる。普通なら素人が懸命に学ばなくてもいいはずの統計用語だ。しかし、数字が嫌いな人にとって統計の数字の裏を読むことは至難の業だ。

 だが次にあげる統計の3つの原則を知ることで、ニュースの数字に隠された真実を見つけることができる。
スポンサードリンク

1.本来のリスク「相対リスク」を考える


 たとえば、「8年間におよぶ研究で、フライドポテト好きは死亡率が2倍」というニュースを挙げよう。

 ポテトをつまみながら飲んでいたビールを思わず吹き出しそうになってしまうだろう。「嘘だろ!」って感じに。

 『American Journal of Clinical Nutrition』に掲載された査読済み研究によれば、これは本当のことだ。

 フライドポテトを多く食べれば死亡率が2倍になるらしい。

 だが、いったいどのくらい食べるとなのだろうか? それから、そもそもその人の元々の死亡リスクはどのくらいなのか?

 それによると、1週間以上あたりで3倍のフライドポテトを食べると、死亡リスクが2倍になるらしい。

 ちなみにこの研究に参加した被験者は、平均年齢60歳の男性だ。

 ポテトを食べなかった場合の死亡率は1パーセントである。すなわち60歳の男性が100人いたとしたら、その翌年には99人に減っているだろうということだ。

 その100人が全員、週に3倍以上のフライドポテトを食べたとすると、死亡率は2倍――2パーセントになる。よって翌年の生き残りは98人だ。

 なお、彼らが生涯その状況に陥るためには一生涯フライドポテトを3倍食べ続けねばならないことになる。

iStock-936886268_e
istock

 これは統計学でいう「相対リスク」の話だ。

 仮にある病気にかかる確率が10億人に1人だったとして、何らかの要因によってそれが4倍になったとする。すると10億人に4人が病気になる。ほぼそんなことにはならない。

 したがって今度、リスクがどうだといった記事を見かけたら、まず「増減がある前の本来のリスクは?」と考えるべきだ。


2.相関関係は因果関係を含意しない


 新しく赤ちゃんを授かろうとしている夫婦に、赤ちゃんが安心して眠れるグッズのセットが贈られる。このベビーボックスは、1930年代末に睡眠中の乳幼児の突然死を防ごうとフィンランドで始められた制度だ。

 フィンランドの乳幼児の死亡率は、これが広まるようになってから急激に低下。今では同国は世界有数の赤ちゃんが死なない国である。よってベビーボックスには、乳幼児の死亡率を大きく改善したという手柄が与えられている。

 だが、ほかにも何か変化はなかったのだろうか?
 それは妊婦健診だ。

 ベビーボックスを手にするための条件として、妊婦は妊娠して最初の4ヶ月の間に検診を受けねばならない。

 1944年、フィンランドでは、妊婦の31パーセントが妊婦教育を受けた。1945年、それは86パーセントに急増。乳幼児の死亡率が改善したのは、ベビーボックスではなく、むしろこの教育と早期の健診のためだった。

 これは「相関関係は因果関係を含意しない」ことを示す古典的な事例だ。ベビーボックスと死亡率の改善には相関があるが、片方が片方の原因になっているわけではない。

2_e11
フィンランド政府から贈られるベビーボックス image credit:Kopu/Flickr, CC BY-NC-ND

 しかし、このちょっとした事実によって、ベビーボックスの人気に歯止めがかかることはなかった。フィンランド生まれのこの贈り物はアメリカでも大流行し、新しくお母さんになる人への人気のギフトである。

 だからもし、「寝る前にチーズを食べると、シーツに絡まって死ぬ」といった見出しを見つけたら、「ほかに何か原因になることがあるのでは?」と疑ってみよう。


3.許容誤差によって結果が曖昧になる


 アメリカ労働統計局が最近発表したデータは、8月から9月の失業率がの3.9パーセントから3.7パーセントに減少したことを示している。

 もちろん、統計局はこの数字を得るために一人一人に仕事があるかどうか訊いて回ったわけではない。ほんの一握りの人たちに質問し、その結果を一般化して全国の状況を推定したのである。

 それは優れた推定であるが、推定は推定だ。そのときに生じる誤差は、統計学でいう「信頼区間」というものによって定義される。

 先ほどのデータは、アメリカ全土で失業者が27万人減少したということだが、そこには信頼区間によって定義される「許容誤差」というものがある

 ――現実はこれを中心とした26.3万人の誤差の範囲があると考えられるのだ。

 1つの数値をはっきり提示できればいいのだが、統計の結果はある範囲を表していると考えた方が正確だろう。失業率の事例で言えば、最大で53.3万人減った可能性もあるし、最低では7000人しか減っていない可能性もあると統計学者は考える。

 冒頭で述べた指の長さで性的な傾向が分かるという問題もこの類のものだ。これらの推定値に関係する範囲のことを考えれば、それが確かな結論であるなどとはとても言えないのだ。
 
iStock-824126076_e
istock

 信頼区間が混乱を与える格好の事例が投票の世論調査だ。

 調査会社は、人口全体を代表すると考えられるサンプルを抽出し、サンプルとして選ばれた人に誰に投票するかと尋ねる。

 そして、その結果から、投票日に有権者全体が誰に票を入れるだろうかと推定する。もし結果が接戦と出れば、誤差があるために誰が当選するのかほとんど分からないも同然だ。

 だから関係者一人一人に質問できるはずがない規模の人口に関する数字を見たら、許容誤差について思い出そう。

References:Numbers in the news? Make sure you don't fall for these 3 statistical tricks/ written by hiroching / edited by parumo

あわせて読みたい
統計学者の4人に1人が、科学者が望む研究結果になるようにデータの操作、改ざんを求められたことがあると回答(アメリカ調査)


情報改ざん・隠ぺい・ねつ造、冤罪はこうして起きる。杜撰で悪質な10の犯罪調査


ニュースを読むにあたって注意しなければならない10のこと(アメリカの場合)


フェイクニュースや意見の偏りがあるウェブサイトを見破るAIが開発される(米研究)


独断的な人、原理主義者の方がフェイクニュースを信じやすいという研究結果(米研究)

この記事が気に入ったら
いいね!しよう
カラパイアの最新記事をお届けします
この記事をシェア :    

Facebook

コメント

1

1. 匿名処理班

  • 2018年11月07日 20:44
  • ID:bUsYb2yk0 #

統計よりひどい確率で彼女ができないんですけどどうしたらいいんでしょうか…

2

2. 匿名処理班

  • 2018年11月07日 20:46
  • ID:NfkYsID30 #

テレビ局が都合の良いように報道するもんね。
街頭アンケートがまさにそう

3

3.

  • 2018年11月07日 21:03
  • ID:xPeG8BW.0 #
4

4. 匿名処理班

  • 2018年11月07日 21:21
  • ID:6ES71M7P0 #

正確に言うと統計学者は範囲ではなくて分布で考えるね。
良い記事だと思うけど普通の人にはなかなか伝わらないだろうなぁ。

5

5.

  • 2018年11月07日 21:23
  • ID:N46o5Eh60 #
6

6. 匿名処理班

  • 2018年11月07日 22:16
  • ID:Djdm21hy0 #

たとえば、
”病院の滞在時間が長い人ほど死亡のリスクが高いので、長生きするには病院に行かない方がよい”
とかそういうのではなく、グラフに単位ついてないとか、n=いくつだよとか、個人的にはそっちのほうがモヤッとするんだよね

7

7. 匿名処理班

  • 2018年11月07日 22:20
  • ID:X76q1bHW0 #

真実は揺るがないが、統計は融通がきく。

8

8. 匿名処理班

  • 2018年11月07日 22:24
  • ID:irYMAVfn0 #

統計学はわかれば面白そうだな

9

9. 匿名処理班

  • 2018年11月07日 22:31
  • ID:NtmdOoRy0 #

統計って正しく使うとすごく便利なんだけど、現実には相手を騙すために使われる場合がほとんどなので、まずは疑ってかかるのが正解。

10

10. 匿名処理班

  • 2018年11月07日 22:31
  • ID:EV0eMPwa0 #

統計屋です。こういう記事、わかりやすくてイイネ!
大体のマスメディアや”煽り”商売は、こういった統計詐欺を使って
危機感を捏造するからねー
みんな冷静に数字見てねー

11

11. 匿名処理班

  • 2018年11月07日 22:39
  • ID:S4ODQ33x0 #

これは良い記事。両親に百回読ませたい。

12

12. 匿名処理班

  • 2018年11月07日 23:22
  • ID:Y2QqxHCU0 #

100%がMAXの棒グラフで統計の最大値(20%とか)を画面端に持ってきて
20%と15%みたいな誤差レベルの差を大差に見せかけるやっすい手法すら
マスメディアのみならずネットニュースでまで使われてるの溜息しか出ない
またそれに踊らされるユーザーが一定数存在するっていうのがさあ…

お名前
スポンサードリンク
記事検索
月別アーカイブ
スマートフォン版
スマートフォン版QRコード
「カラパイア」で検索!!
スポンサードリンク