【統計学が最強の学問である】要約まとめ

統計学の入門書です。

ざっと俯瞰できますが、途中から結構難しくなります。これ1冊で統計学がマスターできるような本ではありません。思わず2回ほど読んでしまい、それでもわからないのでググってました。奥が深いなあ…。

最近ずっとビジネス本の2位ぐらいに位置してます。むかしからある分野ですが、IT化の進展で一気にパワフルになっています。グーグルのチーフエコノミストであるヴァリアン博士曰く、「これからの10年で最もセクシーな職業は統計家だろうって言い続けてるんだ」

現代統計学の父、ロナルド・A・フィッシャーはひょんなことで、科学哲学を揺り動かし、科学で扱える対象の領域を爆発的に拡大させた「ランダム化比較実験計画法」を思いつきます。

1920年代のイギリスで男女が屋外のテーブルで紅茶を楽しんでいたとき、ある婦人が「紅茶を先に入れたミルクティ」か「ミルクを先に入れたミルクティ」か味が全然違うからすぐにわかると言いました。

その場にいた紳士たちは、婦人の主張を笑い飛ばしました。そのときフィッシャーは「その命題をテストしてみようじゃないか」と提案し、さっそくティカップをずらりと並べ、婦人に見えない場所で2種類の違った入れ方ミルクティを用意し、ランダムな順番で婦人にミルクティを飲ませ、婦人の答えを書き留めた後でちょっとした確率の計算をするという実験を行ないました。これが世界で最初に行なわれたランダム化比較実験だそうです。

ちなみに婦人は出されたミルクティをすべて正確に言い当てたそうです。彼女がランダムな5杯のミルクティを飲んでいたとすれば、偶然すべて当てる確率は2の5乗分の1=32分の1(3.1%)、10杯なら1024分の1(0.1%)。

2003年に「1杯の完璧な紅茶の入れ方」を英国王立化学協会が発表しています。

牛乳は紅茶の前に注がれるべきである。なぜなら牛乳蛋白の変性は、牛乳が摂氏75度になると生じることが確かだからである。もし牛乳がお湯の中に注がれると、それぞれの牛乳滴は牛乳としてのまとまりから外れ、確実に変性が生じるだけの時間を紅茶の高温に取り囲まれる。もしお湯が冷たい牛乳に注がれるなら、このような状況ははるかに起こりにくい。

他の読書メモを以下に。



ふ~んとしか言えないグラフ

データ分析において重要なのは、果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか、という視点だ。

きれいな集計グラフをみて「何となく現状を把握したような気になる」という以上の意味はあるのか。

「ふ~ん」以上のリアクションをするとは、すなわち「ビジネスにおける具体的な行動につながる」ということである。そしてそうした具体的な行動を引き出すためには、少なくとも以下の3つの問いに答えられなければならない。
・何かの要因が変化すれば利益は向上するのか
・そうした変化を起すような行動は可能なのか
・変化を起す行動が可能だとしてそのコストは利益を上回るのか

サンプルを1万増やしても標準誤差は0.3%しか変わらない

全数調査をする必要はない。たとえば10万人のデータから男女別割合を調べた結果、女性の割合が70%だったとする。その標準誤差は、何人をサンプリングすればどの程度になるか。

サンプル数が100名分しかなければその標準誤差は9.5%になり「女性の占める割合が70%」という結果が「女性の割合が51%~89%と考えてほぼ間違いない」という解釈になる。

サンプルが1000名いれば標準誤差は3%となり「女性の割合が64%~76%」
サンプルが8000名いれば標準誤差は1%となり「女性の割合が68%~72%」
(前後に標準誤差x2倍の幅を取る。この幅の中に真の値が95%の確率で存在する)

ナイチンゲールの功績

ナイチンゲールがあげた最も大きな業績の1つは、戦争に従軍した兵士の死因を集計した結果、戦闘で負った傷自体で亡くなる兵士よりも、負傷後に何らかの菌に感染したせいで死亡する兵士のほうが圧倒的に多いことを明らかにしたことだった。

彼女はこのデータを元に「戦争で兵士の命を失いたくなければ、清潔な病院を戦場に整備しろ」と軍のお偉方や政治家に迫ったそうだが、これもそうした「集計」の力の1つだったのかもしれない。



恋愛には統計学は無力

知人の統計家には、生涯1人の女性とだけ交際しそのまま結婚した男がいる。そして我々は彼の恋愛について、「統計学では解析できない」という表現で敬意を口にすることがある。データがたった1つしかないということは、誤差も標準偏差もなく、たった1つの値が平均値であり、最大値であり、最小値だ。統計学など無力である。

巨人の肩に立つ

近代物理学を生み出したアイザックニュートンは、「私が遠くを見ることができているのだとすれば、それは巨人の肩に立っていたからです」という言葉を残している。巨人とはすなわち「先人たちの知恵」という意味だ。

世界中には学者や専門家が生涯をかけて明らかにしたさまざまな知恵がある。現代においてその知恵の多くは回帰係数やp値(誤差)といったものによって表現されている。統計リテラシーはこうした知恵を迅速かつ正確に活用できるように、ひいてはあなたを巨人の肩に導いてくれるはずだ。

⇒この本にも紹介されていた、グーグルスカラー(論文の検索サイト)のトップにも「巨人の肩の上に立つ」が書かれています。元は12世紀のフランスの学者ベルナールの言葉だそうです。

オアシスの中では一番聴いたアルバム「スタンディング・オン・ザ・ショルダー・オブ・ジャイアンツ」。彼らにとっての巨人は、言うまでもなくあのロックバンドなんでしょうね。彼らに限らずあらゆるロックバンドでしょうけど。カラオケでよく歌うGo Let it Out[るんるん]

Oasis – Go Let It Out HD (Live at Wembley Stadium '00, Noel with a Fender Telecaster)
PC用関連コンテンツ

シェアする