【書評】今話題の”データサイエンティスト”でなくても必要な統計リテラシーを学ぶ「統計学おは最強の学問」(ダイヤモンド社)西内啓

Web・IT

Googleのチーフ・エコノミストのハル・ヴァリアン氏が「10年後もっとも魅力的な仕事」としてデータサイエンティストを紹介したり、昨今のビッグデータというバズワード絡みで、データを解析・分析出来る人材が不足している点などから、今統計学が注目を集めています。週刊ダイヤモンドでも特集されるくらいなので、かなり大衆的になってきたということでしょう。

本書は、そんな統計学を最強の学問ととらえ、なぜ統計学が最強の学問なのか、統計学の成り立ちから、社会的な課題や経済・ビジネス・マーケティング上の課題における取組、日常的な場面での統計学の活用方法を、非常に平易な言葉でわかりやすく紹介してくれています。

なぜ統計学が最強の学問なのか

著者曰く、統計学が最強の学問であると主張する理由としては以下を挙げています。

どんな分野の議論においても、データを集めて分析することで、最善で最速の答えを出すことが出来るから。

その特徴的な事例として、19世紀に疫学の分野において成果を発揮した「疫学の父」と呼ばれるジョン・スノウの例を挙げています。ロンドンで大流行したコレラ病対策の際に、経験や勘による対策がさらなる状況の悪化を進めたのに対し、統計学的なアプローチにより、コレラ病の真因は分からずとも、因果関係のある環境要因を判別し、飲料水の水源さえ変えさえすればよいという結論を導き出し、見事解決したのです。

医学においては、人命にも大きく関わり失敗が許されない事から、こうした統計学的なエビデンスが重要視されるようになっているなど、こうした学問が実生活においていかに有用かを理解することが出来ます。そして、それは、教育やビジネスの場面でも活用されるようになってきています。

”ビッグデータ”というバズワードについて

統計学が昨今注目されている理由として、ビッグデータというワードともに語られる事が多いのですが、ビッグデータ自体は、ITの進展により、処理できるデータ量の拡大と高速化やデジタル領域における行動トラッキングが容易になることで、計測できるデータの種類もまた増えてきた事で、こうして集められた大量のデータ(ビッグデータ)を何かに活用出来ないかという事で話題になっているわけです。

しかし、著者に言わせれば統計学的な観点で、実際には、それほど膨大なデータがなくとも、必要最小限のデータでも同様の結論・意思決定は導きだせると言います。それがサンプリング調査という考え方です。データは多い方が分析の精度は高まるかも知れませんが、仮に1%程度の精度を高めるために、ビッグデータを集計・解析するためのシステム投資を数億円をかけておこなうべきなのかと疑問を呈しています。そこで、著者は、

正しい判断を行うのに、最小十分なデータを扱うこと

を推奨しています。では、どの程度のサンプルがあれば、必要最小限なのか、そうしたことを考える意味でも、統計学的な知識が必要となってくるわけです。

データをビジネスに活かすための3つの問い

自身も仕事がら、マーケティングやビジネスにおける各種アンケート調査のデータや、サイトのアクセス、通販ビジネスにおけるレスポンス分析など様々なデータを扱う立場におり、日頃からデータの見方については、気を付けていますが、たまに意味のないデータ分析結果を目にすることもあります。

著者はビジネスにおいてデータを活用するために、次の3つの問いが重要であると言います。

【問1】何かの要因が変化すれば売上は変化するのか?
【問2】そうした変化を起こすような行動は実際に可能なのか?
【問3】変化を起こす行動が可能だとして、そのコストは利益を上回るのか?

いたって当たり前のように見えますが、実際のビジネスの現場においても、これらにきちんと答えられるような分析を出来る人間が少ないと感じています。

本書でも例として挙げられていますが、広告・キャンペーンの結果などアンケート調査で分析を行ったりしますが、認知がどの程度売り上げに貢献するのか、そんな単純な因果関係も実は簡単には導きだせずに、「認知が高かったから良かった」なんて結論に至っていたり、そもそもの集計方法自体が公平なものではなかったり、意味のない調査にお金をかけている例を挙げ、統計学的な視点の必要性を述べています。

こうした「因果関係」をきちんと理解しないで調査・分析設計を行うのは無意味です。続いて統計学のキモとなるものとして「誤差」を挙げています。

本書で例として挙げているのは、ある通販系会社でDMを送付した場合の送付者・未送付者の購買金額の差についての分析です。

単純に、ランダムに送付者・未送付者をサンプリングしてDMを送付した結果をトラッキングすると、確かに送付者の方が購買金額が高くなる傾向が見えたとしますが、それが果たして偶然の「誤差」なのか、統計学的に優位な「差」と言えるものなのかを見極める事が統計学的な重要な要素だと言います。それを検証するための「p値(実際に何の差もないのに、誤差や偶然によってたまたまデータのような差が(正確にはそれ以上に極端な差を含む)が生じる確率」「カイ二乗検定」について説明しています。

自身も通販サイトやWeb広告において良く実施する「A/Bテスト」と呼ばれる複数クリエイティブをランダムに掲出して、どのクリエイティブの反応が良いのかを判断する方法を行う事がありますが、これを統計学的には「ランダム化比較実験」というようです。この「A/Bテスト」の結果が誤差なのか、有意な差のあるものなのかをどのように検証するのかもわかりやすく解説されていて非常に参考になりました。

こうしたランダム化比較実験などの手法は実験計画法と呼ばれ、現代統計学の父と呼ばれるロナルド・A・フィッシャー氏が1935年に初めて体系を確立したものだそうです。こうしたランダム化による方法は、医学・疫学だけでなく、教育や政治における政策の効果検証などにも活用することが出来るなど、統計学が最強の学問である事をさらに強調するのですが、ランダム化にも限界があることを認めています。

それは3つの壁があり、1つが「現実」の壁。「絶対的なサンプル数の制限」と「条件の制御不可能性」という物理的な限界。2つ目が「倫理」の壁。ランダム化によって明らかに一方に有害であることや不利益を被る場合は実験自体を行う事が倫理的に許されないということ。3つ目の壁は「感情」の壁。一時Amazonでも来訪者によって価格が異なるのではないかといった事が話題になり、批判を浴びたが、こうした事例も反感を買う要因となるため、実施しがたい。等の事。

こうしたランダム化出来ない場合には統計学は無力なのかという決してそんなことはなく、その場合の処方箋についても本書で紹介されている。それは、ケースコントロール研究と呼ばれるもので、基本的には同様な属性(性年代、社会階層、居住地域など)について同様の条件を満たすグループ同士を比較して、例えば、喫煙の有無によってグループを分けた際に、肺がんの発症可能性が高いのはどちらか、どの程度高いのかを比較するなどの方法。

こうしたデータを分析するためにt検定だとか、カイ二乗検定、分散分析・回帰分析などの解析手法をどういった場合に、どの検定方法を使うべきかも解説している。このあたりは少しずつ数式なども出てきてとっつきにくくなる部分はあるものの、概要を捉える意味では必要十分な内容となっています。

統計家たちの仁義なき戦い

本書の良い点は、上述のような実務的な統計学についての解説にとどまらず、統計学もそれを使う立場の人によって、捉え方が異なる事を俯瞰してみている点は非常に興味深いです。次の6つの立場で、それぞれ考え方が異なると言います。

①実態把握を行う社会調査法
②原因究明のための疫学・生物統計学
③抽象的なものを測定する心理統計学
④機械的分類のためのデータマイニング
⑤自然言語処理のためのテキストマイニング
⑥演繹に関心を寄せる計量経済学

正確さをとことん追求する①の社会調査の専門家、妥当な判断をつけようとする②の疫学者や生物統計家など、それぞれの立場よって統計の捉え方が異なるのも面白いが、データ分析の結果に求めるものの差によるところなのでしょう。

さらに、いずれの分野にも横断して対立があるものとして確率の考え方にも2つあり、頻度論派かベイズ論派かなども紹介されており、この考え方も非常に興味深いです。

今後、様々な場面で統計学のリテラシーは、いずれの分野においても必要となるものなので、後半は若干読み進めるのが大変かもしれませんが、統計学のさわりを理解するのには良いのではないでしょうか。

コメント