【厳選3冊】ビジネスを見据えたデータサイエンスや統計学の入門書

データサイエンス
Pocket

ビジネスの現場など具体的な応用例もあり、骨のある入門書は本当に稀

ビッグデータというワードがバズって以来、データサイエンスに対する関心が高まっている。

自分もその一人で、大学で統計に関する講義をたくさん履修したし、統計検定1級もトライした。

統計やデータサイエンスに関する本はたくさん手に取るけれど、プログラミングなどの技術に偏ったもの、学問としての統計学に終始してしまうものばかりで、結局データサイエンスは実社会でどのように活用されているのか(特にビジネス)のイメージのつく情報がなかった。

実際、データサイエンスを専門にしている企業などともかかわった。そのうえで実務レベルまでしっかりイメージできて難しくない本はこの3冊だった。

 

その問題、数理モデルが解決します

大学卒業までに彼氏ができる確率、内定を取るための数理的アプローチなど、題材が身近で読みやすいと思う。とはいえ巷にあふれる算数で解説するなんちゃってデータサイエンス本とかと比べると本質的な数学を扱うので中盤できついかもしれない。

でも線形代数が出てこないので高校数学レベルの知識で十分。

確率変数の何たるかを丁寧に書いてあるところが非常に好感が持てる。

確率変数と実現値の区別がついていないと統計学の書籍で自習する際に勘違いを起こしやすい。

条件付き期待値とかで大文字と小文字が混在する解説などで頭を抱えることになると思う。

もちろん、現実には数理モデルをたてても実際やってみたら思わぬ障壁があってモデル通りの成果が出せなかった。なんてことは往々にしてある。

けれど、「考え方の方向性としてはこんなモデルがたてられるだろうな」とか「この事象は正規分布を仮定して考えられそうだから○○くらいになりそうだな」という頭があるだけで、思考スピードと質がかなり上がると思う。

数理モデルを通じてセンスを身に着けられる本といっていいと思う。

統計学が最強の学問である [実践編]

こちらは『その問題、数理モデルが解決します』に比べると、かなりビジネスの実務に寄っている。

西内さんなりの分析の型が懇切丁寧に解説されていて身につくと思う。

『その問題、数理モデルが解決します』 で、数理的なアプローチへの魅力を感じたら守破離の守の部分としてのやくわりが取れるように思う。

「分析の型」が身につくまでは、3回くらい読み返すことになるかもしれない。

けれど、データから、人間の勘や常識、経験からは導き出せないようなアイデアを発見する可能性のある分析が身につくなら安いもんだと思う。

また、分析したはいいが、極端な例えをすると、夏にアイスが売れるから、季節を永久に夏にすればよい。というような現実に即さない結果になることもある。そうなってしまった場合の対処なども書いてあり、本当に親しみが持てる。

深く突っ込みすぎずに割と厳密な説明をしているので基本的にはわからなくなったあたりでGoogle先生を活用しながら読んでいけばハードルは高くないと思う。

分析の際にはExcelを使うといいと思う。

Pythonとか使って高度な手法で分析するのがカッコいいと思っているかもしれないが、厳密にわかっていない分析をしても猫に小判だし、何より他人に説明できないし仮に成果が上がっても再現性がアヤシイ。

しかもExcelってバカにできないくらいの高性能。

偉そうなこと言うのはExcel使いこなしてから言えって統計学の教授が言ってたけど本当にその通りだと思う。

同じ西内さんの著書でこちらも併せて参照されたい。内容は似たり寄ったり。

本書の分析の型が身についてきたら『データサイエンティスト養成読本』みたいなのを読みながら自分でプログラミングなども学んでいくといいと思う。

確率思考の戦略論

元USJ森岡さんの本。

これもある種の数理モデルのマーケティングへの適用。

『その問題、数理モデルが解決します』 的なことをプロがやったらこうなった。みたいな印象で読んでほしい。

数理的な内容はγ分布の混合分布みたいなものが出てきたりするので一部はあきらめてもいいと思う。

負の二項分布って使いどころあったんか(笑)とか思いながら巻末を眺めたりした。

マーケティングの本質的な解説書として読むこともできるけれど、数理的アプローチの実用例であり、成功例として純粋に感動してほしい。

「ここまでやれるんか。統計学すげえな」

そう思って憧れや興味が湧けば一番上達への近道になると思う。

ただ、本書で注目すべきところは、

このように数理モデルに基づいて施策を取ったが、アウトカム(売上)に最も大きなパラメータはプレファレンスであるという点。

要は、ブランド力とかコンテンツ力が一番大事だよということ。

おわりに

入門と言い張ったが、きっと本当の意味で万人がこれを読んで理解できるかといわれるとそうでもないと思う。

けれど、この基準で思考することができていると”勘”がいいといわれると思う。

データサイエンスや統計を専門にするのでなければこのレベルを抑えていれば相当リテラシーの高い人材だと思う。

こういったデータに対する思考をもって、相手をexcitedな気分にさせられる価値を提供するスキルを磨けば敵なしだなぁ。

と思っている。

よんでくれてありがとうございました~

コメント