外観
以下のような目次構成
- 事象と確率
- 確率分布と母関数
- 分布の特性値
- 変数変換
- 離散型分布
- 連続型分布と標本分布
- 極限定理、漸近理論
- 統計的推測の基礎
- 区間推定
- 検定の基礎と検定法の導出
- 正規分布に関する検定
- 一般の分布に関する検定法
- ノンパラメトリック法
- マルコフ連鎖
- 確率過程の基礎
- 重回帰分析
- 回帰診断法
- 質的回帰
- 回帰分析とその他
- 分散分析と実験計画法
- 標本調査法
- 主成分分析
- 判別分析
- クラスター分析
- 因子分析・グラフィカルモデル
- その他多変量解析手法
- 時系列解析
- 分割表
- 不完全データの統計処理
- モデル選択
- ベイズ法
- シミュレーション
前半(12章くらいまで)は『現代数理統計学の基礎』などでも詳しく学べるのでまあよし。
深入りしすぎずにサクッと勉強するのが難しかった、確率過程やノンパラ、回帰診断、グラフィカルモデルあたりの章はありがたい存在だと思いませんか?
それに、練習問題があって、解説もちゃんとついてる。(略)とかになっていない!
仮にこの本の解説がわかりづらくて他書を参照するにしても、どこまで勉強すれば良いのかの指針になるだけでもかなり役立つよね。
これまでの公式テキストと比べたら圧倒的に神書
これまで、統計検定からは↑この表紙のシリーズの公式テキストが出ていた。
初学者に全く優しくないし、練習問題の解説たまになかったりわかりにくかったりとあまり充実していなかった。
今回は本編もいくぶん丁寧になったし、例題も全項目にあるし、
メインのテキストとして十分使えると思う。
微積分と行列を使えないと門前払い
このテキストを買う人は、統計検定を受けるつもりで検討するはず。
2週間くらい真面目にやれば受かる2級までをやってきた人が手に取るとp7のモーメント母関数あたりで理解不能になると思う。
いわゆる数3くらいの微積分を使わざるを得ないから。
仮に微積分はOKでも、その後に多変量を扱う中で行列の扱いがわからないと詰まる。
数学の本は大体巻末に付録として微積分と行列の解説があるけど、この本はない。
exp()系の積分できません、とか行列の固有値知りませんって人が読めるのはp6までなので注意。
副読本としては以下がおすすめ。
チョット数学できる人
理系大学出身者、数学が得意な文系
普通の微積分の本とか使うと、統計学でほぼ出てこない三角関数の微積分ばかりやらされるので微妙。
本書は統計学でよく見るe(ネイピア数)の絡んだ微積分とかをよく扱ってくれる。(ヤコビアンとかも教えてくれる)
「完全にゼロからやさしく」みたいな感じじゃないので数学に苦手意識のある人はつらいかも。
数学なんもわからないひと
数2までしかやったことない!とかそういう場合は、
入門の入門的な感じでこの本が良い。
「わからない人」にフォーカスしてくれていて、
「要はこんなことやってるよ。計算してみるとこんなかんじな」
とすごく直観的にもわかりやすい。
この本でイメージをつかんでから、他の本で手を動かして勉強してみるのがおすすめ。
その他2級からの橋渡しになる本
行列の操作や確率密度関数の扱いが直観的に何をしているのかめちゃくちゃ素朴でわかりやすいのですべての人に見てほしいのは以下のシリーズ。
データサイエンスとかまで見据えていく際の土台になる理論の知識の説明の仕方が非常にわかりやすいし、「この式は画的にどうなってるのか」 を確認しながらやれるので、
抽象的でわかりにくい高次元の扱いの苦手意識も払拭できる最強の2冊。
実装しながらやってみると理解が早い
正則化回帰とか多変量解析や時系列解析も範囲に含んでいるが、数学的な証明をよんで一発で完全理解はちょっと難しい。
Kaggleの過去のコンペやトイデータ使って2変量くらいで実装してみてプロットするとすこし理論にあやふやなところがあるときに理解の助けになると思う。
例えばLassoをKaggleのnotebookをコピペして動かしてみて、回帰係数の値を確認してみると納得感がかなりあがる。
英語が苦手なら日本語のサイトや以下に挙げるような解説書で実装してもいいと思う。
とにかく、文字での抽象的な解説よりも実データを入れて計算させてみると印象にも残りやすいのでおすすめ。
迷ったら買っていい本
で、この本はどちらかというと、学習の指針書みたいなもんで、試験範囲表とか辞書的な役割になるかもしれないけど、
有用なことは間違いないので買って損することはないと思っている。
以上が感想でした。