『分析者のためのデータ解釈学入門』を読みました。統計学の教科書を何冊か読んだり、統計検定を受験したりして、統計学の理論についてはある程度勉強しましたが、じゃあそれらを使って普段の業務でどうデータを扱っていけばいいのか自信がなかったので読みました。

表紙

取り扱っている事柄の多くは今まで読んだ教科書にも載っていたことで自分にとっては字面上の目新しさはなかった気がしますが、それらをデータの取り扱いや解釈の仕方という違った視点から概説してもらうことで、「理論は分かるがどう使えばいいか分からない知識」だったものが「日々のデータ分析に使える実用的な知識」へと昇華させる道筋が見えた気がします。

特に以前はよく分かっていなかった統計モデリングの話(どうやってモデルを選ぶのか)や、そもそも数理モデルとは何なのかというところが理解できてよかったです。

よく「○○という事象は✕✕という確率分布によく従っていることが知られている」みたいなことが書かれてるけど、それはどうやって決めてるんだろう?自分がそれを判定するにはどうしたら良いの?観測値から近い分布を探すための指標がある?近似できそうな可能性のある確率分布を全部適用してみて、誤差が一番少ないものを選ぶって感じ?

『統計学入門』を読んだ (2019-03-20)

姉妹書に数理モデルと分析モデルに関する本もあるようなのでそちらも読んでみます。

目次
第1部 データの性質に関する基礎知識
- 第1章 観測は簡単ではない
- 第2章 誤差とばらつき
- 第3章 データに含まれるバイアス
- 第4章 交絡因子と因果関係
- 第5章 データサンプリングの方法論
第2部 データの分析に関する基礎知識
- 第6章 データの扱い
- 第7章 一変数データの取り扱い
- 第8章 変数の間の関係を調べる
- 第9章 多変量データを解釈する
- 第10章 数理モデリングの要点
第3部 データの解釈・活用に関する基礎知識
- 第11章 データ分析の罠
- 第12章 データ解釈の罠
- 第13章 データ活用の罠