意味がわかる統計解析』の読書メモです。

表紙

読んだ動機と感想

統計検定 2 級の公式テキストである『統計学基礎』を読んでいたのですが、難しすぎて試験対策にならなかったので代わりにこの本を読み始めました。

統計学入門』では扱いが少なかった (と記憶している) 仮説検定や区間推定について図解が豊富でポイントが整理されていて分かりやすかったです。あと『統計学入門』では扱っていない分散分析やベイズ統計学についてもページが割かれています。

本書は統計検定に向けた本ではないため 2 級の試験範囲を完全にはカバーしていません。不足している部分は公式テキストを確認した方が良いです。例えば、各種指数 (例えばラスパイレス指数) や適合度・独立性の検定の話は載ってないです。

読書メモ

Twitter でのログ

第 1 章「「統計学」にもいろいろある」

  • 記述統計学と推測統計学、ベイズ統計学、といった統計学の様々な分類の紹介。

第 2 章「統計は「資料の整理」から始まる」

  • データの分類や度数分布表による可視化、平均値や中央値といった統計量、分散と標準偏差、偏差値、など。

第 3 章「確率がわかれば、統計に強くなる!」

  • 確率の基礎、確率分布と確率密度関数、平均値と分散の諸公式、正規分布、パーセント点と p 値、正規分布におけるパーセント点、確率変数の標準化について。
  • 標準偏差は正規分布では変曲点までの距離を表すって知らなかった。分散を平均値で表す方法も忘れがちなので導出できるようにしておかねば。
  • 標準化のやり方とか正規分布の再生性とか最初勉強したときは「ふーん」ぐらいの気持ちだったけど、あとで問題解くときにめっちゃ重要だと分かりました。

第 4 章「統計のスタートは「母集団と標本」から」

  • 母集団分布と標本分布、母平均と標本平均、母分散と不偏分散、自由度、中心極限定理、推定量に求められる性質 (普遍性・一致性・有効性)、など。
  • 不偏分散と自由度の話、難しい説明を避けつつ雰囲気を理解させようとしている様が伝わって良かった。以前読んだ『統計学入門』では自由度についてサクッと書かれてて混乱したので。
  • 一点、不偏分散の計算は自由度 (n-1) で割る理由が天下り的に示されているだけなのが気になった。「標本分散の期待値計算で普遍性を確認できる」と一言注釈に書かれていると良いのかな、と思った。

第 5 章「「推定」という方法で、偶然から真の値を見つけ出す」

  • 点推定と区間推定、最尤推定法、母分散が既知・未知の場合の母平均の推定、母比率の推定、母分散の推定、など。
  • (6 節) 母分散が未知の場合の母平均の推定において、標本の大きさが十分に大きいときは不偏分散を母分散として、母分散が既知の場合の計算方法が使える (t 分布を用いなくて良い) とあるけど、その十分に大きいかどうかはどう判断すれば良いんだろ?
  • (7 節) 母比率の区間推定の計算式が全然分かってなかったんだけど、正規分布の既知な母分散を使った母平均の区間推定式を、ベルヌーイ分布の平均値と分散で置き換えたものなのか。覚えることが減ったぞ。
  • やればやるほど推定と検定まるで分からなくなる。パターン多すぎ

第 6 章「「検定」によって「仮説の真偽」を判定する」

  • 検定の意味と検定対象の母数に応じた検定方法の解説。
  • 検定の種類が多いので混乱する。本章に出てくるものをざっくり整理すると次の感じ?
    • 母平均の検定 (母分散が既知・未知)
    • 母平均の差の検定 (母分散が等しい・等しくない (ウェルチの t 検定))
    • 母比率の検定 (二項分布の正規分布近似)
    • 母分散の検定 (χ2 検定)
    • 等分散の検定 (F 検定)

第 7 章「「相関分析」でデータの関係を見つけ出す」

  • クロス集計表や散布図による 2 変量の可視化、正負の相関、共分散と積率相関係数、順位相関係数、単回帰分析、決定係数、偏相関係数、など。

第 8 章「「分散分析」は統計解析のシンボルだ!」

  • (一元配置) 分散分析の意味と仕組み、t 検定と分散分析の違い (2 標本か 3+ 標本か)、など。
  • グループ内変動とグループ間変動から不偏分散を計算し、F 検定を行う。

第 9 章「もう一歩進んだ「分散分析」をマスターする」

  • 二元配置の分散分析において、繰り返しのない場合・繰り返しのある場合・独立ではない (対応のある) データの場合についてそれぞれ解説。
  • 繰り返しのある場合は相互作用を考慮に入れる。

第 10 章「「ベイズ統計学」は人間の経験も取り入れる統計学」

  • 条件付き確率と乗法定理、ベイズの定理、事前確率・事後確率・尤度、理由不十分の原則による等確率の仮定、事前分布と事後分布、従来の統計学とベイズ統計学の違い、最大事後確率 (MAP) 推定、など。
  • 尤度は確率分布 (確率密度) を与える関数。
  • 事前確率が分からないとき、理由不十分の原則によって等確率を仮定するか、もしくは経験的に確率が分かっているときにそれを取り込める。ゆえに “人間の経験も取り入れる統計学”。