【統計:不偏分散】
不偏分散とはなんだろうか。
文字通り、偏りのない分散である。母分散を推定する際には標準分散ではなく、不偏分散の方が使われる。
スポンサードサーチ
不偏分散の式
不偏分散
ちなみに標本分散
である。
ちなみに、
(確率変数、ここでは身長やサイコロの目の数などの値と思ってくれて良い)
二つの式において、確率変数
また、
これらをもとに再度上記二つの式を見比べてみると、標本時における式だということが分かる。
違いは何か
不偏分散と標本分散の違いは、分母が
たったそれだけの違いだが、統計においては標本分散はあまり使われず、
それはなぜだろうか。
なぜ不偏分散を使うか
実は、標本分散には誤差があるということが不偏分散を使用する元になっている。
というわけでどんな誤差なのか、またどのように不偏分散を導出できるかを解説していくが、そこまで詳しく知りたくないという方はここでサイトを閉じてほしい。
標本分散の式をゴリゴリ変形していく
標本分散の式は、
であるが、括弧の中身である
また、
これを代入して、展開すると、
となる。
ここで、2項目の
さらに、3項目も同様に
そして、さらに2項目のシグマの中は、
平均
よって、
となり、標本分散
と変形できることになる。
そして、
というわけで、標本分散の式を式変形すると、標本平均と母平均のずれが出てくることが分かる。
つまり、このまま標本分散の式を使っては困るというわけだ。
標本分散の式から不偏分散を導出する
ここで、変形した標本分散の式において、母分散を
となる。
ここで、
となり、
となるが、
となる。
これを
となり、標本分散
よって、
となり、これは最初に説明した不偏分散
というわけで、不偏分散と母分散が一致するため、標本分散は使われず、より正しい不偏分散が使われる。
本来は期待値である
また、今回は数式でゴリゴリ書いて説明したが、多くのサイトをみるとさらに期待値という概念が入ってくる。
今回はややこしくなるため書かず説明したが、統計における期待値というのは平均値のことだ。つまり、標本の大きさ
例えば、標本分散
となり、
この式が言いたいことは、『標本サイズnが大きいとき、標本分散はだいたい
が、式の中に期待値が入ると理解が難しくなるため、今回は省いたというわけだ。
スポンサードサーチ
まとめ
標本分散の式は使わず、不偏分散の式を使う。
これだけ覚えておけばOK!