【統計の平均・分散・標準偏差】
ここでは、統計で使う、平均と分散、そして標準偏差について説明していく。
スポンサードサーチ
平均
平均$\bar{x}$は、
と定義される。一般には平均とは、相加平均(算術平均とも)のことを指す。
平均を言葉でいうと、『大小の差がなく、同じ量・長さで揃っていること』であるため、上の式で平均の定義を満たしている。
分散・標準偏差
まずは分散から紹介する。
分散$s^2$は、
と定義される。
分散とは、ばらつきのことで、『平均値からどれだけ離れているか』を表す指標になる。。。が、大体の人は分散から暗記を始めてしまう。が、その必要はない。
分散とは、平均値からどれだけ離れているか、ということなので、まず使う値は平均:$\bar{x}$だ。
平均$\bar{x}$は上で求めたので確認してほしい。
分散の式を導出してみる
分散は、平均$\bar{x}$からのどれだけ離れているかということなので、比べる値$x_i$との差を取ればいい。
これでもいいような気がするが、ちょっと問題がある。
平均より大きい$x_i$はプラスに、平均より小さい$x_i$はマイナスになってしまうことだ。
例えば、平均$ \bar{x}=50 $として、$x_1=48, x_2=52$だとする。
分散の案1式に代入してみると、それぞれ2と-2になってしまい、それらの総和を取ると0になってしまう。
本来なら『平均値からどれだけ離れているか』なので、48も52も同じ距離離れているため4になってほしいところだ。
このプラス・マイナスの問題を解決するには、絶対値チックな形にできれば何とかなりそうだ。
ということで、次の案2を考えてみる。
今度は2乗しているところに注目してほしい。
2乗すると、括弧の中身がマイナスになったとしても2乗されてプラスになる。この性質は使えそうだ。
ということで、案2は良いところまで行っていることが分かった。ただ、このままでは総和をとっただけなので、最後に個数nで割って、一つ当たりのばらつきを出してみる。
となり、これは最初に定義した分散$s^2$となる。下の分散の式と見比べてみてほしい。
しかし、ここで勘のいい人は、なぜ分散がsの2乗なんだ?とか、そもそも2乗しているならルートを付けないといけないのでは?と思うだろう。
安心しておくれ。それが標準偏差である。
標準偏差
さっそくだが、標準偏差の式はこうなる。
急に複雑になったと感じるが、ルートを取っただけだ。
ちなみに、分散は下の式
日本語で書くと、こうなる。
スポンサードサーチ
まとめ
まとめと言っても、式を並べるだけ。
言いたかったのは、別に暗記することなんてないよってこと。意外と単純に導出はできるので、それ以外の式でも『なぜこうなるのか』と一度考えてみてほしい。
以上、平均・分散・標準偏差の簡単な導出方法でした。