【統計の平均・分散・標準偏差】

数学

ここでは、統計で使う、平均と分散、そして標準偏差について説明していく。

スポンサードサーチ

平均

平均$\bar{x}$は、

$${\overline{x} = \frac{1}{n}\sum_{i=1}^{n}x_i}$$

と定義される。一般には平均とは、相加平均(算術平均とも)のことを指す。
平均を言葉でいうと、『大小の差がなく、同じ量・長さで揃っていること』であるため、上の式で平均の定義を満たしている。

分散・標準偏差

まずは分散から紹介する。
分散$s^2$は、

$$ 分散:s^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i-\overline{x})^2$$

と定義される。
分散とは、ばらつきのことで、『平均値からどれだけ離れているか』を表す指標になる。。。が、大体の人は分散から暗記を始めてしまう。が、その必要はない。

分散とは、平均値からどれだけ離れているか、ということなので、まず使う値は平均:$\bar{x}$だ。
平均$\bar{x}$は上で求めたので確認してほしい。

分散の式を導出してみる

分散は、平均$\bar{x}$からのどれだけ離れているかということなので、比べる値$x_i$との差を取ればいい。

$$\sum_{i=1}^{n}(x_i-\overline{x})・・・分散の案1$$ 

これでもいいような気がするが、ちょっと問題がある。
平均より大きい$x_i$はプラスに、平均より小さい$x_i$はマイナスになってしまうことだ。

例えば、平均$ \bar{x}=50 $として、$x_1=48, x_2=52$だとする。
分散の案1式に代入してみると、それぞれ2と-2になってしまい、それらの総和を取ると0になってしまう。
本来なら『平均値からどれだけ離れているか』なので、48も52も同じ距離離れているため4になってほしいところだ。

このプラス・マイナスの問題を解決するには、絶対値チックな形にできれば何とかなりそうだ。
ということで、次の案2を考えてみる。

$$\sum_{i=1}^{n}(x_i-\overline{x})^2・・・分散の案2$$ 

今度は2乗しているところに注目してほしい。
2乗すると、括弧の中身がマイナスになったとしても2乗されてプラスになる。この性質は使えそうだ。

ということで、案2は良いところまで行っていることが分かった。ただ、このままでは総和をとっただけなので、最後に個数nで割って、一つ当たりのばらつきを出してみる。

$$ \frac{1}{n} \sum_{i=1}^{n}(x_i-\overline{x})^2・・・分散の定義と同じ$$

となり、これは最初に定義した分散$s^2$となる。下の分散の式と見比べてみてほしい。

$$ 分散:s^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i-\overline{x})^2$$

しかし、ここで勘のいい人は、なぜ分散がsの2乗なんだ?とか、そもそも2乗しているならルートを付けないといけないのでは?と思うだろう。
安心しておくれ。それが標準偏差である。

標準偏差

さっそくだが、標準偏差の式はこうなる。

$$ 標準偏差:s = \sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_i-\overline{x})^2}$$

急に複雑になったと感じるが、ルートを取っただけだ。
ちなみに、分散は下の式

$$ 分散:s^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i-\overline{x})^2$$

日本語で書くと、こうなる。

$$ 標準偏差 = \sqrt{分散}$$

スポンサードサーチ

まとめ

まとめと言っても、式を並べるだけ。
言いたかったのは、別に暗記することなんてないよってこと。意外と単純に導出はできるので、それ以外の式でも『なぜこうなるのか』と一度考えてみてほしい。

$$平均:{\overline{x} = \frac{1}{n}\sum_{i=1}^{n}x_i}$$
$$ 分散:s^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i-\overline{x})^2$$
$$ 標準偏差:s = \sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_i-\overline{x})^2}$$

以上、平均・分散・標準偏差の簡単な導出方法でした。