【偏差値】

数学

ここでは偏差値について説明する。
偏差値というと、大学受験に聞いたことある人が多いと思うが、あれはいったいどのような値なのだろうか。

スポンサードサーチ

偏差値を理解する

まず、言葉の定義から。

偏差値とは、データの値が、平均50、標準偏差10のデータに変換(正規化)したときに示す値のことである。そして、偏差値はデータの分布が正規分布に近いことを前提として算出している。

と、言葉では意味不明なので、ここでは偏差値の式について説明する。

偏差値の式

偏差値を式で表すと以下のようになる(wiki参考)。

$$ T_i = \frac{10(x_i-\mu_x)}{\sigma_x} + 50 $$

意外に見たことない人も多いのではないかと思う。
早くも逃げ出したくなりそうだが、ちょっと待ってほしい。まずは怪しい変数を明らかにしていく。

まず、$\mu_x$(ミュー、エックス)は、

$$\mu_x = \frac{1}{N}\sum_{i=1}^{N} x_i$$

と表される。

そして、$\sigma_x$(シグマ、エックス)は、

$$\sigma_x = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i-\mu_x)^2}$$

と表される。

ギャーっとなりそうだが、$\mu_x$, $\sigma_x$は、それぞれ平均と標準偏差の式である。
よく分からんって人は、
すでに知ってるかもしれないが導出しておく【統計の平均・分散・標準偏差】を見てほしい。

そして、$x_i$はデータの値である。
例えば、全国で国語のテストを行い、そこから全国の平均($\mu_x$)と標準偏差($\sigma_x$)が出せたとする。そして、その分布が正規分布に従っていたとする。
このとき、自分の国語の点数が68点($x_i$)だったとすると、偏差値の式から求めることができる。

$$ T_i = \frac{10(x_i-\mu_x)}{\sigma} + 50 $$

むむっ!?よく分からんぞという方は、とりあえず全国平均$\mu_x=68$を入れてみればよい。すると、分子が0になり、偏差値50という値が出る。

$$ T_i = \frac{10(68-68)}{\sigma_x} + 50 = 50$$

つまり、偏差値はというのは、全国平均と同じ値を取ればを50になるように補正されていることが分かる。

なぜこの式なのか

変数の説明が済んだところで、この式の形について考えてみる。
$$ T_i = \frac{10(x_i-\mu_x)}{\sigma‗x} + 50 $$

ここで、$×10$や$+50$を取ってみる。

$$ \frac{(x_i-\mu_x)}{\sigma_x} $$

ここで、分子と分母に分けて考えてみる。
分子は『データひとつを見た時のばらつき』、分母は『データ全体とのばらつき』といえる。(標準偏差は分散(ばらつき)が元になっている)

分子ではあるデータと平均の差がダイレクトに効いてくる。
では、分母はどうだろうか。

分母は、
ばらつき$\sigma_x$が 大きいほど影響が小さくなり
ばらつき$\sigma_x$が小さいほど影響は大きく出る

という性質を上記の式から導き出せることができる。
そして、最初に省いた×10や+50は、人が見やすいように×10をしたり、100の真ん中を表す50にくるように+50されているだけである。

例えばどう考える?

さて、偏差値の式の意味が一通り分かったところで、『あー納得』な例を出したいと思う。
偏差値の例でひっかかってくるところは、おそらく『ばらつき』のあたりと思うので、ばらつきが小さいときの例を見てみる。

例えば、みんな60点台しかとらなかったテストで、一人だけ90点を取ったとする。
このとき、全体のばらつきで見るとほとんどが60点だったため、ばらつきは小さいことが予測できる。そして、ばらつきが小さい中で、90点を取ったとなると偏差値はかなり大きい値をとることになる
偏差値の式も、上記のケースをうまく反映していることを確認してほしい。

$$ T_i = \frac{10(x_i-\mu_x)}{\sigma‗x} + 50 $$

ちなみに偏差値は、マイナスに行くこともあるし、100を超えることもるそうな。
ということで、偏差値については以上。

スポンサードサーチ

まとめ

偏差値について説明した。
偏差値の大事な部分は、$\frac{(x_i-\mu_x)}{\sigma_x}$の部分で、残りの係数や+50の補正はおまけである。
また、偏差値は正規分布にしたがうこともお忘れなく。

正規分布もいずれやろうかしらね