【正規分布②】すでに知っているかもしれないが説明しておく

数学

前回:【正規分布①】すでに知っているかもしれないが説明しておくの続き。

正規分布の式は積分できないので、このままでは何も求めることができない。
そこで、まずはμ=1,σ=1の正規分布を考えてみる。この、N(μ,σ)=N(0,1)を標準正規分布と言う。
また、N(μ,σ)は正規分布を表している。

スポンサードサーチ

標準正規分布

一般の正規分布は、

f(x)=12πσexp(12(xμσ)2)

だったが、ここで標準正規分布は、μ=0,σ=1だったので、これを代入して、

f(x)=12πexp(x22)

となる。

で、例えば以下の範囲での面積を求めてみようと思う。

式で表すと、
1+112πexp(x22)dx
となる。
だが、ここまで持っていたとしても積分はできない。

正規分布表というものがあるで!

積分はできないというのは、正確には不定積分はできないということだ。
つまり、exp(x22)に関する不定積分(変数が残っている形)はできないが、定積分(具体的な数値)は求めることができる。

標準正規分布における値は既に求められており、標準正規分布表に全てが書いてある。
>> 標準正規分布表

上記リンクでは、片側のZいった分だけ求めることができる。
この場合で行くと、Z01(このブログでいうならx=01)の面積は、0.3413になる。片側で約3.5割の面積をかカバーしていることになる。

また、x=1+1の範囲では、片側0.3413を2倍して0.6826になり、これだけで約7割の面積をカバーしていることになる。

標準は一般ではない

だが、ここまではあくまでμ=0,σ=1の分布であり、世の中そんな綺麗な数字にはならない。圧倒的にN(μ,σ)の場合の方が多い。

そこで、一般の正規分布をμaまで積分した場合を考えてみる。aというのは、任意の範囲で積分することを表す。

式で表すと、
μa12πσexp(12(xμσ)2)dx

ここでexpの中xμσzと置く。

z=xμσ

次にzで積分をしようと試みる。zを微分すると、
dzdx=1σ
積分範囲μaはそれぞれ、

x=μz=μμσ=0
x=az=aμσ

よって、Zの範囲はz=0aμσとなり、この範囲を積分することになる。

で結局のところ、以下のようにzの変数に変換できる。

μa12πσexp(12(xμσ))dx

0aμσ12πexp(z22)dz(z)

ここで、(★z)式は、μ=0,σ=1の時の標準正規分布の式と同じ形をしている。

(標準正規分布の式)
0b12πexp(x22)dx(x)

というわけで、(z)式に対して、標準正規分布で使用した標準正規分布表が使える。

注意するのは範囲だけ

これで、一般の正規分布に対しても、標準正規分布表から面積(割合)を求められることが分かった。
ただ、注意すべきなのは範囲が変わるということだ。

x=μa

z=0aμσ

このzにおけるxμσの部分を、zにおける標準化変換という。

標準化変換
z=xμσ

μ,σは分かっている。後は問題によってxの範囲を決めてしまえば、z求まるわけだ。

スポンサードサーチ

正規分布を使った問題

正規分布はこんな風に使うんやで、ってことで例題を解いてみよう。

30000人があるテストを受験して、その時の成績がN(63.6,13.42)になった。
(1)75点の人は何番か
(2)20000番目の人は何点か

(1)の解説

とりあえずこの正規分布を図で表すと以下のようになる。

で、この試験の受験者は30000人である。
(1)の75点の人は何番かというのは、全体の数が分かっていて、75点までの割合が分かれば求まりそうだ。というわけで、標準化変換をかましていく。

μ=63.6,σ=13.4であり、x=75を代入すると、z=xμσ=7563.613.4=0.8507となる。
ちなみに、標準正規分布表を見てみると、0.3023と分かる。

ただ、この0.3023というのは平均である63.6点から75点の範囲なので、0点から63.6点までも考慮する必要がある。
0点から63.6点までは正規分布全体のうちの半分なので0.5となる。よって、0.5+0.3023=0.8023となる。

求めたいことは75点の人は何位になるかということなので、30000×0.8023=24069
で、ここで求めた順位はおしりから数えたものになるので、全体から24069を引くと、5931となる。よって(1)の答えは5931番となる。

また、正規分布表から求めた値より0.0007分大きいことを考慮して、24069番より大きいと考え、24070番と治して5930番と求めてもいい。

(1)の答え:5931番か5930番

(2)の解説

20000番目の人を考える前に、15000番目の人の点数は63.6点付近であることを思い出そう。

でちょっとややこしいのが、63.6点付近より点数が高くなると順位は小さくなるので14999以下になる。そして問題となっている『20000番目の人が何点か』ということは、平均点63.6点より低いことが分かる。そこに注意して求めてみよう。

ただ、求める割合は変わらない。20000/30000 = 0.666…となり。半分の0.5を引くと、0.166…となり、この値を標準正規分布表で逆に0.1666…に近い値を探す。すると、z=0.43のとき、0.1664となって近そうだ。というわけで、z=0.43を採用する。

標準化変換の式で、普通はzを求めるが、今回はxについて解いていく。
すると、x=z×σ+μ=0.43×13.4+63.6=69.362となる。
で、5000番目の人であればこれが答えなのだが、今求めたいのは20000番目の点数である。平均戸の差分は69.362-63.6 = 5.762点となる。よって、この平均からこの点数分低い時が20000番目に値する人なので、63.6-5.762 = 57.838点となる。で実際の点数に治すと58点となる。

だが、標準正規分布表から逆算した際に、少し小さい値を選んだため57点でも良い。

(2)の答え:58点か57点

まとめ

今回は正規分布の具体的な求め方を解説した。
重要なことは標準正規分布表と標準化変換だ。とりあえず、これを覚えておけばいい思う。