【統計:母集団・標本】

数学

今回は、母集団と標本のお話
このふたつはかっちりとした言葉で説明するよりも、具体例を挙げた方が分かりやすい。

スポンサードサーチ

母集団は鍋の味噌汁

いきなりたとえ話で申し訳ないが、例えばあなたが味噌汁を作ったとしよう。
そのとき、味見をして、味噌汁の味が薄いかどうか確かめないだろうか?

このとき、

  • 母集団:味噌汁が入った鍋
  • 標本:味見ですくった味噌汁

になる。

これで以上だ。

なぜ母集団と標本で分けるのか

母集団と標本としては以上なのだが、これで終わるわけにもいかない。
そもそも、母集団と標本は、母集団における平均・分散を求めたいというところから始まる。

ハ?

となりそうだが、ここで味噌汁を登場させよう。
味噌汁が入った鍋を母集団、味見するために取ったスプーン一杯の量を標本としよう。このとき、味見と言うのは、スプーン一杯の量から、鍋に入った味噌汁がどんな味かを確かめる行為をしている。

スプーン一杯の量がうすければ、鍋の味噌汁もきっとうすいし、スプーン一杯の味が濃ければ、鍋の味噌汁の味もきっと濃いだろうという事が分かる。
もちろん、2回3回と味見を繰り返していけば、味の正確性は上がるし、さらに、味見する場所を偏りが無いようにいろんな場所から味見をすれば味の精度は上がる。

じゃあ、全部味見すればいいじゃない

味見の回数を増やせば、もちろん味の精度は上がる。
しかし、鍋にある味噌汁すべてに味見をすることはできない。できるかもしれないが、今日の分の味噌汁はなくなってしまう。ご飯のために味噌汁を作っていて、その為の味見だったのに飲みつくしてしまっては意味がない。

このように、母集団と言うのはすべての量を図ることが現実的に難しいときに使われる。
現実的に難しいが、母集団のうち、ちょっとだけ取ってきて(味見をして)、その量を測りたい!という訳だ。味見で取ってきた量が標本となる。

見たい値は分散と平均

さて、母集団がすべてを見ることが難しい量だということが分かったところで、母集団の何が知りたいのかを押さえてみる。

母集団の中でも、特に母集団における平均と分散が知りたい量として出てくる。
母集団では、このふたつは母平均・母分散と呼ばれる。

この母平均・母分散を母数と言い、この母数を求めるためにいくつかデータを取り(標本をとる)、そのデータのにおける平均・分散を求める。
これらを標本平均・標本分散という。

ちょとまとめてみよう。

  • (1)母集団の母数(母平均・母分散)を求めたい
  • (2)標本をとる(ランダム抽出)
  • (3)標本から標本平均・標本分散を求める
  • (4)標本平均・標本分散から母数を推し量る(推定)

いくつか専門用語も使ったが、今の説明で何となく分かるはず。
(実は(4)に関してはちょっと違うが、ここでは上記を信じてほしい)

推定の実例

標本から母数を推し量ることを推定と言う。ただ、そんなこと現実生活であるだろうか?
実は結構ある。ここでは、実際の推定方法については延べないが、こんなことに応用できるという例を挙げる。

  • 選挙速報:開票率1%で本当の結果を当てる
  • 工場で生産したポテチの内容量を調べたい
  • 世界の男性の平均身長

選挙速報は、もろに標本(出口調査)から母数を推定している。
推定した値が、実際の結果と合うのは統計のおかけである。

また、一番多そうな事例は、工場で生産したものに対する平均・分散である。
例えば、工場で生産されるポテトチップスの容量はいくらか?を考えるときに、生産されたポテチの袋を全部開けてはかりで測るのはやりたくない。さすがに会社の損害が大きすぎる。こんなときに、母集団と標本の話を使う訳といいわけだ。

また、世界中の男性の平均身長を求めたい、という時にも使える。
実際に世界中の男性一人一人に対して身長を求めることは不可能なため、同じように無作為にデータを抽出し標本平均・分散を出して推定することになる。

スポンサードサーチ

まとめ

というわけで、今回は母集団と標本に関してだった。

  • 母集団の母数(母平均・母分散)を求めたい
  • 標本を取る(ランダム抽出)
  • 標本から標本平均・標本分散を求める
  • (※)標本平均・標本分散から母数を推し量る(推定)

※実際には違うが、ここでは標本平均・標本分散から推定する、ということで覚えて遅れればOK

実際にどのように推定する方法は、また別の機会で。