ここでは、数学Ⅰ「データの分析」や数学B「統計的な推測」で出てくる「分散(ぶんさん)」についてまとめてます。
博士!
分散って何なの?
ほぅ、難しい言葉が出てきたの。
分散を説明していく前に大雑把なイメージはわかるかの?
んー散らばってるかな。
ジェンガが崩れてバラバラみたいな?
だいたい合っとるのぅ。
そのイメージで大丈夫じゃ。
そうなの?
なんか難しい式が出てきてわからなかったんだけど。
一目見たときは難しそうに見えたかもしれんが、
一つずつ考えていけばそれほど難しくないのじゃ。
それでは説明していくかの。
分散について
会話形式で分散のイメージを補完
テストが返ってきたときに平均点が気になるかの?
自分の点数を見た後に気になるね。
それは何故じゃ?
自分の点が平均よりも上だったら満足だし、
下だったらガッカリするかな。
ふむ。
他には気にならないか?
他に?うーん。
一番いい点数の人が平均からどのぐらい離れているのかとかかな。
そうじゃ。
そのみんなの点数が平均からどのぐらい離れているのかがある程度わかるのが分散じゃ。
なるほど??
分散のイメージ
みんなの点数が平均からどれぐらい離れている(散らばっている)のかがわかるのが、分散です。
分散の値が大きいほど、平均点から大きく離れているし、値が小さいほど、平均点からほとんど離れていないということがわかります。
- 分散の値が大きい:データがより散らばっている
- 分散の値が小さい:データがあまり散らばっておらずまとまっている
分散が大きいほど、みんなの点数差が大きくて、
分散が小さいほど、みんな同じぐらいできる感じだね。
分散の求め方
分散は、平均からどれぐらい離れているのかの指標なので、求め方も似たような感じになります。
まずは、各データ(点数)が平均からどれぐらい離れているのかを1つずつ計算する必要があります。これを偏差(へんさ)と言います。
得点が平均からどれぐらい離れているのかは「偏差」なんだね。
偏差をすべて足すと0になってしまうので、そのままだと計算ができません。また、平均から大きい値や小さい値など、プラス(正)の値とマイナス(負)の値が出てきて見にくいです。
そのため、分散を求めるときは、すべての偏差を2乗して、すべてプラス(正)の値にしてしまいます。
その後、データの個数で割って、平均を出したものが分散です。
つまり、分散とは、平均からどれぐらい離れているのか(偏差)の2乗の平均と言えます。
式で書くと以下のようになります。また、分散(variance)の頭文字を取って、大文字のVをよく使用します。
計算するときに+だったりーだったりするとめんどくさいもんね。
2乗してしまえばすべて+になるから計算しやすいの。
あとがき
分散を比較すれば、どれぐらいデータが散らばっているのかわかるのですが、2乗しているため使いにくい値になってます。単位が\(点^2\)や\(個^2\)になり、単純に比較ができなくなるからです。
そこで、データを比較するときには、√を取り付け、単位を戻した「標準偏差」を使用することが多いです。
コメント