数学Ⅰで学習する、分散と標準偏差の求め方と問題の解き方をまとめました。
分散の平方根が標準偏差になりますが、分散を求めるには平均値と偏差を利用する方法と、平均値の2乗と値の2乗の平均を利用する方法の2パターンあります。
標準偏差を利用した偏差値の求め方についても触れています。
分散と標準偏差とは
分散、標準偏差はデータがどれだけ散らばりがあるかを示すものです。
分散と標準偏差を求めるには、平均値と偏差も必要になります。
平均値…データの合計÷データの個数
\(\bar x=\displaystyle\frac{x_1+x_2+x_3…+x_n}{n}\)
偏差…データの各値と平均値との差
\(x-\bar x\)
分散、標準偏差はいずれもデータの散らばり具合を表しますが、標準偏差は分散の平方根の絶対値となります。
そして平均点±標準偏差の範囲でデータの68.3%が、平均点±標準偏差×2の範囲で95.4%、平均点±標準偏差×3の範囲で99.7%のデータが含まれることを意味します。
分散の求め方
分散は偏差の2乗の和を、データの個数で割ったものになります。
分散…偏差の2乗の和÷データの個数
\(s^2=\displaystyle\frac{(x_1-\bar x)^2+(x_2-\bar x)^2+(x_3-\bar x)^2…+(x_n-\bar x)^2}{n}\)
各値の2乗の平均と平均の2乗の差でも求められます。
\(s^2=\bar{x^2}-\bar{x} ^2\)
例題 次のデータの分散を求めてみましょう。
60, 50, 30, 40, 20, 80, 70, 100, 60, 30
平均は54です。
「偏差の2乗の和÷データの個数」で求める場合
\((60-54)^2+(50-54)^2+(30-54)^2+(40-54)^2+(20-54)^2\)
\(+(80-54)^2+(70-54)^2+(100-54)^2+(60-54)^2+(30-54)^2\)
\(=5640\)より、
\(s^2=\displaystyle\frac{5640}{10}=564\)
「各値の2乗の平均と平均の2乗の差」で求める場合
\(60^2+50^2+30^2+40^2+20^2+80^2+70^2+100^2+60^2+30^2\)
\(=34800\)より
\(\bar{x^2}=\displaystyle\frac{34800}{10}=3480\)
\(\bar{x} ^2=2916\)
\(s^2=\bar{x^2}-\bar{x} ^2=3480-2916=564\)
分散は\(564\)になります。
標準偏差の求め方
標準偏差は分散の平方根になります。
\(s=\sqrt{\displaystyle\frac{(x_1-\bar x)^2+x_2-\bar x)^2+x_3-\bar x)^2…+x_n-\bar x)^2}{n}}\)
\(s=\displaystyle\sqrt{\bar{x^2}-\bar{x} ^2}\)
上の例題で分散が\(564\)だったので、標準偏差は
\(s=\sqrt{564}≒23.7\)となり、54点±23.7点の範囲に68.3%が含まれていると予想できます。
(参考)偏差値の求め方
偏差値は標準偏差を利用して、次の式で求められます。平均点だと偏差値が50になるよう設定されています。
\(\displaystyle\frac{(x-\bar x)}{s}\times 10+50\)
自分の得点と平均点との差を標準偏差で割ったものに10をかけ(※)、50を足すと偏差値が求められます。(※ 標準偏差を10で割ったものをかける、と考えてもOK)
自分の得点が80点、平均点が65点、標準偏差が30だとすると、
\(\displaystyle\frac{(80-65)}{30}\times 10+50=55\)より偏差値55となります。
【問題】分散と標準偏差
問 次のデータの分散と標準偏差を求めましょう。
12, 9, 6, 7, 9, 9, 12, 8