分散公式とは?【導出から覚え方までわかりやすく解説します】

こんにちは、ウチダショウマです。

分散の求め方には、定義に従って求める方法と「分散公式」を使って求める方法の $2$ 通りがあります。

あわせて読みたい
分散の求め方とは?【標準偏差との違いもわかりやすく解説します】
分散の求め方とは?【標準偏差との違いもわかりやすく解説します】「分散とは何か」知りたいですか?本記事では、分散の求め方や意味、分散公式、さらに標準偏差との違いまで、わかりやすく解説します。「分散と標準偏差って、結局何が違うの…?」と感じている方は必見です。


さっそくですが、例題を解いてみましょう。

例題.$4$ 個のデータからなる変量 $x$ がある。
$$3 \ , \ 7 \ , \ 1 \ , \ 9$$このとき、分散 $s^2$ を求めなさい。


【定義通りに求める解法】

平均値 $\displaystyle \overline{x}=\frac{3+7+1+9}{4}=5$ より、

\begin{align}s^2&=\frac{1}{4}\{(3-5)^2+(7-5)^2+(1-5)^2+(9-5)^2\}\\&=\frac{1}{4}\{4+4+16+16\}\\&=\frac{40}{4}\\&=10\end{align}

※以降途切れている数式は横にスクロールできます。(スマホでご覧の方対象。)


【分散公式を使った解法】

データ $x_i$

$3$$7$$1$$9$計 $35$

データ ${x_i}^2$

$9$$49$$1$$81$計 $140$

よって、$\displaystyle \overline{x^2}=\frac{140}{4}=35$ より、

\begin{align}s^2&=\overline{x^2}-(\overline{x})^2\\&=35-5^2\\&=10\end{align}



もちろんですが、どちらの解法でも $s^2=10$ と正しい答えを導き出すことができます。

数学太郎のアイコン画像数学太郎
時と場合によっては分散公式の方が優秀そうですね。
数学花子のアイコン画像数学花子

分散公式の導出から覚え方まで、わかりやすく解説してほしいです。


よって本記事では、分散公式の導出から覚え方について

  • 東北大学理学部数学科卒業
  • 教員採用試験に1発合格 → 高校教諭経験アリ

の僕がわかりやすく解説します。

スポンサーリンク
スポンサーリンク
目次

分散公式の導出【平均値の定義が大切です】

【分散公式】
$$s^2=\overline{x^2}-(\overline{x})^2$$


分散公式を言葉で表すと、「( $x^2$ の平均値) $-$ ( $x$ の平均値の $2$ 乗)」となりますね。

それではこの公式を、さっそく証明していきましょう。


【証明】

分散の定義式を展開し、$\displaystyle \frac{1}{n}$ を分配すると、

\begin{align}s^2&=\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+…+(x_n-\overline{x})^2\}\\&=\frac{1}{n}\{({x_1}^2+{x_2}^2+…+{x_n}^2)-2\overline{x}(x_1+x_2+…+x_n)+n(\overline{x})^2\\&=\frac{1}{n}({x_1}^2+{x_2}^2+…+{x_n}^2)-2\overline{x}・\frac{1}{n}(x_1+x_2+…+x_n)+(\overline{x})^2\end{align}

平均値 $\overline{x}$ の定義は$$\overline{x}=\frac{1}{n}(x_1+x_2+…+x_n)$$であり、同様に平均値 $\overline{x^2}$ の定義は$$\overline{x^2}=\frac{1}{n}({x_1}^2+{x_2}^2+…+{x_n}^2)$$であることから、

\begin{align}s^2&=\frac{1}{n}({x_1}^2+{x_2}^2+…+{x_n}^2)-2(\overline{x})^2+(\overline{x}^2)\\&=\overline{x^2}-(\overline{x})^2\end{align}

(証明終了)


ウチダのアイコン画像ウチダ
皆さん平均値はご存じだと思いますが、定義式をしっかりと覚えているでしょうか。分散公式の導出においては、平均値の定義式がカギとなります。


平均値などのデータの代表値については、「平均値・中央値・最頻値はどう使い分ける?【3つの代表値を詳しく解説】」の記事で詳しく解説しております。

練習問題

では、分散公式を使う練習をしてみましょう。

問題.$8$ 個のデータからなる変量 $x$ がある。
$$1 \ , \ 2 \ , \ 4 \ , \ -1 \ , \ 2 \ , \ 4 \ , \ 3 \ , \ 1$$このとき、分散 $s^2$ を求めなさい。

この問題のように、

  • データの大きさが、まあまあ大きい( $n=8$ )。
  • 個々のデータの $2$ 乗の計算が、それほど大変ではない。
    • 今回の場合、最大でも $4^2=16$

以上の条件を満たすのであれば、分散公式を用いた方が圧倒的に速い場合がほとんどです。

【解答】

変量 $x$ と変量 $x^2$ の表を作る。

データ $x_i$

$1$$2$$4$$-1$$2$$4$$3$$1$計 $16$

データ ${x_i}^2$

$1$$4$$16$$1$$4$$16$$9$$1$計 $52$

したがって、分散公式を用いると、

\begin{align}s^2&=\frac{52}{8}-(\frac{16}{8})^2\\&=\frac{52}{8}-4\\&=\frac{20}{8}\\&=2.5\end{align}

(解答終了)

豆知識として、「データの分析では分数ではなく小数で答える場合が多い」ということも押さえておきましょう。

※小数の方がパッと見た時に、大体の数値がわかりやすいため。

スポンサーリンク

分散公式の覚え方

分散公式の覚え方は、まんまですが以下の通りです。

【分散公式の覚え方】
$2$ 乗の平均 $-$ 平均の $2$ 乗
数学太郎のアイコン画像数学太郎
これ、よく順番が逆になっちゃうときがあるんですけど、どうすればいいですか?
ウチダのアイコン画像ウチダ
実は、順番が逆になってもまったく問題ありません!なぜなら、分散は必ず $0$ 以上の値を取るからです。

たとえば先ほどの問題において、「平均の $2$ 乗 $-$ $2$ 乗の平均」と、順番を逆にして計算してみます。

\begin{align}2^2-\frac{52}{8}&=-\frac{20}{8}\\&=-2.5\end{align}

ここで、「分散が必ず正の値を取る」ことを知っていれば、正負をひっくり返して

$$s^2=2.5$$

と求めることができるのです。

数学花子のアイコン画像数学花子
順番を忘れてしまっても、最後に絶対値を付ければなんとかなる、ということね!

もちろん、順番まで覚えているに越したことはありませんが、「分散は必ず正」これだけ押さえておけば、順番を間違っても正しい答えに辿り着けますので、そこまで心配する必要はないですよ^^

分散公式に関するまとめ

本記事のポイントをまとめます。

  1. 分散公式の導出は、「平均値の定義」に帰着させよう。
  2. 分散公式の覚え方は「 $2$ 乗の平均値 $-$ 平均値の $2$ 乗」
  3. 別に逆に覚えてしまっても、プラスの値にすれば問題ないです。

分散の定義式と分散公式。

どちらの方がより速く求めることができるかは問題によって異なります。

ぜひ両方ともマスターしておきましょう♪

数学Ⅰ「データの分析」の全 $18$ 記事をまとめた記事を作りました。よろしければこちらからどうぞ。

おわりです。

よかったらシェアしてね!
スポンサーリンク

コメント

コメントする

目次
閉じる