こんにちは、ウチダです。
「偏差(へんさ)」とは、データの個々の数値から平均値を引いた値であり、よく耳にする
とは全くの別物です。
データ $x_1$,$x_2$,…,$x_n$ の平均値を $\overline{x}$ とする。
このとき、$x_i$ の偏差を $x_i-\overline{x}$ と定義する。
[ふきだし set=”悩む男性”]「偏差」という言葉がややこしいよね。[/ふきだし]
[ふきだし set=”悩む女性”]偏差そのものは、どういう意味を持っているのかしら?[/ふきだし]
よって本記事では、偏差の求め方から偏差の意味、また偏差に成り立つ性質まで
- 東北大学理学部数学科卒業
- 教員採用試験に1発合格 → 高校教諭経験アリ
の僕がわかりやすく解説します。
偏差の求め方【平均値との差を考えよう】
偏差とは、個々のデータに対して与えられるものであり、「データ $-$ 平均値」で定義されるものです。
少し練習してみましょう。
$$3 \ , \ 5 \ , \ 1 \ , \ 9 \ , \ 7 \ , \ 2 \ , \ 8$$このとき、それぞれの偏差を求めなさい。
偏差を求めるには、まず平均値を求める必要があります。
定義に従い求めると…
$$\frac{3+5+1+9+7+2+8}{7}=\frac{35}{7}=5$$
となります。
≫参考記事:平均値・中央値・最頻値はどう使い分ける?【3つの代表値を詳しく解説】
平均値さえわかれば、あとは単に差を求めるだけです。
データ $x_i$ | $3$ | $5$ | $1$ | $9$ | $7$ | $2$ | $8$ | 計 $35$ |
---|---|---|---|---|---|---|---|---|
偏差 $x_i-\overline{x}$ | $-2$ | $0$ | $-4$ | $4$ | $2$ | $-3$ | $3$ | 計 $0$ |
[ふきだし set=”ウチダ”]表からわかる通り、偏差の和は必ず $0$ になります。これはあとで証明します。[/ふきだし]
このように、偏差の和は必ず $0$ になるので、このままだとあまり使う意味がありません。
よって、平均値からの距離を表すことができる「偏差の $2$ 乗」を上手く使っていきましょう。
偏差だけでは意味がない?【偏差の2乗や偏差の積がポイント】
偏差を使って定義される代表的なものはこちら
$2$ つのデータの比較のときは、$2$ 乗の代わりに「積」を使います。
[ふきだし set=”ウチダ”]偏差の $2$ 乗であればすべて正の値になるため、和は $0$ になるとは限りませんね。[/ふきだし]
偏差そのものにあまり意味はないですが、「偏差の $2$ 乗」および「 $2$ つの偏差の積」には意味があります。
それぞれの詳細は、上記のリンクから解説記事をご覧ください。
偏差の和が必ず0になることの証明
それでは最後に、偏差の和が必ず $0$ であることを証明したいと思います。
まず、変量 $x$ が $x_1$,$x_2$,…,$x_n$ の $n$ 個のデータで作られているとします。
このとき、平均値 $\overline{x}$ は
$$\overline{x}=\frac{x_1+x_2+…+x_n}{n}$$
です。
ここで、偏差の和を考えると…
と、確かに $0$ になることが示せました。
※この数式は横にスクロールできます。
かなり丁寧に式変形を行いました。
自分の手で証明することは理解の促進につながりますので、ぜひ一度は示しておきましょう。
偏差に関する記事はこちらから
本記事のポイントをまとめます。
- 偏差は「個々のデータと平均値との差」である。
- 偏差の和は必ず $0$ になるから、それだけではあまり意味がない。
- 偏差の $2$ 乗の平均値が「分散」、偏差の積の平均値が「共分散」である。
もう一度関連記事のリンクをまとめておきますので、興味のある方はぜひあわせてご覧ください。
- 分散の求め方とは?【標準偏差との違いもわかりやすく解説します】
- 標準偏差の求め方と意味とは?【分散との違いもわかりやすく解説します】
- 偏差値とは?【偏差値60はどのくらいスゴイのか、求め方まで解説します】
- 共分散とは【共分散公式を含む求め方2通り・相関係数との違い】
- 相関係数とは?【強弱の目安・公式を含む求め方2通り・性質2選の証明】
おわりです。
コメントを残す