標準偏差とは何なのかをわかりやすく丁寧に説明する記事。


こんにちは。すけっちです。

今回は、統計のお話です。

心理学の統計は特に「心理統計」という科目になっていて、

学生はむっちゃ統計勉強します。

今回はその中でも「標準偏差」というキーワードをわかりやすく解説したいと思います。

そもそも「偏差」とは、

標準偏差について説明する前に、

「偏差」について説明します。

偏差とは、一言で言えば、

各データの値の「平均との差」

です。

$$偏差=データの値-平均$$

で計算されます。

具体例で説明

下のグラフを見てください。

A~Eの棒の長さを棒グラフで表したものです。

A~Eの棒の長さの平均は100㎝です。(図の赤線のラインです)

その100㎝より、データの値が、上にでっぱっている、あるいは下にへこんでいる場合、

その過不足分が「偏差」です。

前述のように、

$$偏差=データの値-平均$$

で計算されますから、

個々のデータが、

  • 平均値より小さい場合はマイナス
  • 平均値より大きい場合はプラス

になります。

「偏差」の「偏」という字は、「かたより」と訓読みしますから、

データ個々の値のかたよりを示す数値とも捉えられるかもですね。

標準偏差とは

偏差の説明をもとに、標準偏差の説明をします。

標準偏差とは、ざっくりいえば、

「標準となる偏差」のことです。

つまり、

「偏差の幅はまちまちだけど、全体的に見たら大体このくらいだよね」

という数値です。

(後ほど説明しますが、「偏差の平均」ではありません)

標準偏差はどのように算出されるのか

標準偏差は下の式で求められます。

$$標準偏差=\sqrt偏差の2乗の平均$$

「偏差の2乗の平均」を特に「分散」といい、これも散布度の一つです。

ちなみに、冒頭の棒の長さの例の標準偏差を求めると、”約59.67″となります。

80と50の間の値になりましたね。

このデータの「標準の偏差」としてふさわしい値が算出された気がします。

このように、標準偏差は、標準となる偏差の値なんです。

標準偏差は散布度の一つ。

また、標準偏差は、散布度の一つです。

散布度とは、データの散らばり具合を表す指標のことです。

つまり、

$$標準偏差=\sqrt偏差の2乗の平均$$

の式から標準偏差が分かることによって、

平均値だけではわからない

データの散らばり具合がわかるということです。

データの散らばり具合とは

下の図で説明してみます。

上の①~③の棒グラフは、見るからに値の散らばり方が違いますよね。

しかし、平均値はすべて100㎝で同じなんです。

ですから、平均値だけでは、散らばり具合を想定できないんです。

こういうときに、標準偏差をはじめとする散布度は大切なんですね。

標準偏差はなぜ散らばり具合を表せるのか

$$標準偏差=\sqrt偏差の2乗の平均$$

上記の式で求められる標準偏差は、なぜ散布度として扱えるのでしょうか。

もう一度、棒の長さの例に戻りましょう。

当然、散らばり具合は、①<②<③という順になりますね。

ここで、それぞれの偏差に注目してみましょう。

プラスマイナスの値は気にせず、偏差の幅(つまり絶対値)に注目すると、

この度合いも①<②<③となっているのが分かるかと思います。

つまり、散布度は、偏差の幅が大きければ大きいほど、大きな値を取る、ということです。

もう一度、標準偏差の計算式を見てみましょう。

$$標準偏差=\sqrt偏差の2乗の平均$$

偏差を2乗することでプラスマイナスを度外視できますから、

偏差の幅自体が大きいほど、標準偏差が大きくなることが分かります。(もちろん分散も大きくなっています。)

実際、①~③の標準偏差を算出すると以下のようになります。

薄い黄色で囲んだところは、「平均±標準偏差」の範囲です。

このように、散らばり具合が大きいデータ、

つまり、偏差の幅が大きい傾向を持つデータの方が、標準偏差が大きくなります

注意:平均偏差ではない

計算式を見るとわかるように、標準偏差は、「偏差の平均」ではありません。

(偏差の平均は「平均偏差」といいこれも散布度の一つです。)

あくまで、標準であるのみで、平均ではないのです。

実際、標準偏差と平均偏差は異なる値を取ります。

この前出のこのグラフの平均偏差は、

$$平均偏差=\frac{80+80+0+50+50}{5}=52$$

となり、標準偏差59.67とは異なっています。(近い値ではありますが)

偏差の幅の平均値を出せばいいものを、

なぜ「2乗の平均を出してからルートをとる」なんて

面倒なことをしているのかと言えば、

統計的仮説検定との相性がいいからです。

なので、今はとにかく、計算方法に慣れてその仕組みを理解することが優先です。

まとめ

標準偏差は、

  • 「標準となる偏差」で、
  • 散らばり具合を表す指標である散布度の一つである。

というのがお分かりいただけたでしょうか。

ではまた!


参考文献:

山田剛史・村井潤一郎(2004)よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)ミネルヴァ書房

吉田寿夫(1998)本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本北大路書房