石田修二研究室 > データ統計処理 >

標準化

キーワード:規準化(石田注:「基準」ではない!)、標準化、z値(zスコア)

偏差値の元になる考え方です。

様々な平均や標準偏差を持つデータを平均 0、標準偏差 1 に単位を揃えているということです。

求め方は簡単なので手計算でも求められるようにしておこう。

$\displaystyle z=\frac{x-\bar{x}}{s}$ $\bar{x}$:平均 $s$:標準偏差

(注)上の式のソース
$\displaystyle z=\frac{x-\bar{x}}{s}$

成績の場合、z を標準得点と呼ぶことがあります。この式により、偏差値は平均値 50、標準偏差 10 の値を取ることがわかります。

(問題)

ある試験の平均値は54.2点、標準偏差は12.3点だった。このとき、標準化された点数が0の学生の、もとの点数はいくらか。(日本統計学会編『データの分析』東京図書, 2012年, p.89)

標準化得点の性質

平均 $\pm3s$ 以内にデータの大半(約99.7%)が含まれることが期待できるということです。この性質は極めて重要です。

Excelでの操作

Excelには、データを標準化する STANDARDIZE 関数が用意されています。

(書式)=STANDARDIZE(変数, 平均, 標準偏差)

例えば、平均年齢 55 歳、標準偏差 11 歳のデータ分布にしたがう68歳の標準化データの場合は、次のように設定します。

= STANDARDIZE(68, 55, 11)

あらかじめ、データの平均値や標準偏差がわからない場合は、AVERAGE 関数と STDEV (STDEVP) 関数を使ってそれぞれ値を求めておきます。

Rでの操作

関数 scale(x) を使うことで、データ行列 x を標準化することができます。

実例

コピー機販売のA社には7人の営業スタッフがおり、通常、毎月の平均契約件数が3件/人、平均営業経費が 50,000円/人 程度です。しかし、個人の営業成績にはばらつきがあるため、営業スタッフの個別データをまとめ、今後の指導に役立てることにしました。営業スタッフの契約件数・営業経費を標準化し、それぞれのデータを比較し、営業スタッフの個人成績を評価してみよう。(日花弘子『仕事に役立つExcel統計解析』ソフトバンククリエイティブ, 2008年, p.61)

まずは契約件数と営業経費の平均ならびに標準偏差を求めます。


【データ統計処理】