キーワード:規準化(石田注:「基準」ではない!)、標準化、z値(zスコア)
偏差値の元になる考え方です。
様々な平均や標準偏差を持つデータを平均 0、標準偏差 1 に単位を揃えているということです。
求め方は簡単なので手計算でも求められるようにしておこう。
$\displaystyle z=\frac{x-\bar{x}}{s}$ $\bar{x}$:平均 $s$:標準偏差
(注)上の式のソース
$\displaystyle z=\frac{x-\bar{x}}{s}$
成績の場合、z を標準得点と呼ぶことがあります。この式により、偏差値は平均値 50、標準偏差 10 の値を取ることがわかります。
(問題)
ある試験の平均値は54.2点、標準偏差は12.3点だった。このとき、標準化された点数が0の学生の、もとの点数はいくらか。(日本統計学会編『データの分析』東京図書, 2012年, p.89)
平均 $\pm3s$ 以内にデータの大半(約99.7%)が含まれることが期待できるということです。この性質は極めて重要です。
Excelには、データを標準化する STANDARDIZE
関数が用意されています。
(書式)=STANDARDIZE(変数, 平均, 標準偏差)
例えば、平均年齢 55 歳、標準偏差 11 歳のデータ分布にしたがう68歳の標準化データの場合は、次のように設定します。
= STANDARDIZE(68, 55, 11)
あらかじめ、データの平均値や標準偏差がわからない場合は、AVERAGE
関数と STDEV (STDEVP)
関数を使ってそれぞれ値を求めておきます。
関数 scale(x)
を使うことで、データ行列 x を標準化することができます。
コピー機販売のA社には7人の営業スタッフがおり、通常、毎月の平均契約件数が3件/人、平均営業経費が 50,000円/人 程度です。しかし、個人の営業成績にはばらつきがあるため、営業スタッフの個別データをまとめ、今後の指導に役立てることにしました。営業スタッフの契約件数・営業経費を標準化し、それぞれのデータを比較し、営業スタッフの個人成績を評価してみよう。(日花弘子『仕事に役立つExcel統計解析』ソフトバンククリエイティブ, 2008年, p.61)
まずは契約件数と営業経費の平均ならびに標準偏差を求めます。