石田修二研究室 > データ統計処理 >

適当な標本の大きさ

キーワード:

いろんな説明があるのですが、私は丹慶勝市先生の書かれた『図解雑学 統計解析』(ナツメ社, 2003年)の p.172に書かれている説明が一番、理解しやすいです。そういうことなので、その説明を以下に抜粋しておきます。

母比率 $p$ の区間推定の場合、信頼度 95% の信頼区間の幅は $\displaystyle 2\times 1.96\sqrt{\bar{p}(1-\bar{p})/n}$ であった。ところが、

$$ \bar{p}(1-\bar{p})=-(\bar{p})^{2}+\bar{p}=-(\bar{p}-1/2)^{2}+1/4 $$

により、$\bar{p}(1-\bar{p})$ の最大値は $1/4$ である。したがって、信頼区間の幅は広く見積もってもせいぜい $\displaystyle 2\times 1.96\sqrt{1/4n}$ である。

そこで、実際に母比率 $p$ の区間推定を行うとき、信頼区間の幅がたとえば、0.05以内に収まるようにするには、$\displaystyle 1.96\sqrt{n}\leqq 0.05$ が成り立つように標本の大きさ $n$ を決めればよい。この不等式を $n$ について解くと、$\displaystyle \sqrt{n}\geqq 1.96/0.05=39.2$ により、$\displaystyle n\geqq 39.2^{2}\fallingdotseq 1537$ となる。つまり、標本の大きさ $n$ は少なくとも 1537 あればよいことになる。

(注)平方根を含む式の展開方法については、平方根を含む式の計算を参考に。

(補足)$\displaystyle n\geqq 39.2^{2}\fallingdotseq 1537$ のソースは次の通り

$\displaystyle n\geqq 39.2^{2}\fallingdotseq 1537$

リンクはご自由にどうぞ。

【データ統計処理】