石田修二研究室 > データ統計処理 >

ポアソン分布

「ポアソン」です。「ポソン」と読まないようにしましょう。

ポアソン分布とは

2015年の交通事故の死傷者数は,670140人です。これを1億2千万人で割ると,0.0055845 で確率としては0.6%になります。

さて,1人の事故率を $p$ とすれば,$r$ 人が事故にあう確率は2項分布となり,\[ _nC_r p^r (1-p)^{n-r} \] となります。

ところが,この場合の $n$ は我が国の人口であるから非常に大きく,$p$は非常に小さい。

2項分布の平均は $np$,分散は $np(1-p)$ でしたが,ポアソン分布は平均が $np=\lambda$,分散が $np(1-p)$ → $np= \lambda$ と,1つのパラメータしか持たず,平均と分散が等しいという便利な性質を持ちます。

では,次に表計算ソフトや統計ソフトにはどのような関数が用意されているのか見てみましょう。

表計算ソフトでは用意されているものが異なるようです。

Microsoft Excel for macには POISSON.DIST 関数が用意されています。

LibreOffice Calcには POISSON 関数が用意されています。

Rには平均λのポアソン分布の

があります。

ある地域で,1日平均4回交通事故が発生する。交通事故が0回になる確率を求めなさい。(辻谷将明・和田武夫『Rで学ぶ確率・統計』p.26)

まずは,パラメータλを決める必要があります。λは分布の平均と一致するので,この場合交通事故の1日平均の値を使います。$x$ は交通事故の件数になるので,0, 1, 2 …です。

R で計算(dpois(0, 4) と入力)すると,

> dpois(0,4) # 4回が0となる確率
[1] 0.01831564

となる。

Excelでは,POISSON.DIST(0,4,) で求めることができます。

Gretlでは,

自動車は2000マイルにつき1回パンクします。今,1000マイル走った時2回パンクする確率を求めて下さい。(藤沢偉作『統計の初歩』現代数学社,1993年,p.45)

まずパンク率を求めます。パンク率は1マイルにつき,1/2000(0.0005)であり,n = 1000 で非常に大きいので,ポアソン分布を用いることにします。

次にパラメータλを求めます。λ= 1000*(1/2000) になります。$x$ はパンクの回数になるので,2 です。

では,R で計算してみます。

> dpois(2, 1000*(1/2000))
[1] 0.07581633

すなわち,1000回に75回という割合になります。

Gretl でも計算してみます。

ある注射の副作用をうける確率が0.001である時,2000人中(1)3人,(2)3人以上が副作用を受ける確率を求めて下さい。(藤沢偉作『統計の初歩』現代数学社,1993年,p.48)

(1)は次のようになる。

> dpois(3, 2000*0.001)
[1] 0.180447

(2)は次のようになります。

> 1-ppois(2, 2000*0.001)
[1] 0.3233236

左利きの人は3%いるという。100人のクラスで左利きが4人以内いる確率を求めて下さい。(藤沢偉作『統計の初歩』現代数学社,1993年,p.48)

> ppois(4, 100*0.03)
[1] 0.8152632

(例題)ある電気部品の生産工程では、これまでの経験から862個に1個の割合で不良品ができるという。製品は小さいので100個ずつ箱に詰め、それを5箱まとめて梱包し出荷している。検査無しで箱詰めが行われるとすれば、1包あたり少なくとも3個の不良品が入る確率はいかほどか。

p=1/862,n=500 より

λ=500*(1/862)=500/862

Rで計算すると,

> 1-ppois(2,500*(1/862)) # 「少なくとも」なので 1-p の公式で計算
[1] 0.02119005

つまり,1包あたり少なくとも3個の不良品が入るのは,100包あたり約2包の割合であることがわかる。

Gretl の場合,まず2以下の累積確率を求め,1からその値を引けばよい。

グラフを書いてみる。

「平均」に式を入れる場合,=500*(1/862) のように入れる。

ある工場で作られる製品の10%は不良品である。10個の製品中2個が不良品である確率を2項分布とポアソン分布で求めて比較して下さい。(藤沢偉作『統計の初歩』現代数学社,1993年,p.48)

Gretlで計算してみます。[ツール]−[P値ファインダー]をクリックします。

二項分布では次のようになります。

Binomial (p = 0.1, n = 10):
 Prob(x > 2) = 0.0701908
 Prob(x <= 2) = 0.929809
 Prob(x = 2) = 0.19371

ポアソン分布では次のようになります。

ポワソン (平均 = 1):2 = 0.0803014 の右側の領域
 Prob(x <= 2) = 0.919699
 Prob(x = 2) = 0.18394

リンクはご自由にどうぞ。

【データ統計処理】 【石田修二研究室】