石田修二研究室 > 石田修二ホームページ > データ統計処理 >(関連:サイト内検索

p値とは

推定や検定で,p値という言葉は必ず出てきます。大変重要な概念なので,自分の理解を深めるということでここにメモ書きです。

このpは確率の意味です。では何の確率なんでしょうか。

P値の意味には次のように書かれています。

2つの集団の平均が同一であったとしても(帰無仮説が真だとしても),観測された程度の差を生じる確率は3%ほどある。

もしくは,

同一の集団からランダムなサンプリングを行った場合,97%の実験では観測されたものより小さい差を生じるであろうし,3%の実験においては観測されたものより大きな差が生じるであろう。

有意水準は5%,1%,0.1%が通常用いられます。これらは慣例的に用いられているものであり,数値には強い根拠があるものではありません。ただ,社会科学分野の学術研究では検定の際,通常これらの値が用いられています。もちろん,数値が小さくなればなるほど誤って帰無仮説を棄却している可能性が小さくなるので,帰無仮説を棄却し対立仮説をとりたいような一般の研究では,数値が小さいほうが研究者には歓迎されるのが普通です。有意水準は以下のような表記がよく使われます。論文の文中や表の中でよく出てくるので覚えておくといいでしょう。

5%水準p < .05*
1%水準p < .01**
0.1%水準p < .001***

(例題)

統計村の製薬会社が新発売した,いびき改善薬ホゲホゲの効き目について,製薬会社は2週間以内に90%の患者が治ったと主張しています。統計村の医者が15人にホゲホゲを処方したところ,治ったのは11人だけだったので,医者は製薬会社のデータに懐疑的です。製薬会社の主張が正しいのか,証拠(医者が得たデータ)を詳しく調べて判定してみましょう。

検定統計量は,仮説の検定に使う統計値です。治った人の数をXとすると,標本数が15のとき,製薬会社によると0.9の確率で治るので,X~B(15, 0.9)

帰無仮説に当てはまらない部分が危険域です。治った人の数が少ないほど,製薬会社の主張は間違っていることになります。危険域を決める前に,有意水準を決めます。有意水準は α で表し,帰無仮説H0を棄却する基準となる値です。%で表され,製薬会社の主張を5%の有意水準で検定する場合,危険率は0.05です。Xを治った人の数とすると,P(X < C) < α,ただし α = 5%

(実際にRで binom.test(11,15,0.9) で計算してみるとよい。

練習


リンクはご自由にどうぞ。

【石田修二】  【データ統計処理】