石田修二研究室 > データ統計処理 >

母集団と標本

標本調査では、調査の対象全体を母集団といい、母集団から取り出されて、直接調査の対象となるものを標本(サンプリング)といいます。

また、母集団の資料の個数を母集団の大きさといい、標本の資料の個数を標本の大きさといいます。

  1. 農林水産省が行う稲の作柄調査の場合、母集団はその年の日本の稲全体であり、標本は実際に刈り取って収穫量を調べた稲である。
  2. テレビの視聴率調査の場合、母集団はテレビのある世帯全体であり、標本は実際に調査された世帯である。

ある市の中学生は13784人です。これら全員に数学の基礎力テストを実施し、その中から1200人の成績を取り出して調査しました。このときの調査について次の問いに答えて下さい。

  1. 母集団は何ですか。また、母集団の大きさはいくらですか。
  2. 標本は何ですか。また、標本の大きさはいくらですか。

解答は次の通りです。

  1. 母集団はある市の中学3年生、大きさは 13784 です。
  2. 標本は取り出された 1200 人、大きさは 1200 です。

(例題)
ある県で、その県の高校に通っている高校生1,000人を無作為に抽出し、将来その県で生活したいかどうかを調査した。この調査において、母集団と標本、標本の大きさを答えなさい。

(解答)

(例題)
ある企業の顧客として登録されている人の中から無作為に1,000名選び、この1,000名に電話をかけて、小学生の子どものいる人600名に子どものお小遣いに関する調査を行った。
このお小遣いの調査で、母集団と標本、標本の大きさを答えなさい。

(解説)電話をかけたのはある企業に顧客として登録されている人であるが、小学生の子どもがいない人は調査から除外されているので、ここでの母集団は「ある企業に顧客として登録されている人のなかで小学生の子どもを持つ人」全体になる。

(答)

A高校の1年生320人全員について学籍番号のリストを作成し、このリストから乱数を用いて10人の生徒を選んだ。このとき結果的に選ばれた全員が男子であった。このとき適切なものを次の1〜4のうちから1つ選べ。(統計検定3級 第1回問10)

  1. 母集団は全国の高校であり、標本はA高校である。
  2. 母集団はA高校全員であり、標本は選ばれた10人の生徒である。
  3. 母集団はA高校の生徒全員であり、標本は選ばれた1年生10人である。
  4. 母集団はA高校の1年生男子全員であり、標本は選ばれた1年生男子10人である。

(答え)2

総務省統計局の実施している家計調査の調査方法の説明が以下に記してある。

家計調査は,全国の世帯を調査対象とした標本調査であり,層化3段抽出法(第1段−市町村,第2段−単位区,第3段−世帯)により世帯を選定している。

家計調査における母集団と標本についての説明として,適切な組み合わせを,次の 1 〜 5 のうちから1つ選びなさい。

日本統計学会編『統計学I:データ分析の基礎 オフィシャル スタディノート』p139より)

  1. 母集団は日本人全体,標本は全国の世帯
  2. 母集団は全国の世帯,標本は抽出された市町村
  3. 母集団は全国の世帯,標本は抽出された市町村の世帯
  4. 母集団は第2段で抽出された単位区の世帯全体,標本は第3段で抽出された世帯全体
  5. 母集団は全国の世帯,標本は第3段で抽出された世帯全体

(答え)5

(解説)家計調査において,層化3段抽出法というやや複雑な抽出法を用いているのは,無作為抽出をそのまま行うと実際に調査される世帯が全国に散らばってしまい調査の実施が困難なことや,母集団を構成する層のそれぞれについても情報を得ることが理由であって,標本調査の基本的な考え方は全国の世帯からの無作為抽出とかわらない。したがって,母集団は全国の世帯であり,標本は全国から偏りのないように無作為抽出された世帯の全体である。

ある養魚場の池には大量のニジマスがいる。このニジマスの数を推定するために、次のようなステップで調査を行った。

ステップ1:池の中から、ニジマスを80匹採取し、これらのニジマスに目印を付けて元の池に戻した。

ステップ2:数日後、池の中からニジマスを60匹採取したところ、その中に目印のついたニジマスが3匹いた。

この調査のステップ2はある種の標本調査と考えることができる。この場合の母集団、標本、標本の大きさとして最も適切なものを選びなさい。

  1. 母集団:ステップ1で目印をつけた80匹のニジマス
    標本:ステップ2で採取した60匹のニジマス
    標本の大きさ:60
  2. 母集団:ステップ1で目印をつけた80匹のニジマス
    標本:ステップ2で採取した目印付きのニジマス
    標本の大きさ:3
  3. 母集団:ステップ1で目印をつけた80匹のニジマス
    標本:ステップ2で採取した60匹のニジマス
    標本の大きさ:3
  4. 母集団:池のニジマス全体
    標本:ステップ2で採取した60匹のニジマス
    標本の大きさ:60
  5. 母集団:池のニジマス全体
    標本:ステップ2で採取した目印付きのニジマス
    標本の大きさ:3

(答え)4

標本調査では、標本の選び方によっては、標本の特徴が母集団の特徴とは異なる傾向となる場合があります。例えば、インターネット調査でコンピュータの利用割合を調べたとすると、一般の人々でのコンピュータの利用割合よりも利用している人の割合が大きくなる傾向があります。このように、母集団の特徴と標本の傾向が異なる場合には標本に偏りがあるといいます。

自発的に回答する調査

レストランやショッピングセンターに置かれているお客様の声、商品(市政)モニター制度も調査の1つである。このような調査の場合には強い意見を持った人は回答する傾向にあるが、現状に満足していたり、強い意見を持たなかったりする人はあまり回答しない。したがって、回答結果は必ずしもお客様全体の声を反映しているとは限らない。最近では、インターネットを利用した調査も多く行われているが、その多くは自発的に回答する調査であることを考慮する必要があります。

記述統計と推測統計の違いに関する記述について適切でないものを、次の1.〜4.のうちから一つ選びなさい。(統計学II Week1 確認テスト【問題1】)

  1. 記述統計では確率論を用いないのに対して、推測統計では確率論を用いる
  2. 記述統計では母集団を考えないのに対して、推測統計では母集団を考える
  3. 記述統計では母集団を考えるのに対して、推測統計では母集団を考えない
  4. 記述統計では手元のデータを記述・要約するのに対して、推測統計では背後の母集団について推測する

(答え)3. 記述統計では母集団を考えるのに対して、推測統計では母集団を考えない

推測統計では母集団を考えます。

母集団と標本や無作為抽出に関する記述について,次のうちから適切でないものを1つ選びなさい。(統計学II,p145)

  1. 母集団のサイズが大きく全体を調査することが不可能な場合には,その一部を標本として抽出して調査する。その際に,無作為抽出が平均的に偏りのない標本を得る手続きとして基本的な手法である。
  2. 母集団から標本を得ることを標本抽出とよび,標本から母集団に結論を一般化することを統計的推測とよぶ。
  3. 統計調査などによって得られたデータでない場合でも,記述統計的な手法によりデータを要約しデータから有用な情報を得ることができるが,母集団の概念が無いため,そのような情報をどの範囲にまで一般化してよいかについては判断することができない。
  4. データの背後にある母集団が明確に定義できなかったり,母集団が仮想的なものであったりする場合には,推測統計の手法を用いることができない。
  5. 母集団からの無作為抽出の1つの利点は確率論を用いることによって,標本が母集団からどの程度乖離するかについても評価を行うことができる。

(答え)4

(解説)

母集団が明確でなかったり,母集団が仮想的な場合でも,データの背後にそのデータを代表する集団を考えることができ,データがその集団から確率的に得られたものと想定できる場合には,推測統計の手法を用いることができます。ただし,想定が適切であるかどうかについての吟味は必要です。


リンクはご自由にどうぞ。

【石田修二研究室】 【データ統計処理】