Traffine I/O

日本語

2022-11-18

標本調査

標本調査とは

統計調査には、母集団を全て調査対象とする全数調査と、母集団から標本を抽出して、母集団の性質を統計学的に推定する標本調査があります。以下が全数調査と標本調査の実例になります。

  • 全数調査
    • 国勢調査
  • 標本調査
    • 世論調査
    • 社会調査

全数調査は母集団の全てを調査するため、費用、手間、時間が問題となり不可能となる場合が多々あります。例えば、心理学の調査では、全人類が母集団となるため、全数調査は不可能です。したがって、多くの場合は標本調査が行われます。

標本調査は母集団の中から選ばれた一部の標本を対象に調査を行うため、標本調査の結果は母集団の値、つまり真の値との誤差が生じます。この誤差を標本誤差といいます。標本誤差は確率的なばらつきの幅を示す尺度で表されます。正確な標本調査の推計結果を得るためには、標本誤差を小さくする、つまり母集団のきれいな縮図となるように標本を抽出することが重要になります。

標本抽出方法

標本の抽出方法はいくつか存在します。今回は次の抽出方法を紹介します。

  • 単純無作為抽出
  • 層別抽出
  • クラスター抽出
  • 多段抽出

単純無作為抽出

単純無作為抽出とは、母集団から乱数表を用いてサンプリングする方法であり、もっとも基本的な標本の抽出方法になります。単純無作為抽出は標本抽出が容易である一方、母集団が大きいと母集団の性質を反映できずに真に無作為に抽出することが困難な場合があります。

層別抽出

層別抽出とは、母集団をある特性に基づいてあらかじめいくつかの層に分割し、各層の中から調査対象を無作為に抽出する方法です。例えば、男女比が7:3の高校で20人の学生を対象に意識調査を行う場合、男女比に合わせて男子14名を、女子6名をそれぞれに無作為に抽出することは層別抽出に相当します。

層別抽出の特徴としては、各層の特性を反映するため推定の誤差が小さくなる一方、母集団の性質を事前に知っておく必要がある点が挙げられます。

クラスター抽出

クラスター抽出とは、母集団をいくつかのクラスターに分割し、その中から無作為抽出で選ばれたクラスターにおいて全数調査を行う抽出する方法です。例えば、高校生の平均身長の調査時に、高校を1つのクラスターとみなし、全国から高校を無作為に20校を選び、その20校に通う全校生徒の身長を測定することはクラスター抽出に相当します。

クラスター抽出の特徴としては、クラスターの情報を知っていれば抽出が可能であるため調査の手間を省くことができる一方、クラスター内の調査対象は似通った性質を持ちやすく、標本に偏りが生じやすくなる点が挙げられます。

多段抽出

多段抽出とは、母集団の中から複数の段階で抽出を行う方法です。例えば、全国の世帯を対象とした調査時に、まず全国から30の市町村を無作為に抽出し(第一段)、次にその市町村内で5地区を無作為に抽出し(第二段)、さらにその中で20世帯を無作為に抽出します(第三段)。

多段抽出の特徴としては、抽出効率が良い一方、サンプルサイズが小さい場合に標本に偏りが生じやすくなる点が挙げられます。

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!