Traffine I/O

日本語

2022-04-03

推測統計学

推測統計学とは

推測統計学は、研究者が標本から収集した情報に基づいて母集団に関する結論を導くことができる統計学の分野です。標本で観察された特徴やパターンを分析し、母集団に関する一般化、予測、および推定を行うことが含まれます。推測統計学は、社会科学、自然科学、経済学、医学などの様々な分野で重要な役割を果たしています。

母集団と標本

母集団とは、研究者が興味を持つ個人、オブジェクト、または観察の完全な集合を指します。ほとんどの場合、時間、コスト、および物流上の制約のため、全体の母集団を研究することは不可能です。そのため、研究者は、母集団の情報を収集し、推測を行うための標本を使用します。

Population and sample
Sample size definition

推定と統計的検定

推測統計には大きく推定と検定という二つのタイプがあります。

推定

推定は、標本データを使用して母集団のパラメータを推定する基本的な概念です。推定には、点推定と区間推定の2つの主要なタイプがあります。一般に、推定技術は、サンプリングプロセスに伴う不確実性と変動を考慮しながら、母集団パラメータの正確で精密な推定を提供することを目的としています。

仮説検定

仮説検定は、研究者が母集団パラメータに関する特定の主張または仮定に対する証拠を評価することを可能にする広く使用される推測技術です。仮説検定のプロセスには、次のステップが含まれます。

  1. 帰無仮説(H0)と対立仮説(H1)を設定
    帰無仮説は、関心のある変数間に効果や関係がないことを示す文言であり、対立仮説は、効果や関係が存在することを示します。

  2. 適切な検定統計量を選択
    検定統計量は、標本データから計算され、帰無仮説に対する証拠を評価するために使用される数値です。異なる統計検定には、データのタイプと母集団に関する仮定に応じて異なる検定統計量があります。

  3. 帰無仮説の標本分布を決定
    このステップでは、帰無仮説が真である場合の検定統計量の分布を特定します。標本分布により、帰無仮説が真である場合に、検定統計量またはそれ以上の極端な値を観察する確率を計算することができます。

  4. p値を計算
    p値は、標本データから計算された検定統計量と同じように極端であるか、それ以上に極端であるような検定統計量を観察する可能性を表します。p値が小さい(通常0.05未満)場合、帰無仮説に対する強力な証拠があり、研究者は対立仮説を採用して帰無仮説を棄却する場合があります。

  5. 決定を下す
    p値と事前に指定された有意水準(通常0.05)に基づいて、研究者は帰無仮説を棄却するか、棄却しないかを決定します。p値が有意水準次の場合、結果は統計的に有意であり、帰無仮説が棄却されます。

点推定と区間推定

Point and interval estimate
Point and Interval Estimation

点推定

点推定は、母集団パラメータの最良の推定値として機能する単一の値を計算するために標本データを使用する方法です。点推定値を提供する統計量を点推定器と呼び、一般的な点推定器には、サンプル平均(母平均を推定するための)やサンプル比率(母集団比率を推定するための)などがあります。

Point estimate
Point and Interval Estimation

区間推定: 信頼区間

点推定は、母集団パラメータの最良の推定値を1つ提供しますが、推定プロセスに関連する不確実性を伝えることができません。区間推定は、母集団パラメータが確率的に落ち着く可能性がある値の範囲を提供し、特定の信頼度で表現します。

Interval estimate
Point and Interval Estimation

信頼区間は、一般的な区間推定の1つであり、点推定値、推定の標準誤差、および適切な確率分布(t分布や正規分布など)から構成されます。信頼区間は通常、次の形式で表されます。

点推定値 ±(臨界値×標準誤差)

信頼度(通常は95%)は、信頼区間が真の母集団パラメータを含む確率を表します。

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!