2022-11-21

T検定

T検定とは

T検定は、2つのグループの平均を比較し、それらが有意に異なるかどうかを判断するための推論統計の一種です。T検定の「T」は、ウィリアム・シーリー・ゴセットが開発したStudentの疑名を表しています。StudentのT検定の開発以降、異なるタイプのデータや実験デザインに対応するために、WelchのT検定や対応のあるT検定など、さまざまな適応が開発されてきました。

T検定は、帰無仮説検定の原理に基づいて動作します。最初にグループ間に有意な差がないと仮定します（帰無仮説）。次に、T検定を実行し、p値を得ます。p値は、帰無仮説が真である場合に、データ（またはより極端なデータ）を観測する確率を示しています。この確率が低い場合（通常は0.05未満）、帰無仮説を棄却し、グループ間に統計的に有意な差があると結論します。

T検定の重要な側面の1つは、データが正規分布に従い、平均に対称な鐘型の曲線であるという仮定を置いていることです。また、グループの標準偏差を使用して、標本分布の標準誤差を推定します。

StudentのT検定

StudentのT検定、または独立T検定は、2つの独立したグループの平均に有意な差があるかどうかを判断するための統計的手法です。"Student"という疑名で発表したウィリアム・シーリー・ゴセットにちなんで名付けられ、さまざまな分野で広く適用されています。例えば、臨床試験における2つの異なる治療グループの結果を比較したり、異なる方法で教えられた2つの学生グループの平均点を比較したりするために使用できます。

仮定

StudentのT検定は、いくつかの重要な仮定の下で動作します。

観測の独立性
2つのグループで収集されたデータは互いに独立しています。つまり、1人の参加者の測定が他の参加者の測定に影響を与えないことを意味します。
正規分布
両グループのデータは正規分布に従っています。T検定はこの仮定に対して比較的強健ですが、極端な逸脱はテスト結果の妥当性に影響を与える可能性があります。
等分散性
等分散性の仮定とも呼ばれ、2つのグループのデータの標準偏差がほぼ等しいことを前提としています。この仮定が破られると、StudentのT検定の結果が妥当でなくなる可能性があり、通常はWelchのT検定が推奨されます。

手順

StudentのT検定は、2つの独立したグループの平均が有意に異なるかどうかを確定するために、系統的な手順に従います。以下に手順を示します。

帰無仮説と対立仮説を設定

帰無仮説（ $H_0$ ）は通常、2つのグループの平均に差がないということを述べ、対立仮説（ $H_1$ または $H_a$ ）は差があることを述べます。仮説は次のように形式的に書くことができます:

$H_0$ : $\mu_1 = \mu_2$ （グループ間の平均に差がない）
$H_1$ : $\mu_1 \neq \mu_2$ （グループ間の平均に差がある）

T統計量を計算

StudentのT検定におけるT統計量の式は次の通りです。

t = \frac{(\bar{X}_1 - \bar{X}_2)}{\sqrt{(\frac{s^2_1}{n_1} + \frac{s^2_2}{n_2})}}

ここで、 $\bar{X}_1$ と $\bar{X}_2$ は2つのグループの平均、 $s_1$ と $s_2$ は2つのグループの標準偏差、 $n_1$ と $n_2$ は2つのグループのサンプルサイズです。

自由度を決定

StudentのT検定では、自由度は両グループの観測値の合計から2を引いた数で計算されます。

df = n_1 + n_2 - 2

T統計量と臨界値を比較

T統計量を臨界値と比較します。臨界値はt-分布の表から求めるか、統計ソフトウェアを使用して計算することができます。T統計量の絶対値が臨界値よりも大きい場合、帰無仮説を棄却します。

p値を計算

p値は、帰無仮説が真である場合に、観測された値以上に極端なT統計量を観測する確率です。p値が有意水準（通常は0.05）よりも小さい場合、帰無仮説を棄却します。

WelchのT検定

WelchのT検定は、2つのサンプルの分散が等しくない、またはサンプルサイズが異なる場合に適用されるStudentのT検定の変種です。WelchのT検定は、StudentのT検定で必要な等分散性の仮定が成り立たない場合に、より信頼性の高い代替手法となります。

StudentのT検定と同様に、WelchのT検定は2つの独立したグループの平均に有意な差があるかどうかを判断するために使用されます。等分散性の仮定が成り立たない場合に特に有用です。

仮定

WelchのT検定の仮定は、StudentのT検定と類似していますが、1つの重要な例外があります:

観測の独立性
2つのグループで収集されたデータは互いに独立しています。
正規分布
両グループのデータはおおよそ正規分布に従っている必要があります。
分散の不等
StudentのT検定とは異なり、WelchのT検定では等分散性の仮定は必要ありません。分散が等しくない場合でも使用できるように設計されており、これを異質分散と呼びます。

手順

WelchのT検定の手順はStudentのT検定と似ていますが、T統計量と自由度の計算方法において変更があります。

帰無仮説と対立仮説を設定

StudentのT検定と同様に、帰無仮説は通常、2つのグループの平均に差がないことを述べ、対立仮説は差があることを述べます。

T統計量を計算

WelchのT検定におけるT統計量の式はStudentのT検定と同じですが、分母の標準誤差の計算においては、各グループごとに分散を個別に考慮します。

t = \frac{(\bar{X}_1 - \bar{X}_2)}{\sqrt{(\frac{s^2_1}{n_1} + \frac{s^2_2}{n_2})}}

自由度を決定

WelchのT検定における自由度は、Welch-Satterthwaiteの式を使用して計算されます。この計算はStudentのT検定よりも複雑です。

df = \frac{(\frac{s^2_1}{n_1} + \frac{s^2_2}{n_2})^2}{(\frac{(s^2_1 / n_1)^2}{n_1 - 1} + \frac{(s^2_2 / n_2)^2}{n_2 - 1})}

T統計量と臨界値を比較

StudentのT検定と同様に、T統計量の絶対値が臨界値よりも大きい場合、帰無仮説を棄却します。

p値を計算

p値が有意水準（通常は0.05）よりも小さい場合、帰無仮説を棄却します。

対応のあるT検定

対応のあるT検定は、依存T検定またはマッチドT検定とも呼ばれ、2つの観測値の平均差がゼロかどうかを判断するための統計手法です。対応のあるT検定では、各被験者または対象が2回測定され、観測値のペアが作成されます。これらの測定は、異なる時点（例えば、治療前と治療後）から得られる場合や、対応のあるペア（例えば、双子）から得られる場合があります。

対応のあるT検定は、対照研究、クロスオーバー研究デザイン、または反復測定デザインなど、同じ被験者が複数回テストされる場合によく使用されます。

仮定

対応のあるT検定の仮定は次の通りです。

依存するサンプル
サンプルまたはグループは何らかの関連性があり、または観測値はペアで取られるべきです。
正規分布
対応のある観測値の差はおおよそ正規分布に従っているべきです。
観測の独立性
観測値のペアは互いに独立しているべきです。

手順

対応のあるT検定の実施手順は次のとおりです。

帰無仮説と対立仮説を設定

通常、帰無仮説は対応のある観測値の平均に差がないことを述べ、対立仮説は差があることを述べます。

ペア間の差を計算

各ペアごとに2つの観測値の差を計算します。

差の平均と標準偏差を計算

これらの差の平均（ $d$ と表記）と標準偏差（ $s_d$ と表記）を計算します。

T統計量を計算

対応のあるT検定におけるT統計量の式は次の通りです。

t = \frac{d}{\frac{s_d}{\sqrt{n}}}

ここで、 $n$ はペアの数です。

自由度を決定

対応のあるT検定の自由度は、ペアの数から1を引いた値です（ $df = n - 1$ ）。

T統計量と臨界値を比較

T統計量の絶対値が臨界値よりも大きい場合、帰無仮説を棄却します。

p値を計算

p値が有意水準（通常は0.05）よりも小さい場合、帰無仮説を棄却します。

WelchのT-検定のPython実装

Pythonでは、WelchのT-検定をscipy.stats.ttest_ind()関数を使用して実行することができます。equal_var=Falseという引数を指定します。以下に実行方法の例を示します。

python

import numpy as np
from scipy import stats

# Create two groups of data
group1 = np.random.normal(0, 1, 30)
group2 = np.random.normal(0.5, 1.5, 50)

# Perform Welch's t-test
t_stat, p_value = stats.ttest_ind(group1, group2, equal_var=False)

print("t statistic: ", t_stat)
print("p-value: ", p_value)

t statistic:  -1.544992743798216
p-value:  0.1264084891010019

-1.5450のTスコアは、group1の平均がgroup2の平均よりも低いことを示しています。負のTスコアは、最初のグループの平均が2番目のグループの平均よりも低いことを意味します。

0.1264のp値は、観測された差と同程度またはそれ以上の平均差を得る確率が12.64%であることを意味します。これは、帰無仮説が真である場合（つまり、母集団の平均の真の差がゼロである場合）、観測された差以上に大きな差を得る確率です。

通常、仮説検定ではp値の閾値（有意水準）として0.05が使用されます。p値が0.05未満であれば、結果は統計的に有意であり、帰無仮説は棄却されます。この場合、p値は0.05よりも大きいため、帰無仮説を棄却できません。つまり、2つのグループの平均の間に有意な差があると言える十分な証拠はありません。

カイ二乗検定

F検定

Descriptive Statistics

Differential Equation

Dimensionality Reduction

Discrete Choice Model

Google Search Console

Hugging Face

Hypothesis Testing

Inferential Statistics

Probability Distribution

Ryusei Kakujo

Weave the future of cities through data

Transportation modeling/ Urban planning/ Machine learning/ Computer science/ GIS