Traffine I/O

日本語

2022-12-16

カイ二乗分布

カイ二乗分布とは

カイ二乗分布とは、確率変数 X_1, X_2, \cdots, X_n が互いに独立であり、それぞれが標準正規分布 N(0,1) に従うとき、以下の確率変数 \chi^2 が従う確率分布です。

\chi^2 = X_1^2 + X_2^2 + \cdots + X_n^2

カイ二乗分布の確率密度関数は以下の式で表されます。

f(x) = \frac{x^{{\frac{n}{2}}-1}e^{-\frac{x}{2}}}{2\frac{n}{2}\Gamma \frac{n}{2}} \quad (x > 0)

カイ二乗分布の確率密度関数は t 分布の確率密度関数と同様、パラメータが n のみとなっています。n はt分布と同様に自由度と呼ばれます。カイ二乗分布は \chi^2(n) と表されることもあります。

カイ二乗分布のグラフは自由度 n に依存し、以下のようになります。

Chi squared distribution

標準正規分布との関係

自由度が1のカイ二乗分布は、標準正規分布に従う確率変数 X_1 を二乗したものに等しくなります。

\chi^2(1) - X_1^2

カイ二乗分布の期待値と分散

F分布 F(m, n) に従う確率変数 X の期待値、分散はそれぞれ以下になります。

E(X)= k
V(X) = 2k

カイ二乗分布表(上側)

カイ二乗分布はパラメータが n のみであるため、カイ二乗分布の確率をカイ二乗分布表と呼ばれる表にまとめることができます。以下に上側確率 \alpha がそれぞれ,0.1,0.05,0.025,0.01に一致するカイ二乗分布の自由度をまとめたカイ二乗分布表を示します。

自由度 n \alpha=0.1 \alpha=0.05 \alpha=0.25 \alpha=0.01
1 2.71 3.84 5.02 6.64
2 4.61 5.99 7.38 9.21
3 6.25 7.82 9.35 11.35
4 7.78 9.49 11.14 13.28
5 9.24 11.07 12.83 15.09
6 10.65 12.59 14.45 16.81
7 12.02 14.07 16.01 18.48
8 13.36 15.51 17.54 20.09
9 14.68 16.92 19.02 21.67
10 15.99 18.31 20.48 23.21

例えば、自由度5のカイ二乗分布の上側5%点を求めたい場合は、n=10\alpha=0.05 の交差点の値を探します。したがって、求める上側5%点は11.07になります。

カイ二乗分布の再生性

確率変数 XY が次のようにそれぞれカイ二乗分布に従い、互いに独立であるとします。

X \sim \chi^2(n_1),\quad Y \sim \chi^2(n_2)

このとき、X + Y は以下のカイ二乗分布に従います。

X + Y \sim \chi^2(n_1 + n_2)

この性質を再生性と言います。

正規分布に従う母集団からの無作為標本とカイ二乗分布

N(\mu,\sigma^2) の正規分布に従う母集団より無作為抽出された標本 X_1, X_2, \cdots, X_n において、それぞれの X は互いに独立に正規分布に従う場合、以下の確率変数 W は自由度 n-1 のカイ二乗分布に従います。

W = \sum^n_{i=1} \frac{(X_i - \bar{X})^2}{\sigma^2}

また、不偏分散を S^2 とすると W は以下のようにも表すことができます。

W = \frac{(n-1)S^2}{\sigma^2}

Python コード

以下にカイ二乗分布の描画で使用したPythonコードを示します。

from scipy.stats import chi2
import numpy as np
import matplotlib.pyplot as plt

plt.style.use('ggplot')
fig, ax = plt.subplots(facecolor="w", figsize=(10, 5))

x = np.linspace(0, 8, 10000)

k_deg = [1, 2, 3, 4, 5] # degree of freedom

for i in k_deg:
    plt.plot(x, chi2.pdf(x, i), linestyle='-', label='n={}'.format(i), lw=5, alpha=0.5)

plt.xlim(0, 8)
plt.ylim(0, 1)
plt.legend()
plt.show()

Chi squared distribution

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!