幾何分布とは
幾何分布とは、ある事象が起こる確率を
- コインを投げて表が出るまでの回数
- スリーポイントの成功率が3割のバスケットボール選手がスリーポイントを決めるまでに打つシュートの回数
確率変数
幾何分布は
例えば、コインを投げて3投目で初めて表が出る確率は次のように求めることができます。
3投目で初めて表が出る確率は12.5%であることが分かりました。
二項分布との関係
二項分布とは、ある事象が起こる確率を
つまり、同じ事象を二項分布は「回数」で捉え、幾何分布は「時間・間隔」で捉えます。
また、幾何分布は、確率
幾何分布の期待値と分散
確率変数
幾何分布の無記憶性
確率変数
上式は将来の事象発生までの時間がその過去の事象の有無に依存しないということを意味しています。例えばコインを3回投げるときに、2投目までが全て表だったとしても、その結果が3投目に表が出る確率には一切影響しないということになります。この性質を無記憶性(Memoryless)といいます。幾何分布は無記憶性を持つ唯一の離散分布になります。
Python コード
次のPythonコードで幾何分布を描画することができます。
import numpy as np
from scipy.stats import geom
import matplotlib.pyplot as plt
x = np.arange(1, 70, 1)
# probability of the geometric distribution
y005= [geom.pmf(i, 0.05) for i in x]
y01= [geom.pmf(i, 0.1) for i in x]
y05= [geom.pmf(i, 0.5) for i in x]
# draw graph
plt.style.use('ggplot')
fig, ax = plt.subplots(facecolor="w", figsize=(10, 5))
ax.bar(x,y005,alpha=0.5, label="Geometric p=0.05")
ax.bar(x,y01,alpha=0.5, label="Geometric p=0.1")
ax.bar(x,y05,alpha=0.5, label="Geometric p=0.5")
ax.legend()
ax.set_xlabel("k")
ax.set_ylabel("Probability")
plt.show()