Traffine I/O

Bahasa Indonesia

Apa itu distribusi-F

Distribusi-F adalah distribusi probabilitas yang diikuti oleh variabel acak berikut F ketika variabel acak X dan Y mengikuti distribusi chi-square \chi^2(m) dan \chi^2(n) masing-masing dan X dan Y saling independen.

F = \frac{\frac{X}{m}}{\frac{Y}{n}}

Distribusi-F kadang-kadang dilambangkan F(m,n), dan fungsi densitas probabilitas dari distribusi-F dinyatakan dengan persamaan berikut:

f(x) = \frac{\Gamma(\frac{m+n}{2})}{\Gamma(\frac{m}{2})\Gamma(\frac{n}{2})}m^{\frac{m}{2}}n^{\frac{n}{2}}\frac{x^{\frac{m}{2} - 1}}{(mx + n)^{\frac{m+n}{2}}} \quad (x > 0)

Grafik distribusi-F tergantung pada derajat kebebasan m dan n dan terlihat seperti ini.

F distribution

Nilai yang diharapkan dan varians dari distribusi-F

Nilai yang diharapkan dan varians dari variabel acak X yang mengikuti distribusi-F F(m, n) masing-masing adalah:

E(X)= \frac{n}{n-2} \quad (n > 2)
V(X) = \frac{2n^2(m+n-2)}{m(n-2)^2(n-4)} \quad (n > 4)

Tabel distribusi-F (sisi atas)

Karena distribusi-F hanya memiliki parameter m dan n, probabilitas distribusi-F dapat dirangkum dalam sebuah tabel yang disebut tabel distribusi-F. Di bawah ini adalah tabel distribusi-F untuk probabilitas sisi atas \alpha=0.05.

n \ m 1 2 3 4 5 6 7
1 161.448 199.500 215.707 224.583 230.162 233.986 236.768
2 18.513 19.000 19.164 19.247 19.296 19.330 19.353
3 10.128 9.552 9.277 9.117 9.013 8.941 8.887
4 7.709 6.944 6.591 6.388 6.256 6.163 6.094
5 6.608 5.786 5.409 5.192 5.050 4.950 4.876
10 4.965 4.103 3.708 3.478 3.326 3.217 3.135
15 4.543 3.682 3.287 3.056 2.901 2.790 2.707
20 4.351 3.493 3.098 2.866 2.711 2.599 2.514

Misalnya, nilai F dengan \alpha=0.05 untuk m=5 dan n=2 derajat kebebasan adalah 19.296.

Kode Python

Berikut ini adalah kode Python yang digunakan untuk menggambar distribusi F.

from scipy import stats
import matplotlib.pyplot as plt
import numpy as np

plt.style.use('ggplot')
fig, ax = plt.subplots(facecolor="w", figsize=(10, 5))

x = np.linspace(0.000001, 10, 1000) # X axis
f_df = [(5,5), (5,10), (5,20), (10,5), (20,5), (10,10), (20,20)] # degree of freedom of F(m,n)

for i in range(len(f_df)):
    y = stats.f.pdf(x, f_df[i][0], f_df[i][1])
    ax.plot(x, y, linestyle='-', label=f'F({f_df[i][0]}, {f_df[i][1]})', lw=5, alpha=0.5)

plt.xlim(0, 5)
plt.ylim(0, 1.0)
plt.legend()
plt.show()

F distribution

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!