Traffine I/O

Bahasa Indonesia

2022-04-04

Estimasi Interval Proporsi Populasi

Estimasi Interval Proporsi Populasi

Dalam inferensi statistik, tujuannya seringkali adalah membuat pernyataan atau prediksi tentang sifat-sifat populasi yang lebih besar berdasarkan pengamatan dalam sampel yang diambil dari populasi tersebut. Salah satu sifat yang mungkin menarik bagi kita adalah proporsi populasi.

Proporsi populasi, yang ditandai sebagai p, adalah ukuran dari karakteristik tertentu yang dimiliki oleh anggota populasi. Misalnya, jika kita melihat populasi pemilih di suatu negara, p mungkin mewakili proporsi pemilih yang mendukung kandidat tertentu.

Estimasi interval memberikan rentang nilai di dalamnya parameter diperkirakan berada. Berbeda dengan estimasi titik, yang memberikan satu nilai yang paling mungkin untuk parameter, estimasi interval memberikan rentang nilai yang mungkin mengandung parameter tersebut. Rentang ini sering disajikan bersama dengan tingkat kepercayaan, yang mengukur tingkat keyakinan bahwa parameter berada dalam rentang yang diberikan.

Ketika melakukan estimasi interval proporsi populasi, tujuannya adalah menentukan rentang (atau interval) nilai di dalamnya proporsi populasi sebenarnya kemungkinan berada. Ini dilakukan dengan menggunakan data sampel dan metode statistik yang memperhitungkan variasi sampling.

Langkah-langkah Estimasi Interval Proporsi Populasi

Kita akan membahas langkah-langkah yang terlibat dalam estimasi interval proporsi populasi.

Perhitungan Estimator dari Sampel

Langkah pertama dalam estimasi interval adalah menghitung estimator dari sampel. Estimator, sering ditandai sebagai \hat{p} (dibaca sebagai "p-topi"), adalah proporsi dari sampel yang memiliki karakteristik yang ingin diteliti. Secara matematis, estimator dihitung sebagai:

\hat{p} = \frac{X}{n}

di mana X adalah jumlah keberhasilan (individu dengan karakteristik yang diinginkan) dalam sampel, dan n adalah ukuran sampel total.

Menentukan Interval Kepercayaan

Langkah kedua adalah menentukan tingkat kepercayaan yang diinginkan. Tingkat kepercayaan ini mencerminkan tingkat keyakinan kita bahwa proporsi populasi sebenarnya berada dalam interval estimasi kita. Penting untuk dicatat bahwa tingkat kepercayaan juga menentukan skor Z yang digunakan dalam perhitungan interval kepercayaan. Tingkat kepercayaan yang umum digunakan termasuk 90%, 95%, dan 99%, yang masing-masing berkorespondensi dengan skor Z sekitar 1,645, 1,96, dan 2,576.

Pertimbangan Distribusi Sampel Estimator

Aspek penting dari estimasi interval melibatkan pemahaman terhadap distribusi estimator kita. Tergantung pada sifat data, distribusi yang berbeda mungkin berlaku:

Distribusi Binomial

Jika kita mengambil sejumlah besar sampel dengan ukuran yang sama dari suatu populasi dan menghitung \hat{p} untuk masing-masing, nilai-nilai yang dihasilkan akan membentuk distribusi sampling. Dalam kondisi tertentu, distribusi sampling ini mengikuti distribusi binomial.

Fungsi massa probabilitas dari distribusi binomial diberikan oleh:

P(X=k) = C(n,k) * p^k * (1-p)^(n-k)

di mana P(X=k) adalah probabilitas memiliki k keberhasilan dalam n percobaan, C(n,k) adalah koefisien binomial, dan p adalah probabilitas keberhasilan dalam satu percobaan.

Aproksimasi ke Distribusi Normal

Dalam praktiknya, distribusi binomial dapat sulit diolah, terutama untuk ukuran sampel yang besar. Namun, ketika ukuran sampel cukup besar (biasanya, ketika baik np\hat{p} maupun n(1 - \hat{p}) lebih besar dari 5), Teorema Limit Sentral memungkinkan kita untuk mengaproksimasi distribusi binomial dengan distribusi normal.

Perhitungan Interval

Terakhir, kita menghitung estimasi interval itu sendiri. Untuk proporsi populasi, biasanya dinyatakan dalam bentuk \hat{p} \pm Z \times SE(\hat{p}), di mana Z adalah skor Z yang sesuai dengan tingkat kepercayaan yang diinginkan, \hat{p} adalah proporsi sampel, dan SE(\hat{p}) adalah kesalahan standar proporsi.

Kesalahan standar dapat dihitung sebagai:

SE(\hat{p}) = \sqrt{\frac{\hat{p} \ast (1 - \hat{p})}{n}}

Jadi, interval kepercayaan untuk proporsi populasi adalah:

CI = \hat{p} \pm Z \ast \sqrt{\frac{\hat{p} \ast (1 - \hat{p})}{n}}

Ini adalah hasil akhir dari proses estimasi interval untuk proporsi populasi. Ini memberikan kita rentang nilai yang, dengan tingkat kepercayaan tertentu, mengandung proporsi populasi sebenarnya.

Contoh Praktis

Untuk memperkuat pemahaman kita tentang estimasi interval proporsi, mari kita lihat contoh praktis.

Misalkan kita melakukan uji klinis di mana 500 dari 1000 pasien sembuh setelah pengobatan (keberhasilan), sementara sisanya tidak sembuh (kegagalan). Kita ingin mengestimasi proporsi keberhasilan di populasi yang lebih luas.

  1. Perhitungan Estimator dari Sampel

Proporsi keberhasilan sampel dihitung sebagai berikut:

\text{Proporsi} = \frac{\text{Jumlah Keberhasilan}}{\text{Ukuran sampel total}} = \frac{500}{1000} = 0.5
  1. Menetapkan Interval Kepercayaan

Kita menetapkan tingkat kepercayaan 95%.

  1. Pertimbangan Distribusi Sampel Estimator

Karena data bersifat biner (keberhasilan/kegagalan), berlaku distribusi binomial. Namun, dengan ukuran sampel yang besar,
kita dapat menggunakan aproksimasi distribusi normal.

  1. Perhitungan Interval

Dalam kasus ini, kesalahan standar untuk proporsi binomial dapat dihitung menggunakan rumus:

SE = \sqrt{\frac{p(1-p)}{n}}

di mana p adalah proporsi sampel keberhasilan (0.5) dan n adalah ukuran sampel (1000). Ini memberikan kita kesalahan standar sekitar 0.0158.

Interval kepercayaan kita dihitung sebagai berikut:

CI = 1 \pm 1.96 \times 0.0158 = (0.469, 0.531)

Kita dapat dengan 95% kepercayaan mengatakan bahwa proporsi keberhasilan sebenarnya di populasi berada dalam interval ini.

Kode Python

Berikut adalah contoh kode Python untuk melakukan estimasi interval proporsi:

python
import numpy as np
from scipy.stats import norm

# Sample data
successes = 500
failures = 500
total = successes + failures

# Step 1: Calculation of Estimator from Sample
estimator = successes / total

# Step 3: Consideration of Sample Distribution of Estimator
# Calculation of standard error
p = successes / total
se = np.sqrt(p * (1 - p) / total)

# Step 4: Calculation of Interval
z_value = norm.ppf(0.975)  # For 95% confidence level
confidence_interval = (estimator - z_value*se, estimator + z_value*se)

print(f"95% confidence interval for the success proportion is: {confidence_interval}")

# If we use binomial distribution
from scipy.stats import binom
ci_lower, ci_upper = binom.interval(0.95, n=total, p=estimator)
print(f"95% confidence interval for the success proportion is: ({ci_lower/n}, {ci_upper/n})")
95% confidence interval for the success proportion is: (0.4690102483847719, 0.5309897516152281)
95% confidence interval for the success proportion is: (0.469, 0.531)

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!