Estimasi Interval Proporsi Populasi
Dalam inferensi statistik, tujuannya seringkali adalah membuat pernyataan atau prediksi tentang sifat-sifat populasi yang lebih besar berdasarkan pengamatan dalam sampel yang diambil dari populasi tersebut. Salah satu sifat yang mungkin menarik bagi kita adalah proporsi populasi.
Proporsi populasi, yang ditandai sebagai
Estimasi interval memberikan rentang nilai di dalamnya parameter diperkirakan berada. Berbeda dengan estimasi titik, yang memberikan satu nilai yang paling mungkin untuk parameter, estimasi interval memberikan rentang nilai yang mungkin mengandung parameter tersebut. Rentang ini sering disajikan bersama dengan tingkat kepercayaan, yang mengukur tingkat keyakinan bahwa parameter berada dalam rentang yang diberikan.
Ketika melakukan estimasi interval proporsi populasi, tujuannya adalah menentukan rentang (atau interval) nilai di dalamnya proporsi populasi sebenarnya kemungkinan berada. Ini dilakukan dengan menggunakan data sampel dan metode statistik yang memperhitungkan variasi sampling.
Langkah-langkah Estimasi Interval Proporsi Populasi
Kita akan membahas langkah-langkah yang terlibat dalam estimasi interval proporsi populasi.
Perhitungan Estimator dari Sampel
Langkah pertama dalam estimasi interval adalah menghitung estimator dari sampel. Estimator, sering ditandai sebagai
di mana
Menentukan Interval Kepercayaan
Langkah kedua adalah menentukan tingkat kepercayaan yang diinginkan. Tingkat kepercayaan ini mencerminkan tingkat keyakinan kita bahwa proporsi populasi sebenarnya berada dalam interval estimasi kita. Penting untuk dicatat bahwa tingkat kepercayaan juga menentukan skor Z yang digunakan dalam perhitungan interval kepercayaan. Tingkat kepercayaan yang umum digunakan termasuk 90%, 95%, dan 99%, yang masing-masing berkorespondensi dengan skor Z sekitar 1,645, 1,96, dan 2,576.
Pertimbangan Distribusi Sampel Estimator
Aspek penting dari estimasi interval melibatkan pemahaman terhadap distribusi estimator kita. Tergantung pada sifat data, distribusi yang berbeda mungkin berlaku:
Distribusi Binomial
Jika kita mengambil sejumlah besar sampel dengan ukuran yang sama dari suatu populasi dan menghitung
Fungsi massa probabilitas dari distribusi binomial diberikan oleh:
di mana
Aproksimasi ke Distribusi Normal
Dalam praktiknya, distribusi binomial dapat sulit diolah, terutama untuk ukuran sampel yang besar. Namun, ketika ukuran sampel cukup besar (biasanya, ketika baik
Perhitungan Interval
Terakhir, kita menghitung estimasi interval itu sendiri. Untuk proporsi populasi, biasanya dinyatakan dalam bentuk
Kesalahan standar dapat dihitung sebagai:
Jadi, interval kepercayaan untuk proporsi populasi adalah:
Ini adalah hasil akhir dari proses estimasi interval untuk proporsi populasi. Ini memberikan kita rentang nilai yang, dengan tingkat kepercayaan tertentu, mengandung proporsi populasi sebenarnya.
Contoh Praktis
Untuk memperkuat pemahaman kita tentang estimasi interval proporsi, mari kita lihat contoh praktis.
Misalkan kita melakukan uji klinis di mana 500 dari 1000 pasien sembuh setelah pengobatan (keberhasilan), sementara sisanya tidak sembuh (kegagalan). Kita ingin mengestimasi proporsi keberhasilan di populasi yang lebih luas.
- Perhitungan Estimator dari Sampel
Proporsi keberhasilan sampel dihitung sebagai berikut:
- Menetapkan Interval Kepercayaan
Kita menetapkan tingkat kepercayaan 95%.
- Pertimbangan Distribusi Sampel Estimator
Karena data bersifat biner (keberhasilan/kegagalan), berlaku distribusi binomial. Namun, dengan ukuran sampel yang besar,
kita dapat menggunakan aproksimasi distribusi normal.
- Perhitungan Interval
Dalam kasus ini, kesalahan standar untuk proporsi binomial dapat dihitung menggunakan rumus:
di mana
Interval kepercayaan kita dihitung sebagai berikut:
Kita dapat dengan 95% kepercayaan mengatakan bahwa proporsi keberhasilan sebenarnya di populasi berada dalam interval ini.
Kode Python
Berikut adalah contoh kode Python untuk melakukan estimasi interval proporsi:
import numpy as np
from scipy.stats import norm
# Sample data
successes = 500
failures = 500
total = successes + failures
# Step 1: Calculation of Estimator from Sample
estimator = successes / total
# Step 3: Consideration of Sample Distribution of Estimator
# Calculation of standard error
p = successes / total
se = np.sqrt(p * (1 - p) / total)
# Step 4: Calculation of Interval
z_value = norm.ppf(0.975) # For 95% confidence level
confidence_interval = (estimator - z_value*se, estimator + z_value*se)
print(f"95% confidence interval for the success proportion is: {confidence_interval}")
# If we use binomial distribution
from scipy.stats import binom
ci_lower, ci_upper = binom.interval(0.95, n=total, p=estimator)
print(f"95% confidence interval for the success proportion is: ({ci_lower/n}, {ci_upper/n})")
95% confidence interval for the success proportion is: (0.4690102483847719, 0.5309897516152281)
95% confidence interval for the success proportion is: (0.469, 0.531)