Traffine I/O

Bahasa Indonesia

2022-04-04

Estimasi Interval Mean Populasi

Estimasi Interval Mean Populasi

Mengestimasi mean populasi adalah pertanyaan mendasar dalam statistika. Dalam banyak skenario, kita memiliki sampel data yang dikumpulkan dari populasi yang lebih besar, dan kita tertarik untuk membuat inferensi tentang parameter populasi seperti mean.

Dalam artikel ini, saya akan memperkenalkan langkah-langkah untuk mengestimasi mean populasi.

Langkah-langkah untuk Membangun Interval Kepercayaan

Identifikasi Statistik Sampel

Karena kita mencoba mengestimasi mean populasi, kita memilih mean sampel (dinyatakan sebagai \bar{x}) sebagai statistik sampel.

Pilih Tingkat Kepercayaan

Tingkat kepercayaan didefinisikan untuk kita dalam masalah tersebut. Pilihan umum adalah tingkat kepercayaan 90%, 95%, atau 99%.

Temukan Standar Error

Standar error (SE) adalah ukuran akurasi statistik. Ini menggambarkan kesalahan atau deviasi yang khas dari suatu statistik (seperti mean) dari parameter populasi yang sebenarnya (tetapi sering tidak diketahui). Standar error memainkan peran penting dalam pembangunan interval kepercayaan.

Jika kita memiliki simpangan baku populasi (\sigma), kita dapat menghitung standar error mean sebagai berikut:

SE = \frac{\sigma}{\sqrt{n}}

Namun, dalam kebanyakan kasus praktis, \sigma tidak diketahui, dan kita mengestimasinya menggunakan simpangan baku sampel (s).

SE = \frac{s}{\sqrt{n}}

Jika kita menggunakan simpangan baku sampel, distribusi sampel mean tidak mengikuti distribusi normal. Sebaliknya, distribusinya mengikuti distribusi t. Distribusi t mirip dengan distribusi normal tetapi memiliki ekor yang lebih berat. Hal ini membuatnya lebih konservatif (memberikan interval kepercayaan yang lebih lebar) ketika ukuran sampel kecil. Ketika ukuran sampel semakin besar, distribusi t mendekati distribusi normal.

Bangun Interval Kepercayaan

Setelah kita menghitung standar error, kita dapat membangun interval kepercayaan. Interval kepercayaan menyediakan rentang nilai perkiraan yang kemungkinan mencakup parameter populasi yang tidak diketahui, rentang perkiraan tersebut dihitung dari sekumpulan data sampel yang diberikan.

Interval kepercayaan dapat diungkapkan sebagai berikut:

CI = \bar{x} \pm Z \cdot SE

Implementasi Python

Berikut ini adalah contoh sederhana tentang bagaimana Anda melakukan estimasi interval mean populasi menggunakan scipy.stats. Kita akan menghasilkan sampel dengan ukuran 100 dari distribusi normal, kemudian membangun interval kepercayaan 95% untuk mean.

python
import numpy as np
import scipy.stats as stats

# Generate a sample from a normal distribution
np.random.seed(0)  # for reproducibility
sample = np.random.normal(loc=50, scale=5, size=100)  # mean = 50, std_dev = 5, sample size = 100

# Calculate the sample mean and standard deviation
sample_mean = np.mean(sample)
sample_std_dev = np.std(sample, ddof=1)  # ddof=1 to use the unbiased estimator

# Choose the desired confidence level
confidence_level = 0.95

# Find the standard error
standard_error = sample_std_dev / np.sqrt(len(sample))

# Calculate the margin of error. Here we use t-distribution
degree_of_freedom = len(sample) - 1
t_score = stats.t.ppf((1 + confidence_level) / 2, degree_of_freedom)
margin_of_error = t_score * standard_error

# Construct the confidence interval
confidence_interval = (sample_mean - margin_of_error, sample_mean + margin_of_error)

print(f"The {confidence_level*100}% Confidence Interval for the population mean is: {confidence_interval}")
The 95.0% Confidence Interval for the population mean is: (49.294074104983, 51.30400605036188)

uran sampel Anda cukup besar, Anda mungkin ingin menggunakan distribusi normal daripada distribusi t.

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!