Apa itu Uji Z
Uji Z adalah salah satu prosedur statistik yang paling umum digunakan, menjadi alat dasar bagi statistikawan, peneliti, dan analis data. Uji ini termasuk dalam keluarga uji hipotesis yang memberikan metode untuk membuat inferensi atau kesimpulan tentang karakteristik populasi berdasarkan analisis data sampel.
Istilah 'Uji Z' berasal dari distribusi normal standar, juga dikenal sebagai 'distribusi Z', yang merupakan kasus khusus dari distribusi normal di mana rerata adalah 0 dan simpangan baku adalah 1. 'Z' dalam Uji Z berasal dari skor Z, yang merupakan cara untuk mengstandarisasi variabel acak dalam statistik.
Ide dasar di balik Uji Z adalah melihat seberapa jauh rerata sampel yang diamati dari rerata populasi yang diasumsikan, dalam hal simpangan baku. Jika rerata sampel cukup jauh dari rerata populasi, kita menolak hipotesis nol dan menerima hipotesis alternatif. Dengan kata lain, kita menyimpulkan bahwa ada perbedaan secara signifikan secara statistik antara rerata sampel dan rerata populasi.
Sebagai contoh, bayangkan produsen sepatu mengklaim bahwa sepatu mereka rata-rata tahan selama 12 bulan. Anda curiga ini mungkin tidak akurat, jadi Anda mengumpulkan sampel sepatu dan menguji umur pakainya. Uji Z dapat membantu Anda menentukan apakah umur rata-rata dalam sampel Anda secara statistik berbeda dari klaim 12 bulan.
Asumsi Uji Z
Uji Z, seperti banyak prosedur statistik lainnya, didasarkan pada beberapa asumsi. Jika asumsi-asumsi ini tidak terpenuhi, hasil yang diperoleh dari uji tersebut mungkin tidak valid atau dapat diandalkan. Oleh karena itu, sebelum melakukan uji Z, penting untuk memastikan bahwa data Anda memenuhi asumsi-asumsi berikut:
-
Populasi Berdistribusi Normal
Populasi dari mana sampel diambil harus memiliki distribusi normal agar uji Z valid. Namun, berkat Teorema Pusat Limit, jika Anda memiliki ukuran sampel yang cukup besar (biasanya dianggap lebih dari 30), tidak masalah jika populasi tidak berdistribusi normal. Distribusi rerata sampel masih akan mendekati distribusi normal. -
Simpangan Baku Populasi Diketahui
Ini mungkin adalah asumsi yang paling ketat dari uji Z. Asumsi ini mengasumsikan bahwa simpangan baku populasi diketahui. Namun, dalam kenyataannya, hal ini sering tidak terjadi, dan simpangan baku sampel digunakan sebagai estimasi dari simpangan baku populasi. Ketika hal ini terjadi, lebih tepat untuk menggunakan Uji T daripada Uji Z.
Jenis-jenis Uji Z
Tergantung pada sifat data dan pertanyaan yang ingin kita jawab, terdapat berbagai jenis uji Z yang dapat digunakan. Berikut adalah tiga jenis yang paling umum:
-
Uji Z Satu Sampel
Uji Z satu sampel digunakan ketika Anda ingin mengetahui apakah sampel Anda berasal dari populasi tertentu. Rerata dan simpangan baku populasi diketahui dari studi sebelumnya. Anda kemudian mengambil sampel dari populasi ini, menemukan rerata sampel, dan membandingkannya dengan rerata populasi. Jika rerata sampel cukup berbeda dari rerata populasi, Anda dapat menyimpulkan bahwa sampel Anda mungkin tidak berasal dari populasi tersebut. -
Uji Z Dua Sampel
Uji Z dua sampel digunakan ketika Anda tertarik untuk membandingkan dua kelompok independen untuk melihat apakah mereka berasal dari populasi yang sama. Misalnya, Anda mungkin ingin tahu apakah tinggi rata-rata pria berbeda dari tinggi rata-rata wanita. Anda akan secara acak mengambil sampel pria dan wanita, dan membandingkan rerata tinggi pria dengan rerata tinggi wanita. Jika perbedaannya secara signifikan secara statistik, Anda akan menyimpulkan bahwa pria dan wanita mungkin berasal dari populasi yang berbeda dalam hal tinggi. -
Uji Z Berpasangan
Uji Z berpasangan digunakan ketika Anda tertarik pada perbedaan antara dua variabel untuk kelompok subjek yang sama. Misalnya, Anda mungkin tertarik untuk mengetahui apakah program pelatihan meningkatkan kinerja. Anda mengukur kinerja sebelum dan setelah program pelatihan, lalu membandingkan kedua set skor tersebut. Jika perbedaan rerata secara signifikan secara statistik, Anda akan menyimpulkan bahwa program pelatihan kemungkinan memiliki efek.
Langkah-langkah Melakukan Uji Z
Melakukan uji Z melibatkan serangkaian langkah. Di sini, kita akan menguraikan proses umum untuk melakukan uji Z satu sampel. Ingat, ini adalah contoh yang disederhanakan dan langkah-langkah spesifik mungkin bervariasi berdasarkan sifat data Anda dan jenis uji Z yang digunakan.
Nyatakan Hipotesis Nol dan Hipotesis Alternatif
Hipotesis nol (
Sebagai contoh:
-
:H_0 =\mu \mu_0 -
:H_1 ≠\mu \mu_0
di mana
Pilih Tingkat Signifikansi
Tingkat signifikansi (ditandai sebagai
Hitung Skor Z
Skor Z dihitung menggunakan rumus berikut:
di mana:
adalah rerata sampel\bar{X} adalah rerata populasi yang dihipotesiskan\mu_0 adalah simpangan baku populasi\sigma adalah ukuran sampeln
Tentukan Skor Z Kritis
Skor Z kritis adalah nilai yang membagi area di bawah kurva normal menjadi segmen yang terkait dengan tingkat signifikansi. Untuk uji dua sisi dengan tingkat signifikansi 0,05, skor Z kritis biasanya adalah ±1,96.
Buat Keputusan
- Jika Z > Skor Z kritis, kita menolak hipotesis nol.
- Jika Z ≤ Skor Z kritis, kita gagal menolak hipotesis nol.
Ingat, gagal menolak hipotesis nol tidak sama dengan menerima hipotesis nol. Ini hanya berarti bahwa tidak ada cukup bukti untuk mendukung hipotesis alternatif.
Laporkan Hasil
Terakhir, Anda harus melaporkan hasil Anda. Ini termasuk nilai Z, nilai p (probabilitas mengamati data yang diberikan bahwa hipotesis nol benar), dan apakah Anda menolak atau gagal menolak hipotesis nol.
Implementasi Python untuk Uji Z
Dalam bab ini, saya akan mengimplementasikan uji Z satu sampel menggunakan Python.
Pertama, Anda perlu mengimpor pustaka yang diperlukan.
import numpy as np
from scipy import stats
Sekarang, asumsikan Anda memiliki kumpulan data sampel dan Anda ingin menguji apakah reratanya berbeda dari rerata populasi yang dihipotesiskan. Mari kita anggap simpangan baku populasi diketahui.
# Sample data
sample_data = np.array([2, 3, 5, 6, 9, 11, 12, 15, 18, 20, 22, 24, 26, 27, 30])
# Known population standard deviation
population_std_dev = 5.0
# Hypothesized population mean
population_mean = 20.0
Sekarang, kita dapat menghitung rerata dan ukuran sampel:
# Calculate sample mean and size
sample_mean = np.mean(sample_data)
sample_size = len(sample_data)
Selanjutnya, kita hitung skor Z:
# Calculate Z-score
Z = (sample_mean - population_mean) / (population_std_dev / np.sqrt(sample_size))
Kita dapat mencari skor Z kritis menggunakan pustaka scipy.stats
. Untuk uji dua sisi dengan tingkat signifikansi 0,05, skor Z kritis adalah sekitar ±1,96.
# Two-tailed test for 95% confidence level
Z_critical = stats.norm.ppf(0.975) # 0.975 = 1 - (0.05/2)
Terakhir, kita membuat keputusan berdasarkan perbandingan antara skor Z yang dihitung dan skor Z kritis:
# Make a decision
if np.abs(Z) > Z_critical:
print("Reject the null hypothesis.")
else:
print("Fail to reject the null hypothesis.")
Ini akan mencetak "Reject the null hypothesis." atau "Fail to reject the null hypothesis." tergantung pada apakah nilai absolut dari skor Z yang dihitung lebih besar dari skor Z kritis.