Traffine I/O

Bahasa Indonesia

Apa itu Uji Chi-Square

Uji Chi-Square adalah alat dalam bidang pengujian hipotesis yang digunakan terutama untuk menentukan apakah terdapat hubungan yang signifikan antara dua variabel kategorikal.

Berbeda dengan beberapa uji lainnya, uji chi-square tidak membutuhkan asumsi tentang distribusi populasi, sehingga disebut "non-parametrik". Uji ini dirancang khusus untuk menganalisis data kategorikal atau nominal, seperti jenis kelamin, warna, preferensi merek, dan sebagainya, daripada data numerik.

Uji chi-square membandingkan frekuensi yang diamati dalam setiap kategori dari tabel kontingensi dengan frekuensi yang diharapkan, yaitu frekuensi yang akan kita antisipasi jika tidak ada hubungan antara variabel-variabel tersebut. Dengan membandingkan kedua set frekuensi ini, uji ini membantu peneliti dalam memutuskan apakah menerima atau menolak hipotesis nol mereka tentang hubungan antara variabel-variabel yang diteliti.

Konsep Uji Chi-Square

Uji Chi-Square adalah prosedur statistik yang digunakan untuk menentukan apakah terdapat perbedaan signifikan antara distribusi yang diharapkan dengan distribusi aktual. Uji ini dinamai berdasarkan distribusi Chi-Square yang merupakan keluarga distribusi yang hanya mengambil nilai positif dan memiliki kemiringan ke kanan, sifat yang diikuti oleh statistik uji ini.

Uji Chi-Square membandingkan perbedaan antara frekuensi yang diamati dan frekuensi yang diharapkan dalam data. "Frekuensi yang diamati" adalah data aktual yang telah Anda kumpulkan. "Frekuensi yang diharapkan" adalah frekuensi yang Anda harapkan dalam setiap sel tabel kontingensi jika tidak ada hubungan antara variabel-variabel tersebut.

Frekuensi yang diamati:

Total
✖︎ a c i
b d j
Total x y N

Frekuensi yang diharapkan:

✖︎ x \times i / N y \times i / N
x \times j / N y \times j / N

Statistik chi-square dihitung menggunakan rumus berikut:

\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

di mana:

  • \chi^2 = Statistik chi-square
  • O_i = Frekuensi yang diamati
  • E_i = Frekuensi yang diharapkan
  • \sum menunjukkan bahwa kita menjumlahkan perhitungan ini untuk semua sel dalam tabel kontingensi.

Hasil perhitungan ini, \chi^2, adalah sebuah angka tunggal yang mewakili seluruh perbedaan antara frekuensi yang diamati dengan frekuensi yang diharapkan. Jika frekuensi yang diamati mendekati frekuensi yang diharapkan (menunjukkan bahwa variabel-variabel kita kemungkinan bebas), maka statistik \chi^2 akan kecil. Jika frekuensi yang diamati sangat berbeda dari frekuensi yang diharapkan (menunjukkan bahwa variabel-variabel kita kemungkinan tidak bebas), maka statistik \chi^2 akan besar.

Hipotesis Uji Chi-Square

Seperti semua pengujian hipotesis, uji chi-square menggunakan hipotesesis nol dan hipotesis alternatif.

Hipotesis nol (H_0) untuk uji Chi-Square adalah bahwa tidak ada hubungan antara variabel kategorikal. Dengan kata lain, variabel-variabel tersebut independen.

Hipotesis alternatif (H_1) adalah bahwa terdapat hubungan antara variabel-variabel tersebut - mereka tidak independen.

Jenis-jenis Uji Chi-Square

Uji chi-square bukanlah satu uji tunggal, tetapi sekelompok uji statistik yang mengikuti distribusi chi-square di bawah hipotesis nol. Meskipun ada beberapa jenis uji chi-square yang berbeda, tiga di antaranya cukup umum: uji chi-square untuk independensi, uji chi-square untuk kecocokan, dan uji chi-square untuk homogenitas.

Uji Chi-Square untuk Independensi

Uji chi-square untuk independensi, juga dikenal sebagai uji chi-square untuk asosiasi, digunakan untuk menentukan apakah terdapat hubungan yang signifikan antara dua variabel kategorikal. Dengan kata lain, uji ini menguji apakah variabel-variabel tersebut independen atau saling berhubungan.

Hipotesis nol untuk uji ini menyatakan bahwa variabel-variabel tersebut independen, sementara hipotesis alternatif menyatakan bahwa variabel-variabel tersebut tidak independen, yaitu terdapat hubungan atau keterkaitan di antara mereka.

Uji Chi-Square untuk Kecocokan

Uji chi-square untuk kecocokan digunakan untuk menentukan apakah sejumlah data kategorikal yang diamati sesuai dengan distribusi yang diharapkan. Uji ini umum digunakan untuk menguji hipotesis bahwa distribusi frekuensi yang diamati sesuai dengan distribusi teoritis tertentu.

Hipotesis nol untuk uji chi-square kecocokan adalah bahwa data yang diamati sesuai dengan distribusi yang diharapkan, sementara hipotesis alternatif adalah bahwa data yang diamati tidak sesuai dengan distribusi yang diharapkan.

Uji Chi-Square untuk Homogenitas

Uji chi-square untuk homogenitas digunakan untuk menentukan apakah sampel-sampel (populasi) yang berbeda memiliki distribusi yang sama dari suatu variabel kategorikal tunggal. Misalnya, uji chi-square untuk homogenitas dapat digunakan untuk menguji apakah distribusi preferensi partai politik sama untuk tiga kelompok usia yang berbeda.

Hipotesis nol untuk uji homogenitas adalah bahwa populasi memiliki distribusi yang sama - mereka homogen. Hipotesis alternatif adalah bahwa populasi tidak memiliki distribusi yang sama - mereka tidak homogen.

Langkah-langkah dalam Melakukan Uji Chi-Square

Melakukan uji chi-square melibatkan serangkaian langkah. Berikut adalah proses umum yang umumnya diikuti.

Menentukan Hipotesis

Langkah pertama adalah menentukan hipotesis nol dan hipotesis alternatif. Untuk uji chi-square, hipotesis nol biasanya menyatakan bahwa variabel-variabel tersebut independen, sementara hipotesis alternatif menyatakan bahwa variabel-variabel tersebut tidak independen.

Menghitung Statistik Uji

Selanjutnya, bangun tabel kontingensi frekuensi yang diamati. Dari tabel ini, hitung frekuensi yang diharapkan. Frekuensi yang diharapkan untuk setiap sel dalam tabel dihitung sebagai (total baris × total kolom) / total keseluruhan.

Statistik chi-square kemudian dihitung menggunakan rumus:

\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

di mana:

  • \chi^2 = Statistik chi-square
  • O_i = Frekuensi yang diamati
  • E_i = Frekuensi yang diharapkan
  • \sum menunjukkan bahwa kita menjumlahkan perhitungan ini untuk semua sel dalam tabel kontingensi.

Menentukan Nilai Kritis

Langkah berikutnya adalah menentukan nilai kritis dari distribusi chi-square. Hal ini membutuhkan pengetahuan tentang derajat kebebasan uji. Untuk uji chi-square untuk independensi, derajat kebebasan dihitung sebagai (jumlah baris - 1) × (jumlah kolom - 1).

Setelah Anda memiliki derajat kebebasan, Anda dapat mencari nilai kritis dari tabel distribusi chi-square. Nilai kritis adalah angka yang harus melebihi statistik uji untuk menolak hipotesis nol.

Menafsirkan Hasil

Terakhir, bandingkan statistik uji chi-square dengan nilai kritis untuk memutuskan apakah menerima atau menolak hipotesis nol.

  • Jika statistik uji chi-square lebih besar dari nilai kritis, kita menolak hipotesis nol. Hal ini menunjukkan bahwa frekuensi yang diamati berbeda secara signifikan dari frekuensi yang diharapkan, menunjukkan adanya hubungan antara variabel-variabel tersebut.
  • Jika statistik uji chi-square kurang dari atau sama dengan nilai kritis, kita gagal menolak hipotesis nol. Hal ini menunjukkan bahwa frekuensi yang diamati tidak berbeda secara signifikan dari frekuensi yang diharapkan, tidak memberikan bukti adanya hubungan antara variabel-variabel tersebut.

Implementasi Python dari Uji Chi-Square

Melakukan uji Chi-Square dalam Python dapat cukup mudah. Berikut ini adalah contoh bagaimana melakukannya.

Pertama, mari kita impor library yang diperlukan.

python
import numpy as np
import scipy.stats as stats

Mari kita anggap kita memiliki frekuensi yang diamati dalam sebuah tabel kontingensi:

python
# Observed data in each category
observed = np.array([[10, 15, 20], [20, 15, 15]])

Kita dapat melakukan uji chi-square menggunakan fungsi chi2_contingency dari scipy.stats. Fungsi ini menghitung statistik chi-square dan nilai p dari uji hipotesis independensi frekuensi yang diamati dalam tabel kontingensi.

python
chi2, p, dof, expected = stats.chi2_contingency(observed)

Fungsi ini mengembalikan empat nilai:

  • chi2: Statistik uji.
  • p: Nilai p dari uji.
  • dof: Derajat kebebasan.
  • expected: Frekuensi yang diharapkan, berdasarkan jumlah marjinal tabel.

Terakhir, kita dapat mencetak nilai-nilai tersebut:

python
print("Chi-square statistic = ", chi2)
print("p-value = ", p)
print("Degrees of freedom = ", dof)
print("Expected contingency table: \n", expected)
Chi-square statistic =  3.7949735449735464
p-value =  0.14994499194861846
Degrees of freedom =  2
Expected contingency table:
 [[14.21052632 14.21052632 16.57894737]
 [15.78947368 15.78947368 18.42105263]]

Berdasarkan output uji chi-square, kita dapat menafsirkan hasil sebagai berikut:

  • Chi-square statistic
    Statistik chi-square sebesar 3,79 mengukur perbedaan antara data yang diamati dan nilai yang Anda harapkan jika hipotesis nol benar (yaitu, jika variabel-variabel tersebut independen).

  • p-value
    Nilai p sebesar 0,1499 adalah probabilitas memperoleh data yang diamati (atau data yang lebih ekstrem) jika hipotesis nol benar. Dalam kebanyakan kasus, ambang batas (\alpha) sebesar 0,05 digunakan. Jika nilai p kurang dari \alpha, hipotesis nol akan ditolak. Dalam kasus ini, nilai p lebih besar dari 0,05, sehingga kita gagal menolak hipotesis nol. Ini berarti, berdasarkan data Anda, tidak ada cukup bukti untuk menyimpulkan bahwa terdapat hubungan yang signifikan antara dua variabel tersebut.

  • Degrees of freedom
    Derajat kebebasan untuk uji ini adalah 2. Ini dihitung sebagai (jumlah baris - 1) × (jumlah kolom - 1) pada tabel kontingensi.

  • Expected contingency table
    Ini adalah tabel kontingensi yang Anda harapkan jika hipotesis nol benar. Nilai-nilai ini dihitung berdasarkan jumlah marjinal data yang diamati Anda. Anda dapat membandingkan nilai-nilai ini dengan data yang diamati untuk melihat di mana adanya perbedaan yang signifikan.

Hasil uji chi-square menunjukkan bahwa tidak ada hubungan yang signifikan antara variabel yang diteliti, karena nilai p lebih besar dari 0,05.

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!