Apa itu i.i.d.
i.i.d. adalah singkatan dari Independent and Identically Distributed, yang berarti bahwa variabel acak
Misalkan Anda melempar koin 10 kali dan mendapatkan 6 kepala dan 4 ekor. Kemudian, mari kita asumsikan bahwa lemparan koin kesebelas dilakukan. Dalam hal ini, probabilitas mendapatkan "kepala" atau "ekor" masing-masing adalah
Penting untuk dicatat bahwa i.i.d. tidak berarti probabilitas yang sama; itu tidak berarti bahwa dua variabel acak masing-masing harus memiliki probabilitas
Sebagai contoh yang tidak mengikuti i.i.d., berikut adalah contoh bermain kartu: Misalkan ada satu kartu yang diambil dari setumpuk 52 kartu remi dan kartu tersebut adalah kartu as hati. Dalam kasus ini, probabilitas untuk menarik kartu as adalah
Asumsi i.i,d. sering digunakan dalam pemrosesan statistik, pengujian hipotesis, dan pembelajaran mesin karena tidak memerlukan pertimbangan korelasi (seperti kovarians) dan sangat mudah dihitung.
Identically Distributed
Identically Distributed berarti tidak ada kecenderungan secara keseluruhan, yaitu, tidak ada variasi dalam distribusi, dan semua item dalam sampel diambil dari distribusi probabilitas yang sama.
Misalnya, jika kekuatan suatu produk diukur dan rata-rata kekuatannya lebih tinggi ketika lebih banyak sampel dikumpulkan, sulit untuk menarik kesimpulan tentang kekuatannya. Rata-rata kekuatan produk akan tergantung pada waktu pengukuran. Untuk mengevaluasi pengukuran yang cenderung tren dari waktu ke waktu, perlu dilakukan analisis deret waktu, misalnya.
Ketika membandingkan kelompok-kelompok dalam suatu analisis, rata-rata, rasio, dan karakteristik lain dari kelompok-kelompok tersebut bisa berbeda, tetapi setiap kelompok harus memiliki distribusi yang sama.
Bagaimana cara memeriksa i.i.d.
Untuk mengetahui apakah data independen dan terdistribusi secara identik, periksa independensi dan tren data.
Independensi Data
Untuk memeriksa independensi data, pahami proses pengumpulan data. Anda akan ingin memahami bagaimana data dikumpulkan, apakah Anda menggunakan random sampling atau convenience sampling, dan bagaimana data diamati.
Tren Data
Untuk mengidentifikasi tren data, buatlah grafik data sesuai urutan pengukuran setiap item, seperti proporsi, rata-rata, dan variabilitas, dan cari polanya. Carilah tren bermasalah dalam sampel yang menunjukkan bahwa data tidak mengikuti distribusi probabilitas tunggal.
Referensi