Traffine I/O

Bahasa Indonesia

Apa itu i.i.d.

i.i.d. adalah singkatan dari Independent and Identically Distributed, yang berarti bahwa variabel acak X_1, X_2, \cdots, X_n tidak bergantung satu sama lain dan semuanya mengikuti distribusi probabilitas yang sama. Harap dicatat bahwa tidak ada distribusi probabilitas seperti i.i, d.

Misalkan Anda melempar koin 10 kali dan mendapatkan 6 kepala dan 4 ekor. Kemudian, mari kita asumsikan bahwa lemparan koin kesebelas dilakukan. Dalam hal ini, probabilitas mendapatkan "kepala" atau "ekor" masing-masing adalah \frac{1}{2}, dan tidak terpengaruh oleh hasil dari 10 lemparan pertama. Dengan kata lain, hasil lemparan koin pertama sampai kesebelas tidak bergantung satu sama lain dan secara konsisten memiliki distribusi yang sama. Oleh karena itu, kita bisa mengatakan bahwa lemparan koin ini mengikuti i.i.d.

Penting untuk dicatat bahwa i.i.d. tidak berarti probabilitas yang sama; itu tidak berarti bahwa dua variabel acak masing-masing harus memiliki probabilitas \frac{1}{2}, atau bahwa empat variabel acak masing-masing harus memiliki probabilitas \frac{1}{4} untuk mengatakan itu mengikuti i.i.d.

Sebagai contoh yang tidak mengikuti i.i.d., berikut adalah contoh bermain kartu: Misalkan ada satu kartu yang diambil dari setumpuk 52 kartu remi dan kartu tersebut adalah kartu as hati. Dalam kasus ini, probabilitas untuk menarik kartu as adalah \frac{4}{52}. Jika kita menarik kartu lain tanpa mengembalikan kartu as hati yang kita tarik sebelumnya, probabilitas untuk menarik kartu as adalah \frac{3}{51}. Jadi, probabilitas untuk menarik kartu as tidak independen satu sama lain, juga tidak memiliki distribusi probabilitas yang sama, jadi kita tidak bisa mengatakan bahwa mereka mengikuti i.i.d.

Asumsi i.i,d. sering digunakan dalam pemrosesan statistik, pengujian hipotesis, dan pembelajaran mesin karena tidak memerlukan pertimbangan korelasi (seperti kovarians) dan sangat mudah dihitung.

Identically Distributed

Identically Distributed berarti tidak ada kecenderungan secara keseluruhan, yaitu, tidak ada variasi dalam distribusi, dan semua item dalam sampel diambil dari distribusi probabilitas yang sama.

Misalnya, jika kekuatan suatu produk diukur dan rata-rata kekuatannya lebih tinggi ketika lebih banyak sampel dikumpulkan, sulit untuk menarik kesimpulan tentang kekuatannya. Rata-rata kekuatan produk akan tergantung pada waktu pengukuran. Untuk mengevaluasi pengukuran yang cenderung tren dari waktu ke waktu, perlu dilakukan analisis deret waktu, misalnya.

Ketika membandingkan kelompok-kelompok dalam suatu analisis, rata-rata, rasio, dan karakteristik lain dari kelompok-kelompok tersebut bisa berbeda, tetapi setiap kelompok harus memiliki distribusi yang sama.

Bagaimana cara memeriksa i.i.d.

Untuk mengetahui apakah data independen dan terdistribusi secara identik, periksa independensi dan tren data.

Independensi Data

Untuk memeriksa independensi data, pahami proses pengumpulan data. Anda akan ingin memahami bagaimana data dikumpulkan, apakah Anda menggunakan random sampling atau convenience sampling, dan bagaimana data diamati.

Tren Data

Untuk mengidentifikasi tren data, buatlah grafik data sesuai urutan pengukuran setiap item, seperti proporsi, rata-rata, dan variabilitas, dan cari polanya. Carilah tren bermasalah dalam sampel yang menunjukkan bahwa data tidak mengikuti distribusi probabilitas tunggal.

Referensi

https://towardsdatascience.com/independent-and-identically-distributed-ce250ad1bfa8
https://statisticsbyjim.com/basics/independent-identically-distributed-data/

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!