Traffine I/O

Bahasa Indonesia

2022-04-15

Efek Kausal

Apa itu Efek Kausal

Efek kausal, yang merupakan inti dari inferensi kausal, mengacu pada perubahan dalam hasil akibat dari intervensi atau perlakuan tertentu. Perlakuan tersebut dapat berupa pemberian obat kepada pasien, perubahan kebijakan yang diterapkan di suatu negara, atau metode pengajaran yang digunakan di dalam kelas.

Model Kausal Rubin (RCM)

Model Kausal Rubin, yang dinamai sesuai dengan ahli statistik Donald Rubin, mengformalkan kerangka kerja hasil potensial untuk inferensi kausal. Efek kausal untuk individu i didefinisikan sebagai perbedaan antara hasil potensial di bawah perlakuan, Y_i(1), dan hasil potensial di bawah kontrol, Y_i(0).

CE_i = Y_i(1) - Y_i(0)

Efek kausal pada tingkat individu ini seringkali menarik perhatian, tetapi dalam banyak situasi, kita tidak dapat mengidentifikasinya untuk setiap individu karena masalah mendasar dalam inferensi kausal. Sebagai gantinya, kita fokus pada efek kausal rata-rata di seluruh populasi atau subpopulasi.

Average Treatment Effect (ATE)

Average Treatment Effect (ATE) adalah salah satu ukuran mendasar dalam inferensi kausal. Ini mewakili perbedaan yang diharapkan dalam hasil akibat dari perlakuan di seluruh populasi.

Secara matematis, ATE didefinisikan sebagai:

ATE = E[Y_i(1) - Y_i(0)]

di mana E[] menunjukkan harapan. Ini mengukur efek rata-rata dari perlakuan di semua unit, baik yang diobati maupun yang tidak diobati.

Namun, karena masalah mendasar dalam inferensi kausal, kita tidak dapat secara langsung mengamati baik Y_i(1) maupun Y_i(0) untuk unit yang sama i. Oleh karena itu, kita sering memperkirakan ATE dalam praktik dengan membandingkan hasil rata-rata di kelompok perlakuan dan kelompok kontrol:

\hat{ATE} = \frac{1}{N_t}\sum_{i \in T}Y_i - \frac{1}{N_c}\sum_{i \in C}Y_i

di mana T adalah himpunan unit yang diobati, C adalah himpunan unit kontrol, N_t adalah jumlah unit yang diobati, dan N_c adalah jumlah unit kontrol.

Contoh ATE

Misalkan ada Randomized Controlled Trial yang mempelajari efek obat baru. Setiap pasien diberikan obat baru (perlakuan) atau plasebo (kontrol). Setelah uji coba, kita mengukur beberapa hasil kesehatan, seperti tingkat pemulihan. ATE dalam kasus ini akan menjadi perbedaan rata-rata dalam tingkat pemulihan antara pasien yang mengonsumsi obat baru dan mereka yang mengonsumsi plasebo.

Jika uji coba tersebut benar-benar teracak secara sempurna, perbedaan yang diamati dalam hasil antara kelompok perlakuan dan kelompok kontrol adalah estimasi yang tidak bias dari ATE. Namun, dalam studi observasional atau percobaan yang tidak teracak secara sempurna, mengestimasi ATE bisa lebih kompleks karena adanya faktor-faktor konfounding. Metode statistik lanjutan sering diperlukan untuk memperbaiki faktor-faktor konfounding ini dan mendapatkan estimasi yang tidak bias dari ATE.

Conditional Average Treatment Effect (CATE)

Conditional Average Treatment Effect (CATE) memperluas konsep ATE dengan mempertimbangkan efek perlakuan yang bersyarat pada karakteristik yang diamati (covariates) dari unit-unit tersebut. Hal ini bisa sangat berharga ketika efek perlakuan bervariasi di antara subkelompok yang berbeda.

Secara matematis, CATE untuk nilai covariate tertentu x didefinisikan sebagai:

CATE(x) = E[Y_i(1) - Y_i(0) | X_i = x]

di mana X_i mewakili covariates untuk unit i.

Dalam praktiknya, seringkali kita perlu memperkirakan CATE karena masalah mendasar dalam inferensi kausal. Hal ini biasanya dilakukan menggunakan metode-metode seperti stratifikasi, penyesuaian regresi, atau teknik-teknik pembelajaran mesin yang lebih canggih.

Contoh CATE

Misalkan ada studi pendidikan yang menyelidiki dampak metode pengajaran baru. CATE akan memungkinkan kita untuk memeriksa efek metode ini pada kelompok-kelompok siswa yang berbeda, seperti siswa dengan pencapaian sebelumnya yang tinggi dibandingkan dengan siswa dengan pencapaian sebelumnya yang rendah.

Misalkan covariate X_i mewakili pencapaian sebelumnya, yang dapat memiliki nilai "tinggi" atau "rendah". Maka, kita dapat memperkirakan CATE untuk setiap kelompok sebagai berikut:

\hat{CATE}("high") = \frac{1}{N_t^h}\sum_{i \in T^h}Y_i - \frac{1}{N_c^h}\sum_{i \in C^h}Y_i
\hat{CATE}("low") = \frac{1}{N_t^l}\sum_{i \in T^l}Y_i - \frac{1}{N_c^l}\sum_{i \in C^l}Y_i

di mana T^h dan C^h adalah himpunan unit yang diobati dan kontrol dengan pencapaian sebelumnya yang tinggi, N_t^h dan N_c^h adalah jumlah unit-unit tersebut. Demikian pula, T^l dan C^l adalah himpunan unit yang diobati dan kontrol dengan pencapaian sebelumnya yang rendah, dan N_t^l dan N_c^l adalah jumlah unit-unit tersebut.

Local Average Treatment Effect (LATE)

Local Average Treatment Effect (LATE) berfokus pada estimasi efek perawatan untuk individu yang dipengaruhi oleh perawatan tertentu, yang dikenal sebagai "compliers". Compliers adalah individu yang menerima perawatan hanya jika kondisi tertentu terpenuhi, seperti ditugaskan ke kelompok perawatan atau bersedia mematuhi protokol perawatan.

Mari kita pertimbangkan variabel perawatan biner, D, yang mengambil nilai 1 jika individu menerima perawatan dan 0 jika sebaliknya. Selain itu, kita memiliki variabel hasil, Y, yang mewakili respons yang diminati. Hasil potensial ditandai sebagai Y(0) dan Y(1), yang mengindikasikan hasil tanpa perawatan dan di bawah perawatan, masing-masing.

Efek kausal dari perawatan terhadap hasil dapat didefinisikan sebagai:

LATE = \frac{E[Y(1)|Z = 1] - E[Y(0)|Z = 1]}{E[D|Z = 1] - E[D|Z = 0]}

di mana,

  • D adalah indikator perawatan biner, di mana D = 1 mewakili perawatan dan D = 0 mewakili kontrol.
  • Y(D) adalah hasil potensial jika individu menerima tingkat perawatan D.
  • Z adalah variabel instrumental yang mempengaruhi kemungkinan menerima perawatan, tetapi tidak secara langsung mempengaruhi hasil.

Pembilang dalam persamaan ini, E[Y(1)|Z = 1] - E[Y(0)|Z = 1], mengukur perbedaan hasil potensial di bawah perawatan dan kontrol bagi individu yang perawatannya berubah karena variabel instrumental Z. Oleh karena itu, LATE mengukur efek kausal dari perawatan untuk subpopulasi compliers, yaitu mereka yang mengubah status perawatan mereka sebagai respons terhadap variabel instrumental Z.

Perbandingan dengan ATE

Di sisi lain, ATE mengukur perbedaan yang diharapkan dalam hasil jika kita menerapkan perawatan pada seluruh populasi, dibandingkan dengan jika kita menerapkan kontrol pada seluruh populasi.

Perbedaan penting antara ATE dan LATE terletak pada populasi yang mereka targetkan. ATE memberikan efek rata-rata dari perawatan atas seluruh populasi, termasuk mereka yang selalu menerima perawatan, tidak pernah menerima perawatan, dan mereka yang dipengaruhi oleh instrumen (compliers). Di sisi lain, LATE secara khusus menargetkan compliers.

Average Treatment Effect on the Treated (ATT)

Average Treatment Effect on the Treated (ATT), juga dikenal sebagai efek perlakuan pada yang diobati, adalah ukuran penting lain dalam inferensi kausal. Ukuran ini secara khusus memusatkan perhatian pada unit-unit yang menerima perlakuan.

Secara matematis, ATT didefinisikan sebagai:

ATT = E[Y_i(1) - Y_i(0) | D_i = 1]

di mana D_i adalah indikator apakah unit i menerima perlakuan (dengan D_i = 1 jika unit i diobati).

Karena masalah mendasar dalam inferensi kausal, kita tidak dapat secara langsung mengamati Y_i(0) untuk unit yang diobati. Oleh karena itu, kita perlu memperkirakannya, seringkali menggunakan data dari kelompok kontrol. Namun, hal ini dapat memperkenalkan bias jika unit-unit yang diobati dan kontrol berbeda secara sistematis. Berbagai metode, seperti pencocokan atau pembobotan berdasarkan skor kecenderungan (propensity scores), digunakan untuk memperbaiki bias pemilihan ini dan memperkirakan ATT.

Contoh ATT

Misalkan ada program pelatihan kerja yang dirancang untuk meningkatkan prospek kerja. Jika kita secara khusus tertarik pada efek pelatihan pada mereka yang benar-benar menerimanya, kita akan melihat ATT.

Kita dapat menghitung ATT dengan membandingkan hasil kerja dari mereka yang menerima pelatihan dengan individu-individu serupa yang tidak menerima pelatihan. Dengan memfokuskan pada individu-individu serupa, kita berusaha untuk mendekati hasil kontrafaktual Y_i(0) untuk unit-unit yang diobati, sehingga kita dapat memperkirakan ATT. Namun, mengestimasi ATT dapat menjadi tantangan jika penugasan perlakuan tidak acak, sehingga memerlukan pertimbangan yang cermat terhadap variabel-variabel konfounding yang mungkin ada.

Average Treatment Effect on the Controls (ATC)

Average Treatment Effect on the Controls (ATC) adalah ukuran lain yang menarik dalam inferensi kausal, yang memusatkan perhatian pada efek rata-rata yang akan dimiliki perlakuan terhadap unit-unit yang tidak menerima perlakuan.

Secara matematis, ATC didefinisikan sebagai:

ATC = E[Y_i(1) - Y_i(0) | D_i = 0]

di mana D_i adalah indikator apakah unit i menerima perlakuan (dengan D_i = 0 jika unit i berada dalam kelompok kontrol).

Seperti ukuran efek kausal lainnya, kita menghadapi masalah mendasar dalam inferensi kausal ketika mencoba untuk menghitung ATC: kita tidak dapat secara langsung mengamati hasil potensial di bawah perlakuan, Y_i(1), untuk unit-unit kontrol. Oleh karena itu, kita sering perlu memperkirakannya menggunakan hasil yang diamati dari unit-unit yang diobati. Namun, hal ini dapat menghasilkan bias jika unit-unit kontrol dan diobati berbeda secara sistematis. Berbagai metode, seperti pencocokan atau pembobotan berdasarkan skor kecenderungan (propensity scores), dapat digunakan untuk memperbaiki bias ini dan memperkirakan ATC.

Contoh ATC

Mari kita pertimbangkan sebuah program beasiswa yang mencakup biaya kuliah bagi siswa terpilih. Misalkan kita tertarik untuk memahami apa yang akan terjadi pada kinerja akademik siswa penerima beasiswa jika mereka tidak menerima beasiswa. Ini akan menjadi ATC.

Kita dapat memperkirakan ATC dengan membandingkan kinerja akademik siswa penerima beasiswa dengan siswa-siswa serupa yang tidak menerima beasiswa. Dengan memfokuskan pada siswa-siswa serupa, kita berusaha untuk mendekati hasil kontrafaktual Y_i(1) untuk unit-unit kontrol, sehingga kita dapat memperkirakan ATC. Namun, mengestimasi ATC dapat menjadi tantangan jika penugasan perlakuan (pemberian beasiswa dalam hal ini) tidak acak, sehingga memerlukan penanganan yang cermat terhadap variabel-variabel konfounding yang mungkin ada.

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!