2022-04-30

Propensity Score Matching (PSM)

Apa itu Propensity Score Matching (PSM)

Propensity score matching (PSM) adalah teknik statistik yang digunakan dalam studi observasional untuk memperkirakan efek kausal dari suatu intervensi atau perlakuan tertentu dengan mempertimbangkan kovariat yang memprediksi penerimaan perlakuan. Teknik ini memungkinkan hasil yang lebih akurat dengan mengatasi masalah konfounding, di mana efek dari variabel-variabel tertentu dapat bingung dengan efek dari variabel-variabel lainnya.

Teori PSM

Propensity Score adalah probabilitas kondisional menerima perlakuan tertentu berdasarkan kumpulan kovariat yang diamati. Mari kita tandai status perlakuan sebagai $T$ (di mana $T=1$ menunjukkan perlakuan dan $T=0$ kontrol), dan kumpulan kovariat yang diamati sebagai $X$ . Propensity Score, $e(X)$ , didefinisikan sebagai:

e(X) = P(T=1|X)

Ini menggambarkan kemungkinan menerima perlakuan berdasarkan kovariat-kovariat.

Propensity Score berfungsi sebagai skor penyeimbang, yang berarti distribusi kovariat yang diamati akan serupa antara subjek yang diterapi dan yang tidak diterapi dengan Propensity Score yang sama. Secara matematis, sifat ini dapat dinyatakan sebagai:

T \perp X | e(X)

Persamaan ini menyiratkan bahwa, secara kondisional pada Propensity Score, penugasan perlakuan $T$ tidak terkait dengan kovariat-kovariat $X$ .

Dalam studi observasional, tujuannya seringkali untuk memperkirakan average treatment effect (ATE), yang didefinisikan sebagai:

ATE = E[Y(1) - Y(0)]

di mana $Y(1)$ mewakili hasil potensial jika subjek diterapi dan $Y(0)$ mewakili hasil potensial jika subjek tidak diterapi.

Namun, karena kita hanya dapat mengamati satu hasil potensial untuk setiap subjek, memperkirakan ATE secara langsung tidak memungkinkan. PSM membantu mengatasi masalah ini dengan menciptakan pasangan yang cocok antara subjek yang diterapi dan yang tidak diterapi yang memiliki Propensity Score yang serupa, sehingga menyerupai eksperimen acak.

Proses dimulai dengan menghitung Propensity Score untuk setiap subjek, kemudian mencocokkan subjek yang diterapi dan yang tidak diterapi berdasarkan Propensity Score mereka. Setelah pencocokan, keseimbangan kovariat diperiksa untuk memastikan bahwa distribusi kovariat serupa di kedua kelompok. Akhirnya, efek perlakuan diestimasi berdasarkan sampel yang telah dicocokkan.

Untuk mengilustrasikan proses ini, mari kita pertimbangkan contoh hipotetis sederhana:

ID Subjek	Status Perlakuan	Kovariat X1	Kovariat X2	Propensity Score
1	1	5	2	0.75
2	0	4	2	0.72
3	1	7	3	0.80
4	0	5	3	0.78

Dengan mencocokkan berdasarkan Propensity Score, kita dapat menggabungkan Subjek 1 dengan Subjek 2, dan Subjek 3 dengan Subjek 4, menciptakan sampel yang cocok yang seimbang pada kovariat yang diamati.

Asumsi di Balik PSM

Penerapan PSM bergantung pada dua asumsi utama:

Asumsi tidak peduli (Asumsi Kemandirian Kondisional)
Asumsi tumpang tindih (Asumsi Pendukung Umum)

Asumsi Kemandirian Kondisional

Juga dikenal sebagai Asumsi Kemandirian Kondisional (AKK), asumsi ini menyatakan bahwa, dengan mempertimbangkan kovariat yang diamati, hasil potensial adalah independen dari penugasan perlakuan. Secara matematis, hal ini dapat dinyatakan sebagai:

\{Y(0), Y(1)\} \perp T | X

Persamaan ini menyiratkan bahwa, kondisional pada kovariat-kovariat $X$ , hasil potensial $Y(0)$ dan $Y(1)$ independen dari penugasan perlakuan $T$ . Asumsi kemandirian memungkinkan kita untuk memperkirakan efek perlakuan rata-rata dengan membandingkan hasil antara kelompok yang diterapi dan yang tidak diterapi, karena kovariat-kovariat yang diamati yang dapat membingungkan hubungan antara perlakuan dan hasil dikendalikan.

Namun, batasan utama dari asumsi ini adalah bahwa asumsi ini tidak dapat diuji. Tanpa pengetahuan tentang semua confounder potensial atau eksperimen acak, kita tidak dapat dengan pasti memastikan apakah asumsi ini berlaku.

Asumsi Tumpang Tindih

Asumsi tumpang tindih, juga dikenal sebagai asumsi pendukung umum, menyatakan bahwa untuk setiap nilai kovariat, ada probabilitas positif untuk berada dalam kelompok perlakuan atau kelompok kontrol. Dalam hal Propensity Score, ini berarti bahwa untuk setiap Propensity Score, harus ada unit yang diterapi dan unit yang tidak diterapi. Secara matematis, ini dapat dinyatakan sebagai:

0 < P(T=1|X=x) < 1 \quad \text{for all } x

Asumsi ini memastikan bahwa setiap unit yang diterapi dapat dipasangkan dengan unit yang tidak diterapi yang serupa. Tanpa asumsi ini, estimasi efek perlakuan menjadi sulit, terutama untuk unit yang diterapi yang tidak memiliki unit yang tidak diterapi yang serupa (atau sebaliknya).

Penting untuk memeriksa asumsi tumpang tindih ketika menggunakan PSM. Praktik umum adalah dengan membuat plot distribusi Propensity Score untuk kelompok yang diterapi dan yang tidak diterapi, lalu secara visual memeriksa tingkat tumpang tindih. Unit yang diterapi di luar rentang unit yang tidak diterapi (dan sebaliknya) biasanya dihapus dalam proses pencocokan untuk memenuhi asumsi ini.

Proses PSM

Proses PSM dapat dibagi menjadi tiga langkah: mendefinisikan Propensity Score, mencocokkan peserta berdasarkan skor tersebut, dan mengevaluasi kualitas pencocokan.

Mendefinisikan Propensity Score

Langkah pertama dalam PSM adalah menghitung Propensity Score untuk setiap individu dalam studi. Propensity Score adalah probabilitas kondisional dari menerima perlakuan berdasarkan kovariat yang diamati. Biasanya, ini diestimasi menggunakan regresi logistik, meskipun metode lain juga dapat digunakan.

Untuk perlakuan biner $T$ dan kumpulan kovariat yang diamati $X$ , Propensity Score didefinisikan sebagai:

e(X) = P(T=1|X)

Mencocokkan Peserta

Setelah Propensity Score dihitung, langkah selanjutnya adalah mencocokkan peserta yang diterapi dan yang tidak diterapi berdasarkan skor tersebut. Tujuannya adalah menciptakan kelompok peserta yang diterapi dan yang tidak diterapi yang memiliki Propensity Score yang serupa, sehingga menyerupai eksperimen acak.

Beberapa teknik pencocokan yang dapat digunakan antara lain:

Pencocokan tetangga terdekat
Setiap peserta yang diterapi dicocokkan dengan peserta yang tidak diterapi yang memiliki Propensity Score terdekat.
Pencocokan dengan kaliper
Setiap peserta yang diterapi dicocokkan dengan peserta yang tidak diterapi yang memiliki Propensity Score dalam rentang tertentu (kaliper).
Pencocokan dengan stratifikasi
Rentang Propensity Score dibagi menjadi interval (stratum), dan peserta yang diterapi dan yang tidak diterapi dalam stratum yang sama dicocokkan.
Pencocokan dengan kernel
Rata-rata tertimbang dari semua peserta yang tidak diterapi digunakan untuk menciptakan pencocokan untuk setiap peserta yang diterapi, dengan bobot ditentukan oleh Propensity Score.

Masing-masing metode ini memiliki kelebihan dan kelemahan, dan pilihan metode tergantung pada spesifik studi.

Mengevaluasi Kualitas Pencocokan

Langkah terakhir dalam PSM adalah mengevaluasi kualitas pencocokan. Hal ini melibatkan pemeriksaan apakah distribusi kovariat serupa antara kelompok yang diterapi dan yang tidak diterapi setelah pencocokan.

Metode umum untuk mengevaluasi keseimbangan adalah dengan menghitung perbedaan standar rata-rata untuk setiap kovariat sebelum dan setelah pencocokan. Jika proses pencocokan berhasil, perbedaan standar harus kecil (biasanya kurang dari 0,1) untuk semua kovariat setelah pencocokan.

Selain itu, metode grafis dapat digunakan untuk secara visual mengevaluasi keseimbangan. Misalnya, dapat dibuat plot distribusi Propensity Score atau kovariat untuk kelompok yang diterapi dan yang tidak diterapi sebelum dan setelah pencocokan, lalu dibandingkan tingkat tumpang tindih.

Jika kovariat tidak seimbang setelah pencocokan, mungkin perlu menyesuaikan proses pencocokan (misalnya, dengan mengubah kaliper dalam pencocokan dengan kaliper) atau menyertakan kovariat tambahan dalam model Propensity Score. Proses mendefinisikan Propensity Score, mencocokkan peserta, dan mengevaluasi kualitas pencocokan mungkin perlu diulang beberapa kali untuk mencapai keseimbangan yang memuaskan.

Batasan dan Risiko PSM

Meskipun memiliki berbagai aplikasi dan keunggulan, PSM memiliki beberapa batasan dan risiko tertentu. Memahami hal ini penting untuk menginterpretasikan hasil dengan benar dan untuk mengetahui kapan dan bagaimana menggunakan PSM.

Bias Tersembunyi karena Confounder yang Tidak Diukur
Salah satu batasan utama PSM adalah kemungkinan bias tersembunyi karena confounder yang tidak diukur. PSM dapat menyeimbangkan kovariat yang diamati antara kelompok perlakuan dan kelompok kontrol, tetapi jika ada kovariat yang tidak diukur yang mempengaruhi baik penugasan perlakuan maupun hasil, dapat ada bias dalam perkiraan efek perlakuan. Masalah ini menjadi semakin sulit karena asumsi tidak adanya confounder yang tidak diukur tidak dapat diuji.
Ketergantungan yang Berlebihan pada Model Propensity Score
Model Propensity Score, yang sering kali menggunakan regresi logistik, digunakan untuk mengestimasi probabilitas penugasan perlakuan berdasarkan kovariat yang diamati. Jika model ini tidak sesuai dengan baik - jika term- term interaksi penting atau hubungan non-linear terlewatkan, misalnya - Propensity Score yang dihasilkan dapat bias, mengakibatkan estimasi efek perlakuan yang bias.
Pengurangan Ukuran Data
Risiko lain yang mungkin timbul adalah pengurangan ukuran data akibat pencocokan. Ketika unit yang diterapi dicocokkan dengan unit yang tidak diterapi, seringkali unit yang tidak cocok dihapus dari analisis, terutama saat menggunakan pencocokan tepat atau dengan kaliper. Hal ini tidak hanya mengurangi ukuran sampel, tetapi juga dapat memperkenalkan bias jika unit yang dihapus berbeda secara sistematis dari yang dimasukkan. Dalam skenario terburuk, asumsi tumpang tindih dapat dilanggar, yang berarti ada unit yang diterapi yang tidak memiliki unit yang tidak diterapi yang serupa, atau sebaliknya.
Sensitivitas terhadap Pilihan Algoritma Pencocokan
Pilihan algoritma pencocokan dapat memiliki dampak signifikan pada estimasi efek perlakuan. Algoritma yang berbeda (misalnya, pencocokan tetangga terdekat, pencocokan dengan kaliper, kernel, dll.) memiliki kelebihan dan kelemahan yang berbeda, dan tidak ada pilihan yang secara universal "terbaik". Pemilihan algoritma harus dipandu oleh spesifik dari studi, dan idealnya peneliti harus memeriksa kekokohan hasil mereka terhadap pilihan algoritma.

Studi Kasus PSM

Mari kita pertimbangkan sebuah studi kasus hipotetis dalam konteks penelitian pendidikan.

Latar Belakang Studi Kasus

Misalkan kita tertarik untuk mengevaluasi efek dari strategi pengajaran baru (perlakuan) terhadap skor ujian akhir siswa. Strategi pengajaran baru diterapkan di beberapa kelas (kelompok perlakuan), tetapi tidak di kelas lain (kelompok kontrol). Mengingat bahwa ini bukan uji coba acak, mungkin ada faktor confounder, seperti prestasi akademik sebelumnya siswa dan status sosial ekonomi. Dataset kita berisi informasi tentang skor ujian akhir siswa, apakah mereka terpapar dengan strategi pengajaran baru, IPK mereka tahun sebelumnya, dan indeks status sosial ekonomi.

Tabel berikut menggambarkan subset kecil dari data kita:

ID Siswa	Status Perlakuan	IPK Sebelumnya	Indeks Status Sosial Ekonomi	Skor Ujian Akhir
1	1	3.5	7	85
2	0	3.2	5	80
3	1	3.8	8	88
4	0	3.0	6	78
5	0	3.1	6	81
6	1	3.7	7	87

Estimasi Propensity Score

Kita memulai dengan mengestimasi Propensity Score menggunakan model regresi logistik, di mana variabel dependen adalah status perlakuan, dan variabel independen adalah IPK siswa sebelumnya dan indeks status sosial ekonomi. Propensity Score untuk setiap siswa merepresentasikan probabilitas prediksi untuk menerima strategi pengajaran baru berdasarkan kovariat mereka.

Pencocokan Peserta

Langkah selanjutnya adalah mencocokkan siswa dalam kelompok perlakuan dan kelompok kontrol berdasarkan Propensity Score ini. Dalam kasus ini, kita akan menggunakan pencocokan tetangga terdekat tanpa penggantian, yang berarti setiap siswa dalam kelompok kontrol hanya bisa dipasangkan dengan satu siswa dalam kelompok perlakuan.

Memeriksa Keseimbangan

Setelah pencocokan, kita memeriksa keseimbangan kovariat dalam kelompok perlakuan dan kelompok kontrol. Jika perbedaan standar rata-rata untuk kovariat-kovariat tersebut kecil (biasanya kurang dari 0,1), kita dapat menyimpulkan bahwa pencocokan berhasil.

Mengestimasi Efek Perlakuan

Terakhir, kita mengestimasi efek perlakuan dengan membandingkan rata-rata skor ujian akhir antara kelompok perlakuan dan kelompok kontrol. Perbedaan mean ini memberikan perkiraan efek rata-rata dari strategi pengajaran baru terhadap skor ujian akhir siswa.

Regression Discontinuity Design (RDD)

Pembelajaran Mesin (Machine Learning)

Descriptive Statistics

Differential Equation

Dimensionality Reduction

Discrete Choice Model

Google Search Console

Hugging Face

Hypothesis Testing

Inferential Statistics

Probability Distribution

Ryusei Kakujo

Weave the future of cities through data

Transportation modeling/ Urban planning/ Machine learning/ Computer science/ GIS