Traffine I/O

Bahasa Indonesia

Apa itu Logit Model

Model Logit, juga dikenal sebagai regresi logistik, adalah metode statistik yang banyak digunakan untuk menganalisis dan memprediksi hasil biner, ordinal, dan nominal berdasarkan satu atau lebih variabel independen. Model ini termasuk dalam kelas yang lebih luas dari model linier tergeneralisasi (GLM) dan sangat cocok untuk situasi di mana hubungan antara variabel independen dan dependen tidak bersifat linear.

Nama model "logit" berasal dari logaritma odds, yang merupakan konsep inti dari model ini. Odds didefinisikan sebagai rasio antara probabilitas terjadinya suatu peristiwa dengan probabilitas peristiwa tersebut tidak terjadi. Model logit menggunakan logaritma alami dari odds sebagai variabel respon, memungkinkan prediksi probabilitas yang berkisar antara 0 dan 1.

Model logit digunakan dalam berbagai disiplin ilmu seperti ekonomi, ilmu politik, pemasaran, perawatan kesehatan, ilmu sosial, dan perencanaan transportasi. Beberapa aplikasi umum dari model logit antara lain:

  • Ekonomi
    Menganalisis pilihan dan preferensi konsumen, memprediksi pangsa pasar, dan mempelajari hasil pasar tenaga kerja.

  • Ilmu Politik
    Menyelidiki perilaku pemilih, mempelajari faktor-faktor yang menentukan partisipasi politik, dan menganalisis hasil pemilihan.

  • Pemasaran
    Memprediksi pilihan pelanggan, memahami dampak iklan, dan membagi pasar.

  • Perawatan Kesehatan
    Menganalisis prevalensi penyakit, memprediksi hasil pasien, dan menilai faktor risiko.

  • Ilmu Sosial
    Menyelidiki faktor-faktor yang menentukan pencapaian pendidikan, mempelajari mobilitas sosial, dan menganalisis kejahatan dan kebiasaan ulang.

  • Perencanaan Transportasi
    Memodelkan pilihan moda, pilihan rute, dan pilihan tujuan, mengevaluasi kebijakan transportasi dan investasi infrastruktur, dan menilai dampak pola penggunaan lahan pada perilaku transportasi.

Konsep Utama dalam Model Logit

Dalam model logit, hubungan antara variabel independen dan dependen ditetapkan dengan menggunakan fungsi logistik. Fungsi logistik, direpresentasikan sebagai:

P(Y=1 | X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k)}}

mengubah kombinasi linear dari variabel independen menjadi probabilitas yang berkisar antara 0 dan 1. Di sini, P(Y=1 | X) menyatakan probabilitas variabel dependen Y mengambil nilai 1, dengan variabel independen X, dan \beta_0, \beta_1, \dots, \beta_k adalah koefisien yang perlu diestimasi.

Kelebihan dan Keterbatasan Model Logit

Kelebihan

  • Model logit dapat menangani variabel dependen biner, ordinal, dan nominal, sehingga sangat fleksibel dalam berbagai pengaturan penelitian.
  • Berbeda dengan regresi linier, keluaran model logit berupa probabilitas yang berkisar antara 0 dan 1, sehingga lebih mudah diinterpretasikan dalam aplikasi praktis.
  • Model ini dapat menyesuaikan beberapa variabel independen, termasuk variabel kontinu, diskrit, dan kategorikal.

Keterbatasan

  • Model logit mengasumsikan bahwa hubungan antara variabel independen dan log odds bersifat linear, yang mungkin tidak selalu benar.
  • Dibutuhkan sampel besar untuk menghasilkan perkiraan yang stabil dan dapat diandalkan.
  • Model ini mengasumsikan independensi dari observasi, yang mungkin tidak terjadi pada beberapa pengaturan, seperti data panel atau data longitudinal.

Fungsi Utilitas

Fungsi utilitas adalah representasi matematis dari preferensi individu, di mana nilai yang lebih tinggi dari fungsi tersebut mewakili tingkat kepuasan atau utilitas yang lebih tinggi yang diperoleh dari pilihan atau hasil tertentu. Fungsi utilitas adalah komponen penting dari model logit, karena membantu mengukur bagaimana individu membuat keputusan berdasarkan nilai yang tersedia dari pilihan yang tersedia.

Dalam konteks model logit, fungsi utilitas digunakan untuk memodelkan pilihan yang dibuat oleh individu atau entitas, dengan mempertimbangkan preferensi dan pengorbanan antara alternatif yang tersedia. Asumsi mendasar adalah bahwa individu atau entitas membuat pilihan yang memaksimalkan utilitas mereka, dengan mempertimbangkan karakteristik dan kendala mereka.

Dalam konteks model logit, fungsi utilitas dapat direpresentasikan sebagai:

U_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \dots + \beta_k X_{ki} + \varepsilon_i

di mana U_i menyatakan utilitas alternatif i, \beta_0 adalah intercept, \beta_1, \beta_2, \dots, \beta_k adalah koefisien dari variabel independen X_{1i}, X_{2i}, \dots, X_{ki}, dan \varepsilon_i adalah istilah kesalahan.

Model Utilitas Acak dan Model Logit

Dalam model utilitas acak (RUMs), fungsi utilitas terdiri dari komponen deterministik dan komponen stokastik, mencerminkan faktor-faktor yang tidak dapat diamati yang mempengaruhi preferensi individu. Komponen deterministik menangkap bagian sistematis dari utilitas, yang dapat dijelaskan oleh variabel independen yang diamati. Komponen stokastik mewakili faktor-faktor yang tidak diamati yang mempengaruhi utilitas.

Model logit adalah kasus khusus dari model utilitas acak, di mana komponen stokastik dari fungsi utilitas mengikuti distribusi Gumbel. Asumsi distribusi ini mengarah pada ekspresi probabilitas pilihan yang mudah dihitung dalam model logit, sehingga model ini dapat diestimasi dengan lebih mudah.

Utilitas Tidak Langsung dan Probabilitas Pilihan

Dalam model logit, probabilitas memilih alternatif tertentu berasal dari fungsi utilitas tidak langsung. Fungsi utilitas tidak langsung mencerminkan utilitas maksimum yang dapat diperoleh oleh individu, dengan mempertimbangkan pilihan yang tersedia dan karakteristiknya.

Untuk model logit biner, probabilitas pilihan dapat diungkapkan sebagai:

P(Y=1 | X) = \frac{e^{U_1}}{e^{U_1} + e^{U_0}}

di mana U_1 dan U_0 adalah fungsi utilitas tidak langsung untuk alternatif 1 dan 0, masing-masing.

Model Logit Biner

Model logit biner adalah bentuk paling sederhana dari model logit dan digunakan untuk memodelkan hasil biner. Model ini memprediksi probabilitas terjadinya suatu kejadian (misalnya, keberhasilan, kehadiran, atau pemilihan alternatif 1) berdasarkan satu atau lebih variabel independen. Model ini sangat berguna ketika hubungan antara variabel independen dan variabel dependen biner tidak bersifat linear.

Dalam model logit biner, probabilitas pemilihan dihitung sebagai:

P(Y=1 | X) = \frac{e^{U_1}}{e^{U_1} + e^{U_0}}

di mana U_1 dan U_0 adalah fungsi utilitas untuk alternatif 1 dan 0, masing-masing.

Model Logit Multinomial

Model logit multinomial memperluas model logit biner untuk situasi dengan lebih dari dua pilihan tanpa urutan (yaitu, hasil nominal). Model ini memprediksi probabilitas setiap alternatif berdasarkan satu atau lebih variabel independen.

Dalam model logit multinomial, probabilitas pemilihan untuk alternatif j dihitung sebagai:

P(Y=j | X) = \frac{e^{U_j}}{\sum_{i=1}^{J} e^{U_i}}

di mana U_j adalah fungsi utilitas untuk alternatif j, dan J adalah jumlah total alternatif.

Model Logit Ordinal

Model logit ordinal digunakan ketika variabel dependen memiliki kategori yang terurut, seperti tingkat kepuasan atau persetujuan. Dalam model ini, probabilitas kumulatif untuk mengamati suatu hasil kurang dari atau sama dengan kategori tertentu dimodelkan sebagai fungsi dari variabel independen.

Model logit ordinal dapat dinyatakan sebagai:

P(Y \leq j | X) = \frac{e^{\alpha_j - (\beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k)}}{1 + e^{\alpha_j - (\beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k)}}

di mana \alpha_j adalah parameter ambang untuk kategori j, dan \beta_0, \beta_1, \dots, \beta_k adalah koefisien dari variabel independen.

Pemilihan Model dan Pertimbangan

Ketika memilih antara model logit biner, multinomial, dan ordinal, penting untuk mempertimbangkan sifat variabel dependen dan pertanyaan penelitian yang ditangani. Model logit biner cocok untuk hasil biner, model logit multinomial untuk hasil nominal tanpa urutan, dan model logit ordinal untuk hasil kategori yang terurut.

Selain itu, penting untuk memastikan bahwa asumsi model terpenuhi, seperti independensi alternatif yang tidak relevan (IIA) untuk model logit multinomial dan proporsi peluang untuk model logit ordinal.

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!