Traffine I/O

Bahasa Indonesia

Apa itu Model Logit Campuran

Model Logit Campuran, juga dikenal sebagai model logit parameter acak atau model logit koefisien acak, memperkenalkan fleksibilitas dan menangkap heterogenitas yang tidak diamati dalam perilaku pilihan dengan memperbolehkan variasi acak dalam preferensi individu.

Koefisien acak

Dalam model logit tradisional, koefisien yang mewakili efek variabel penjelas pada probabilitas pilihan diasumsikan tetap di seluruh populasi. Namun, asumsi ini dapat membatasi, karena tidak memungkinkan kemungkinan bahwa individu yang berbeda memiliki sensitivitas yang berbeda terhadap atribut alternatif.

Model logit campuran mengatasi keterbatasan ini dengan memperlakukan koefisien ini sebagai variabel acak. Dengan menentukan distribusi untuk setiap koefisien acak, kita dapat menangkap variasi preferensi di seluruh populasi. Distribusi yang umum digunakan termasuk distribusi normal, log-normal, dan seragam. Distribusi ini dapat dipilih berdasarkan pertimbangan teoritis, atau dapat dipilih melalui perbandingan dan pengujian model.

Komponen kesalahan

Komponen kesalahan mewakili sumber heterogenitas yang tidak diamati tambahan dalam model logit campuran. Mereka dapat dianggap sebagai faktor yang tidak diamati yang memengaruhi utilitas alternatif dengan cara yang sistematis, seperti karakteristik produk yang tidak terukur atau preferensi personal. Dengan menyertakan komponen kesalahan dalam model, kita dapat memperhitungkan korelasi antara alternatif dan menangkap kesamaan dalam perilaku pilihan individu.

Komponen kesalahan dapat ditentukan dalam berbagai cara, tergantung pada konteks dan jenis korelasi yang ingin ditangkap. Misalnya, kita dapat menyertakan komponen kesalahan umum untuk alternatif yang termasuk dalam kelompok atau kategori yang sama, atau kita dapat memodelkan komponen kesalahan sebagai variabel acak yang saling berkorelasi untuk menangkap struktur ketergantungan di antara alternatif.

Manfaat Model Logit Campuran

Model logit campuran menawarkan beberapa keuntungan dibandingkan dengan model logit tradisional:

  • Mereka memperhitungkan heterogenitas preferensi yang tidak diamati, menghasilkan representasi preferensi dan perilaku pilihan individu yang lebih akurat.
  • Mereka dapat menangkap korelasi antara alternatif, memungkinkan pemodelan pola substitusi yang lebih realistis.
  • Mereka lebih fleksibel dalam hal bentuk fungsional dan dapat menampung rentang spesifikasi utilitas yang lebih luas.
  • Mereka dapat lebih baik menangani keberadaan data panel dan pilihan yang diulang, yang umum dalam banyak aplikasi pemodelan pilihan.

Aplikasi Praktis Model Logit Campuran

Model logit campuran telah ditemukan penggunaannya yang luas dalam berbagai bidang karena kemampuannya untuk memperhitungkan heterogenitas preferensi yang tidak diamati dan menangkap korelasi antara alternatif. Bab ini memamerkan beberapa aplikasi yang paling umum dari model logit campuran, menyoroti nilai praktis dan keandalannya dalam mengatasi masalah dunia nyata.

Penelitian Pasar dan Analisis Pilihan Konsumen

Dalam penelitian pasar, model logit campuran digunakan untuk memahami dan memprediksi preferensi konsumen untuk berbagai produk dan layanan. Dengan memasukkan koefisien acak dan komponen kesalahan, model-model ini dapat menangkap variasi preferensi individu dan memperhitungkan faktor yang tidak diamati yang mempengaruhi perilaku pilihan. Aplikasi dalam domain ini meliputi:

  • Model pemilihan merek
    Mengestimasi efek atribut produk, variabel campuran pemasaran, dan karakteristik konsumen pada preferensi merek.

  • Analisis conjoint
    Menganalisis kompromi yang dibuat konsumen saat memilih di antara produk dengan banyak atribut.

  • Desain produk baru
    Mengidentifikasi kombinasi optimal fitur produk dan strategi penetapan harga yang memaksimalkan kepuasan konsumen dan pangsa pasar.

Perencanaan dan Analisis Kebijakan Transportasi

Model logit campuran banyak digunakan dalam perencanaan transportasi untuk memodelkan perilaku perjalanan individu dan membantu keputusan kebijakan. Model-model ini dapat membantu perencana memahami bagaimana berbagai faktor, seperti waktu perjalanan, biaya, dan atribut moda, memengaruhi pilihan moda perjalanan dan pemilihan rute. Beberapa aplikasi dalam perencanaan transportasi meliputi:

  • Model pemilihan moda
    Mengestimasi probabilitas individu memilih mode transportasi yang berbeda, seperti mobil, bus, atau kereta.

  • Model pemilihan rute
    Memprediksi kemungkinan traveler memilih rute atau jalur tertentu berdasarkan waktu perjalanan, kemacetan, dan karakteristik rute lainnya.

  • Evaluasi kebijakan
    Menilai dampak potensial kebijakan transportasi, seperti tarif kemacetan atau subsidi transit, pada perilaku perjalanan dan pemilihan moda.

Ekonomi Kesehatan dan Pengambilan Keputusan Medis

Dalam ekonomi kesehatan, model logit campuran telah digunakan untuk menganalisis preferensi individu terhadap layanan perawatan kesehatan, rencana asuransi, dan opsi pengobatan. Dengan mengakomodasi heterogenitas preferensi, model-model ini dapat memberikan wawasan tentang faktor yang mendorong pilihan yang berhubungan dengan kesehatan dan menginformasikan intervensi kebijakan. Aplikasi dalam ekonomi kesehatan meliputi:

  • Model permintaan layanan kesehatan
    Mengestimasi efek harga, kualitas, dan aksesibilitas pada pilihan penyedia layanan kesehatan atau layanan.

  • Model pemilihan asuransi kesehatan
    Menganalisis preferensi individu untuk rencana asuransi yang berbeda dan opsi cakupan.

  • Pengambilan keputusan pasien
    Memahami kompromi yang dilakukan pasien saat memilih pengobatan medis atau intervensi, berdasarkan faktor seperti risiko, efektivitas, dan efek samping.

Implementasi Model Logit Campuran dengan Dataset Train

Pada bab ini, saya akan mengimplementasikan model logit campuran dengan menggunakan dataset Train dari paket mlogit.

Menyiapkan Data

Pertama, kita perlu memuat pustaka mlogit dan dataset Train.

r
library("mlogit")
data("Train", package = "mlogit")

Kita akan mempersiapkan data dengan membuat variabel choiceid, mengubah skala price dan time, dan mengonversi dataset menjadi format yang sesuai untuk mlogit.

r
# Create a new variable choiceid in the Train dataset.
# The choiceid variable assigns a unique identifier
# (running from 1 to the number of rows in the Train dataset) to each observation.
Train$choiceid <- 1:nrow(Train)

# Reshape the dataset to long format and convert to mlogit format
Tr <- dfidx(Train, choice = "choice", varying = 4:11, sep = "_",
            opposite = c("price", "comfort", "time", "change"),
            idx = list(c("choiceid", "id")), idnames = c("chid", "alt"))

# Rescale price to Euro and time to hours
Tr$price <- Tr$price / 100 * 2.20371
Tr$time <- Tr$time / 60

Mengestimasi Model Logit Campuran

Kita akan memperkirakan model logit campuran dengan variabel price, time, change, dan comfort. Kita akan memasukkan koefisien acak untuk time, change, dan comfort untuk memperhitungkan heterogenitas preferensi yang spesifik pada individu. Formula dapat ditulis sebagai berikut:

r
choice ~ price + time + change + comfort | - 1

Bagian sebelum | merepresentasikan komponen utilitas sistematis, sedangkan - 1 setelah | menunjukkan bahwa tidak ada konstanta khusus alternatif dalam model.

Dengan formula model yang ditentukan, kita sekarang dapat memperkirakan model logit campuran menggunakan fungsi mlogit(). Kita perlu memberikan beberapa argumen ke fungsi tersebut:

  • formula: Formula model yang ditentukan sebelumnya.
  • data: Dataset Train yang telah dipersiapkan (Tr) dalam format mlogit.
  • panel: Diatur ke TRUE untuk memperhitungkan struktur panel data.
  • rpar: Vektor yang menentukan distribusi koefisien acak (dalam kasus kita, distribusi normal "n" untuk time, change, dan comfort).
  • R: Jumlah simulasi acak Halton untuk koefisien acak (100 simulasi dalam kasus kita).
  • correlation: Diatur ke FALSE untuk mengasumsikan tidak ada korelasi antara koefisien acak.
  • halton: Diatur ke NA untuk menggunakan urutan Halton default untuk simulasi.
  • method: Diatur ke "bhhh" untuk menggunakan algoritma optimasi Berndt, Hall, Hall, dan Hausman.

Kode untuk memperkirakan model logit campuran adalah:

r
Train.mxlu <- mlogit(
  choice ~ price + time + change + comfort | - 1,
  Tr,
  panel = TRUE,
  rpar = c(time = "n", change = "n", comfort = "n"),
  R = 100,
  correlation = FALSE,
  halton = NA,
  method = "bhhh"
)

Terjemahkan Hasil

Mari kita menafsirkan hasil dengan mencetak ringkasan model.

r
summary(Train.mxlu)
Call:
mlogit(formula = choice ~ price + time + change + comfort | -1,
    data = Tr, rpar = c(time = "n", change = "n", comfort = "n"),
    R = 100, correlation = FALSE, halton = NA, panel = TRUE,
    method = "bhhh")

Frequencies of alternatives:choice
      A       B
0.50324 0.49676

bhhh method
44 iterations, 0h:0m:6s
g'(-H)^-1g = 8.58E-07
gradient close to zero

Coefficients :
            Estimate Std. Error z-value  Pr(>|z|)
price      0.1373518  0.0061272 22.4166 < 2.2e-16 ***
time       4.3084957  0.2917274 14.7689 < 2.2e-16 ***
change     0.8879947  0.0956106  9.2876 < 2.2e-16 ***
comfort    2.4534514  0.1428630 17.1735 < 2.2e-16 ***
sd.time    4.9079488  0.3624716 13.5402 < 2.2e-16 ***
sd.change  1.6382549  0.1367053 11.9838 < 2.2e-16 ***
sd.comfort 2.4009629  0.1580942 15.1869 < 2.2e-16 ***
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Log-Likelihood: -1551.4

random coefficients
        Min.    1st Qu.    Median      Mean  3rd Qu. Max.
time    -Inf  0.9981346 4.3084957 4.3084957 7.618857  Inf
change  -Inf -0.2169914 0.8879947 0.8879947 1.992981  Inf
comfort -Inf  0.8340265 2.4534514 2.4534514 4.072876  Inf

Hasil menunjukkan koefisien yang diperkirakan, kesalahan standar, z-nilai, dan nilai p untuk setiap variabel. Semua variabel secara statistik signifikan pada tingkat 0,001. Koefisien positif untuk time, change, dan comfort menunjukkan bahwa penumpang lebih memilih waktu perjalanan yang lebih singkat, lebih sedikit perubahan, dan kereta yang lebih nyaman.

Untuk price, intuisinya adalah koefisien harus negatif, tetapi koefisien yang diperkirakan sedikit positif.

Koefisien acak (simpangan baku) untuk time, change, dan comfort juga secara statistik signifikan, menunjukkan bahwa preferensi untuk variabel ini bervariasi di antara individu.

Willingness to Pay (WTP)

Willingness to Pay (WTP) adalah konsep penting dalam model pilihan diskrit, karena memberikan ukuran dari seberapa banyak nilai moneter yang ditempatkan penumpang pada atribut tertentu. Untuk menghitung WTP untuk time, change, dan comfort, kita akan membagi koefisien masing-masing dengan koefisien price:

r
coef(Train.mxlu)[2:4] / coef(Train.mxlu)[1]
     time    change   comfort
31.368325  6.465112 17.862536

Nilai WTP memberikan perkiraan nilai moneter yang ditempatkan penumpang pada atribut time, change, dan comfort:

  • Time
    Penumpang bersedia membayar sekitar 31,37 unit mata uang untuk mengurangi waktu perjalanan satu unit (misalnya satu jam). Nilai ini menunjukkan pentingnya waktu perjalanan sebagai faktor dalam memilih kereta.

  • Change
    Penumpang bersedia membayar sekitar 6,47 unit mata uang untuk mengurangi jumlah perubahan satu. Ini menunjukkan bahwa penumpang lebih suka kereta langsung dan bersedia membayar lebih untuk itu.

  • Comfort
    Penumpang bersedia membayar sekitar 17,86 unit mata uang untuk kenaikan satu satuan kenyamanan. Nilai ini menunjukkan bahwa penumpang menilai kenyamanan saat memilih kereta dan bersedia membayar premi untuk kereta yang lebih nyaman.

Referensi

https://cran.r-project.org/web/packages/mlogit/vignettes/c5.mxl.html

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!