0% menganggap dokumen ini bermanfaat (0 suara)
188 tayangan10 halaman

Binary Logistic Regression

[Ringkasan] Ringkasan dokumen tersebut adalah: 1. Dokumen tersebut membahas tentang model regresi logistik binary dan cara mengestimasikannya menggunakan SPSS, dengan contoh kasus memprediksi praktik perataan laba perusahaan. 2. Model regresi logistik binary digunakan untuk menggambarkan hubungan antara variabel respon biner dengan satu atau beberapa variabel prediktor. Variabel prediktor dalam contoh kasus ini adalah ukuran perusahaan

Diunggah oleh

Della Ayu Sagita
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
188 tayangan10 halaman

Binary Logistic Regression

[Ringkasan] Ringkasan dokumen tersebut adalah: 1. Dokumen tersebut membahas tentang model regresi logistik binary dan cara mengestimasikannya menggunakan SPSS, dengan contoh kasus memprediksi praktik perataan laba perusahaan. 2. Model regresi logistik binary digunakan untuk menggambarkan hubungan antara variabel respon biner dengan satu atau beberapa variabel prediktor. Variabel prediktor dalam contoh kasus ini adalah ukuran perusahaan

Diunggah oleh

Della Ayu Sagita
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 10

Binary Logistic Regression (Bagian 1): Teori

Kontributor: Kharisma
Prima
Editor: Gin Gumilang
Model regresi logistik digunakan untuk menggambarkan hubungan antara variabel
respon biner dengan satu atau beberapa buah variabel prediktor. Menurut Agresti
(1996), dalam model regresi logistik dapat menggunakan variabel independen yang
berupa kualitatif (berskala pengukuran nominal atau ordinal) atau kuantitatif
(berskala pengukuran interval atau rasio) atau gabungan (campuran) dari keduanya.
Dalam regresi logistik digunakan link function logit.
Variabel dependen dalam regresi logistik pada umumnya berbentuk dikotomus,
dimana variabel dependen dapat mengambil nilai 0 dengan suatu kemungkinan
sukses (x), atau nilai 1 dengan kemungkinan kegagalan 1-(x). Variabel jenis ini
disebut variabel biner.
Seperti yang telah dijelaskan sebelumnya, variabel independen atau prediktor dalam
regresi logistik dapat berbentuk apapun, baik itu berbentuk kategori atau kontinu.
Selain itu, terdapat juga asumsi-asumsi dalam regresi logistik, yakni tidak harus
berdistribusi normal, berhubungan secara linier atau memiliki varians yang sama di
dalam masing-masing kelompok. Hubungan antara variabel prediksi dan variabel
respon bukanlah suatu fungsi linier dalam regresi logistik, sebagai alternatif, fungsi
regresi logistik yang digunakan merupakan transformasi logit dari (x):

dimana = konstanta, = koefisien regresi, dan i = banyaknya variabel independen.


Namun terdapat suatu bentuk alternatif dari persamaan regresi logistik, yaitu:
Untuk menaksir parameter dalam model regresi logistik digunakan metode
penaksiran maximum likelihood melalui iterasi. Dengan cara ini, regresi logistik
menaksir peluang terjadinya suatu peristiwa tertentu. Perhatikan bahwa regresi
logistik menghitung perubahan dalam log odds variabel dependen, bukan perubahan
dalam variabel dependen itu sendiri seperti halnya pada regresi linier biasa.
Odds dapat diartikan sebagai rasio antara dua peluang, seperti rasio antara peluang
peristiwa sukses dengan peluang peristiwa gagal. Nilai odds yang tinggi dapat
disamakan dengan nilai peluang yang tinggi. Begitu pula sebaliknya, nilaiodds yang
rendah sesuai dengan nilai peluang yang rendah. Odds yang dinotasikan oleh
dapat dirumuskan sebagai berikut:

Untuk menghitung asosiasi X dan Y dapat diperlihatkan melalui rasio dua


buah odds yang disebut Odds Ratio, yang mana dinotasikan oleh dengan
perumusan sebagai berikut:

Regresi logistik memiliki banyak kesamaan dengan regresi linier biasa: koefisien
logit dapat disamakan dengan koefisien dalam persamaan regresi linier biasa,
koefisien logit yang distandarisasi dapat disamakan dengan yang diboboti,

dan R2 untuk meringkas kekuatan hubungan. Walau bagaimanapun tidak seperti


regresi linier biasa, regresi logistik tidak mengasumsikan hubungan linier antara
variabel independen dan variabel dependen, tidak memerlukan variabel yang
berdistribusi normal, tidak mengasumsikan homokedastisitas, dan biasanya memiliki
syarat yang lebih sedikit. Akan tetapi, regresi logistik memiliki syarat bahwa
pengamatan bersifat independen. Uji kecocokan model dapat dilakukan dengan
menggunakan chi-square sebagai
indikator
kecocokan
model,
dan
statistik Wald untuk menguji signifikans variabel independen secara individual.
Uji Signifikansi Parameter
Sebelum melakukan uji signifikansi parameter secara individual, lakukan uji
signifikansi parameter secara overall terlebih dahulu. Pengujian secara overall dapat
disebut juga uji keberartian model, dimana salah satu alat pengujiannya
adalah Likelihood Ratio Test. Hipotesis dalam Likelihood Ratio Test adalah H0:
1 = 2 = = p = 0, yang menyatakan model tidak berarti. Statistik uji yang
digunakan dalam Likelihood Ratio Test, yaitu:

dengan:
l0 : Nilai maksimum dari fungsi likelihood untuk model dibawah hipotesis nol.
l1 : Nilai maksimumdari fungsi likelihood untuk model dibawah hipotesis alternatif.
L0 : Nilai fungsi log likelihood yang maksimum untuk model dibawah hipotesis nol.
L1 : Nilai fungsi log likelihood yang maksimum untuk model dibawah hipotesis
alternatif.
Nilai -2(L0L1) tersebut mengikuti distribusi chi-square dengan df = p. Jika -2(L0L1)
(p), maka tolak H0, terima dalam hal lainnya. Jika H0 ditolak artinya model berarti,
sehingga uji signifikansi parameter dapat dilanjutkan dengan pengujian secara
individual untuk mengetahui variabel-variabel X yang signifikan terhadap variabel Y.
Wald Test digunakan untuk menguji signifikans dari tiap koefisien () dalam model.
Hipotesis dalam Wald Test adalah H0: = 0, yang menyatakan peluang sukses
independen terhadap variabel X. Statistik uji yang digunakan dalam Wald Test, yaitu:

Nilai kuadrat Z tersebut mengikuti distribusi chi-square dengan df = 1. Jika Z (1),


maka tolak H0, terima dalam hal lainnya.
Uji Kecocokan Model
Salah satu alat yang dapat digunakan untuk menguji kecocokan model dari regresi
logistik adalah Uji Hosmer-Lemeshow. Statistik Hosmer-Lemeshow mengevaluasi
kecocokan model dengan membuat 10 kelompok pengamatan yang direncanakan
dan kemudian dibandingkan dengan jumlah yang sebenarnya pada masing-masing
kelompok (yang diamati) dengan jumlah yang diprediksi oleh model regresi logistik
(yang diprediksi). Sehingga, statistik uji adalah suatu statistik chi-square dengan df =
g-2, dimana g adalah banyaknya kelompok. Hipotesis (H0) dalam uji HosmerLemeshowadalah model prediksi dengan yang diamati tidak berbeda secara
signifikan.
Langkah-langkah dalam uji Hosmer-Lemeshow adalah sebagai berikut:
Koefisien Determinasi
Koefisien determinasi dapat menjelaskan besarnya kekuatan hubungan antara
variabel dependen dengan variabel independen. Koefisien determinasi pada regresi

linier tidak dapat digunakan pada analisis regresi logistik karena dalam analisis
regresi linier biasa terdapat asumsi bahwa variabel dependen harus berupa metrik.
Agresti (1990), mengemukakan suatu nilai koefisien determinasi pada model regresi
logistik untuk variabel dependen berupa biner yaitu (koefisien determinasi)
dan R0,adj (koefisien determinasi yang disesuaikan), yang dapat dirumuskan sebagai
berikut:
1.
Bentuk sepuluh kelompok pengamatan yang dapat menggunakan dua cara,
yaitu:
a. Pengamatan dapat dikelompokkan berdasarkan peluang taksirannya; yaitu
pengamatan yang mempunyai peluang taksiran 0-0,1 membentuk satu kelompok,
kemudian pengamatan yang mempunyai peluang taksiran 0,1-0,2 membentuk
satu kelompok pula, dan begitu seterusnya, sampai kepada pengamatan yang
mempunyai
peluang
0,9-1,0.
b. Pengamatan dikelompokkan berdasarkan persentil dari nilai peluang
taksirannya; yaitu kelompok pertama beranggotakan n1 = n/10 pengamatan yang
memiliki peluang taksiran terkecil, dan begitu seterusnya hingga kelompok
terakhir beranggotakan n10 = n/10 pengamatan yang memiliki peluang taksiran
terbesar.
2.
Masing-masing kelompok tersebut selanjutnya dibagi menjadi dua kelompok
berdasarkan variabel hasil pengamatan yang sebenarnya (sukses, gagal).
Kemudian sebagian besar pengamatan dengan peristiwa sukses digolongkan
dalam desil resiko yang lebih tinggi dan pengamatan dengan peristiwa gagal
digolongkan dalam desil resiko yang lebih rendah.
3.
Hitung statistik chi-square dengan perumusan sebagai berikut:
dengan:
Ni : Total frekuensi pengamatan kelompok ke-i,
Oi : Frekuensi pengamatan kelompok ke-i,
i : Rata-rata taksiran peluang kelompok ke-i.
4.
Bandingkan dengan nilai pada tabel chi-square dengan df = g-2,
dimana g adalah banyaknya kelompok. Jika HL (g-2) maka tolak hipotesis (H0),
dan terima dalam hal lainnya.
Koefisien Determinasi
Koefisien determinasi dapat menjelaskan besarnya kekuatan hubungan antara
variabel dependen dengan variabel independen. Koefisien determinasi pada regresi
linier tidak dapat digunakan pada analisis regresi logistik karena dalam analisis
regresi linier biasa terdapat asumsi bahwa variabel dependen harus berupa metrik.
Agresti (1990), mengemukakan suatu nilai koefisien determinasi pada model regresi
logistik untuk variabel dependen berupa biner yaitu (koefisien determinasi)
dan R0,adj (koefisien determinasi yang disesuaikan), yang dapat dirumuskan sebagai
berikut:

dan R0,adj sebagai berikut:

dengan:

n: banyaknya pengamatan
k: banyaknya prediktor
Untuk
memudahkan
proses
estimasi
model,
kita
dapat
menggunakan software statistik seperti SPSS, Stata, Minitab, atau yang lainnya.
Pada artikel berikutnya akan dijelaskan langkah-langkah analisa dan interpretasi
model binary logistic regression dengan menggunakan software SPSS.

Binary Logistic Regression (Bagian 2): SPSS


Tutorial
Kontributor: Kharisma
Prima
Editor: Gin Gumilang
Seperti yang telah dipaparkan pada artikel sebelumnya, dimana model regresi
logistik digunakan untuk menggambarkan hubungan antara variabel respon biner
dengan satu atau beberapa buah variabel prediktor, kali ini saya akan
memberikan tutorial singkat tentang bagaimana cara mengestimasi model regresi
logistik tersebut dengan menggunakan bantuan aplikasi program SPSS.
Dalam tutorial ini saya menggunakan SPSS versi 13.0, namun Anda dapat
menggunakan versi lainnya dengan tampilan yang kurang lebih sama dengan versi
yang saya gunakan. Oke, langsung saja kita beranjak pada contoh kasus.
Misalkan seorang peneliti ingin mengetahui faktor-faktor apa saja yang
mempengaruhi sebuah perusahaan akan melakukan praktik perataan laba (income
smoothing). Faktor-faktor tersebut telah diidentifikasi sebanyak 3 faktor yang
kemudian akan menjadi variabel prediktor, antara lain: ukuran perusahaan (LnTA);
profitabilitas perusahaan (RoA); dan rasio debt perusahaan (DAR). Ketiga
variabel ini akan memprediksi praktik perataan laba, sehingga variabel respon di
dalam model regresi logistik ini adalah variabel income smoothing (IS).
Menyiapkan Data
Pertama-tama, buka SPSS Data Editor dan pada tab Variable View (1) buatlah 4
variabel dengan nama masing-masing LnTA, RoA, DAR dan IS. Ubah nilai desimal
variabel IS pada kolom Decimals (2) menjadi 0.

Langkah selanjutnya, klik pada bagian baris IS dan kolom Values (3), sehingga akan
muncul jendela Value Labels. Pada bagian ini kita definisikan kategori Income
Smoothing (IS) berdasarkan data yang kita miliki (4), dimana kategori perata kita
beri skor 1 dan kategori bukan perata kita beri skor 0. Masukkan skor 0 pada
bagian Value dan bukan perata pada bagian Value Label, lalu klik Add. Lakukan
hal yang sama untuk kategori perata. Klik OK. Perlu diperhatikan bahwa
pendefinisian skor 1 dan 0 tidak boleh terbalik, skor 1 untuk kategori/peluang sukses
dan skor 0 untuk kategori/peluang gagal.

Klik pada tab Data View (5), lalu masukkan satu per satu data penelitian sesuai
variabel-variabel yang bersangkutan (6).

Sebagaimana terlihat pada gambar di atas, variabel LnTA, RoA dan DAR masingmasing bertipe data metrik, sedangkan variabel IS bertipe data kategorik (binary).
Langkah-langkah Estimasi
Klik Analyze > Regression > Binary Logistic, sehingga akan muncul jendela Logistic
Regression. Masukkan variabel LnTA, RoA dan DAR ke kolom Covariates,
sedangkan variabel IS ke kolom Dependent. Pada bagian Method paling tidak
terdapat
3
opsi
yang
dapat
digunakan,
yakni Enter dan Stepwise. Metode Stepwise sendiri
terbagi
menjadi
dua,
yakni Forward dan Backward. Pada contoh kali ini kita gunakan metode Enter,
dimana seluruh variabel prediktor dimasukkan ke dalam model dan diestimasi
secara bersama-sama. Metode Stepwise akan dibahas pada artikel lainnya.

Masih pada jendela Logistic Regression, klik Options, lalu beri tanda checklist pada
bagian Classification plots, Hosmer-Lameshow goodnes-of-fit, Correlations of
estimates, Iteration history dan CI for exp(B). Klik Continue.

Apabila pada variabel-variabel prediktor terdapat variabel yang bertipe data


kategorik, maka kita perlu mendefinisikannya dengan cara klik Categorical, lalu
masukkan variabel prediditor bertipe data kategorik tersebut ke kolom Categorical
covariates, klik Continue. Namun pada contoh kasus kali ini, seluruh variabel
prediktor bertipe data metrik.
Klik OK, maka akan muncul jendela SPSS Viewer yang berisi output hasil estimasi
regresi logistik.
Hasil dan Interpretasi

Melalui kedua tabel Iteration History di atas kita dapat menghitung nilai -2(L0
L1) sebagai berikut:
-2(L0L1) = 715,356 693,364 = 21,992
Dengan = 0,05 dan degree of freedom (df) = k = 3, dimana k adalah jumlah
variabel prediktor, didapat nilai (p) dari tabel distribusi chi-kuadrat sebesar 7,815.
Dikarenakan 21,992 > 7, 815 atau -2(L0L1) > (p), maka dapat disimpulkan bahwa
secara bersama-sama (simultan), ketiga variabel prediktor berpengaruh signifikan
terhadap variabel Income Smoothing (IS).

SPSS
tidak
mengakomodir
nilai R0,adj (koefisien
determinasi
yang
disesuaikan). Namun sebagai alternatif, SPSS menyediakan Cox & Snell R
Square dan Nagelkerke R Square. Untuk dapat mengestimasi nilai R0,adj, kita harus
melakukannya secara manual menggunakan bantuan aplikasi program Ms.Excel
atau yang lainnya. Tutorial estimasi nilai R0,adj ini akan dibahas pada artikel lainnya.
Cox & Snells R Square merupakan ukuran yang mencoba meniru
ukuran R pada multiple
linear
regression yang
didasarkan
pada
teknik

estimasi likelihood dengan nilai maksimum kurang dari 1 (satu) sehingga sulit
diinterpretasikan (Ghozali, 2011:341). Lebih lanjut menurut Ghozali, Nagelkerkes R
Square merupakan modifikasi dari koefisien Cox dan Snell untuk memastikan bahwa
nilainya bervariasi dari 0 (nol) sampai 1 (satu). Hal ini dilakukan dengan cara
membagi nilai Cox & Snells R Square dengan nilai maksimumnya.
Nilai Nagelkerkes R Square dapat diinterpretasikan seperti nilai R pada multiple
linear regression.
Melalui tabel Model Summary di atas didapat nilai Nagelkerkes R Square sebesar
0,055. Hal ini mengindikasikan bahwa variabilitas variabel dependen (IS) yang dapat
dijelaskan oleh variabilitas variabel independen (LnTA, RoA dan DAR secara
simultan) adalah sebesar 5,5%, sedangkan sisanya sebesar 94,5% dijelaskan oleh
variabilitas variabel lain diluar ketiga variabel independen yang diteliti tersebut.

Melalui tabel Variables in the Equation di atas dapat terlihat nilai taksiran koefisien
regresi modelnya, sehingga didapatkan model regresi logistik sebagai berikut:

atau

dimana e adalah bilangan konstanta bernilai 2,71828. Hasil persamaan regresi


logistik di atas tidak bisa langsung diinterpretasikan dari nilai koefisiennya seperti
dalam regresi linier biasa. Interpretasi bisa dilakukan dengan melihat
nilai Exp(B) atau nilai eksponen dari koefisien persamaan regresi yang terbentuk
(Yamin & Kurniawan, 2014:101). Interpretasi dalam persamaan regresi logistik harus
dilakukan secara hati-hati ketika variabel prediktor yang dimasukkan ke dalam model
memiliki beberapa tipe data. Untuk variabel prediktor pada contoh kasus ini, dimana
ketiga variabel prediktor bertipe data metrik, nilai Exp(B) dapat diinterpretasikan jika
variabel
LnTA meningkat
sebesar
1
satuan,
maka
akan
terdapat
perubahan odds ratio sebesar 1,207. Demikian juga halnya interpretasi pada
variabel prediktor lainnya.
Melalui persamaan model tersebut kita dapat melakukan prediksi income
smoothing (IS) berdasarkan nilai-nilai tertentu yang telah diketahui pada variabel
LnTA, RoA dan DAR. Misalkan diketahui nilai LnTA sebesar 20,51 RoA sebesar 6,67
dan DAR sebesar 0,62, kemudian nilai-nilai tersebut kita substitusikan ke dalam
persamaan model sebagai berikut:

Seperti yang telah didefinisikan sebelumnya bahwa skor 1 merupakan kategori


perata dan skor 0 merupakan kategori bukan perata, maka hasil prediksi di atas
dapat dikategorikan sebagai perusahaan yang melakukan praktik perataan laba
(income smoothing). Hal ini dikarenakan hasil nilai logit sebesar 0,718 tersebut di
atas bernilai lebih besar dari nilai cut-off 0,5. Namun jika nilai logit kurang dari nilai
cut-off 0,5, maka hasil prediksi dapat dikategorikan sebagai bukan perata.
Masih melalui tabel Variables in the Equation, nilai probabilitas (p-value) signifikansi
parameter dapat dilihat pada kolom Sig., dimana p-value yang lebih kecil dari taraf
signifikansi yang telah ditetapkan (0,05) dapat diartikan bahwa variabel prediktor
yang bersangkutan memiliki pengaruh yang signifikan terhadap variabel
respon. Dapat diketahui bahwa secara parsial, variabel LnTa berpengaruh signifikan
terhadap IS (0,001 < 0,05), variabel RoA tidak berpengaruh signifikan terhadap IS
(0,068 > 0,05) dan variabel DAR tidak berpengaruh signifikan terhadap IS (0,067
> 0,05). Uji signifikansi parameter dapat pula dilakukan menggunakan nilai interval
konfidensi 95%. Sebagai contoh nilai 95,0% C.I. for EXP(B) pada variabel LnTa
adalah sebesar 1,077 (Lower) dan sebesar 1,353 (Upper), maka dapat disimpulkan
bahwa LnTA berpengaruh nyata terhadap IS. Hal ini dikarenakan nilai 1 (satu)
berada diluar retang interval konfidensi tersebut. Sebaliknya, apabila nilai 1 (satu)
berada di dalam rentang interval konfidensi, maka variabel prediktor dapat
dinyatakan tidak berpengaruh nyata terhadap variabel respon seperti terlihat pada
hasil interval konfidensi variabel RoA dan DAR.

Tabel Hosmer and Lemeshow Test di atas digunakan untuk menguji kesesuaian
model (goodness of fit), atau dengan kata lain untuk menguji apakah model yang
kita gunakan, yaitu dengan menggunakan dua variabel independen (LnTa, RoA dan
DAR) sudah sesuai dengan data empiris atau tidak. Hipotesis nol pada pengujian ini
adalah model telah cukup menjelaskan data (fit) dengan kriteria uji tolak hipotesis
nol jika nilai probabilitas lebih kecil atau sama dengan taraf signifikansi yang telah
ditetapkan (p 0,05). Berdasarkan tabel di atas didapat nilai Chi-square sebesar
8,502 dengan nilai probabilitas sebesar 0,386. Dengan demikian hipotesis nol
diterima (0,386 > 0,05), artinya model telah cukup menjelaskan data (fit).
Referensi:
o
Ghozali, Imam. 2011. Aplikasi Multivariate dengan Program IBM SPSS 19,
Edisi 5. Semarang: Badan Penerbit Universitas Diponegoro.
o
Yamin, Sofyan & Heri Kurniawan. 2014. SPSS Complete Teknik Analisis
Statistik Terlengkap dengan Software SPSS, Edisi 2. Jakarta: Salemba Infotek.

Anda mungkin juga menyukai