BAB II
TINJAUAN PUSTAKA
2.1 Tinjauan Statistik
2.1.1 Analisis Regresi Logistik
1) Regresi Logistik Biner
Regresi Logistik Biner merupakan suatu metode analisis data
yang digunakan untuk mencari hubungan antara variabel respon y
yang bersifat biner atau dikotomus dengan variabel prediktor (x) yang
bersifat polikotomus (Hosmer dan Lemeshow, 1989). Bentuk data variabel
respon terdiri dari 2 kategori yaitu “sukses” dan “gagal” yang dapat
dinotasikan dengan y 1 (sukses) dan y 0 (gagal). Dalam keadaan
demikian variabel y mengikuti distribusi Bernoulli untuk setiap
observasi tunggal. Fungsi Probabilitas untuk tiap observasi adalah
diberikan sebagai berikut :
= − ; = 0.1
Dimana bila = 0 maka f ( y) 1 dan bila = 1 maka
f ( y ) . Fungsi regresi logistiknya dapat dituliskan sebagai berikut:
= ekuivalen dengan =
dengan = + + ⋯+ .
9
http://repository.unimus.ac.id
10
Nilai antara −∞ dan +∞ sehingga nilai f (z ) terletak antara nilai 0
dan 1 untuk setiap nilai yang diberikan. Dari Hal tersebut dapat dilihat
bahwa model logistik menggambarkan probabilitas dari suatu objek. Berikut
adalah model regresi logistiknya :
! "⋯"#$ %$
= ! "⋯"#$ %$
1+
& = banyaknya variabel predictor, tersebut terletak antara 0 dan
1, nilai akan menurun maupun naik mengikuti kenaikan . Berikut adalah
uraian menggunakan transformasi logit dari model regresi logistik pada
persamaan diatas untuk mempermudah pendugaan parameter regresi.
! "⋯"#$ %$
= ! "⋯"#$ %$
1+
! "⋯"#$ %$ ! "⋯"#$ %$
'1 + (=
! "⋯"#$ %$ ! "⋯"#$ %$
+ ' (=
! "⋯"#$ %$ ! "⋯"#$ %$
= −
! "⋯"#$ %$
= )1 − *
! "⋯"#$ %$
=
1−
! "⋯"#$ %$
ln - . = ln' (
1−
http://repository.unimus.ac.id
11
ln - .= + ⋯ $ !$
1−
dengan:
/ = banyaknya variabel prediktor
= konstanta
= koefisien dari , dimana = , , 1, … ,
= variabel bebas, dimana = , 1, … ,
3 = Logit [ ]
= Probabilitas sukses dari variabel
Model tersebut merupakan fungsi linier dari parameter-parameternya.
Pada regresi logistik, variabel respon diekspresikan sebagai = +6
dimana 6 mempunyai salah satu dari kemungkinan dua nilai yaitu 6 = 1 −
dengan peluang jika = 1 dan 6 = − jika = 0 dan
mengikuti distribusi binomial dengan rataan nol dan varians 1−
. Sehingga model yang terbentuk akan mengikuti pola seperti kurva
berikut ini :
http://repository.unimus.ac.id
12
Sumber : Agesti, 2002
Gambar 2.1 kurva fungsi regresi logistik
Kelemahan dari regresi logistik adalah ketika sampel kecil dan data
yang kelasnya tidak seimbang. Data yang jumlah sampelnya kecil dan
kelasnya tidak seimbang akan menghasilkan akurasi yang rendah
(Harington dalam Rianto, 2015). Jika kelas data awal tidak seimbang
(imbalance) maka hasil prediksi cenderung menghasilkan kelas mayoritas
(Khoshgoftaar et al dalam Rianto, 2015).
2) Estimasi Parameter
Estimasi parameter pada regresi logistik dilakukan dengan metode
Maximum Likelihood Estimation (MLE). Metode tersebut bertugas
mengestimasi parameter dengan cara memaksimalkan fungsi likelihood
dan mensyaratkan bahwa data harus mengikat suatu distribusi tertentu. Pada
regresi logistik, setiap pengamatan mengikuti distribusi Bernoulli sehingga
dapat ditentukan fungsi likelihoodnya.
http://repository.unimus.ac.id
13
Jika xi dan yi merupakan pasangan variabel bebas dan terikat pada
pengamatan ke−7 dan diasumsikan bahwa setiap pasangan pengamatan
saling independen dengan pasangan pengamatan lainnya, i 1,2,..., n maka
fungsi probabilitas untuk setiap pasangannya adalah :
8 = 8
8
1− 8
8
; 8 = 0,1 ;
$
9∑ # % =
;< ; ;
dengan, 8 = $
9∑ # % =
;< ; ;
dimana, ketika > = 0 maka nilai 8? = 8 = 1 . Setiap pengamatan
diasumsikan independen sehingga fungsi likelihoodnya merupakan
gabungan dari fungsi distribusi masing-masing pasangan yaitu sebagai
berikut:
B B
@ == A 8 =A 8
D 1− 8
D
8C 8C
Fungsi likelihood tersebut lebih mudah dimaksimumkan dalam bentuk
log @ dan dinyatakan dengan E .
E = log @
$
∑;< D !D;
E = ∑?C ∑B8C 8 8? ? − ∑8C log 1 +
B
Nilai β maksimum didapatkan melalui turunan E terhadap dan
hasilnya adalah sama dengan nol.
http://repository.unimus.ac.id
14
B B $
∑;< D !D;
HE
=I 8 8? −I 8?
H ? 1+
∑;<
$
D !D;
8C 8C
Sehingga, ∑B8C 8 8? − ∑B8C 8? J 8 = 0 dengan > = 0,1, … , &
Untuk nilai taksiran dari turunan pertama fungsi @ non linier
maka digunakan metode Iterasi Newton Raphson. Persamaan yang
digunakan :
(t 1) (t ) ( H (t ) ) 1 q (t ) ; t = 1,2,…, sampai konvergen.
L ( ) L ( ) L ( )
dengan, q T ( , ,..., )
0 1 k
dan H merupakan matriks Hessian. Elemen-elemennya adalah
h11 h12 ... h1k
L( )
2 h21 h22 ... h2 k
, sehingga H .
h ju
j u . ... . ,
h hk 2 ... hkk
k1
dan pada setiap iterasi berlaku,
h (jut )
2 L( ) |
(t ) xij xiu ( xi ) ( t ) (1 ( x i ) (t ) )
j u i 1
n
L ( ) | ( y i ( xi ) (t ) ) x ij
q (t )
(t )
j
j
i 1
k
( (t )
j x ij )
j0
e
( x i ) (t ) k
( (t)
j x ij )
1 e j0
http://repository.unimus.ac.id
15
dari persamaan diatas diperoleh,
K
= K
+{ M
N7O3P 8
K
)1 − 8
K
*Q } M
−S K
Langkah-langkah iterasi Newton Raphson diberikan sebagai berikut:
a. Menentukan nilai dugaan awal (0) kemudian dengan menggunakan
persamaan maka didapatkan
( xi ) ( 0 ) .
b. Dari ( xi ) (0) pada langkah a, diperoleh matriks Hessian H (0) dan vektor
q (0) .
c. Proses selanjutnya untuk t 0 digunakan hingga (xi )(t) dan (t )
konvergen.
Untuk metode Maximum Likelihood Estimation (MLE) akan digunakan
uji serentak dan parsial guna mengetahui signifikansi parameter dari tiap
variabel.
1) Uji Serentak
Pengujian ini dilakukan untuk mengetahui signifikansi parameter
terhadap variabel respon secara bersama-sama dengan
menggunakan statistik Uji G (Hosmer and Lemeshow, 2000).
Hipotesisnya adalah sebagai berikut :
H = = 1 =⋯= U =0
H = S7V7SO@ OWO XOYZ ≠ 0, , > = 1,2, … , ]
Taraf signifikansi : α
http://repository.unimus.ac.id
16
Statistik uji yang digunakan adalah statistic uji Ghit atau Likelihood
Ratio Test, yaitu :
` ` ` `
'`( '`(
^ = −2@V _∏` ecd fcD g
D< b
Statistik uji :
D
Dengan V = ∑B8C 8; V = ∑B8C 1 − 8 ;V = V + V
Daerah penolakan : tolak H0 jika ^ > 1
! dengan p adalah
derajat bebas banyaknya variabel predikor atau jika nilai
p-value < α .
2) Uji Parsial
Pengujian ini dilakukan untuk mengetahui signifikansi parameter β
terhadap variabel responnya secara parsial mengunakan statistik uji
Wald (Hosmer and Lemeshow, 2000). Hipotesisnya adalah sebagai
berikut :
i = U =0
i = U ≠ 0; ] = 1,2, … , &
Taraf signifikansi : α
Daerah penolakan : tolak H0 jika j| > lm
n
2.1.2 Metode Resampling Bootstrap
Bootstrap adalah metode dan teknik Resampling nonparametrik
yang berbasis komputer dan sangat potensial untuk dipergunakan pada
http://repository.unimus.ac.id
17
masalah keakurasian yang didasarkan pada simulasi data untuk keperluan
inferensi statistik (Sungkono, 2013). Bootstrapping bertujuan untuk
menentukan nilai estimasi yang kuat bersarakan standard eror dan interval
kepercayaan untuk mengestimasi proporsi, rerata, median, odds ratio,
koefisien korelasi atau koefisien regresi (Widhiarso, 2012). Keuntungan
metode Bootstrap ini, nilai error akan menurun secara signifikan jika
diaplikasikan pada data yang kecil (Ruparel et al., 2013). Metode Bootstrap
diawali dengan mengambil sampel dari sampel asli dengan ukuran sama
sesuai ukuran data asli, dan dilakukan dengan pengembalian. Dinotasikan
dengan o ∗ , o1∗ , … , oq∗ masing-masing berisi nilai data yang telah disampling
secara random dengan pengembalian dari sampel . Kemudian dilakukan
evaluasi hasil resampling Bootstrap yang diperoleh untuk masing-masing
sampel Bootstrap. Lalu estimasi standard error untuk sampel Bootstrap.
Proses resampling Bootstrap dilakukan dengan menggunakan program
komputer, karena besarnya jumlah resampling yang bisa mencapai ribuan
kali sehingga sangatlah sulit untuk melakukan perhitungan secara manual
(Ustyannie, 2014).
1) Pembentukan Sampel Bootstrap
Menurut (Walpole, Myers, & Ye, 2007), sampel adalah suatu
himpunan bagian dari populasi. Istilah sampel asli digunakan untuk
menyebut himpunan bagian yang pertama diambil dari populasi,
http://repository.unimus.ac.id
18
sebelum dilakukan resampling, yaitu proses pengambilan sampel
kembali dari sampel yang telah kita ambil dari populasi, sedangkan
istilah sampel Bootstrap (resampling) digunakan untuk menyebut
sampel yang telah kita resampling dari sampel asli. Sampel asli
dilambangkan dengan x {x1,.....,xn } dimana n 1, 2,3,..., n , dan sampel
Bootstrap dilambangkan dengan
x* {x1* , x2* ,...,xB* } dimana
B 1,2,3,..., B . Sampel Bootstrap diperoleh dengan cara sampling secara
acak dengan pengembalian dari sampel asli. Ini berarti bahwa setelah
observasi diambil secara acak dari sampel asli kemudian diletakkannya
kembali sampel yang terambil tersebut sebelum diambil sampel atau
observasi berikutnya. Sampel menggunakan pengembalian
memungkinkan untuk mendapatkan jumlah data yang sama dengan
ketika pertama kali kita melakukan sampling, dan memungkinkan satu
data diambil beberapa kali. Peluang sampel dengan pengembalian dapat
dinotasikan dengan:
1
P ( x 1* x j | x ) untuk i , j 1, 2 ,..., n
n
Ini adalah distribusi seragam untuk sampling Bootstrap. Masing-
masing sampel Bootstrap yang diambil setiap kali pengambilan adalah
sama banyaknya dengan sampel asli.
2) Estimasi standar error Metode Bootstrap
http://repository.unimus.ac.id
19
Estimasi Bootstrap untuk standard error tidak memerlukan
perhitungan teori dan selalu tersedia walaupun sekompleks apapun
perhitungan statistika untuk estimator ˆ , artinya prosedur Bootstrap
untuk standard error selalu sama untuk semua bentuk distribusi data.
Menurut (Efron & Tibshirani, 1993), Estimasi standard error
untuk sampel Bootstrap yaitu :
sˆeB {b1 (ˆ b ˆ ) 2 /(B 1) 2 }
B
1 B ˆb
dimana: ˆ .
B b1
3) Interval konfidensi Bootstrap pendekatan normal
Interval konfidensi (1 ) Bootstrap pendekatan normal dapat
dikonstruksikan sebagai berikut:
ˆ (b) t n p, / 2 seˆ (b) ˆ (b) t n p, / 2 seˆ (b)
dimana t n p, / 2 adalah nilai kritis t dengan luas daerah sebelah
kanan / 2 , dan n p adalah nilai derajat kebebasan. seˆ
(b)
adalah
nilai standard error dari ˆ . Jika V ≥ 30, maka distribusi l yang
(b)
digunakan untuk interval konfidensi.
http://repository.unimus.ac.id
20
4) Prosedur Resampling Metode Bootstrap
Prosedur Bootstrap untuk standard error selalu sama untuk semua
bentuk distribusi data. Menurut Efron dan Tibshirani, langkah-langkah
prosedur Bootstrap sebagai berikut :
1. Pilih sampel Bootstrap, yaitu sampel yang telah kita resampling dari
sampel asli sebanyak B. Dinotasikan dengan X1*, X2*,..., XB*, masing-
masing berisi nilai data yang telah disampling secara random dengan
pengembalian dari sampel X.
2. Evaluasi hasil Bootstrap yang diperoleh untuk masing-masing sampel
Bootstrap tu v = X J v ), dimana nilai w = 1,2, … , x.
3. Estimasi standard error untuk sampel Bootstrap
sˆeB {b1 (ˆ b ˆ ) 2 /(B 1) 2 }
B
(2.4)
1 B ˆb
dimana: ˆ .
B b1
4. Mengulangi langkah 1, 2 dan 3 hingga B kali, sehingga akan diperoleh
Xy , Xy1, … . , Xyq
Pendekatan Bootstrap jika diulang lebih dari satu kali akan memberikan
hasil yang berbeda, hal ini karena yang dilakukan adalah suatu simulasi.
Jika dapat dilakukan menggunakan semua kemungkinan sampel yaitu
VB maka hasilnya akan sama (Sungkono, 2013).
http://repository.unimus.ac.id
21
2.2 Landasan Teori
2.2.1 Pengertian Kecelakaan
Kecelakaan lalu lintas adalah suatu peristiwa di jalan yang tidak
disangka-sangka dan tidak disengaja. Kecelakaan melibatkan kendaraan
dengan atau tanpa pemakai jalan lainnya yang mengakibatkan korban
manusia ataupun kerugian harga benda (Peraturan Pemerintah No 43 tahun
1993 pasal 93). Kecelakaan lalu lintas pada umumnya terjadi disebabkan
oleh banyak faktor penyebab, misalkan ketidak hati-hatian dalam
pengguna jalan, tidak menggunakan atribut lengkap untuk berkendara
adala faktor penyebab timbulnya kecelakaan. Selain faktor dari manusia
ada juga faktor jalan, kondisi kendaraan saat digunakan, cuaca, ataupun
pandangan terhalang satu dan lain hal. Kecelakaan lalu lintas tidak terjadi
secara kebetulan melainkan disertai berbagai suatu sebab yang dapat dicari
tahu untuk melakukan tindakan preventif atau pencegahan sebelum terjadi
karena dampaknya merugikan secara materi maupun nonmateri
(Suma’mur, 2009).
Lalu lintas merupakan pergerakan suatu kendaraan dan orang diruang
lalu lintas. Kecelakaan lalu lintas sulit di prediksi kapan dan dimana
terjadinya. Kecelakaan dapat menyebabkan trauma, cidera, atapun
kecacatan, tetapi akibat paling fatal adalah kematian. Kejadian kecelakaan
sulit diminimalisasi dan cenderung meningkat seiring berkembangannya
http://repository.unimus.ac.id
22
jaman, pertambahan panjang jalan dan bertambahnya kuantitas kendaraan
dijalan karena menyebabkan semakin meningkatnya mobilitas manusia.
2.2.2 Faktor Penyebab Kecelakaan
Banyak faktor penyebab kecelakaan lalu lintas dijalan. Kecelakaan
lalu lintas di Indonesia tiga tahun terakhir berada di urutan ketiga setelah
penyakit jatung coroner dan tuberculosis sebagai penyumbang korban jiwa
terbanyak berdasarkan penilaian oleh WHO, setiap tahunnya di seluruh
dunia 1,24 juta korban meninggal dunia dan 20-50 juta megalami luka,
tiap harinya ada 1000 anak-anak meninggal dunia rentang umur 10-24
tahun (World Health Organization, 2013). Kecelakaan dapat di timbulkan
dari berbagai aspek, dapat dari faktor pengguna jalan, faktor pembangunan
jalan, faktor pengguna jalan, faktor kendaraan yang digunakan, dan faktor
lingkungan.
1) Faktor pengguna jalan
Faktor pengguna jalan, banyak kejadian kecelakaan bersumber dari
pengguna. Tingkat kesadaran keselamatan dalam berlalu lintas masih
sangat rendah padahal pengetahuan tersebut sangat penting untuk
pengendara itu sendiri maupun pengguna jalan lainnya. Beberapa
penyebab kecelakaan bersumber dari pengendara adalah pengendara yang
mengantuk, terlalu lelah karena perjalanan jauh, tidak menggunakan
atribut keselamatan selama berkendara, tidak mematuhi rambu lalu lintas
http://repository.unimus.ac.id
23
yang ada, menggunakan telepon genggam saat berkendara, dan merokok
saat berkendara.
2) Faktor Jalan
Saat membangun jalan tidak sesuai dengan standar aman, jalan menjadi
licin, bergelombang, yang menyebabkan pengendara kurang nyaman saat
menggunakan jalan. Dari faktor kelengkungan dan jarak pandang
pengendara memberkan efek besar penyebab kecelakaan. Faktor psikologi
pengendara juga menjadi pertimbangan pembangunan jalan.
3) Faktor kendaraan
Kita sering kali mendapatkan himbauan untuk selalu mengecek kesiapan
kendaraan sebelum digunakan. Kendaraan juga memiliki peran dalam
keselamatan berkendara, ketika kendaraan dalam kondisi prima maka
pengendarapun merasa aman ketika menggunakannya. Banyak kejadian
kecelakaan disebabkan dari faktor kendaraan, yang paling sering adalah
rem blong. Hal tersebut sangatlah fatal karena ketika kendaraan mulai
bergerak dengan kecepatan tetapi tidak berfungsinya rem pada kendaraan
dapat dipastikan terjadinya kecelakaan. Dari kelengkapan kendaraan, kaca
spion berfungsi untuk melihat apakah ada kendaraan satu dengan
kendaraan lain dengan posis berdekatan sehingga ketika akan melakukan
pergerakan dapat memperkirakan jarak aman dengan pengendara lain.
Banyak pengendara yang melalaikan fungsi dari spion bahkan pada
kendaraannya tidak di lengkapi dengan spion. Selain spion, lampu pada
http://repository.unimus.ac.id
24
kendaraan juga dapat menyumbang angka kecelakaan dijalan. Lampu
berfungsi memberikan padangan yang lebih jelas kepada pengendara
ketika terdapat di lokasi minim cahaya. Tetapi penggunaan lampu
kendaraan yang tidak tepat dapat membahayakan kendaraan lain. Saat
lampu kendaraan tidak sesuai dengan standar yang telah di tentukan oleh
pemerintah digunakan maka bisa mengganggu pandangan pengendara lain
yang dapat berakibat fatal yaitu kecelakaan.
4) Faktor Lingkungan
Faktor lingkungan memiliki pengaruh walaupun tidak sebesar faktor
pengguna dan kendaraan. Keadaan disekeliling jalan juga harus
dipertimbangkan untuk keselamatan pengguna jalan nantinya. Semua hal
tersebut dipertimbangkan oleh traffic engineer sebagai perancang dari
faktor kontur tanah, sungai yang dilalui, tempat penyebrangan pejalan
kaki, peletakan lampu jalan,cuaca didaerah tersebut dan masih banyak lain
hal. Kasus lingkungan menyebabkan korban sangat kecil terjadi tetapi ada,
seperti tanah longsor, pohon roboh, cuaca ekstrim, dan tanah amblas.
http://repository.unimus.ac.id