Model Marginal Logistik Biner Untuk Data Longitudinal
Model Marginal Logistik Biner Untuk Data Longitudinal
Model Marginal Logistik Biner Untuk Data Longitudinal
Longitudinal data is data collection is done many times in a certain time. Analysis of
longitudinal data with binary response variables should be considered from the point of view
of likelihood inference, which requires the full specification of the stochastic model for
individuals. In this study used biner markov chains which are basic stochastic mechanisms to
illustrate binary logistic models in longitudinal data regardless of random effects. Analysis of
binary logistic marginal model using first-order markov chain dependence applied to
Diabetes Mellitus data in West Ampana Puskesmas of Tojo Uno-Uno Regency. The results
obtained from the application of this model in diabetes mellitus data are blood glucose levels
influenced by the time covariate variable and patient group.
Kata kunci : Longitudinal Data, Regression Logistic, Marginal Model, markov chain,
Maximum Likelihood Method, BFGS Quasi Newton.
1. Latar Belakang
Data longitudinal merupakan gabungan antara data runtun waktu (time series) dan data
silang (cross section). Data longitudinal selain untuk melihat perubahan, dapat juga melihat
variasi perubahan diantara individu. Studi kasus data longitudinal semakin popular dari
waktu ke waktu. Misalnya dilakukan di bidang kesehatan, sosial, dan beberapa bidang
lainnya dalam menganalisis berbagai macam jenis data.
E ( Y ∨ X=x )=
exp ( β 0 + β 1 x i 1+ β 2 xi 2 +… ,+ β k xik )
=
(
exp β 0+ ∑ β j xij
j =1
) (2)
1+ exp ( β 0+ β1 x i1 +… ,+ β k x ik ) k
(
1+exp β 0 + ∑ β j x ij
j=1
)
Transformasi logit diterapkan pada model regresi logistik,
k
π (x)
[
logit ( π ( x ) ) =g ( x ) =ln
1−π ( x )]=β 0 + ∑ β j x ij
j=1
(3)
dengan:
π (x ) = Peluang kejadian sukses
g(x) = Nilai estimasi dari logit
β 0 , β 1 , … , β k = Parameter regresi logistik biner.
2.5 Distribusi Marginal Biner
Persamaan distribusi marginal dari Y it biner
[
f ( Y it ∨X itj )=exp y it ∅t −log {1+exp ( ∅ t ) } ] (4)
dengan asumsi bahwa:
μt
∅ t =log
( (1−μt ) )
= X 'itj β
dependensi diantara observasi yang berturut-turut merupakan model dari odd ratio
pada peluang transisi dari orde pertama rantai markov non homogen. Persamaan odd ratio
adalah :
Pt 1 P(Y t =1∨Y t −1=1)
1−Pt 1 P (Y t=0∨Y t −1=1) P( Y t−1=Y t =1) P(Y t −1=Y t =0)
ψt= = =
Pt0 P (Y t=1∨Y t −1=0) P(Y t −1 =0 ,Y t=1) P( Y t−1=1 , Y t=0)
1−Pt 0 P(Y t=0∨Y t −1=0)
(6)
Fitzmaurice and Laird (1993) menunjukkan bagaimana kaitan antara observasi dengan
model ψ t , estimasi nilai rata-rata relatif tidak sensitif terhadap perubahan parameter asosiasi
untuk keadaan non stasioner
θt =θt −1 pt 1 +(1−θt −1) p t 0 untuk t=2,3 , … , T (7)
dan untuk t=1 , E ( Y 1) =Pr ( Y 1=1 )=θ 1
untuk memberikan nilai dari β, barisan θ1 , θ2 , … , θT dapat ditentukan dari persamaan
(5) , dapat menyelesaikan persamaan (6) dan (7) dengan mengikuti pt 1 dan pt 0 sembarang
t >1. Setelah dimanipulasi menggunakan algebra maka diperoleh persamaan sebagai berikut:
θt untuk ψ t =1
{
ptl = δ−1+ ( ψ t−1 ) ( θt −θ t−1 ) 1−δ + ( ψ t−1 ) (θt +θ t−1−2 θt θt −1) untukψ t ≠ 1
2 ( ψ t−1 ) ( 1−θt−1 )
+l
2 ( ψ t −1 ) θt −1 ( 1−θ t−1 )
(8)
t−1
( 1− p y ) t−1
(9)
Dengan metode maksimum likelihood, fungsi likelihood L dan log-likelihoodnya pada
persamaan (9) dituliskan sebagai berikut :
T
yt 1− y t
Lt ( β , λ∨ y 1 , y 2 … , y T ) =∏ p y t −1
( 1− p y )
t−1
(10)
t =1
T
py
l t =log Lt=∑ y t log
t =1 ( ( 1−p y
t−1
t−1
) + log (1− p y ) t−1
) (11)
t−1 t−1
(15)
t
dengan :
δ−1+ ( ψ t −1 )( θt −θt−1 ) 1−δ + ( ψ t −1 ) ( θt + θt−1−2θt θ t−1 )
py = + y t−1
t−1
2(ψ t−1)(1−θ t−1) 2(ψ t −1)θt −1 (1−θt −1)
δ 2=1+ ( ψ t −1 ) {( θ t−θ t−1 )2 ψ t −( θt +θt −1 )2 +2(θ t +θt −1)}
untuk t >1 , dan untuk t=1 p y =θ 1. Persamaan 15 kemudian di estimasi menggunakan
0
t−1
( 1− p y ) t−1
t =1
Selanjutnya dari fungsi likelihood pada persamaan (16), dapat diperoleh fungsi log-
likelihoodnya sebagai berikut :
T T
l t =log Lt ( β , λ ) =¿ log p y ( ∑ yt
t=1
t−1
( 1− p y ) t−1
∑ (1− y t)
t=1
)¿
T
¿ ∑ { yt logit ( p y )+ log(1− p y ) } t−1 t−1
(17)
t=1
Turunan pertama log-likelihood untuk individu ke-i pada waktu-t didefinisikan sebagai
berikut :
N N T
∂l ∂l ∂l
=∑ it =∑ ∑ t (18)
∂ β i=1 ∂ β i=1 t=1 ∂ β
N
∂l ∂ lit N T ∂l t
=∑ =∑ ∑ (19)
∂ λ i=1 ∂ λ i=1 t=1 ∂ λ
+
( {[
1
A 2 (
2 y t −1−1 )
−∂ δ
∂ θt −1
+ ( ψ t −1
{ ) }] [ ( })
A− 2 ψ t −1 )( 2 y t −1−1 ) ] B θ t−1 X 't−1 ( 1−θt −1 )=0
−∂ δ
¿∑∑
N T
( yt
−
1
×
[ t
{ } ]
( 2 y t −1−1 ) ∂ ψ +θ t−1 +θ t A−[ 2 {1− y t −1 + ( 2 y t −1 −1 ) θ t−1 } B ]
× ψt )
i=1 t=2 py t −1
( 1− p y ) ( p yt−1 t−1
) A2
()
β0 −∂l t
()β1 N
^θk +1= ⋮ + ∑
β k i=1
λ
∂ β1
⋮
−∂l t
∂ βk
−∂l t
(22)
λ
Persamaan (22) inilah yang akan digunakan untuk menyelesaikan proses iterasi
estimasi parameter distribusi marginal logistik yang tidak dapat diselesaikan secara analitik
menggunakan Maksimum likelihood. Proses iterasi Algoritma BFGS Quasi Newton akan
berhenti apabila parameter taksiran sudah konvergen ke suatu nilai atau ‖θ(k+1 )−θ(k)‖≤ e,
dengan e adalah suatu bilangan positif yang biasanya ditetapkan sebagai 1.0 ×10−6. Untuk
mendapatkan hasil taksiran parameter dalam penelitian ini menggunakan bantuan perangkat
lunak Rstudio 0.99.491
3.3 Penerapan Model Marginal Logistik Pada Data Diabetes Melitus
3.3.1 Uji Signifikan Model
nilai uji log-likelihood sebesar −28. 4989 , sehingga nilai uji log-likelihood rasio G2
yaitu G 2=−2 (−28.4989 ) =58.9978. Kemudian dibandingkan dengan nilai tabel Chi-Square
χ 2(a=0.05,120)=9.4877 maka dapat disimpulkan tolak H0 karena nilai
G 2=58.9978> χ (a2 ,n )=9.4877 artinya, kadar glukosa darah pasien dipengaruhi oleh variabel
kovariat yang diujikan yaitu jenis kelamin, pekerjaan, waktu, dan kelompok
4.2 Saran
Dari hasil pembahasan dalam penelitian ini, ada beberapa hal yang dapat disarankan
oleh penulis diantaranya :
1. Dalam penelitian ini hanya menggunakan data lengkap dengan kategori biner, sehingga
diharapkan dalam penelitian selanjutnya dapat menggunakan kategori data bernilai
ordinal.
2. Dalam penelitian ini hanya menggunakan model marginal tanpa memperhatikan efek
acak, sehingga diharapkan dalam penelitian selanjutnya dapat menggunakan model
dengan memperhatikan efek acak dari model.
3. Selain menggunakan rantai markov orde pertama, terdapat pula model rantai markov
orde kedua atau orde ke-m. Pembahasan mengenai model ini dapat digunakan untuk
penelitian selanjutnya.
DAFTAR PUSTAKA
Agustin W, Purwanto IN. 2013. Metode Quasi Newton Menggunakan Formula Powell-
Symmetric-Broydee dan Symmetric-Rank-One. Jurnal Mahasiswa Matematika. 1(4):
300-303.
Azzalini, A. 1994. Logistic Regression for Autocorrelated Data with Aplication To Repeated
Measures, Biometrika, vol 81, halaman 767-775.
Bilous. (2002). Seri Kesehatan Bimbingan Dokter pada Diabetes. Jakarta: Dian Rakyat.
Darmawati. 2013. Pengaruh Senam Diabetes Terhadap Penurunan Kadar Glukosa Darah
Pada Orang Dewasa Sehat Diwilayah Puskesmas Ampana Barat Kab. Tojo Una-Una.
Jurusan Keperawatan Fakultas Kedokteran. Universitas Hasanuddin.
Dorland, W. A. N. 2010. Dorland’s Illustrated Medical Dictionary (29th ed.). Hartanto, H. et
al. (Ahli Bahasa), Jakarta: EGC
G.M. Fitzmaurice, N.M. Laird, A Likelihood Based Method For Analyzing Longitudinal
Binary, Biometrika 80 (1993) 141–151.
Greene, W. H. (2002). Econometric Analysis. New York: Mcmillan Publishing Company.
Hosmer DW, and Lemeshow S. 1989. "Applied Logistic Regression". New York: John Wiley
and Sons.
Islam, M. Ataharul dan Rahman M. Shafiqur, 2007. Markov Structure Based Logistic
Regression For Repeated Measures: An Application To Diabetes Mellitus Data.
Universitas Of Dhaka. Bangladesh.
Klein Mitchel dan Kleinbaum G. David. 2010. Logistic Regression A Self-Learning Text
Third Edition. Departement Of statistics North Carolina State University Raleigh. USA.
PERKENI, 2011. Konsensus Pengelolaan dan Pencegahan Diabetes Melitus Tipe 2 di
Indonesia. www.perkeni.org, 18 Oktober 2016.
Rochayati,2014. Model Marginal Data Longitudinal Biner menggunakan Rantai Markov.
Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas
Gajah Mada.
Ross, M. Sheldon, 2010. Introduction To Probability Models 10th Edition. University Of
Southern California Los Angeles. California.
Sherwood, L. 2011. Organ Endokrin Perifer dalam Fisiologi Manusia dari Sel ke Sistem.
Jakarta: EGC.
Soegondo, S. 2008. Hidup Secara Mandiri Dengan Diabetes Melitus, Kencing Manis, Sakit
Gula. Jakarta: FKUI
Wijiasih, Lina. 2015. Penerapan Generalized Estimating Equation (GEE) Berbasis Web
Interaktif Dengan R-Shiny Untuk Tidak Bebas Multinomial Berskala Ordinal. Jurusan
Matematika Fakultas Matematika Dan Ilmu Pengetahuan Alam. Universitas Jember
Wilson, R. Jeffrey dan Lorenz A. Kent. 2015. Modeling Binary Correlated Using SAS, SPSS
and R. Springer International. Switzerland