Bayesian Network-2
Bayesian Network-2
PENDAHULUAN
• Bayesian Network berasal dari teorema bayes, sebuah pendekatan untuk sebuah
ketidakpastian yang diukur dengan probabilitas.
• Bayesian Network merupakan suatu metode pemodelan data berbasis probabilitas
yang merepresentasikan suatu himpunan variabel dan conditional
interdependenciesnya melalui suatu DAG (Directed Acyclic Graph)
PEMODELAN PROBABILITAS MENGGUNAKAN BN
Diketahui suatu permasalahan digambarkan dengan possibility tree sebagai berikut :
Jika ingin diketahui probabilitas seseorang merupakan perokok jika diketahui bahwa
dia penderita kanker, maka :
ARC REVERSAL OPERATION
Jika diketahui :
Probabilitas P(Y) dan P(X|Y) dapat dicari dengan menggunakan Teorema Bayes
sebagai berikut :
𝑃 𝑌 = 𝑃 𝑋 𝑃(𝑌|𝑋)
𝑃 𝑋 𝑃(𝑌|𝑋)
𝑃 𝑋𝑌 =
𝑃(𝑌)
EXAMPLE
0,1 0,9
0,85
True
Flu
0,15
0,7 False
Fever
True
0,3
0,45
False
Flu
0,55
False
HOW TO BUILD BN
1. Konstruksi Struktur
Struktur bayesian network adalah direct acyclic graph yang dapat
merepresentasikan sebuah pola dari sekumpulan data.
Perepresentasian dalam bentuk graf dapat dilakukan dengan mengidentifikasi
konsep-konsep informasi yang relevan terhadap masalah.
Selanjutnya konsep-konsep tersebut disebut himpunan variabel.
Himpunan tersebut kemudian direpresentasikan menjadi node node dalam graf.
Pengaruh antara variable dinyatakan eksplisit menggunakan edge pada graf.
HOW TO BUILD BN
1. Konstruksi Struktur
Contoh Direct Acyclic Graph
a. Node A adalah parent dari node B; node B adalah child dari node A.
b. Node A adalah parent dari node C; node C adalah child dari node A.
c. Node B adalah parent dari node D; node D adalah child dari node B.
d. Node B adalah parent dari node E; node E adalah child dari node B.
e. Node C adalah parent dari node F; node F adalah child dari node C.
f. {B,C,D,E,F} adalah descendant dari node A.
g. {D,E} adalah descendant dari node B.
h. {F} adalah descendant dari node C.
HOW TO BUILD BN
2. Estimasi Parameter
Setelah struktur bayesian network terbentuk, parameter dan hubungan
ketergantungan antara node ditentukan dengan menggunakan pengetahuan
pakar, analisis sejumlah data, dsb.
Informasi ini dibutuhkan agar dapat menghitung joint probability distribution.
CHAIN RULE
Kaidah aturan berantai (chain rule) digunakan untuk merepresentasikan joint
probability distribution (JPD) yang terdapat pada struktur Bayesian Networks, di
mana struktur tersebut kemungkinan akan terdiri dari N variabel/node.
Jika kita anggap keseluruhan node-node yang terdapat pada Bayesian Network
diwakili oleh U, maka JPD P(U) adalah perkalian dari semua probabilitas bersyarat
yang terdapat pada struktur.
BN REPRESENTS JOINT PROBABILITY DISTRIBUTION
BN mampu menyederhanakan Joint Probability Distribution (JPD)
p(A,B,C,D,E,F)= p(A,B,C,D,E,F)=p(A)p(B|A)p(C|A,B)p(D|A,B,C)
p(A)p(B|A)p(C)p(D|B,C)p(E|B)p(F|B,E) p(E|A,B,C,D)p(F|A,B,C,D,E)
CONDITIONAL INDEPENDENCE
Jika diketahui variabel A, B, dan C P(A|B, C) adalah probabilitas kondisional A
given B dan C
Jika p(A|B, C) tidak bergantung secara aktual pada nilai B, misal
p(A|B=b1,C)=p(A|B=b2,C), maka dapat dituliskan p(A|B, C) = p(A|C)
Dikatakan bahwa A adalah conditionally independent terhadap B given C. Notasinya
adalah sebagai berikut :
Misal diketahui Conditional Probability Table (CPT) p(A|B,C) sbb :
Dapat disederhanakan
menjadi p(A|C)
GRAPHICAL REPRESENTATION OF CONDITIONAL INDEPENDENCE IN
3 NODE BN
Diketahui 3 variabel, penjabaran joint probability p(A,B,C) :
P(A,B,C) = p(A|B,C) p(B|C) p(C)
Jika 𝐴 ⊥ 𝐵|𝐶, maka gunakan hubungan p(A|B,C)=p(A|C), sehingga :
P(A,B,C) = p(A|C) p(B|C) p(C)
Example: a male officer worker has abnormal serum calcium, what is the chance that
he has lung cancer?
THANK YOU