0% menganggap dokumen ini bermanfaat (0 suara)

137 tayangan28 halaman

Decision Tree

Pada dokumen tersebut dijelaskan tentang penggunaan metode decision tree learning untuk memecahkan masalah klasifikasi penerimaan pegawai berdasarkan tiga parameter penilaian yaitu IPK, hasil tes psikologi, dan hasil tes wawancara. Langkah-langkah pembangunan decision tree menggunakan algoritma ID3 dijelaskan, dimulai dari penetapan atribut root berdasarkan perhitungan information gain. [/ringkasan]

Diunggah oleh

MUHAMMAD NURIL HUDA

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

137 tayangan28 halaman

Decision Tree

Diunggah oleh

MUHAMMAD NURIL HUDA

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd

Anda di halaman 1/ 28

DECISION TREE

Yufis Azhar – Teknik Informatika – UMM

A
B
Rule-based System
 Features : Temperature (Hot, Cool); Humidity (Wet, Dry)
 Class : Play (Yes, No)
 Rules :
 IF temperature is Hot AND Humidity is Wet, THEN Play is Yes
 IF temperature is Hot AND Humidity is Dry, THEN Play is Yes
 IF temperature is Cool AND Humidity is Wet, THEN Play is No
 IF temperature is Cool AND Humidity is Dry, THEN Play is Yes

Temperature
Hot Cool
Yes
Humidity
Wet Dry
No Yes
Contoh Kasus Penerimaan
Pegawai
 Terdapat 11 pelamar kerja dg 3 parameter penilaian : IPK,
hasil tes psikologi, hasil tes wawancara
 IPK dikelompokkan dlm 3 kategori (Bagus, Cukup, Kurang)
 Hasil tes psikologi dikelompokkan dlm 3 kategori (Tinggi,
Sedang, Rendah)
 Hasil tes wawancara dikelompokkan dlm 2 kategori (Baik,
Buruk)
 Untuk data yang lengkap, seharusnya terdapat 3x3x2 = 18
kombinasi sample data
 Untuk lebih jelasnya, lihat table berikut :
Contoh Kasus Penerimaan
Pegawai
Pelamar IPK Psikologi Wawancara Diterima
P1 Bagus Tinggi Baik Ya
P2 Bagus Sedang Baik Ya
P3 Bagus Sedang Buruk Ya
P4 Bagus Rendah Buruk Tidak
P5 Cukup Tinggi Baik Ya
P6 Cukup Sedang Baik Ya
P7 Cukup Sedang Buruk Ya
P8 Cukup Rendah Buruk Tidak
P9 Kurang Tinggi Baik Ya
P10 Kurang Sedang Buruk Tidak
P11 Kurang Rendah Baik Ya
Contoh Kasus Penerimaan
Pegawai
 Dari table tersebut data yang tersedia hanya 11
sample data. Artinya informasi aturannya tidak
lengkap.
 Bagaimana jika ada pelamar yang memiliki data

[ IPK : Kurang, Psikologi : Rendah, Wawancara :

Buruk ]. Bisakah system memutuskan apakah
pelamar tersebut diterima atau tidak ?
 Bagaimana system bisa kita paksa untuk

menyelesaikan kasus tersebut ??

Analisa
 Jika misal data yang terdapat di kasus sebelumnya
dibuat lengkap (18 kombinasi) maka secara manual
(tanpa bantuan system) pun kita bisa dg mudah
menentukan apakah seorang pelamar layak diterima
atau tidak
 Tapi, bagaimana jika parameter yg diperhitungkan
30 atribut ? Dengan masing2 atribut memiliki 3
kategori yang berbeda ? Maka kombinasinya adalah
330 = 205.891.132.094.696 (lebih dari 200 trilyun
kombinasi)
Decision Tree Learning
 Decision Tree Learning adalah salah satu metode
yg sangat populer dan banyak digunakan secara
praktis
 Jenis Decision Tree yg cukup populer antara lain :
 ID3 ( Iterative Dychotomizer version 3 )

 ASSISTANT

 C4.5
Decision Tree Learning
 Decision Tree Learning akan berusaha membangun
pohon keputusan secara top-down, mulai dg
pertanyaan :
Atribut mana yang pertama kali harus dicek dan
diletakkan pada root ?
 Untuk menentukannya, diperlukan suatu ukuran
statistik yaitu Entropy dan Information Gain
Entropy
 Entropy adalah suatu parameter untuk mengukur
heterogenitas (keberagaman) suatu kumpulan data
 Rumusnya :
c
Entropy(S)  i - pi log2 pi
Misal untuk menghitung entropy atribut ‘Diterima’ :
Entropy(S) = - (8/11)log2 (8/11) - (3/11)log2 (3/11)
= 0,8454
Information Gain
 Setelah mendapatkan nilai Entropy dari suatu atribut,
maka kita dapat mengukur efektifitas suatu atribut
dalam mengklasifikasikan data ( Information Gain )
 Rumus :
|Sv|
Gain (S,A)  Entropy (S) -  vValues(A) |S| Entropy(Sv)
Information Gain
Contoh penghitungan information gain untuk IPK :
Misalkan atribut Diterima = ‘Ya’ dikatakan sebagai sampel positif ( + ), dan ‘Tidak’
dikatakan sebagai sampel negatif ( - ). Maka :

Values (S) = Bagus, Cukup, Kurang

S = [ 8+, 3- ], |S| = 11
SBagus = [3+, 1-], |SBagus| = 4
SCukup = [3+, 1-], |SCukup| = 4
SKurang = [2+, 1-], |SKurang| = 3
Information Gain
Contoh penghitungan information gain untuk IPK :
Misalkan atribut Diterima = ‘Ya’ dikatakan sebagai sampel positif ( + ), dan ‘Tidak’
dikatakan sebagai sampel negatif ( - ). Maka :
8 8 3 3
Values (S) = Bagus, Cukup, Kurang 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆 ) =−
11 ( )
𝑙𝑜𝑔 2
11
−
11
𝑙𝑜𝑔 2 ( )
11
=0.8454

Gain (S,IPK) = Entropy (S) – (4/11) Entropy (SBagus) – (4/11) Entropy (SCukup) –
(3/11) Entropy (SKurang)
= 0.8454 – (4/11)0.8113 – (4/11)0.8113 – (3/11)0.9183
= 0.0049
Algoritma ID3
 ID3 adalah algoritma paling dasar dalam decision
tree learning. Algoritma ini melakukan pencarian
secara rakus/menyeluruh (greedy) pd semua
kemungkinan tree.
Contoh Kasus Penerimaan
Pegawai
Pelamar IPK Psikologi Wawancara Diterima
P1 Bagus Tinggi Baik Ya
P2 Bagus Sedang Baik Ya
P3 Bagus Sedang Buruk Ya
P4 Bagus Rendah Buruk Tidak
P5 Cukup Tinggi Baik Ya
P6 Cukup Sedang Baik Ya
P7 Cukup Sedang Buruk Ya
P8 Cukup Rendah Buruk Tidak
P9 Kurang Tinggi Baik Ya
P10 Kurang Sedang Buruk Tidak
P11 Kurang Rendah Baik Ya
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

Langkah 1
 Pada tahap ini, harus ditentukan dulu atribut root.
 Kandidatnya ada 3, yaitu IPK, Psikologi atau Wawancara
 Kandidat yg terpilih adalah yang memiliki Information Gain paling besar
 Setelah dilakukan penghitungan, didapatkan Information Gain untuk tiap
atribut adalah :
Gain (S, IPK) = 0.0049
Gain (S, Psikologi) = 0.2668
Gain (S, Wawancara) = 0.4040
 Karena Information Gain dari atribut ‘Wawancara’ memiliki nilai paling besar,
maka atribut ini dipilih sebagai root
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

Langkah 1
Wawancara
Baik Buruk
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

Langkah 2
 Pada tahap ini, dilakukan pengecekan
terhadap semua nilai pada atribut root, yaitu
‘Baik’ dan ‘Buruk’
 Dimulai dari ‘Baik’ terlebih dahulu
 Karena di table, nilai ‘Baik’ memiliki 6
sample, berarti nilai ‘Baik’ tidak kosong
 SampleBaik = [6+, 0-]
 Karena semua sample menyatakan ‘Ya’,
maka nilai yg dikembalikan untuk nilai
‘Baik’ hanya nilai ‘Ya’, maka di bawah edge
‘Baik’ adalah leaf ‘Ya’
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

Langkah 2
Wawancara
Baik Buruk
Ya
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

Langkah 2
 Berikutnya, kita cek record (sample) yang
fitur wawancaranya ‘Buruk’
 Karena di table, nilai ‘Buruk’ memiliki 5
sample, berarti nilai ‘Buruk’ tidak kosong
 SampleBuruk = [2+, 3-]
 Karena ada sample yang memiliki class ‘Ya’,
dan ada yang ‘Tidak’, maka di bawah edge
‘Buruk’ bukan leaf, melainkan node baru
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

Langkah 2
Wawancara
Baik Buruk
Ya
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

Langkah 3
 Pada tahap ini, sebenarnya hanya merupakan pengulangan dari langkah 1, hanya
sample yang diamati hanya yang nilai wawancaranya ‘Buruk’ saja
 Karena ‘wawancara’ sudah digunakan sebagai root, maka yang dihitung nilai
information gain nya di tahap ini hanya ‘IPK’ dan ‘Psikologi’ saja

IPK 2 2 3 3

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆 ) =− ()
𝑙𝑜𝑔 2 − 𝑙𝑜𝑔2 ()
=0. 9710
Values (IPK) = Bagus, Cukup, Kurang 5 5 5 5
S = SampleBuruk = [ 2+, 3- ], |S| = 5 1 1 1 1
SBagus = [ 1+, 1- ], | SBagus | = 2
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆 𝑏𝑎𝑔𝑢𝑠 )=− 2
𝑙𝑜𝑔2 ( )
2
− 𝑙𝑜𝑔 2
2 2 ( )
=1

SCukup = [ 1+, 1- ], | SCukup | = 2

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆 𝑐𝑢𝑘𝑢𝑝
1 1 1 1
)=− 2 𝑙𝑜𝑔 ( 2 ) − 2 𝑙𝑜𝑔 ( 2 )=1
2 2
SKurang = [ 0+, 1- ], | SKurang | = 1
0 0 1 1
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆 𝑘𝑢𝑟𝑎𝑛𝑔 )= − 1 𝑙𝑜𝑔 ( 1 )− 1 𝑙𝑜𝑔 ( 1 )=0
2 2

2 2 1

𝐺𝑎𝑖𝑛 ( 𝑆 , 𝐼𝑃𝐾 ) =𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆 ) −
5
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆 𝐵𝑎𝑔𝑢𝑠 ) − 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆𝐶𝑢𝑘𝑢𝑝 ) − 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 ( 𝑆 𝐾𝑢𝑟𝑎𝑛𝑔 )
5 5
2 2 1
¿ 0.9710 − (1)− (1)− (0)
5 5 5
¿ 𝟎 .𝟏𝟕𝟏𝟎

Karena Psikologi punya nilai Gain lebih
Psikologi
besar, maka psikologi dipilih simpul
𝐺𝑎𝑖𝑛
( 𝑆 , 𝑃𝑠𝑖𝑘𝑜𝑙𝑜𝑔𝑖 ) =𝟎 . 𝟒𝟐𝟏𝟎 berikutnya
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

Langkah 3
Wawancara
Baik Buruk
Ya
Psikologi
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

 Demikian seterusnya sampai semua atribut selesai dicek semuanya.

 Decision Tree akhir yg dihasilkan dr penerapan algoritma ini adalah
Wawancara

Baik Buruk

Ya Psikologi

Tinggi Sedang Rendah

? Tidak
IPK

Bagus Cukup Kurang

Ya Ya Tidak
Penyelesaian Kasus Penerimaan Pegawai
Menggunakan ID3

 Mengapa ada leaf yang bernilai tanda tanya (?) di sana?

 Ini karena tidak ada data yang dapat membantu untuk mengetahui
bagaimana jika pelamar memiliki nilai wawancara ‘buruk’ dan nilai
psikologi ‘tinggi’
 Ini adalah salah satu kelemahan metode ID3, dimana metode ini
memerlukan dataset yang cukup besar untuk dapat menghasilkan decision
tree yang baik

Anda mungkin juga menyukai

Rule Base (Decision Tree) (PPTX)
Belum ada peringkat
Rule Base (Decision Tree) (PPTX)
25 halaman
Soal Ujian Tengah Semester Algoritma & SD 1
89% (9)
Soal Ujian Tengah Semester Algoritma & SD 1
3 halaman
162-Article Text-6115-1-10-20211108
100% (1)
162-Article Text-6115-1-10-20211108
100 halaman
Modul Design Thinking
100% (1)
Modul Design Thinking
7 halaman
Modul Kecerdasan Buatan
Belum ada peringkat
Modul Kecerdasan Buatan
62 halaman
Ragam Dialog Manusia Dan Komputer
Belum ada peringkat
Ragam Dialog Manusia Dan Komputer
15 halaman
Flow Chart
Belum ada peringkat
Flow Chart
2 halaman
Data Python
Belum ada peringkat
Data Python
126 halaman
IMK Ragam Dialog
Belum ada peringkat
IMK Ragam Dialog
31 halaman
materiVBNet
Belum ada peringkat
materiVBNet
174 halaman
Formula Fungsi Pada Microsoft Excel 2016
Belum ada peringkat
Formula Fungsi Pada Microsoft Excel 2016
58 halaman
Review Jurnal
Belum ada peringkat
Review Jurnal
22 halaman
Modul Praktikum Struktur Data
Belum ada peringkat
Modul Praktikum Struktur Data
36 halaman
SQL - Data Manipulation Language
Belum ada peringkat
SQL - Data Manipulation Language
33 halaman
Bab 1-4
Belum ada peringkat
Bab 1-4
52 halaman
Algoritma C45
Belum ada peringkat
Algoritma C45
8 halaman
Contoh Paper Metode Profile Matching
Belum ada peringkat
Contoh Paper Metode Profile Matching
12 halaman
Administrasi Basis Data
Belum ada peringkat
Administrasi Basis Data
16 halaman
Formula Dan Fungsi Excel Untuk Bisnis Dan Perkantoran PDF
Belum ada peringkat
Formula Dan Fungsi Excel Untuk Bisnis Dan Perkantoran PDF
47 halaman
Quiz 01 Ui
Belum ada peringkat
Quiz 01 Ui
1 halaman
RPS Algoritma Dan Dasar Pemrograman
Belum ada peringkat
RPS Algoritma Dan Dasar Pemrograman
11 halaman
Rubrik Penilaian
Belum ada peringkat
Rubrik Penilaian
7 halaman
Modul Struktur Data PDF
Belum ada peringkat
Modul Struktur Data PDF
26 halaman
Tugas Mandiri 2
Belum ada peringkat
Tugas Mandiri 2
8 halaman
Uts - Imk A - 4518210090 - Ayu Laura Limbong
0% (1)
Uts - Imk A - 4518210090 - Ayu Laura Limbong
4 halaman
Rancangan Sistem Aplikasi Penjualan Dan Pembelian
100% (2)
Rancangan Sistem Aplikasi Penjualan Dan Pembelian
16 halaman
Kecerdasan Buatan 20140113N2
Belum ada peringkat
Kecerdasan Buatan 20140113N2
194 halaman
Prinsip Desain Interaksi
Belum ada peringkat
Prinsip Desain Interaksi
57 halaman
Pengantar Teori Graph Dan Otomata
0% (1)
Pengantar Teori Graph Dan Otomata
23 halaman
(IND) Modul 4 - DML
Belum ada peringkat
(IND) Modul 4 - DML
23 halaman
5 - Proses Desain Interaksi
Belum ada peringkat
5 - Proses Desain Interaksi
49 halaman
Uts Ds Rheza Haeruddin 21.55.1075
Belum ada peringkat
Uts Ds Rheza Haeruddin 21.55.1075
13 halaman
01 Pengantar Business Intelligence
Belum ada peringkat
01 Pengantar Business Intelligence
24 halaman
Bab 1 Aplikasi Excel IF Mata Kuliah Praktikum Komputer Akuntansi
Belum ada peringkat
Bab 1 Aplikasi Excel IF Mata Kuliah Praktikum Komputer Akuntansi
19 halaman
Decision-Tree Kuliah
Belum ada peringkat
Decision-Tree Kuliah
45 halaman
Kecerdasan Buatan
Belum ada peringkat
Kecerdasan Buatan
46 halaman
Tugas Imk
Belum ada peringkat
Tugas Imk
6 halaman
Kecerdasan Buatan
Belum ada peringkat
Kecerdasan Buatan
65 halaman
Modul P12
Belum ada peringkat
Modul P12
14 halaman
Perbandingan Algoritma Brute Force, Divide and Conquer, Dan Dynamic Programming Untuk Solusi Maximum
Belum ada peringkat
Perbandingan Algoritma Brute Force, Divide and Conquer, Dan Dynamic Programming Untuk Solusi Maximum
5 halaman
Ragam Dialog
Belum ada peringkat
Ragam Dialog
13 halaman
Aspek Ergonomik
Belum ada peringkat
Aspek Ergonomik
13 halaman
Penerapan Struktur Data
Belum ada peringkat
Penerapan Struktur Data
20 halaman
Pertemuan 8 - UX
Belum ada peringkat
Pertemuan 8 - UX
26 halaman
Tugas Akhir Data Mining
Belum ada peringkat
Tugas Akhir Data Mining
63 halaman
PPT-profile Matching-Statistikmanajerial
Belum ada peringkat
PPT-profile Matching-Statistikmanajerial
6 halaman
SPK-14 Metode Weighted Product
Belum ada peringkat
SPK-14 Metode Weighted Product
11 halaman
Kul 3 - Heuristic Search
Belum ada peringkat
Kul 3 - Heuristic Search
23 halaman
3 3 Disiplin Ilmu Metode Penelitian Dan Computing Method1
Belum ada peringkat
3 3 Disiplin Ilmu Metode Penelitian Dan Computing Method1
25 halaman
DML (Data Manipulation Language)
Belum ada peringkat
DML (Data Manipulation Language)
10 halaman
Modul II Form Dan Tabel
Belum ada peringkat
Modul II Form Dan Tabel
5 halaman
Bahan Uts Se
Belum ada peringkat
Bahan Uts Se
27 halaman
Uas Estetikahumanisme 200401070065 Yosafathp
Belum ada peringkat
Uas Estetikahumanisme 200401070065 Yosafathp
5 halaman
MODUL PRAKTIKUM KECERDASAN BUATAN - Daftar Isi PDF
Belum ada peringkat
MODUL PRAKTIKUM KECERDASAN BUATAN - Daftar Isi PDF
1 halaman
2.3-Python-Id Praktikum 2
Belum ada peringkat
2.3-Python-Id Praktikum 2
4 halaman
Tugas 10&11 Kelompok 9 POK
Belum ada peringkat
Tugas 10&11 Kelompok 9 POK
2 halaman
Uts Praktikum Sistem Basis Data
Belum ada peringkat
Uts Praktikum Sistem Basis Data
3 halaman
Modul 4. Membuat Login Form Dengan Fungsi If Dan or
Belum ada peringkat
Modul 4. Membuat Login Form Dengan Fungsi If Dan or
3 halaman
Belajar SQL
Belum ada peringkat
Belajar SQL
12 halaman
Soal UTS Gasal 2005-2006 CI1418 Human Computer Interaction
Belum ada peringkat
Soal UTS Gasal 2005-2006 CI1418 Human Computer Interaction
1 halaman