Implementasi Algoritma Naïve Bayes Pada Data Set Hepatitis Menggunakan Rapid Miner
Implementasi Algoritma Naïve Bayes Pada Data Set Hepatitis Menggunakan Rapid Miner
1 Maret 2019
P-ISSN 1410-5063, E-ISSN: 2579-3500
Akreditasi Ristekdikti, No: 21/E/KPT/2018
http://ejournal.bsi.ac.id/ejurnal/index.php/paradigma DOI: 10.31294/p.v20i2
Cara Sitasi: Novianti, D. (2019, Maret). Implementasi Algoritma Naïve Bayes Pada Data Set Hepatitis
Menggunakan Rapid Miner. (S. Dalis, Ed.) Paradigma - Jurnal Komputer dan Informatika, 21(1).
doi:10.31294/p.v21i1.4979
Abstract - One of the diseases anticipated by doctors is hepatitis. This is because if the patient is not detected
from the beginning having hepatitis, then the disease will develop into liver cancer. It can be seen that cancer is
one of the deadliest diseases in the world that there are no drugs used for healing. By utilizing this increasingly
developing science, researchers try to predict or classify whether a patient has suffered from hepatitis sickness
based on the results of tests that have been undertaken before. One data mining technique can be used to predict
Hepatitis and the method used is Naive Bayes. The data used is sourced from the UCI Repository with the web
address https://archive.ics.uci.edu/ml/datasets/Hepatitis . The amount of data available is 155 data with 123
patients with Life hepatitis and 32 patients with Die hepatitis. The attributes contained in this hepatitis dataset
are: Age, Sex, Steroids, Antivirals, Fatigue, Malaise, Anorexia, Big Liver, Liver Firm, Spleen Palpable, Spiders,
Ascites, Varices, Bilirubin, Alk Phosphate, Sgot, Albumin, Protime, Histology , and Class (predictive result
attribute). From the results of the research that has been done, it can be concluded that the Naive Bayes method
includes an accurate algorithm to predict because the results of accuracy using Rapid Miner show more than
50% which is equal to 76.77%. With the highest Precision Class results of 98.88% for "Life" predictions, and
Class Recall of 96.88% for "Die" Predictions.
Beberapa tahun ini, penyakit yang di antisipasi oleh Dengan memanfaatkan ilmu pengetahuan yang
para dokter salah satunya adalah penyakit Hepatitis. semakin berkembang ini lah para peneliti berusaha
Hal tersebut disebabkan jika sang pasien tidak untuk memprediksi atau mengklasifikasikan apakah
terdeteksi sejak awal memiliki penyakit hepatitis, seorang pasien telah menderita sakit hepatitis
maka penyakit tersebut akan berkembang menjadi berdasarkan hasil tes yang telah dijalani sebelumnya.
penyakit kanker hati. Dapat diketahui bahwa kanker Beberapa hasil penelitian terdahulu dapat
merupakan salah satu penyakit mematikan di dunia disimpulkan bahwa algoritma Naive Bayes dapat
yang belum ada obat yang digunakan untuk digunakan untuk meneliti prediksi penyakit
penyembuhannya. Penyakit Hepatitis merupakan Hepatitis. Sistem diagnosis penyakit hati
masalah kesehatan masyarakat di dunia termasuk di menggunakan metode Naïve Bayes dapat
diimplementasikan dengan 3 proses utama yaitu sedikit dari jumlah penderita sesungguhnya.
menghitung nilai prior atau peluang penyakit, Mengingat penyakit ini adalah penyakit kronis yang
menghitung likelihood berdasarkan masukkan menahun, dimana pada saat orang tersebut telah
pengguna, serta menghitung posterior yang terinfeksi, kondisi masih sehat dan belum
diperoleh dari perkalian antara prior dan likelihood. menunjukkan gejala dan tanda yang khas, tetapi
Nilai posterior tertinggi akan diambil sebagai penularannya terus berjalan (Kementrian Kesehatan
keputusan akhir sistem. Pengujian akurasi RI : 2014, n.d.)
memperoleh hasil akurasi sebesar 87,5% dari 40
data uji terdapat lima ketidakcocokan antara hasil 2. Diagnosis
sistem dengan hasil diagnosis dokter, Diagnosis adalah suatu analisis terhadap kelainan
ketidakcocokan terjadi disebabkan karena gejala atau salah penyesuaian dari pola gejala-gejalanya.
dimiliki oleh dua penyakit sedangkan sistem hanya Sama dengan istilah dalam dunia kedokteran,
dapat mendiagnosis dengan output satu penyakit diagnosis merupakan kegiatan untuk menentukan
(Prayoga, Hidayat, & Dewi, 2018). Metode naive jenis penyakit dengan meneliti gejala-gejalanya.
Bayes dapat digunakan dalam memprediksi risiko Berdasarkan hal tersebut diagnosis merupakan
seseorang terkena penyakit jantung. Ketepatan hasil proses pemeriksaan terhadap hal-hal yang dianggap
prediksi terhadap hasil pengklasifikasian risiko tidak beres atau bermasalah (Suryanih, 2011).
penyakit jantung berdasarkan data yang didapatkan
dari RSUD AWS bulan November dan Desember Menurut (Kajian Pustaka, n.d.), diagnosis dapat
2016 menggunakan program Delphi 7 Enterprise diartikan sebagai:
yaitu untuk percobaan 1 dengan jumlah data testing a. Upaya atau proses menemukan kelemahan atau
sebanyak 25 data didapat tingkat akurasi sebesar penyakit (weakness, disease) apa yang dialami
80% dan pada percobaan 2 dengan jumlah data seorang dengan melalui pengujian dan studi yang
testing sebanyak 50 data diperoleh tingkat akurasi saksama mengenai gejala-gejalanya (symptons)
sebesar 78% (Sabransyah, Nasution, & Tisna, 2017). b. Studi yang saksama terhadap fakta tentang suatu
Didapatkan bahwa ketepatan klasifikasi hal untuk menemukan karakteristik atau kesalahan
menggunakan model Naive Bayes pada penelitian ini dan sebagainya yang esensial
yaitu sebesar 93% atau memiliki error sebesar 7% c.Keputusan yang dicapai setelah dilakukan suatu
(Ria Amora dan Akhmad Fauzy. 2016). Maka dari studi yang saksama atas gejala-gejala atau fakta
itu disimpulkan bahwa metode Naive Bayes dapat tentang suatu hal.
digunakan dalam melakukan prediksi untuk penyakit
hepatitis. Dalam membangun sistem diagnosis 3. Data Mining
penyakit kambing, metode yang digunakan adalah Data mining, sering juga disebut Knowledge
Naive Bayes. Proses dimulai dengan menerima Discovery In Database (KDD) adalah kegiatan yang
inputan fakta kemudian dihitung dengan metode meliputi pengumpulan, pemakaian data historis
Naive Bayes. Akurasi pengujian sistem untuk menemukan keteraturan, pola atau hubungan
implementasi metode Naive Bayes untuk diagnosis dalam data berukuran besar. Keluaran dari data
penyakit kambing sebesar 90%. Ini dikarenakan mining ini bisa dipakai untuk memperbaiki
metode Naive Bayes hanya melakukan perhitungan pengambilan keputusan di masa depan. Saat ini
berdasarkan data latih dan inputan dalam sistem istilah pengenalan pola (pattern recognition) jarang
yang dibuat hanya berjumlah 4 inputan (Prayoga et digunakan karena ia termasuk bagian dari data
al., 2018). Untuk mengimplementasikan metode mining (Prasetyo, 2012).
Naïve Bayes data-data harus terlebih dahulu
dikonversi menjadi bentuk diskrit dengan cara Berdasarkan fungsinya, data mining dikelompokkan
dikelompok-kelompokkan. Dengan menerapkan menjadi 6 yaitu deskripsi, estimasi, prediksi,
metode Naïve Bayes pada aplikasi prediksi maka klasifikasi, clustering, danasosiasi (Larose, 2005).
didapatlah tingkat akurasi sebesar 82,97% (Bari, Klasifikasi (taksonomi) adalah proses menempatkan
Sitorus, & Ristian, 2018). objek tertentu (konsep) dalam satu set kategori,
berdasarkan masing-masing objek (konsep)
1. Hepatitis property (Gorunescu, 2011). Proses klasifikasi
Istilah “Hepatitis” dipakai untuk semua jenis didasarkan pada empat komponen mendasar yaitu
peradangan pada sel-sel hati, yang bisa disebabkan kelas, prediktor, training set, dan pengujian dataset.
oleh infeksi (virus, bakteri, parasit), obat-obatan Diantara model klasifikasi yang paling popular
(termasuk obat tradisional), konsumsi alkohol, adalah Decision/Classification Trees, Bayesian
Classifiers/Naïve Bayes Classifiers, Neural
lemak yang berlebih dan penyakit autoimmune. Ada
Networks, Statistical Analysis, Genetic Algorithms,
5 jenis Hepatitis Virus yaitu Hepatitis A, B, C, D,
Rough Sets, K-Nearest Neighbor Classifier, Rule-
dan E. Antara Hepatitis yang satu dengan yang lain based Methods, Memory Based Reasoning, Support
tidak saling berhubungan. Hepatitis virus merupakan Vector Machines (Gorunescu, 2011).
sebuah fenomena gunung es, dimana penderita yang
tercatat atau yang datang ke layanan kesehatan lebih
50 Implementasi Algoritma Naïve Bayes Pada Data Set Diagnosa Penyakit Hepatitis...
Paradigma – Jurnal Informatika dan Komputer, XXI No. 1 Maret 2019
P-ISSN 1410-5063, E-ISSN: 2579-3500
Deny Novianti 51
Paradigma – Jurnal Informatika dan Komputer, XXI No. 1 Maret 2019
P-ISSN 1410-5063, E-ISSN: 2579-3500
Pada tahap ini dilakukan pengujian metode Naive Spiders Yes 0,904 0,096
Bayes yang akan digunakan untuk memprediksi
penyakit hepatitis. Langkah-langkah yang dilakukan Varices No 0,389 0,611
adalah untuk menghitung nilai probabilitas nilai
“Life” dan “Die” dari masing-masing atribut pada
total kasus “Life” dan “Die” dari keseluruhan data.
Berdasarkan tabel di atas, maka dapat dihitung
probabilitas dari tiap atribut yang ada.
52 Implementasi Algoritma Naïve Bayes Pada Data Set Diagnosa Penyakit Hepatitis...
Paradigma – Jurnal Informatika dan Komputer, XXI No. 1 Maret 2019
P-ISSN 1410-5063, E-ISSN: 2579-3500
REFERENSI
Deny Novianti 53
Paradigma – Jurnal Informatika dan Komputer, XXI No. 1 Maret 2019
P-ISSN 1410-5063, E-ISSN: 2579-3500
54 Implementasi Algoritma Naïve Bayes Pada Data Set Diagnosa Penyakit Hepatitis...