7764 19600 1 PB PDF
7764 19600 1 PB PDF
7764 19600 1 PB PDF
Abstrak— Pada saat ini perkembangan dunia perfilman sudah sangat pesat, contohnya dengan banyaknya
film-film yang silih berganti untuk ditayangkan. Para penikmat film juga membutuhkan film-film yang
mempunyai kualitas gambar, suara, alur cerita dan nilai positif yang baik dalam sebuah film, agar mereka
tetap antusias dalam mengikuti film-film yang terbaru. Namun film-film yang ada tidak semuanya dapat
dinikmati dan tidak semua kalangan menyukai semua film. Agar suatu film dapat terus berkembang,
tentunya membutuhkan penilaian-penilaian dari para penikmat film, untuk mengetahui selera film yang
sesuai dengan para penikmat film. Untuk itu dibutuhkan analisis agar dapat mengetahui bagaimana minat
penikmat film yaitu dengan membuat penilaian-penilaian yang nantinya digunakan untuk mengetahui
rating suatu film menggunakan metode naïve bayes yaitu metode yang melakukan pendekatan statistika
yang fundamental dalam pengenalan pola (pattern recognition). Pendekatan ini didasarkan pada kuantifikasi
trade-off antara berbagai keputusan klasifikasi dengan menggunakan probabilitas dan resiko yang
ditimbulkan dalam keputusan-keputusan tersebut. Metode tersebut merupakan salah satu metode dari data
mining, dengan atribut yang sudah ditentukan, yaitu meliputi genre film, aktor film, bahasa,warna, durasi
film, negara, dan lainnya yang dapat digunakan sebagai tolak ukur sutradara untuk membuat film.
60
Jurnal Teknik Elektro Vol. 8 No. 2 61
Juli - Desember 2016
pembelajaran yang dilakukan. Data training yang digunakan Variabel X18 Num_users_for_reviews
adalah data sampel yang di dapat dari situs di internet, yaitu Variabel X19 Language
dari situs https://www.kaggle.com/. Variabel X20 Country
2) Data Testing Variabel X21 Content_rating
Variabel X22 Budget
Data testing merupakan data yang akan atau sedang terjadi
dan dipergunakan sebagai bahan uji yang sebelumnya sudah Variabel X23 Title_year
didapatkan pada data training. Data testing tersebut juga Variabel X24 Movie_facebook_like
menggunakan data sampel yang diperoleh dari situs di internet, Variabel X25 Num_critic_for_reviews
yaitu dari situs https://www.kaggle.com/. D. Data Cleaning
C. Penentuan Atribut Pembersihan data perlu dilakukan supaya data yang
Atribut-atribut yang digunakan untuk proses data mining digunakan valid sesuai kebutuhan. Sehingga dari nilai class
ini mengacu pada tujuan penelitian. Ada dua jenis variabel data film dalam atribut tidak terjadi ketidakkonsistenan data
yang ditentukan [7],yaitu : dalam pengujian.
Director
color director_name num_critic_for_reviews duration actor_3_facebook_like
facebook_like
Color James Cameron tinggi panjang rendah rendah
Color Gore Verbinski sedang panjang sedang sedang
Color Sam Mendes tinggi panjang rendah rendah
Color Christopher Nolan tinggi panjang tinggi tinggi
Color Andrew Stanton tinggi panjang rendah sedang
Color Sam Raimi sedang panjang rendah rendah
Color Nathan Greno sedang pendek rendah rendah
Color Joss Whedon tinggi panjang rendah rendah
Color David Yates sedang panjang rendah rendah
Color Zack Snyder tinggi panjang rendah rendah
TABEL III. DATA TRAINING