Jurnal Metode Kuantitatif Kelompok 5

Download as pdf or txt
Download as pdf or txt
You are on page 1of 4

Feb 2024

PEMBAHASAN JURNAL “ANALISIS SENTIMEN KASUS SIANIDA


SETELAH TAYANG 'ICE COLD' DENGAN METODE NLP
MENGGUNAKAN ALGORITMA NAÏVE BAYES”

Direview Oleh:
Adri Listianto 1, Hisyam Husein 2 , M. Fauzi Irawan 3 , Daniel Alexander 4 dan Gerry
Santika Riyanto 5
1
Metode Kuantitatif, Universitas Gunadarma

Abstrak. Information technology is developing increasingly rapidly, and the reach of the
Internet has expanded even to remote areas. The public increasingly uses social media as a
source of information that discusses all aspects of people's lives. Social media has a vital role
for most people, one of which is the news of the cyanide coffee case. The Cyanide Coffee case
was discussed again by netizens after Netflix raised this case in a documentary film entitled Ice
Cold, which made the public even more convinced of the irregularities of the case. Based on
this, sentiment analysis is needed to extract comments to obtain public opinion information.
The sentiment analysis aims to create a sentiment model to determine public comments on this
case. Therefore, this research was conducted to find out and classify public sentiment on the
Cyanide Coffee Case using the Natural Language Processing (NLP) method, which is a text
preprocessing process followed by the tokenization stage. Data filtering was used using
Indonesian Stopwords, and then normalization was continued using Porter Stemmer. In this
study, data collection was carried out based on public comments on Ice Cold shows on the
TikTok platform using TikTok Comments Scraper. The test results show that the classification
using naïve Bayes obtained the results of 22 negative comments, 4052 neutral comments and
34 positive comments. The classification results of this study are 87% accuracy, 97.6%
precision, 87% recall, and 91.9% F-Score.

Kata kunci: Cyanide Coffee Case, Ice Cold , Natural Language Processing, NLP, TikTok.

I. PENDAHULUAN Kasus Kopi Sianida Jessica Wongso


Teknologi informasi berkembang kembali mencuri perhatian sejak ditayangkan
semakin pesat, dan jangkauan Internet pun sebagai film dokumenter di Netflix bertajuk Ice
semakin meluas hingga ke daerah-daerah Cold. Sejak dinyatakan bersalah melakukan
terpencil. Media sosial semakin banyak pembunuhan berencana atas kematian Wayan
digunakan masyarakat sebagai sumber informasi Mirna Salihin 7 tahun lalu, Jessica Kumala
di era milenial ini, tentunya membahas segala Wongso menjadi perbincangan hangat di media
aspek kehidupan mulai dari sosial, budaya, sosial. Spekulasi banyak orang berubah ketika
ekonomi, kriminal hingga gaya hidup film dokumenter itu ditayangkan. Diketahui, pada
masyarakat. Media sosial memiliki peran yang Januari 2016 lalu, masyarakat Indonesia
vital bagi sebagian besar masyarakat, salah dihebohkan dengan meninggalnya seorang
satunya adalah pemberitaan kasus kopi sianida. wanita bernama Wayan Mirna Salihin yang
Seperti kita ketahui, peran media sosial sangat meninggal usai meminum Es Kopi Vietnam di
penting untuk mengangkat suatu isu, Olivier Cafe, Grand Indonesia Mall Jakarta,
menjadikannya viral, dan menarik perhatian bersama dua temannya, Hani dan Jessica.
masyarakat luas perhatian, dengan lembaga- Kematian Mirna diduga disebabkan oleh zat
lembaga terkait menyelesaikan permasalahan ini korosif yang terdapat pada kopi yang
dengan lebih cepat. diminumnya. Pasca penayangan film dokumenter
tersebut, banyak stigma sosial dan perubahan
Jurnal 64-PLSI 1
Feb 2024

pandangan masyarakat terhadap terdakwa Jessica IV. PREPROCESSING


Kumala Wongso. Perubahan pandangan tersebut Preprocessing disini merupakan tahapan
mempengaruhi keyakinan masyarakat bahwa untuk mengubah struktur data berupa kumpulan
Jessica adalah pembunuh Mirna yang teks menjadi token atau kata melalui tahap
sebenarnya. tokenisasi; token diproses kembali melalui tahap
proses pembersihan yaitu case lipat untuk
II. TUJUAN PENELITIAN mengubah teks menjadi huruf kecil dan tahap
Tujuan dari Penilitian ini adalah penghapusan stopwords agar token tidak
membandingkan penggunaan 2 metode yang mengulang kata yang sama dan menjadi kata
digunakan Natural Language Processing dan dasar dengan menghilangkan kata-kata yang
Multi-Layer Perceptron pada Algorithma tidak mempunyai nilai. , seperti "yang", "dan",
Naiye Baiyes. "di ". Simbol, emotikon, angka, dan tanda baca
dibersihkan selama proses pembersihan. Tahap
III. PENJELASAN DATA terakhir dilakukan normalisasi menggunakan
Penelitian ini menggunakan metode Porter stemmer sebelum data dimasukkan ke
Natural Language Processing (NLP) adalah dalam model klasifikasi untuk menormalkan kata
berdasarkan pada jurnal penelitian yang yang disingkat atau diulang.
ditulis oleh Nico Munasatya dan Sendi
Novianto dengan judul “Natural Language V. MODEL PREDIKSI
Processing untuk Analisis Sentimen Presiden Penelitian ini menggunakan teknik data
Jokowi Menggunakan Multi-Layer mining dengan model klasifikasi. Model yang
Perceptron”, dimana penelitian ini dilakukan dibentuk untuk membandingkan klasifikasi data
membuktikan bahwa analisis sentimen biasa yang berisi opini, apakah positif, negatif, atau
digunakan untuk opinion mining dalam arti netral. Dengan menggunakan Algoritma Naïve
memberi identitas/label (Positif, Negatif, Bayes, Confusion Matrix digunakan untuk
Netral) pada data/korpus. NLP (Natural mengukur hasil klasifikasi metode Naïve Bayes
Language Processing) digunakan untuk Classifier. Confusion Matrix adalah metode yang
mengolah data/corpus agar dapat dipahami digunakanuntuk menghitung akurasi dalam
oleh mesin atau bisa dikatakan sebagai data konsep data mining. Evaluasi dengan
preprocessing/cleaning text. menghasilkan nilai akurasi, presisi dan recall,
penelitian oleh (Pang, Lee, & Vaithyanathan,
2002).
Alasan peneliti memilih model prediksi
tersebut adalah algoritma Naïve Bayes mampu
memberikan performa klasifikasi yang lebih baik
dibandingkan algoritma klasifikasi yang lain,
sehingga cocok digunakan untuk
mengklasifikasikan data klasifikasi data yang
berisi opini, apakah positif, negatif, atau netral.
Membandingkan algoritma Naïve Bayes dengan
2 metode yang digunakan Natural Language
Processing dan Multi-Layer Perceptron pada
Algorithma Naiye Baiyes. Pemodelan topik
merupakan salah satu teknik dalam Natural
Language Processing (NLP) untuk menganalisis
teks suatu algoritma untuk mengidentifikasi pola
tersembunyi dari sekumpulan kata dengan
menggunakan teknik mendistribusikan kata
dalam sekumpulan dokumen. Keluaran dari
pemodelan topik adalah sekumpulan topik yang
terdiri dari beberapa kelompok kata yang muncul
Jurnal 64-PLSI 2
Feb 2024

bersamaan dalam dokumen berdasarkan polaVII. PARAMETER


tertentu, penelitian oleh (AGGARWAL & ZHAI, Pada penelitian ini terdapat beberapa
2013). parameter yang digunakan untuk mengukur
Pengklasifikasi Naive Bayes Naïve performa model klasifikasi. Parameter tersebut
Bayes Classifier merupakan salah satu metode meliputi area under curve (AUC), Akurasi
pembelajaran mesin yang memanfaatkan (CA), FI, Presisi, Recall. Akurasi digunakan
perhitungan probabilitas dan statistik yang untuk mengukur sejauh mana model dapat
dikemukakan oleh ilmuwan Inggris Thomas mengklasifikasikan data dengan benar. Presisi
Bayes, yaitu memprediksi probabilitas masa mengukur sejauh mana model dapat
depan berdasarkan pengalaman sebelumnya, mengidentifikasi dengan tepat kelas positif.
penelitian oleh (Jacobi, Atteveldt, & Welbers, Recall mengukur sejauh mana model dapat
2015). Dasar Naïve Bayes yang digunakan mengidentifikasi dengan tepat semua instance
dalam pemrograman adalah rumus Bayes kelas positif. Sedangkan AUC mengukur
dalam persamaan, penelitian oleh (Br Ginting sejauh mana model dapat membedakan antara
& Trinanda, 2013). Peluang kejadian A kelas positif dan negatif.
sebagai B atau P(A|B) ditentukan dari peluang
terjadinya B ketika A atau P(B|A), peluang VIII. METODE/TOOLS
terjadinya A atau, dan peluang terjadinya B Model penelitian yang digunakan pada
atau P(A) serta peluang dari B atau P(B). penelitian ini diuji menggunakan tools aplikasi
orange data mining versi 3.36 untuk
penambangan opini. Menurut Turney, Opinion
mining atau analisis sentimen adalah proses
memahami, mengekstraksi, dan mengolah data
tekstual secara otomatis untuk memperoleh
VI. RUMUSAN informasi sentimen dalam sebuah kalimat
Peneliti ini menggunakan Rumusan opini. Analisis sentimen dilakukan untuk
Confusion Matrix, Confusion Matrix melihat opini atau kecenderungan berpendapat
digunakan untuk mengukur hasil klasifikasi terhadap suatu masalah atau objek yang
metode Naïve Bayes Classifier. Confusion diungkapkan seseorang, apakah cenderung
Matrix adalah metode yang digunakan untuk berpandangan atau berpendapat negatif atau
menghitung akurasi dalam konsep data positif, penelitian oleh (Pisceldo, Adriani, &
mining. Evaluasi dengan menghasilkan nilai Manurung, 2009). Penambangan opini
akurasi, presisi dan recall, penelitian oleh dilakukan untuk melihat opini atau
(Pang, Lee, & Vaithyanathan, 2002). kecenderungan opini terhadap suatu
permasalahan atau topik berita yang dilakukan
seseorang, apakah cenderung negatif, positif
atau netral, sehingga diharapkan opini yang
dikumpulkan dapat menjadi informasi yang
Keakuratan klasifikasi adalah persentase bermanfaat.
pencatatan data yang diklasifikasikan dengan
benar setelah dilakukan pengujian hasil
klasifikasi. Presisi adalah proporsi kasus
positif yang diprediksi dan positif sebenarnya
pada data sebenarnya. Recall adalah proporsi
kasus positif sebenarnya yang diprediksi
positif dengan tepat. Persamaan:

Jurnal 64-PLSI 3
Feb 2024

IX. ANALISA HASIL & MODEL DAFTAR PUSTAKA


Pengujian model yang dilakukan 1 kali
menunjukkan hasil akurasi, presisi, recall, dan [1] Rahmatika Hizria, Sarwadi, Rabiatul
AUC sebagai berikut. Adawiyah Hasibuan, Ramadhani Ritonga &
Rika Rosnelly (2024) Sentiment Analysis on
Cyanide Case After 'Ice Cold' Aired with NLP
Hasil pengujian terhadap analisis Method using Naïve Bayes Algorithm.
sentimen yang telah dibangun diperoleh Journal of Computer Networks, Architecture
bahwa hasil pengujian dengan menggunakan and High Performance Computing 2655-9102
algoritma naïve Bayes classifier memberikan
hasil pengujian klasifikasi dengan akurasi
sebesar 87%, presisi sebesar 97,6%, recall
sebesar 87% dan F-Score sebesar 91,9%.
Hasil pengujian penelitian ini menunjukkan
bahwa klasifikasi menggunakan naïve Bayes
memperoleh hasil negatif sebanyak 22
komentar, 4052 komentar netral dan 34
komentar positif, seperti terlihat pada Gambar
di bawah ini:

X. KESIMPULAN
Kesimpulan yang diambil dari penelitian
tersebut dapat disimpulkan bahwa AUC (Area
Under ROC Curve) mempunyai nilai yang
paling rendah dikarenakan adanya
ketidakseimbangan hasil klasifikasi dengan
menggunakan algoritma naïve Bayes
classifier karena menghasilkan kinerja akurasi
yang lebih baik dalam penerapan klasifikasi
tersebut.

XI. SARAN
Saran yang diambil dari penelitian ini
dapat ditambhkan alur dari prepocessing yang
lebih jelas untuk menggunakan metodenya
apa dan bagaimana bekerjanya. Metode yang
digunakan sudah sangat baik dan meghasilkan
data yang baik juga namun perlu adanya
pengembangan penelitian kedepannya dalam
menggunakan lebih dari 2 (dua) atau metede
lainnya agar dapat memperluas cakupan
penelitian yang sejenis untuk di masa yang
akan datang.

Jurnal 64-PLSI 4

You might also like