Pengenalan Data Mining
Pengenalan Data Mining
Contoh :
Jika mempunyai kartu kredit, biasanya bank selalu memberikan penawaran
barang atau jasa. Jika bank memiliki 1.000.000 nasabah dan biaya
pengiriman surat setiap nasabah adalah 500 rupiah maka biaya yang harus
dikeluarkan oleh bank adalah 500 juta rupiah. Padahal nasabah yang
mungkin menerima tawaran tsb hanya 15% sehingga terjadi pembuangan
biaya sekitar 85% dari 500 juta yang merugikan pihak bank sekitar
425juta. Jika pihak bank dapat memanfaatkan data-data yang ada sehingga
hanya nasabah yang berpotensi untuk membeli saja yang dikirimkan surat
maka biaya pengiriman dapat ditekan.
AKAR ILMU DATA MINING
1. 1. Statistik
2. Tanpa ada statistik maka data mining mungkin tidak ada. Teknik yang
digunakan adalah metode komputasional dan visualisasi data.
3. 2.Artificial Intelligence
4. AI berkontribusi terhadap teknik pengolahan informasi berdasarkan
pada model penalaran manusia. Salah satu cabang AI adalah machine
learning.
5. 3. Pattern Recognition
6. Pengenalan pola pada data mining dilakukan dengan mengolah data
dari basis data. Ciri dari data mining adalah pencarian pola asosiasi dan
pola sekuensial.
7. 4. Sistem Basis Data
8. Basis data menyediakan informasi berupa data yang akan digali
menggunakan metode-metode tertentu.
TASK DALAM DATA MINING
Pada eager learner dilakukan proses pelatihan Pada lazy learner hanya sedikit melakukan
atau pembelajaran pada data latih agar dapat pelatihan bahkan tidak. Hal ini menyebabkan
memetakan dengan benar setiap vektor proses prediksi menjadi lama karena model
masukan ke label kelas keluarannya sehingga di harus membaca semua data latih agar dapat
akhir proses pelatihan model sudah dapat memberikan keluaran dengan benar. Kelebihan
memetakan data uji dengan benar. Proses algoritma ini proses pelatihan berjalan dengan
prediksi menggunakan model yang tersimpan cepat.
dan tidak melibatkan data latih sehingga proses
prediksi berjalan dengan cepat tetapi proses Algoritma yang termasuk kategori ini antara
pelatihannya memakan waktu lama. lain k-nearest neighbours (KNN), fuzzy k-
nearest neighbour, dan regresi linear
Algoritma yang termasuk eager learner yaitu
jaringan syaraf tiruan, decision tree, bayesian,
support vector machine
ALGORITMA KLASIFIKASI
Support
Vector
Machine
(SVM).
K-nearest Jaringan
Neighbors Syarat Tiruan Naive Bayes
(KNN) (JST) Classifier
Bayesian
Network
Decision
Tree
KONSEP KLASIFIKASI
KONSEP KLUSTER
Clustering merupakan proses partisi satu set objek data ke dalam himpunan
bagian yang disebut dengan cluster. Objek yang di dalam cluster memiliki
kemiripan karakteristik antar satu sama lainnya dan berbeda dengan cluster yang
lain. Partisi tidak dilakukan secara manual melainkan dengan suatu algoritma
clustering.
Clustering dapat dibedakan menjadi 2 tujuan yaitu clustering untuk pemahaman
dan clustering untuk penggunaan.
METODE CLUSTER
Buatlah sebuah contoh kasus yang bisa diaplikasikan dengan teknik data
mining.
TUGAS DIKUMPUL SEBELUM UTS
Judul paper yang direview tidak boleh sama, untuk kelas A, B, C maupun D.
Kirim paling lambat sehari sebelum pelaksanaan UTS (Tanggal …… pukul …… )
Ke email [email protected] dengan subjek :
NAMA_NIM_ TUGASUTSDATAMINING