0% menganggap dokumen ini bermanfaat (0 suara)
237 tayangan11 halaman

Machine Learning: Materi Minggu 5: Unsupervised Learning Dan K-Means

Unsupervised learning adalah teknik pembelajaran yang tidak memerlukan dataset berlabel. Teknik ini seperti k-Means clustering yang dapat memecah data menjadi kelompok berdasarkan kemiripan. Algoritma k-Means memilih pusat kluster awal lalu mengelompokkan sampel berdasarkan jarak terdekat. Python memiliki library k-Means untuk melakukan clustering secara cepat dan mudah.

Diunggah oleh

Enjang
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
237 tayangan11 halaman

Machine Learning: Materi Minggu 5: Unsupervised Learning Dan K-Means

Unsupervised learning adalah teknik pembelajaran yang tidak memerlukan dataset berlabel. Teknik ini seperti k-Means clustering yang dapat memecah data menjadi kelompok berdasarkan kemiripan. Algoritma k-Means memilih pusat kluster awal lalu mengelompokkan sampel berdasarkan jarak terdekat. Python memiliki library k-Means untuk melakukan clustering secara cepat dan mudah.

Diunggah oleh

Enjang
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 11

Machine learning

05
Modul ke:

Materi Minggu 5: Unsupervised Learning dan k-Means


Buku Acuan: A. C. Muller dan S. Guido, Introduction to Machine Learning with Python.
California: O’ Reilly Media Inc, 2016.
Fakultas
FASILKOM I Putu Edy Suardiyana Putra, Ph.D.

Program Studi
Teknik
Informatika
Unsupervised learning
• Pada pertemuan selanjutnya Anda sudah belajar tentang
teknik supervised learning, di mana teknik ini membutuhkan
“contoh” berupa labelled dataset untuk “belajar”.
• Di pertemuan ini Anda akan mempelajari tentang teknik
unsupervised learning.
• Teknik unsupervised learning ini tidak akan diberikan labelled
dataset, melainkan teknik ini hanya akan diberikan unlabelled
dataset.
• Contoh implementasi dari teknik ini adalah pendeteksi topik
yang sedang ramai dibicarakan di sosmed dan aplikasi
pengelompokkan buku berdasarkan kemiripan isinya.
Clustering Algorithm

• Algoritma clustering masuk ke dalam kategori


unsupervised learning.
• Algoritma ini mempartisi data ke dalam
beberapa grup berdasarkan kemiripannya.
• Teknik ini banyak digunakan untuk:
– Segmentasi pasar
– Analisa sosial media
– Analisis data astronomi
Perbedaan clustering dan
klasifikasi
Clustering Classification

Data tidak berlabel Data berlabel

Unsupervised learning Supervised learning

Tujuan: membentuk grup berdasarkan Mengidentifikasi class berdasarkan


keimiripan contoh yang diberikan

Jumlah group/class belum diketahui Jumlah group/class sudah diketahui di


awal
k-Means clustering

• k-Means merupakan salah satu algoritma k-


Means yang paling sederhana dan mudah
untuk diimplementasikan.
• Algoritma ini dimulai dengan mencari cluster
center yang bisa merepresentasikan sebuah
grup/class dengan baik.
• Lalu, semua sample yang ada akan di
pasangkan dengan sebuah cluster center.
k-Means clustering
k-Means clustering

• Untuk
  menghitung “kemiripan” antara sample
dan cluster center, bisa menggunakan salah
satu formula berikut:
– Euclidean distance (silahkan lihat slide di
pertemuan sebelumnya)
– Manhattan distance:

– Minkowski Distance
k-Means dengan Python

• Library k-Means dengan Python dapat


ditemukan di tautan berikut: https://
scikit-learn.org/stable/modules/generated/skl
earn.cluster.KMeans.html
• Pada contoh implementasi kali ini akan
digunakan library Pandas untuk memudahkan
dalam mengatur data.
Contoh code dengan Python
Contoh luaran
Terima Kasih
I Putu Edy Suardiyana Putra, Ph.D.

Anda mungkin juga menyukai