8 Unsupervised Learning Kmeans

Diunggah oleh

Zufar Ntsr

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

55 tayangan21 halaman

8 Unsupervised Learning Kmeans

Diunggah oleh

Zufar Ntsr

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

Anda di halaman 1/ 21

Unsupervised Learning

(K-Means)
Kuliah Pertemuan 8
MK Pembelajaran Mesin
Semester 6
Teknologi Rekayasa Komputer
Unsupervised Learning
Unsupervised learning adalah proses pembelajaran dilakukan tanpa petunjuk. Algoritma
dalam komputerlah yang bekerja untuk menemukan pola- pola di dalam data.
Secara matematis, unsupervised learning terjadi ketika kita memiliki sejumlah data
masukan (X) dan tanpa variabel output yang berhubungan.

Jika menggunakan analogi, siswa belajar tanpa ada solusi dan jawaban yang benar, siswa
harus menemukan sendiri jawabannya.

Masalah Unsupervised learning dapat dibagi menjadi dua jenis yaitu asosiasi dan
clustering
Contoh
Contoh
Data berisi tiga jenis item yang berbeda.
Ketiga item tersebut akan dipisah menjadi beberapa kategori tergantung data.
Komputer hanya mengetahui fitur-fitur yang akan digunakan untuk membedakan ketiga
item tersebut yaitu warna dan bentuk.
Dengan menggunakan algoritma clustering, komputer akan dapat membagi item-item
menjadi tiga kelompok tanpa harus diberi pengetahuan.
Algoritma akan bekerja untuk membagi menjadi beberapa kelompok dengan melihat isi
data masing-masing item.
Asosiasi
Asosiasi adalah teknik yang digunakan untuk mengidentifikasi hubungan atau keterkaitan
antara dua atau lebih variabel dalam data.
Dalam analisis asosiasi, kita mencari korelasi antara variabel-variabel tersebut dan
mencoba untuk mengidentifikasi pola-pola yang tersembunyi di dalamnya.

Salah satu contoh penerapan asosiasi adalah dalam analisis pasar, di mana kita mencoba
untuk menemukan keterkaitan antara produk-produk yang dibeli bersama-sama.
Clustering
Clustering adalah teknik yang digunakan untuk mengelompokkan objek-objek dalam data
ke dalam kelompok-kelompok yang serupa berdasarkan pada karakteristik yang dimiliki.
Dalam analisis clustering, kita mencari pola-pola di dalam data yang menggambarkan
kesamaan atau perbedaan antara objek-objek.

Salah satu contoh penerapan clustering adalah dalam analisis pelanggan, di mana kita
mencoba untuk mengelompokkan pelanggan-pelanggan yang memiliki preferensi dan
perilaku konsumsi serupa.
K-means
Overview
K-Means adalah salah satu “unsupervised machine learning algorithms” yang paling
sederhana dan populer. Tujuan dari algoritma ini adalah untuk menemukan grup dalam
data, dengan jumlah grup yang diwakili oleh variabel K. Variabel K adalah jumlah kluster
yang diinginkan.
Metode K-Means Clustering berusaha mengelompokkan data yang ada ke dalam
beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang
sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang
ada di dalam kelompok yang lain. Karakteristik yang sama itu ditandai dengan jarak atau
distance yang lebih dekat, mirip seperti KNN.
Algoritma
1. Tentukan jumlah kluster
Jumlah kluster adalah jumlah kelompok yang diinginkan.
Penentuan jumlah kluster ini merupakan langkah awal yang menentukan hasil dari
klasterisasi nantinya.
Untuk mengelompokkan data tersebut perlu keahlian dan pemahaman terhadap data
dan subjek permasalahan.
Dapat juga melakukan uji terhadap kluster untuk menentukan K-terbaik.
Jumlah kluster yang telah ditentukan akan diberi nilai koordinat acak yang
merepresentasikan mean atau rata-rata dari kelompok tersebut yang disebut mean-
cluster.
Mean-cluster
Algoritma

2. Alokasikan data ke dalam kluster

secara random
Setiap data dimasukkan ke dalam kluster
tertentu secara acak.
Walaupun akan ada data yang masuk ke
dalam kluster yang salah tidak apa-apa.
Karena algoritma ini akan mengubahnya
berdasarkan nilai mean-cluster yang diset
pada langkah 1 di langkah berikutnya.
Algoritma

3. Update mean/rata-rata jarak cluster

berdasarkan data cluster
Langkah ini merupakan koreksi untuk
langkah 1 dimana kita memberikan nilai
acak pada mean-cluster.
Proses update dilakukan dengan
menghitung jarak rata-rata baru pada
kluster tersebut berdasarkan titik-titik
pada langkah 2 lalu nilai mean yang baru
akan menggantikan nilai mean- cluster.
Dengan kata lain, nilai mean-cluster telah
di update sesuai dengan anggotanya.
Algoritma
4. Alokasikan masing-masing data ke rata-rata terdekat
Langkah ini merupakan koreksi terhadap anggota kluster, dimana keangotaan data
terhadap kluster diubah berdasarkan jarak data ke titik mean-cluster.
Keanggotaan dipilih berdasarkan jarak terdekat.
Sebagai contoh pada gambar, data yang berada pada titik (1,5) adalah anggota kluster 1,
namun jika dihitung kembali jaraknya ke mean kluster 1 baru dan mean kluster 2 baru
ternyata jaraknya lebih dekat kepada mean kluster 2.
Oleh karena itu pada gambar, keanggotaan titik (1,5) berubah dari kluster 1 menjadi
kluster 2
Update
keanggotaan
kluster
berdasarkan
mean-cluster
baru
Algoritma
5. Kembali ke langkah 3
Apabila masih ada data yang berpindah cluster pada langkah 4 atau apabila perubahan
nilai centroid, ada yang di atas nilai threshold yang ditentukan atau apabila perubahan
nilai pada objective function yang digunakan, di atas nilai threshold yang ditentukan
maka kembali ke langkah 3 untuk mengupdate nilai mean-cluster.
Nilai threshold dapat bervariasi tergantung pada data yang digunakan, dan biasanya
diatur untuk mencapai tingkat akurasi atau kecepatan komputasi yang diinginkan.
Semakin kecil nilai threshold, semakin lama waktu yang dibutuhkan untuk mencapai
konvergensi.
Konvergensi dapat didefinisikan sebagai suatu kondisi di mana proses iterasi telah
mencapai titik di mana perubahan nilai output atau parameter yang dicari menjadi kecil
dan tidak signifikan lagi. Pada titik tersebut, nilai yang ditemukan dianggap sebagai solusi
yang paling optimal.
Algoritma
Manfaat
1. Pemrosesan data yang lebih cepat dan efisien
Algoritma k-means merupakan salah satu algoritma klasterisasi yang paling populer dan
mudah digunakan. Algoritma ini dapat memproses data dengan cepat dan efisien bahkan
dengan jumlah data yang sangat besar.

2. Menghasilkan kelompok atau klaster data yang homogen

Dengan menggunakan algoritma k-means, kita dapat mengelompokkan data ke dalam
cluster yang memiliki kemiripan fitur atau karakteristik. Dalam setiap cluster, data
memiliki kesamaan yang signifikan dan perbedaan yang relatif kecil.

3. Identifikasi pola dan struktur dalam data

Algoritma k-means membantu dalam mengidentifikasi pola atau struktur dalam data
yang mungkin sulit ditemukan secara manual.
Manfaat
4. Meningkatkan pemahaman tentang data
Algoritma k-means dapat membantu dalam memahami data dengan lebih baik. Dengan
mengetahui kelompok mana data termasuk, kita dapat mempelajari lebih banyak
tentang karakteristik data dan mengambil keputusan yang lebih tepat dalam
penggunaannya.

5. Aplikasi dalam berbagai bidang

Algoritma k-means memiliki berbagai aplikasi di berbagai bidang seperti ilmu
pengetahuan, teknologi, ekonomi, dan sosial. Algoritma ini dapat digunakan untuk
mengidentifikasi tren dan pola dalam data pasar, membantu dalam analisis data medis
dan epidemiologi, serta membantu dalam mengklasifikasikan kategori pelanggan dalam
bisnis.
Kelebihan
1. Sederhana dan mudah digunakan: Algoritma k-means mudah dipahami dan
diimplementasikan, bahkan oleh pemula.
2. Efisien: Algoritma k-means memproses data dengan cepat, bahkan pada jumlah data
yang besar.
3. Hasil yang akurat: Algoritma k-means dapat menghasilkan klaster yang akurat dan
berarti.
4. Skalabilitas: Algoritma k-means dapat diterapkan pada berbagai macam data, baik
data numerik maupun kategorikal.
5. Sangat cocok untuk data dengan jumlah klaster yang jelas: Algoritma k-means bekerja
dengan baik untuk data yang memiliki jumlah klaster yang jelas dan terlihat.
Kekurangan
1. Bergantung pada jumlah klaster: Algoritma k-means sangat bergantung pada jumlah
klaster yang dipilih dan bisa sangat mempengaruhi hasil clustering. Oleh karena itu,
memilih jumlah klaster yang optimal menjadi sangat penting dalam analisis data.
2. Rentan terhadap inisialisasi centroid awal yang buruk: Hasil clustering dapat sangat
dipengaruhi oleh inisialisasi centroid awal. Jika centroid awal dipilih secara acak,
algoritma k-means dapat memberikan hasil yang tidak optimal.
3. Rentan terhadap data yang berbeda skala: Algoritma k-means sangat rentan
terhadap data yang berbeda skala. Oleh karena itu, perlu untuk melakukan
normalisasi data sebelum melakukan klasterisasi.
4. Tidak cocok untuk data dengan bentuk yang kompleks: Algoritma k-means tidak
cocok untuk data dengan bentuk yang kompleks seperti data berbentuk lingkaran
atau data dengan kelompok yang tumpang tindih.
5. Kesulitan menangani outlier: Algoritma k-means sangat sensitif terhadap outlier
dalam data, yang dapat mempengaruhi hasil clustering secara signifikan.

Anda mungkin juga menyukai

M-3 Refraktometer Aurel
Belum ada peringkat
M-3 Refraktometer Aurel
4 halaman
Op Amp
Belum ada peringkat
Op Amp
19 halaman
Contoh Laporan Praktikum Getaran Teredam
Belum ada peringkat
Contoh Laporan Praktikum Getaran Teredam
3 halaman
Instrumentasi Mekanik
Belum ada peringkat
Instrumentasi Mekanik
9 halaman
LP - 7 - Ade Rizki Wahyudi
Belum ada peringkat
LP - 7 - Ade Rizki Wahyudi
21 halaman
Makalah Mekanika GHS Fix
Belum ada peringkat
Makalah Mekanika GHS Fix
32 halaman
Tugas Makalah Reciprocal Lattice
Belum ada peringkat
Tugas Makalah Reciprocal Lattice
22 halaman
Jurnal
Belum ada peringkat
Jurnal
6 halaman
Tabel Modul 4 Momen Inersia
Belum ada peringkat
Tabel Modul 4 Momen Inersia
5 halaman
Laporan Konstanta Planck
Belum ada peringkat
Laporan Konstanta Planck
28 halaman
Pembiasan Dan Pemantulan Gelombang (M-4)
Belum ada peringkat
Pembiasan Dan Pemantulan Gelombang (M-4)
4 halaman
Modul 6 Tugas Akhir Karakteristik Beberapa Elemen Listrik
Belum ada peringkat
Modul 6 Tugas Akhir Karakteristik Beberapa Elemen Listrik
4 halaman
Tugas Laporan Kristalografi
Belum ada peringkat
Tugas Laporan Kristalografi
24 halaman
Mata4432 M1
Belum ada peringkat
Mata4432 M1
59 halaman
Percobaan 2 Pengenalan Matlab New
Belum ada peringkat
Percobaan 2 Pengenalan Matlab New
3 halaman
Sinyal Dan Sistem Subahan
Belum ada peringkat
Sinyal Dan Sistem Subahan
8 halaman
Signal Scaling, Shifting and Mirroring
Belum ada peringkat
Signal Scaling, Shifting and Mirroring
3 halaman
Kalkulus 1 - 01 Sistem Bilangan Riil
Belum ada peringkat
Kalkulus 1 - 01 Sistem Bilangan Riil
36 halaman
Evraniti Iman Praharti - GHS
Belum ada peringkat
Evraniti Iman Praharti - GHS
28 halaman
Laporan Tetap Praktikum Fisika Dasar II Acara Vii Kisi Difraksi
Belum ada peringkat
Laporan Tetap Praktikum Fisika Dasar II Acara Vii Kisi Difraksi
14 halaman
Makalah Kel 3 GO
Belum ada peringkat
Makalah Kel 3 GO
22 halaman
PEGAS
Belum ada peringkat
PEGAS
17 halaman
1-DIKTAT Pengantar Fisika Zat Padat 23-4-2014
100% (3)
1-DIKTAT Pengantar Fisika Zat Padat 23-4-2014
69 halaman
Decimal To Binary in Matlab
100% (1)
Decimal To Binary in Matlab
3 halaman
Ana Fitriana - Materi 4 - Resume Kerja
Belum ada peringkat
Ana Fitriana - Materi 4 - Resume Kerja
5 halaman
Diktat Gabungan Matlab
100% (1)
Diktat Gabungan Matlab
48 halaman
29 - Mathlab
Belum ada peringkat
29 - Mathlab
77 halaman
Laporan Praktikum Seisfrak
Belum ada peringkat
Laporan Praktikum Seisfrak
11 halaman
Its-Article-4995-Harisubiyanto, Subowo-Pengaruh Temperatur Sintering Terhadap Sifat Mekanik Keramik Insulator Listrik
100% (1)
Its-Article-4995-Harisubiyanto, Subowo-Pengaruh Temperatur Sintering Terhadap Sifat Mekanik Keramik Insulator Listrik
4 halaman
Rahmi Khairina 011500423 TKN15 Laporan Cloud Chamber
Belum ada peringkat
Rahmi Khairina 011500423 TKN15 Laporan Cloud Chamber
17 halaman
Laporan Praktikum Komputasi Numerik (P6) 33 - Kevin Bazli Santoso
Belum ada peringkat
Laporan Praktikum Komputasi Numerik (P6) 33 - Kevin Bazli Santoso
15 halaman
Laporan Modul2 161810201056
Belum ada peringkat
Laporan Modul2 161810201056
22 halaman
Laporan - 3 - Difraksi Laser Oleh CD
Belum ada peringkat
Laporan - 3 - Difraksi Laser Oleh CD
21 halaman
Bab
Belum ada peringkat
Bab
23 halaman
Fisika Inti Bab 1
Belum ada peringkat
Fisika Inti Bab 1
13 halaman
Tugas Instrumentasi
Belum ada peringkat
Tugas Instrumentasi
21 halaman
Difraksi Medan Jauh Dan Dekat
Belum ada peringkat
Difraksi Medan Jauh Dan Dekat
8 halaman
LAPORAN Fisika Komputasi
Belum ada peringkat
LAPORAN Fisika Komputasi
11 halaman
Coy
Belum ada peringkat
Coy
8 halaman
Vibrasi Kristal PDF
100% (1)
Vibrasi Kristal PDF
25 halaman
LAPORAN PRAKTIKUM FISIKA KOMPUTASI M14 Mohamad Anur Maulid 171810201038
Belum ada peringkat
LAPORAN PRAKTIKUM FISIKA KOMPUTASI M14 Mohamad Anur Maulid 171810201038
15 halaman
Makalah GPR
Belum ada peringkat
Makalah GPR
47 halaman
Hukum Pembiasan Dengan Kalkulus Variasi by Aula Caem
Belum ada peringkat
Hukum Pembiasan Dengan Kalkulus Variasi by Aula Caem
1 halaman
Superposisi Dan Interferensi Cahaya
Belum ada peringkat
Superposisi Dan Interferensi Cahaya
48 halaman
Laporan Elektonika Analog
Belum ada peringkat
Laporan Elektonika Analog
11 halaman
Interferensi Gelombang
Belum ada peringkat
Interferensi Gelombang
3 halaman
Buku 1 Propagasi Cahaya Dalam Pandu Gelombang Optik PDF
Belum ada peringkat
Buku 1 Propagasi Cahaya Dalam Pandu Gelombang Optik PDF
71 halaman
Laporan Akhir Modul 8
Belum ada peringkat
Laporan Akhir Modul 8
5 halaman
UTS Kalkulus 2 Teknik Industri
Belum ada peringkat
UTS Kalkulus 2 Teknik Industri
2 halaman
FOURIER
Belum ada peringkat
FOURIER
19 halaman
Sifat Termal Material
Belum ada peringkat
Sifat Termal Material
13 halaman
Makalah Aljabar Linear Dasar - Materi Ke-3 - Kelompok 9 - PSPM E 2019
Belum ada peringkat
Makalah Aljabar Linear Dasar - Materi Ke-3 - Kelompok 9 - PSPM E 2019
16 halaman
K-Means Clustering Pengertian, Cara Kerja, Kelebihan Dan Kekurangannya
Belum ada peringkat
K-Means Clustering Pengertian, Cara Kerja, Kelebihan Dan Kekurangannya
16 halaman
Konsep Metode K-Means
Belum ada peringkat
Konsep Metode K-Means
4 halaman
Makalah K - Means Clustering RAPID MINER
Belum ada peringkat
Makalah K - Means Clustering RAPID MINER
18 halaman
Pembalajaran Mesin Algoritma K-Means
Belum ada peringkat
Pembalajaran Mesin Algoritma K-Means
4 halaman
K Means
Belum ada peringkat
K Means
9 halaman
(08.B) Modul Clustering
Belum ada peringkat
(08.B) Modul Clustering
32 halaman
Data Mining
Belum ada peringkat
Data Mining
5 halaman
File Tersebut Berisi Materi Tentang Unsupervised Learning
Belum ada peringkat
File Tersebut Berisi Materi Tentang Unsupervised Learning
3 halaman
Operasi Dasar Sinyal Variable Bebas
Belum ada peringkat
Operasi Dasar Sinyal Variable Bebas
18 halaman
Sinyal
Belum ada peringkat
Sinyal
135 halaman
Sinyal Disktrit
Belum ada peringkat
Sinyal Disktrit
14 halaman
1 PB
Belum ada peringkat
1 PB
10 halaman