0% menganggap dokumen ini bermanfaat (0 suara)
210 tayangan6 halaman

Contoh Clustering Ok

BPR ABC melakukan clustering terhadap data nasabahnya menggunakan algoritma K-Means untuk mengelompokkan nasabah berdasarkan jumlah rumah dan mobil yang dimiliki. Setelah tiga iterasi, terbentuk tiga cluster nasabah dengan ciri-ciri nasabah yang memiliki jumlah rumah dan mobil hampir sama masuk ke dalam satu cluster.

Diunggah oleh

Fariz Agito
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
210 tayangan6 halaman

Contoh Clustering Ok

BPR ABC melakukan clustering terhadap data nasabahnya menggunakan algoritma K-Means untuk mengelompokkan nasabah berdasarkan jumlah rumah dan mobil yang dimiliki. Setelah tiga iterasi, terbentuk tiga cluster nasabah dengan ciri-ciri nasabah yang memiliki jumlah rumah dan mobil hampir sama masuk ke dalam satu cluster.

Diunggah oleh

Fariz Agito
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 6

Contoh Studi Kasus Clustering dengan algoritma K‐Means 

BPR  ABC  memiliki  data  nasabah  yang  pernah  memperoleh  kredit,  data  berupa  jumlah  rumah 
dan mobil yang dimiliki pelanggan.  
Tabel Data nasabah 

 
Clustering  yang  diharapkan  mampu  menghasilkan  kelompok  nasabah  yang  memenuhi  sifat 
berikut: 
1. Nasabah  yang  jumlah  rumah  dan  mobilnya  hampir  sama  akan  berada  pada  kelompok 
nasabah yang sama. 
2. Nasabah yang jumlah rumah dan mobilnya cukup berbeda akan berada pada kelompok 
nasabah yang berbeda.  
 
Berikut langkah‐langkah clustering menggunakan algoritma K‐Means.  
1. Langkah 1: Tentukan jumlah cluster yang diinginkan (misl:k=3)  
2.  Langkah 2: Pilih centroid awal secara acak : Pada langkah ini secara acak akan dipilih 3 
buah data sebagai centroid, misalnya: data {B,E,F}  
M1=(3,3) ,M2=(1,2),M3=(4,2)  
3.  Langkah 3: Hitung jarak dengan centroid …………………… (iterasi 1)  
Pada  langkah  ini  setiap  data  akan  ditentukan  centroid  terdekatnya,  dan  data  tersebut  akan 
ditetapkan sebagai anggota kelompok yang terdekat dengan centroid.  
Untuk menghitung jarak ke centroid masing‐masing cluster pada nasabah A sbb:  
Data: (1,3) , centroid M1: (3,3), centroid M2: (1,2), centroid M3: (4,2)  
 
Tabel hasil perhitungan jarak selengkapny antara masing‐masing data dengan centroid: 

 
Dari tabel diatas didapatkan keanggotaan nasabah sbb:  
Cluster 1 = {B},cluster 2 ={A,E,G,H},cluster 3= {C,D,F}  
Pada  langkah  ini  dihitung  pula  rasio  antara  besaran  BCV  (Between  Cluster  Variation)  dengan 
WCV (Within Cluster Variation) :  
Karena centroid M1=(3,3) ,M2=(1,2),M3=(4,2)  

 
BCV=d(m1,m2)+d(m1,m3)+d(m2,m3) = 2.236+1.414+3 = 6,650  
Dalam hal ini d(mi,mj) menyatakan jarak Euclidean dari m ke mj  
Menghitung WCV  
Yaitu dengan memilih jarak terkecil antara data dengan centroid pada masing‐masing cluster:  
 
 
Sehingga Besar Rasio = BCV/WCV = 6.650 / 7 = 0.950  
Karena langkah ini merupakan iterasi 1 maka lanjutkan ke langkah berikutnya 
4.  Langkah  4:  Pembaruan  centroid  dengan  menghitung  rata‐rata  nilai  pada  masing‐masing 
cluster. 

 
Sehingga didapatkan centroid baru yaitu : m1=(3,3),m2=(1.25,1.75),m3=(4.33,2.67)  
 
5. Langkah 3: (Iterasi‐2) Kembali kelangkah 3, jika masih ada data yang berpindah cluster 
atau  jika  nilai  centroid  diatas  nilai  ambang,  atau  jika  nilai  pada  fungsi  obyektif  yang 
digunakan  masih  diatas  ambang.  Selanjutnya  pada  langkah  ini  dilakukan  penempatan 
lagi  data  dalam  centroid  terdekat  sama  seperti  yang  dilakukan  dilangkah‐3.  Untuk 
menghitung jarak ke centroid masing‐masing cluster pada nasabah A sbb: 
 Data : (1,3) , m1=(3,3),m2=(1.25,1.75),m3=(4.33,2.67) 

 
Dari tabel diatas didapatkan keanggotaan nasabah sbb:  
Cluster 1 = {B},cluster 2 ={A,E,G,H},cluster 3= {C,D,F}  
Pada  langkah  ini  dihitung  pula  rasio  antara  besaran  BCV  (Between  Cluster  Variation)  dengan 
WCV (Within Cluster Variation) :  
BCV=d(m1,m2)+d(m1,m3)+d(m2,m3) = 6,741 

 
Sehingga Besar Rasio = BCV/WCV = 6.741 /4.833 = 1.394  
 
Bila dibandingkan maka rasio sekarang (1.394)  lebih besar dari rasio sebelumnya (0.950) oleh 
karena itu algoritma dilanjutkan kelangkah berikutnya  
 
6. Langkah ke 4 – iterasi 3  
Pada langkah ini dilakukan pembaruan centroid lagi:  
 
7.  Langkah  ketiga  iterasi‐3  Untuk  menghitung  jarak  ke  centroid  masing‐masing  cluster  pada 
nasabah A sbb:  
Data nasabah A : (1,3) , m1=(3,3),m2=(1.25,1.75),m3=(4.33,2.67) 

 
Dari tabel diatas didapatkan keanggotaan nasabah sbb:  
Cluster 1 = {B},cluster 2 ={A,E,G,H},cluster 3= {C,D,F}  
Pada  langkah  ini  dihitung  pula  rasio  antara  besaran  BCV  (Between  Cluster  Variation)  dengan 
WCV (Within Cluster Variation) :  
BCV=d(m1,m2)+d(m1,m3)+d(m2,m3) = 6,741  
 
Sehingga Besar Rasio = BCV/WCV = 6.741 /4.833 = 1.394  
Bila  dibandingkan  maka  rasio  sekarang  (1.394)  sudah  tidak  lagi  lebih  besar  dari  rasio 
sebelumnya (1.394) oleh karena itu algoritma akan dihentikan.  
 
 

Anda mungkin juga menyukai