Contoh Clustering Ok
Contoh Clustering Ok
BPR ABC memiliki data nasabah yang pernah memperoleh kredit, data berupa jumlah rumah
dan mobil yang dimiliki pelanggan.
Tabel Data nasabah
Clustering yang diharapkan mampu menghasilkan kelompok nasabah yang memenuhi sifat
berikut:
1. Nasabah yang jumlah rumah dan mobilnya hampir sama akan berada pada kelompok
nasabah yang sama.
2. Nasabah yang jumlah rumah dan mobilnya cukup berbeda akan berada pada kelompok
nasabah yang berbeda.
Berikut langkah‐langkah clustering menggunakan algoritma K‐Means.
1. Langkah 1: Tentukan jumlah cluster yang diinginkan (misl:k=3)
2. Langkah 2: Pilih centroid awal secara acak : Pada langkah ini secara acak akan dipilih 3
buah data sebagai centroid, misalnya: data {B,E,F}
M1=(3,3) ,M2=(1,2),M3=(4,2)
3. Langkah 3: Hitung jarak dengan centroid …………………… (iterasi 1)
Pada langkah ini setiap data akan ditentukan centroid terdekatnya, dan data tersebut akan
ditetapkan sebagai anggota kelompok yang terdekat dengan centroid.
Untuk menghitung jarak ke centroid masing‐masing cluster pada nasabah A sbb:
Data: (1,3) , centroid M1: (3,3), centroid M2: (1,2), centroid M3: (4,2)
Tabel hasil perhitungan jarak selengkapny antara masing‐masing data dengan centroid:
Dari tabel diatas didapatkan keanggotaan nasabah sbb:
Cluster 1 = {B},cluster 2 ={A,E,G,H},cluster 3= {C,D,F}
Pada langkah ini dihitung pula rasio antara besaran BCV (Between Cluster Variation) dengan
WCV (Within Cluster Variation) :
Karena centroid M1=(3,3) ,M2=(1,2),M3=(4,2)
BCV=d(m1,m2)+d(m1,m3)+d(m2,m3) = 2.236+1.414+3 = 6,650
Dalam hal ini d(mi,mj) menyatakan jarak Euclidean dari m ke mj
Menghitung WCV
Yaitu dengan memilih jarak terkecil antara data dengan centroid pada masing‐masing cluster:
Sehingga Besar Rasio = BCV/WCV = 6.650 / 7 = 0.950
Karena langkah ini merupakan iterasi 1 maka lanjutkan ke langkah berikutnya
4. Langkah 4: Pembaruan centroid dengan menghitung rata‐rata nilai pada masing‐masing
cluster.
Sehingga didapatkan centroid baru yaitu : m1=(3,3),m2=(1.25,1.75),m3=(4.33,2.67)
5. Langkah 3: (Iterasi‐2) Kembali kelangkah 3, jika masih ada data yang berpindah cluster
atau jika nilai centroid diatas nilai ambang, atau jika nilai pada fungsi obyektif yang
digunakan masih diatas ambang. Selanjutnya pada langkah ini dilakukan penempatan
lagi data dalam centroid terdekat sama seperti yang dilakukan dilangkah‐3. Untuk
menghitung jarak ke centroid masing‐masing cluster pada nasabah A sbb:
Data : (1,3) , m1=(3,3),m2=(1.25,1.75),m3=(4.33,2.67)
Dari tabel diatas didapatkan keanggotaan nasabah sbb:
Cluster 1 = {B},cluster 2 ={A,E,G,H},cluster 3= {C,D,F}
Pada langkah ini dihitung pula rasio antara besaran BCV (Between Cluster Variation) dengan
WCV (Within Cluster Variation) :
BCV=d(m1,m2)+d(m1,m3)+d(m2,m3) = 6,741
Sehingga Besar Rasio = BCV/WCV = 6.741 /4.833 = 1.394
Bila dibandingkan maka rasio sekarang (1.394) lebih besar dari rasio sebelumnya (0.950) oleh
karena itu algoritma dilanjutkan kelangkah berikutnya
6. Langkah ke 4 – iterasi 3
Pada langkah ini dilakukan pembaruan centroid lagi:
7. Langkah ketiga iterasi‐3 Untuk menghitung jarak ke centroid masing‐masing cluster pada
nasabah A sbb:
Data nasabah A : (1,3) , m1=(3,3),m2=(1.25,1.75),m3=(4.33,2.67)
Dari tabel diatas didapatkan keanggotaan nasabah sbb:
Cluster 1 = {B},cluster 2 ={A,E,G,H},cluster 3= {C,D,F}
Pada langkah ini dihitung pula rasio antara besaran BCV (Between Cluster Variation) dengan
WCV (Within Cluster Variation) :
BCV=d(m1,m2)+d(m1,m3)+d(m2,m3) = 6,741
Sehingga Besar Rasio = BCV/WCV = 6.741 /4.833 = 1.394
Bila dibandingkan maka rasio sekarang (1.394) sudah tidak lagi lebih besar dari rasio
sebelumnya (1.394) oleh karena itu algoritma akan dihentikan.