Clustering PDF
Clustering PDF
Penerapan Algoritma K
Means
Data Minig
1. Clustering bertujuan
1. Classification bertujuan untuk mengelompokan
untuk memetakan satu titik titik-titik data yang
data ke dalam satu kelas berdekatan dan
yang telah ditentukan mimisahkannya dengan
sebelumnya kelompok-kelompok lain
2. Classification dilakukan yang berjauhan dalam
secara supervised, artinya suatu ruang.
algoritma pemelajaran 2. Clustering dilakukan
untuk melakukan secara unsupervised,
klasifikasi diberikan contoh artinya tidak ada contoh
titik data dan kelas apa bagaimana seharusnya
seharusnya titik data mengelompokan titik-titik
tersebut dipetakan. tersebut.
Fakultas Ilmu Komputer 6
Clustering
Basic Concept Clustering
Langkah 1
Langkah 2
Langkah 3
6 o4 2 2
o5 9 5
5 o1 o2 o5 o6 o6 11 5
o7 11 2
4
o8 9 2
3
2 o4 o3 o8 o7
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
2 o4 +
c
o 3 o8 o7
2
1
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
4
3
3
2 o4 +
c
o 3 o8 o7
2
1
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
2 o4 +
c
o 3 o8 o7
2
1
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
2 o4 +
c
o 3 o8 o7
2
1
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
4 o2 2 3 C1
3 o3 3,6 0 C2
2 o4 +
c
o 3 o8 o7 o4 3 2 C2
2 o5 7 5,8 C2
1
o6 9 7,6 C2
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12 o7 9,8 7 C2
o8 7,6 5 C2
2 o4 +
c
o 3 o8 o7
2
1
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
masing-masing anggota o1 2 5 C1
kluster untuk o2 4 5 C1
menentukan titik o3 4 2 C2
centroid baru o4 2 2 C2
o5 9 5 C2
C1 (x1,x2) = (2+4)/2,(5+5)/2
o6 11 5 C2
= 3,5 o7 11 2 C2
C2 (x1,x2) =(4+2+9+11+11+9)/6, o8 9 2 C2
(2+2+5+5+2+2)/6
=7.6 , 3
x2
6
c1
5 o1 + o2 o5 o6
3 +
c
2
2 o4 o3 o8 o7
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
o2 4 5 1 C1
Contoh Fungsi Objektif O1 : o3 4 2 13,96 C2
D(X1,C1) 2 = (2-3) ²+(5-5) ² =1 o4 2 2 32,36 C2
o7 11 2 22,16 C2
=|114,16-0= 114,16 o8 9 2 7,76 C2
x2
6
c1
5 o1 + o2 o5 o6
3 +
c
2
2 o4 o3 o8 o7
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
Data x1 x2 Centroid
• Hitung rata – rata titik baru
masing-masing anggota o1 2 5 C1
kluster untuk o2 4 5 C1
menentukan titik o3 4 2 C1
centroid baru o4 2 2 C1
o5 9 5 C2
C1 (x1,x2) = 12/4, 14/4
o6 11 5 C2
= 3, 3.5
o7 11 2 C2
C2 (x1,x2) = 40/4, 14/4
o8 9 2 C2
=10, 3.5
x2
6
5 o1 o2 o5 o6
3
+ c1 + c2
2 o4 o3 o8 o7
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
o3 4 2 3,25 C1
=|j baru- J lama | o4 2 2 3,25 C1
=|25,5-114,16 | o5 9 5 3,25 C2
=88,66 o6 11 5 7,25 C2
dilakukan
Fakultas Ilmu Komputer 31
Ulangi langkah 2 dengan centroid baru
K-means
4
o1 1,80 8,13 C1 C1
3
+ c1 + c2 o2 1,80 6,18 C1 C1
2 o4 o3 o8 o7 o3 1,80 6,18 C1 C1
1 o4 1,80 8,13 C1 C1
0 x1 o5 6,18 1,80 C2 C2
0 1 2 3 4 5 6 7 8 9 10 11 12
o6 8,13 1,80 C2 C2
o7 8,13 1,80 C2 C2
Tidak ada perubahan cluster lama dengan
o8 6,18 1,80 C2 C2
cluster baru, pencarian centroid berakhir
5 o1 o2 o5 o6
3
+ c1 + c2
2 o4 o3 o8 o7
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
5 o1 o2 o5 o6
2 o4 o3 o8 o7
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
2 o4 +
c
o 3 o8 o7
2
1
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
2 o4 +
c
o 3 o8 o7
2
1
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
x2
6
c1
5 o1 + o2 o5 o6
3 +
c
2
2 o4 o3 o8 o7
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12
5 o1 o2 o5 o6
3
+ c1 + c2
2 o4 o3 o8 o7
0 x1
0 1 2 3 4 5 6 7 8 9 10 11 12