0% menganggap dokumen ini bermanfaat (0 suara)

320 tayangan28 halaman

K Means Clustering

Diunggah oleh

Irene Situmorang

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PPT, PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

320 tayangan28 halaman

K Means Clustering

Diunggah oleh

Irene Situmorang

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PPT, PDF, TXT atau baca online di Scribd

Anda di halaman 1/ 28

K-Means Clustering

What is Clustering?
Also called unsupervised learning, sometimes called classification by statisticians and sorting by psychologists and segmentation by people in marketing

Mengelompokkan data-data menjadi beberapa cluster berdasarkan kesamaannya

What is a natural grouping among these objects?

Clustering is subjective

Simpson's Family

School Employees

Females

Males

Two Types of Clustering

Partitional algorithms: Membuat beberapa partisi dan mengelompokkan objek berdasarkan kriteria tertentu Hierarchical algorithms: Membuat dekomposisi pengelompokan objek berdasarkan kriteria tertentu. Misal= tua-muda, tua-muda(merokok-tidak merokok)

Hierarchical

Partitional

What is Similarity?
The quality or state of being similar; likeness; resemblance; as, a similarity of features.
Webster's Dictionary

Similarity is hard to define, but We know it when we see it.

Distance : Adalah ukuran kesamaan antar objek yang dihitung berdasarkan rumusan tertentu
0 8 0 8 2 0 7 4 3 0 7 4 3 1 0

D( , ) = 8 D( , ) = 1

Partitional Clustering
Nonhierarchical, setiap objek ditempatkan di salah satu cluster Nonoverlapping cluster Jumlah kluster yang akan dibentuk ditentukan sejak awal

Algorithm k-means
1. Tentukan berapa cluster k yang mau dibuat. 2. Inisialisasi centroid dari tiap cluster (randomly, if necessary). 3. Tentukan keanggotaan objek-objek yang lain dengan mengklasifikasikannya sesuai centroid terdekat (berdasarkan distance ke centroid) 4. Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai centroid baru 5. Jika centroid baru tidak sama dengan centroid lama, maka perlu diupdate lagi keanggotaan objek-objeknya(balik ke -3). Sebaliknya jika centroid baru sama dengan yang lama maka selesai.

K-means Clustering: Step 1-2

Tentukan berapa cluster k yang mau dibuat. Inisialisasi centroid dari tiap cluster (randomly, if necessary)
5

k1
3

k3
0 0 1 2 3 4 5

K-means Clustering: Step 3

Tentukan keanggotaan objek-objek yang lain dengan mengklasifikasikannya sesuai centroid terdekat
5

k1
3

k3
0 0 1 2 3 4 5

K-means Clustering: Step 4

Setelah cluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai centroid baru
5

k3
1

0 0 1 2 3 4 5

Jika centroid baru tidak sama dengan centroid lama, maka perlu diupdate lagi keanggotaan objek-objeknya
5

K-means Clustering: Step 5

k3
1

0 0 1 2 3 4 5

K-means Clustering: Finish

Lakukan iterasi step 3-5 sampai tak ada lagi perubahan centroid dan tak ada lagi objek yang berpindah kelas

Comments on the K-Means Method

Strength
Relatively efficient: O(tkn), where n is # objects, k is # clusters, and t is # iterations. Normally, k, t << n. Often terminates at a local optimum. The global optimum may be found using techniques such as: deterministic annealing and genetic algorithms

Weakness
Applicable only when mean is defined, then what about categorical data? Need to specify k, the number of clusters, in advance Unable to handle noisy data and outliers

Algoritma pengukuran distance

SqEuclidean Cityblock Cosine Correlation Hamming

MATLAB
[IDX,C] = kmeans(X,k) returns the k cluster centroid locations in the k-by-p matrix C

[...] = kmeans(...,'param1',val1,'param2',val2,...) enables

you to specify optional parameter name-value pairs to control the iterative algorithm used by kmeans. The parameters are :
distance start replicates maxiter emptyaction display

'distance
Distance measure, in p-dimensional space, that kmeans minimizes with respect to. kmeans computes centroid clusters differently for the different supported distance measures:

'start'
Method used to choose the initial cluster centroid positions, sometimes known as "seeds". Valid starting values are:

'replicates'
Number of times to repeat the clustering, each with a new set of initial cluster centroid positions. kmeans returns the solution with the lowest value for sumd. You can supply 'replicates' implicitly by supplying a 3-dimensional array as the value for the 'start' parameter.

'maxiter'
Maximum number of iterations. Default is 100.

'emptyaction'
Action to take if a cluster loses all its member observations. Can be one of:

'display'
Controls display of output. 'off : Display no output. 'iter : Display information about each iteration during minimization, including the iteration number, the optimization phase, the number of points moved, and the total sum of distances. 'final : Display a summary of each replication. 'notify : Display only warning and error messages. (default)

Example
dataku =[ 7 26 6 60; 11 56 8 20; ... 11 31 8 47; ... 7 52 6 33; ... 11 55 9 22; ... 3 71 17 6; ... 1 31 22 44; ... 2 54 18 22; ... 21 47 4 26; ... 1 40 23 34; ... 11 66 9 12; ... 10 68 8 12] 1 29 15 52; ...

Using kmeans to build 3 cluster

hasilk = kmeans(dataku,3)

Result
hasilk = 1 1 2 1 2 2 2 3 2 2 3 2 2

Meaning of the result

Data at row number 1, 2, and 4 are member of first cluster (cluster number 1). Data at row number 3,5,6,7,9,10,12 and 13 are member of second cluster (cluster number 2). Data at row number 8 and 11 are member of third cluster (cluster number 3).

Anda mungkin juga menyukai

Clustering
Belum ada peringkat
Clustering
34 halaman
NEW - Modul 7 Clustering & K-Means
Belum ada peringkat
NEW - Modul 7 Clustering & K-Means
12 halaman
Materi Pekan 15 - Clustering
Belum ada peringkat
Materi Pekan 15 - Clustering
30 halaman
DSF - Clustering Dan Evaluasi
Belum ada peringkat
DSF - Clustering Dan Evaluasi
96 halaman
K-Means
Belum ada peringkat
K-Means
33 halaman
Algoritma K-Means Final (FIX)
Belum ada peringkat
Algoritma K-Means Final (FIX)
19 halaman
Pengenalan K Means Contoh
Belum ada peringkat
Pengenalan K Means Contoh
8 halaman
Clustering PDF
100% (1)
Clustering PDF
40 halaman
K-Means Clustering
Belum ada peringkat
K-Means Clustering
25 halaman
Contoh Kasus Clustering K Means
Belum ada peringkat
Contoh Kasus Clustering K Means
13 halaman
DM 03 3 K Means
Belum ada peringkat
DM 03 3 K Means
32 halaman
Makalah Algoritma K Means
Belum ada peringkat
Makalah Algoritma K Means
18 halaman
10-Clustering Dokumen (K-Means) A SA1250 5.0 V2.08
Belum ada peringkat
10-Clustering Dokumen (K-Means) A SA1250 5.0 V2.08
23 halaman
Clustering - Share
Belum ada peringkat
Clustering - Share
23 halaman
Pertemuan 3: Unsupervised Learning Clustering
Belum ada peringkat
Pertemuan 3: Unsupervised Learning Clustering
22 halaman
Clustering IgedeAris
Belum ada peringkat
Clustering IgedeAris
33 halaman
11 Klasterisasi 1
Belum ada peringkat
11 Klasterisasi 1
29 halaman
Algoritma K Means
Belum ada peringkat
Algoritma K Means
24 halaman
Pertemuan 12-Algoritma K-Means
Belum ada peringkat
Pertemuan 12-Algoritma K-Means
16 halaman
Machine Learning K-Means
Belum ada peringkat
Machine Learning K-Means
21 halaman
K Mean Clustering
Belum ada peringkat
K Mean Clustering
6 halaman
Materi 10 - K-Means Clustering 2022
Belum ada peringkat
Materi 10 - K-Means Clustering 2022
33 halaman
Materi Clustering
Belum ada peringkat
Materi Clustering
23 halaman
8 Unsupervised Learning Kmeans
Belum ada peringkat
8 Unsupervised Learning Kmeans
21 halaman
06 K-Means Clustering
Belum ada peringkat
06 K-Means Clustering
27 halaman
Temu 10 - K Means Clustering
Belum ada peringkat
Temu 10 - K Means Clustering
11 halaman
Modul 11 - Klasterisasi
Belum ada peringkat
Modul 11 - Klasterisasi
26 halaman
Pert5 Overview Clustering
Belum ada peringkat
Pert5 Overview Clustering
30 halaman
Tugas Data Mining Vii 0908605028
100% (1)
Tugas Data Mining Vii 0908605028
26 halaman
K-Means Data Mining Kelompok 7
Belum ada peringkat
K-Means Data Mining Kelompok 7
22 halaman
MODUL 5 Penggalian Data
Belum ada peringkat
MODUL 5 Penggalian Data
11 halaman
I Made Gde Putra Dipanala - Tugas Clustering Python
Belum ada peringkat
I Made Gde Putra Dipanala - Tugas Clustering Python
7 halaman
Algoritma K Means
Belum ada peringkat
Algoritma K Means
16 halaman
K-Means Algo
Belum ada peringkat
K-Means Algo
19 halaman
K-Means Clustering Pengertian, Cara Kerja, Kelebihan Dan Kekurangannya
Belum ada peringkat
K-Means Clustering Pengertian, Cara Kerja, Kelebihan Dan Kekurangannya
16 halaman
Kelompok 7
Belum ada peringkat
Kelompok 7
11 halaman
Algoritma K-Means
Belum ada peringkat
Algoritma K-Means
16 halaman
Pertemuan 7 - Clustering
Belum ada peringkat
Pertemuan 7 - Clustering
34 halaman
Data Mining Kelompok Kmeans
Belum ada peringkat
Data Mining Kelompok Kmeans
15 halaman
Algoritma K-Means
Belum ada peringkat
Algoritma K-Means
16 halaman
Data Mining
Belum ada peringkat
Data Mining
5 halaman
CLUSTERING
Belum ada peringkat
CLUSTERING
6 halaman
Pertemuan 4: Supervised Learning Klasifikasi Dan Regresi
Belum ada peringkat
Pertemuan 4: Supervised Learning Klasifikasi Dan Regresi
16 halaman
Makalah Klastering - Vony Nur Alizah
Belum ada peringkat
Makalah Klastering - Vony Nur Alizah
9 halaman
Pert Ke 9 Sistem Cerdas
Belum ada peringkat
Pert Ke 9 Sistem Cerdas
16 halaman
Konsep Metode K-Means
Belum ada peringkat
Konsep Metode K-Means
4 halaman
09 Kmeans
Belum ada peringkat
09 Kmeans
18 halaman
EAS Multivariat
Belum ada peringkat
EAS Multivariat
6 halaman
Analisis Cluster Metode K-Means (Rizka F - 1311100126)
Belum ada peringkat
Analisis Cluster Metode K-Means (Rizka F - 1311100126)
19 halaman
Algoritma KMeans
Belum ada peringkat
Algoritma KMeans
11 halaman
Pembalajaran Mesin Algoritma K-Means
Belum ada peringkat
Pembalajaran Mesin Algoritma K-Means
4 halaman
Yudi Agusta
Belum ada peringkat
Yudi Agusta
15 halaman
Modul 9
Belum ada peringkat
Modul 9
7 halaman
HawiNatalino K-Meansalgorith
Belum ada peringkat
HawiNatalino K-Meansalgorith
8 halaman
K Means
Belum ada peringkat
K Means
9 halaman
K-Means Clustering (Case 2 Cluster)
Belum ada peringkat
K-Means Clustering (Case 2 Cluster)
6 halaman
K Means Algorithm
Belum ada peringkat
K Means Algorithm
5 halaman
Information Retrieval Metode Clustering Kmeans
Belum ada peringkat
Information Retrieval Metode Clustering Kmeans
6 halaman
Machine Learning With Python For Beginner
Belum ada peringkat
Machine Learning With Python For Beginner
6 halaman
Metode K-Means
Belum ada peringkat
Metode K-Means
5 halaman