0% menganggap dokumen ini bermanfaat (0 suara)

146 tayangan7 halaman

Penerapan Metode K-Means Clustering Data

Dokumen tersebut menggambarkan penggunaan metode K-Means Clustering pada data program studi untuk mengelompokkan tingkat persaingan berdasarkan daya tampung dan minat mahasiswa. Metode ini digunakan untuk memecah data menjadi 3 cluster dengan menghitung jarak euclidean antara data dan centroid cluster.

Diunggah oleh

ciwideyadhitya

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

146 tayangan7 halaman

Penerapan Metode K-Means Clustering Data

Diunggah oleh

ciwideyadhitya

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

Anda di halaman 1/ 7

Penerapan Metode K-Means Clustering Datamining pada Tingkat

Persaingan SBMPTN di Program Studi ITS

Tugas : Demo Program Data Mining

Disusun sebagai salah satu syarat untuk memenuhi tugas Projek Akhir mata kuliah Data Mining.

Oleh :
Riza Nidhom Fahmi
NRP 2110157002

PROGRAM STUDI D4 LJ PJJ TEKNIK INFORMATIKA

DEPARTEMEN TEKNIK INFORMATIKA DAN KOMPUTER
POLITEKNIK ELEKTRONIKA NEGERI SURABAYA
2016
Metode K-Means Clustering digunakan dalam data mining untuk mengelompokan data-
data kedalam cluster atau beberapa kelompok berdasarkan suatu kemiripan variabel atau atribut
data. Berikut adalah contoh data yang saya Gunakan:

NO Nama Prodi data tampung 2016 peminat

2015
1 FISIKA 30 361
2 MATEMATIKA 39 493
3 STATISTIKA 36 759
4 KIMIA 36 586
5 BIOLOGI 27 644
6 TEKNIK MESIN 60 1.784
7 TEKNIK ELEKTRO 48 1.199
8 TEKNIK KIMIA 48 956
9 TEKNIK FISIKA 45 898
10 TEKNIK INDUSTRI 60 1.225
11 TEKNIK MATERIAL DAN 39 1.235
METALURGI
12 TEKNIK SIPIL 45 1.653
13 ARSITEKTUR 30 1.135

Berdasarkan data diatas saya ingin mengelompokkan Tingkat Persaingan yang ada di Program
Studi ITS dengan kriteria Daya Tampung program studi dan peminat program studi tersebut.

Algoritma Metode K Means Clustering

Algoritma Flowchart Metode Klastering K Means

Langkah- Langkah perhitungannya adalah:
1. Menentukan Jumlah cluster data.
2. Tentukan titik pusat cluster secara Random.
3. Hitung centroid/rata-rata dari data yang ada di masing-masing cluster
4. kelompokan obyek (Alokasikan masing-masing data ke centroid/rata-rata terdekat)
5. Kembali ke Step 3, apabila masih ada data yang berpindah cluster atau apabila perubahan nilai
centroid, ada yang di atas nilai threshold yang ditentukan atau apabila perubahan nilai pada
objective function yang digunakan di atas nilai threshold yang ditentukan

Distance space digunakan untuk menghitung jarak antara data dan centroid. Adapun
persamaan yang dapat digunakan salah satunya yaitu Euclidean Distance Space. Euclidean
distance space sering digunakan dalam perhitungan jarak, hal ini dikarenakan hasil yang diperoleh
merupakan jarak terpendek antara dua titik yang diperhitungkan. Adapun persamaannya adalah
sebagai berikut :

dimana :
dij = Jarak objek antara objek i dan j
P = Dimensi data
Xik = Koordinat dari obyek i pada dimensi k
Xjk = Koordinat dari obyek j pada dimensi k
Dalam tahap ini akan dijelaskan langkah-langkah pengoperasian algoritma K-Means secara
manual:
Langkah 1. Menentukan Jumlah Claster.

Diketahui:
Jumlah Cluster = 3,
jumlah data = 13,
jumlah atribut = 2

NO Nama Prodi data tampung 2016 peminat 2015

1 FISIKA 30 361
2 MATEMATIKA 39 493
3 STATISTIKA 36 759
4 KIMIA 36 586
5 BIOLOGI 27 644
6 TEKNIK MESIN 60 1.784
7 TEKNIK ELEKTRO 48 1.199
8 TEKNIK KIMIA 48 956
9 TEKNIK FISIKA 45 898
10 TEKNIK INDUSTRI 60 1.225
11 TEKNIK MATERIAL DAN 39 1.235
METALURGI
12 TEKNIK SIPIL 45 1.653
13 ARSITEKTUR 30 1.135

Langkah 2. Tentukan Titik Pusat Cluster Secara Random.

Di ambil data random sebagai pusat cluster ke-1 30 586

Di ambil data random sebagai pusat cluster ke-2 27 1199
Di ambil data random sebagai pusat cluster ke-3 45 759
Langkah 3. Perhitungan Jarak Pusat Cluster
Untuk mengukur jarak antara dengan pusat Cluster digunakan Euclidian Distance, kemudian
akan didapatkan matriks jarak yaitu C1, C2 dan C3 sebagai berikut:

Berikut perhitungannya dengan menggunakan persamaan Euclidean Distance Space :

- Jarak antara data daya tampung dan peminat pertama dengan pusat cluster pertama.
C1= SQRT((30-30)^2+(361-586)^2)=225
- Jarak antara data daya tampung dan peminat pertama dengan pusat cluster ke-dua.
C2= SQRT((30-27)^2+(361-1199)^2)= 838.0054
- Jarak antara data daya tampung dan peminat pertama dengan pusat cluster ke-tiga.
C3= SQRT((30-45)^2+(361-759)^2)= 398.2826
Adapun hasil dari perhitungan dari keseluruhan data terhadap tiap pusat cluster awal disajikan
pada tabel berikut

NO Nama Prodi data peminat C1 C2 C3 Jarak

tampung 2015 Terpendek
2016
1 FISIKA 30 361 225 838.0054 398.2826 225
2 MATEMATIKA 39 493 93.43447 706.0255 266.0677 93.43447
3 STATISTIKA 36 759 173.104 441.0215 9 9
4 KIMIA 36 586 6 613.3974 173.2339 6
5 BIOLOGI 27 644 58.07753 555.6564 116.4002 58.07753
6 TEKNIK MESIN 60 1.784 1198.376 588.0689 1025.11 588.0689
7 TEKNIK ELEKTRO 48 1.199 613.2642 48 440.0102 48
8 TEKNIK KIMIA 48 956 370.4376 247.6954 197.0228 197.0228
9 TEKNIK FISIKA 45 898 312.3604 304.3452 139 139
10 TEKNIK INDUSTRI 60 1.225 639.7038 65.39113 466.2414 65.39113
11 TEKNIK 39 1.235
MATERIAL DAN
METALURGI 649.0624 53.07542 476.0378 53.07542
12 TEKNIK SIPIL 45 1.653 1067.105 456.2247 894 456.2247
13 ARSITEKTUR 30 1.135 549 70.68239 376.2991 70.68239
Langkah 4. Pengelompokan Data
Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak terdekat antara data dengan
pusat cluster, jarak ini menunjukkan bahwa data tersebut berada dalam satu kelompok dengan
pusat cluster terdekat.
Berikut ini akan ditampilkan data matriks pengelompokkan group, nilai 1 berarti data tersebut
berada dalam group(kelompok data).

NO C1 C2 C3
1 1 0 0
2 1 0 0 Kelompok data 1
3 0 0 1
4 1 0 0
5 1 0 0
6 0 1 0
7 0 1 0
8 0 0 1
9 0 0 1
10 0 1 0
11 0 1 0
12 0 1 0
13 0 1 0

Langkah 5. Penentuan pusat cluster baru

Setelah diketahui anggota tiap-tiap cluster kemudian pusat cluster baru dihitung
berdasarkan data anggota tiap-tiap cluster sesuai dengan rumus pusat anggota cluster. Sehingga
didapatkan perhitungan sebagai berikut :
1 2
C1 33 521
C2 47 1371.833
C3 43 871
Ulangi langkah ke 3 (kedua) hingga posisi data tidak mengalami perubahan.
No Nama Prodi data peminat c1 c2 c3
tampung 2015
2016
1 FISIKA 30 361 160.0281 1010.976 510.1657
2 MATEMATIKA 39 493 28.63564 878.8694 378.0212
3 STATISTIKA 36 759 238.0189 612.9317 112.2185
4 KIMIA 36 586 65.06919 785.91 285.086
5 BIOLOGI 27 644 123.1463 728.1077 227.5632
6 TEKNIK MESIN 60 1784 1263.289 412.372 913.1583
7 TEKNIK ELEKTRO 48 1199 678.1659 172.8359 328.0381
8 TEKNIK KIMIA 48 956 435.2585 415.8342 85.14693
9 TEKNIK FISIKA 45 898 377.1909 473.8372 27.07397
10 TEKNIK INDUSTRI 60 1225 704.5176 147.4074 354.408
11 TEKNIK MATERIAL 39 1235 714.0252 137.0667 364.022
DAN METALURGI
12 TEKNIK SIPIL 45 1653 1132.064 281.1741 782.0026
13 ARSITEKTUR 30 1135 614.0073 237.4424 264.3199

Langkah selanjutnya sama dengan langkah pada nomor 4 jarak hasil perhitungan akan
dilakukan perbandingan dan dipilih jarak terdekat antara data dengan pusat cluster, jarak ini
menunjukkan bahwa data tersebut berada dalam satu kelompok dengan pusat cluster terdekat.

NO C1 C2 C3
1 1 0 0
2 1 0 0
3 0 0 1
4 1 0 0
5 1 0 0
6 0 1 0 Kelompok data 2
7 0 1 0
8 0 0 1
9 0 0 1
10 0 1 0
11 0 1 0
12 0 1 0
13 0 1 0

Keterangan: Karena kelompok data 1 dan Kelompok data 2 sudah tidak ada perbedaan maka Proses
Perulangannya di Hentikan karena proses pengclasifikasian sudah selesai.

Anda mungkin juga menyukai

Makalah Fungsi Keuangan
Belum ada peringkat
Makalah Fungsi Keuangan
21 halaman
Contoh Kasus Clustering K Means
Belum ada peringkat
Contoh Kasus Clustering K Means
13 halaman
Penyusutan Aset Berwujud Dan Amortisasi Aset Tidak Berwujud
Belum ada peringkat
Penyusutan Aset Berwujud Dan Amortisasi Aset Tidak Berwujud
12 halaman
Rangkuman Chapter 3 - SISTEM INFORMASI, ORGANISASI, DAN STRATEGI
Belum ada peringkat
Rangkuman Chapter 3 - SISTEM INFORMASI, ORGANISASI, DAN STRATEGI
5 halaman
Makalah Aspek Keprilakuan
Belum ada peringkat
Makalah Aspek Keprilakuan
16 halaman
Theory of Constraint
Belum ada peringkat
Theory of Constraint
22 halaman
Sistem Informasi Manajemen - HTML
50% (2)
Sistem Informasi Manajemen - HTML
47 halaman
Akuntansi Inflasi
Belum ada peringkat
Akuntansi Inflasi
18 halaman
TUJUAN
Belum ada peringkat
TUJUAN
3 halaman
K Means Clustering
Belum ada peringkat
K Means Clustering
12 halaman
Makalah Computing Resources and Communication
0% (1)
Makalah Computing Resources and Communication
23 halaman
KELOMPOK 2 Managemen Persediaan
Belum ada peringkat
KELOMPOK 2 Managemen Persediaan
15 halaman
Non Positive (Non-Mainstream) Tampil
Belum ada peringkat
Non Positive (Non-Mainstream) Tampil
12 halaman
Laporan Ppic A6 Lengkap
100% (1)
Laporan Ppic A6 Lengkap
76 halaman
Penghindaran Pajak Berganda (P3B) - Kelompok 9-AK-B
Belum ada peringkat
Penghindaran Pajak Berganda (P3B) - Kelompok 9-AK-B
58 halaman
Siklus Bisnis Indonesia
100% (1)
Siklus Bisnis Indonesia
9 halaman
Akuntansi Pertanggungjawaban
Belum ada peringkat
Akuntansi Pertanggungjawaban
17 halaman
Tarif & Cara Perhitungan PPN & PPNBM
Belum ada peringkat
Tarif & Cara Perhitungan PPN & PPNBM
23 halaman
Manajemen Operasi 1
Belum ada peringkat
Manajemen Operasi 1
13 halaman
1536-Article Text-4427-1-10-20230216
Belum ada peringkat
1536-Article Text-4427-1-10-20230216
10 halaman
Makalah MO Forcesting (Peramalan) Kel.7
Belum ada peringkat
Makalah MO Forcesting (Peramalan) Kel.7
8 halaman
Big Data
Belum ada peringkat
Big Data
6 halaman
4 TSP PPT 1
Belum ada peringkat
4 TSP PPT 1
58 halaman
Modul Materi Pert 2 Audit Sistem Informasi
Belum ada peringkat
Modul Materi Pert 2 Audit Sistem Informasi
15 halaman
Makalah Kel.5 - Teori Portofolio
Belum ada peringkat
Makalah Kel.5 - Teori Portofolio
24 halaman
Tugas Topik 6 KLP 11
Belum ada peringkat
Tugas Topik 6 KLP 11
10 halaman
Karakteristik Koperasi
Belum ada peringkat
Karakteristik Koperasi
11 halaman
Cara Membaca Output Regresi Pada SPSS
100% (1)
Cara Membaca Output Regresi Pada SPSS
6 halaman
Perencanaan Kebutuhan Bahan Baku Dalam Kelancaran Proses Produksi Pada Benz United
Belum ada peringkat
Perencanaan Kebutuhan Bahan Baku Dalam Kelancaran Proses Produksi Pada Benz United
101 halaman
Kelompok 1 Kajian Pustaka Metpen 5A Akuntansi
Belum ada peringkat
Kelompok 1 Kajian Pustaka Metpen 5A Akuntansi
20 halaman
Topik 7 Akuntansi Dan Pengendalian Biaya Bahan
Belum ada peringkat
Topik 7 Akuntansi Dan Pengendalian Biaya Bahan
61 halaman
Kuliah 2 - Peramalan
Belum ada peringkat
Kuliah 2 - Peramalan
10 halaman
Production Planning Inventory Control
Belum ada peringkat
Production Planning Inventory Control
13 halaman
Berikut Adalah Beberapa Contoh Judul Skripsi
Belum ada peringkat
Berikut Adalah Beberapa Contoh Judul Skripsi
17 halaman
Makalah - Estimasi - Biaya Manajem Proyek
Belum ada peringkat
Makalah - Estimasi - Biaya Manajem Proyek
15 halaman
Strategies For Information Management, Towards Knowledge Management
100% (1)
Strategies For Information Management, Towards Knowledge Management
62 halaman
Bahan Ajar Basis Data
Belum ada peringkat
Bahan Ajar Basis Data
5 halaman
Struktur Dan Desain Organisasi - Kelompok 1
Belum ada peringkat
Struktur Dan Desain Organisasi - Kelompok 1
14 halaman
Production Planning and Control PPC
0% (1)
Production Planning and Control PPC
3 halaman
Tugas Akhir Praktikum Sewa Mobil
Belum ada peringkat
Tugas Akhir Praktikum Sewa Mobil
11 halaman
Materi Teori Fortofolio Dan Analisis Investasi Unsera PDF
Belum ada peringkat
Materi Teori Fortofolio Dan Analisis Investasi Unsera PDF
6 halaman
Makalah Toc
Belum ada peringkat
Makalah Toc
15 halaman
Pemeliharaan Fasilitas Dan Penanganan Bahan
Belum ada peringkat
Pemeliharaan Fasilitas Dan Penanganan Bahan
22 halaman
Kelompok 2 Kegagalan Keberhasilan ERP
Belum ada peringkat
Kelompok 2 Kegagalan Keberhasilan ERP
11 halaman
Pengendalian Keamanan Informasi
Belum ada peringkat
Pengendalian Keamanan Informasi
16 halaman
Simulasi Sistem Proses Produksi Paddock Menggunakan Software Promodel
Belum ada peringkat
Simulasi Sistem Proses Produksi Paddock Menggunakan Software Promodel
6 halaman
Makalah Peramalan Industri
Belum ada peringkat
Makalah Peramalan Industri
28 halaman
Inventory Management
Belum ada peringkat
Inventory Management
40 halaman
Penyusutan Aktiva Tetap - Kelompok 5 - Manajemen
Belum ada peringkat
Penyusutan Aktiva Tetap - Kelompok 5 - Manajemen
14 halaman
Bab 7 - SCM
Belum ada peringkat
Bab 7 - SCM
29 halaman
Laporan Praktikum MPP
Belum ada peringkat
Laporan Praktikum MPP
13 halaman
3b. Solusi Optimal - Metode Grafik - LATIHAN
Belum ada peringkat
3b. Solusi Optimal - Metode Grafik - LATIHAN
33 halaman
Sistem Informasi Manajemen
Belum ada peringkat
Sistem Informasi Manajemen
18 halaman
Manajemen Pemeliharaan
Belum ada peringkat
Manajemen Pemeliharaan
9 halaman
Blockchain
Belum ada peringkat
Blockchain
23 halaman
Manajemen Personalia
Belum ada peringkat
Manajemen Personalia
24 halaman
Akutansi Menejemen Dalam Pengambilan Keputusan
Belum ada peringkat
Akutansi Menejemen Dalam Pengambilan Keputusan
48 halaman
Pertemuan 4 - Clustring
Belum ada peringkat
Pertemuan 4 - Clustring
18 halaman
Data Mining (K-Means Dan K-Modes)
Belum ada peringkat
Data Mining (K-Means Dan K-Modes)
8 halaman
Algoritma K Means
Belum ada peringkat
Algoritma K Means
16 halaman
Bab 2 Demografi & Kependudukan
Belum ada peringkat
Bab 2 Demografi & Kependudukan
8 halaman
Kuesioner Tesis
Belum ada peringkat
Kuesioner Tesis
9 halaman
BAB V Penutup
Belum ada peringkat
BAB V Penutup
1 halaman
Bongo Dan Rilley
Belum ada peringkat
Bongo Dan Rilley
3 halaman
Pertemuan 1 - ILUSTRASI - Pengantar Ilustrasi
Belum ada peringkat
Pertemuan 1 - ILUSTRASI - Pengantar Ilustrasi
26 halaman
Bab 2 Kajian Pustaka Tesis
Belum ada peringkat
Bab 2 Kajian Pustaka Tesis
43 halaman
BAB 2 Metodologi Pelaksanaan
Belum ada peringkat
BAB 2 Metodologi Pelaksanaan
5 halaman
Bab 4 Hasil Dan Pembahasan Tesis
Belum ada peringkat
Bab 4 Hasil Dan Pembahasan Tesis
99 halaman
BAB 3 Gambaran Umum Ciamis
Belum ada peringkat
BAB 3 Gambaran Umum Ciamis
9 halaman
Program Book Seminar SoBAT Ke-2
Belum ada peringkat
Program Book Seminar SoBAT Ke-2
69 halaman
1ReskiRafidah - UNHAS - Analisis Peningkatan Genangan Akibat Pembangunan PLTA Salu Uro Luwu Utara SulSel
Belum ada peringkat
1ReskiRafidah - UNHAS - Analisis Peningkatan Genangan Akibat Pembangunan PLTA Salu Uro Luwu Utara SulSel
8 halaman
Tesis Rachman Firdaus A14
Belum ada peringkat
Tesis Rachman Firdaus A14
116 halaman
Bab 3 Objek & Metode Penelitian Tesis
Belum ada peringkat
Bab 3 Objek & Metode Penelitian Tesis
35 halaman
Bab 4 Hasil Dan Pembahasan Tesis
Belum ada peringkat
Bab 4 Hasil Dan Pembahasan Tesis
113 halaman
21749-5195-1-PB Air Tanah
Belum ada peringkat
21749-5195-1-PB Air Tanah
8 halaman
Optimasi UAS
Belum ada peringkat
Optimasi UAS
17 halaman
Bab 1 Pendahuluan UP PDF
Belum ada peringkat
Bab 1 Pendahuluan UP PDF
10 halaman
Jurnal Tesis Adhitya Ang. 14 NIM 2212181002
Belum ada peringkat
Jurnal Tesis Adhitya Ang. 14 NIM 2212181002
15 halaman