RG - Unsupervised Learning
RG - Unsupervised Learning
https://www.linkedin.com/in/muhammad-fahmi17/
Reminder :
● Wajib on Camera
● Tepat waktu
● Raise Hand kalau mau bertanya atau langsung on mic
● Break / istirahat setiap 1 jam (menyesuaikan)
● On Focus
Outline :
● Unsupervised Learning
● Clustering
● K-Means Clustering
● Elbow Method
● Silhouette Score
● Hands - on
● QnA & Penutup
Unsupervised Learning
Install Python
Jenis-Jenis Unsupervised Learning
1. Clustering
Clustering adalah teknik untuk mengelompokkan data berdasarkan kesamaan karakteristik.
Misalnya, jika kita memiliki berbagai jenis buah yang bercampur, algoritma clustering akan
mengelompokkan buah-buah yang serupa berdasarkan ukuran, warna, atau bentuknya.
2. Anomaly Detection
Anomaly detection digunakan untuk mendeteksi data yang tidak biasa atau mencurigakan.
Contohnya, perusahaan kartu kredit menggunakan metode ini untuk mengidentifikasi
transaksi yang mencurigakan dan berpotensi sebagai penipuan.
3. Dimensionality Reduction
Dimensionality reduction bertujuan untuk mengurangi jumlah fitur dalam data tanpa
kehilangan informasi penting. Misalnya, seperti mengkompres file agar ukurannya lebih kecil
tetapi tetap mempertahankan informasi utama. Dalam machine learning, ini membantu
mempercepat proses pelatihan model.
Apa itu Unsupervised Learning?
Di unsupervised learning, hanya input data yang disediakan dalam dataset.
Tidak ada keluaran berlabel untuk dituju. Tetapi mengetahui bahwa masih
mungkin untuk menemukan banyak pola menarik dan kompleks yang
tersembunyi di dalam data tanpa label apa pun. Tujuannya adalah untuk
menangkap struktur / informasi yang menarik.
Unsupervised Learning Algorithms
Clustering
Install Python
Apa itu Clustering?
Clustering adalah tugas membagi data points ke dalam beberapa kelompok sedemikian
rupa sehingga data points dalam kelompok yang sama lebih mirip dengan data points lain
di kelompok yang sama daripada yang ada di kelompok lain. Tujuannya adalah untuk
memisahkan kelompok-kelompok dengan sifat-sifat yang sama dan menetapkannya ke
dalam kelompok-kelompok.
Kenapa menggunakan Clustering?
Clustering sangat bagus untuk menganalisa
Nilai K = 3
Ilustrasi K-Means
Setiap pusat kemudian diperbarui...
...menggunakan rata-rata dari semua titik yang
ditetapkan ke cluster itu.
Ilustrasi K-Means
Titik data diwarnai (lagi) sesuai dengan pusat
terdekat.
Ilustrasi K-Means
hitung ulang semua pusat cluster
Ilustrasi K-Means
Setelah mengulangi langkah-langkah ini untuk beberapa
iterasi lagi... Pusat-pusat berkumpul menjadi solusi yang
stabil! Pusat-pusat ini menentukan kelompok akhir.
Elbow
Install Method
Python
How to choose the best K?
● Tidak ada cara "mudah" untuk memilih 'K' terbaik
● Kita bisa menggunakan elbow method untuk
menghitungnya
Elbow Method
Metode Elbow (Elbow Method)
adalah suatu pendekatan grafis
yang digunakan dalam analisis
clustering untuk menentukan
jumlah cluster yang optimal dalam
suatu dataset. Tujuan dari metode
ini adalah untuk menemukan titik di
mana penambahan jumlah klaster
tidak memberikan peningkatan
signifikan dalam penjelasan varians
data.
Install Python
https://drive.google.com/file/d/173B2aaRtv9ekO-4suLD8h2zS7Lrkct_8/view?us
p=drive_link
Feedback
Install Python
http://bit.ly/FeedbackBootcampAI-Batch6
See u Next Python
Install Session