Tugas 3 Learning
Tugas 3 Learning
Pendahuluan
Learning atau pembelajaran adalah proses di mana individu atau sistem memperoleh
pengetahuan, keterampilan, atau pemahaman baru melalui pengalaman, pengamatan, atau
pengajaran. Proses ini tidak hanya mencakup pengumpulan informasi, tetapi juga
bagaimana cara individu atau sistem tersebut mengorganisir dan menerapkan informasi
yang telah dipelajari untuk menyelesaikan masalah atau membuat keputusan. Dalam
konteks manusia, pembelajaran terjadi melalui interaksi dengan lingkungan atau melalui
pengalaman langsung, sementara dalam teknologi, seperti dalam kecerdasan buatan,
learning memungkinkan mesin untuk mempelajari pola dari data dan meningkatkan
kinerjanya tanpa intervensi pemrograman eksplisit.
B. Kasus:
Pengenalan angka adalah aplikasi sederhana dari supervised learning. Dalam kasus ini,
kita akan menggunakan dataset Digits yang berisi gambar angka tulisan tangan dari 0
hingga 9. Tujuannya adalah untuk melatih model machine learning agar dapat mengenali
angka yang ditulis tangan berdasarkan gambar yang disediakan.
C. Penyelesaian
1. Pengumpulan Data
Pada langkah pertama, kita akan menggunakan dataset yang telah disediakan
oleh scikit-learn, yaitu dataset Digits. Dataset ini berisi 1.797 gambar tulisan tangan
angka dari 0 hingga 9, di mana setiap gambar adalah gambar berukuran 8x8 piksel,
dan setiap piksel adalah fitur yang menggambarkan intensitas warna.
Langkah-langkah:
2. Preprocessing Data
Sebelum memulai pelatihan, kita perlu membagi dataset menjadi dua bagian: data
latih untuk melatih model dan data uji untuk menguji kinerja model setelah dilatih.
Pembagian data ini membantu kita mengevaluasi seberapa baik model dapat
menggeneralisasi ke data yang belum pernah dilihat sebelumnya.
Langkah-langkah:
1) Bagi dataset menjadi data latih dan data uji menggunakan train_test_split.
Dengan pembagian ini, 75% data digunakan untuk pelatihan dan 25% sisanya
untuk pengujian.
3. Pelatihan Model
Sekarang, kita akan melatih model untuk mengenali angka dari gambar. Untuk kasus
ini, kita akan menggunakan algoritma k-Nearest Neighbors (k-NN), yang cukup
sederhana dan intuitif. Dalam k-NN, prediksi dilakukan berdasarkan kedekatan data
yang diuji dengan data latih.
Langkah-langkah:
1) Import model k-Nearest Neighbors.
2) Latih model menggunakan data latih.
n_neighbors=3 berarti model akan mencari tiga tetangga terdekat dalam data
latih untuk menentukan label pada data uji.
4. Memprediksi dengan Model
Setelah model dilatih, kita akan menguji seberapa baik model ini mengenali angka-
angka dari gambar pada data uji. Prediksi dilakukan pada data uji yang belum pernah
dilihat sebelumnya oleh model.
Langkah-langkah:
1) Prediksi angka pada data uji menggunakan model yang telah dilatih.
5. Evaluasi Model
Untuk mengevaluasi seberapa baik model kita, kita bisa menggunakan beberapa
metrik, seperti akurasi, precision, recall, F1-score, dan matriks kebingungannya.
Langkah-langkah:
1) Import metrik evaluasi yang diperlukan.
2) Tampilkan hasil evaluasi model.
6. Visualisasi Hasil
Untuk lebih memahami kinerja model, kita bisa menampilkan beberapa gambar angka
dari data uji yang diprediksi oleh model. Ini membantu kita melihat apakah model
mengidentifikasi gambar dengan benar atau tidak.
Langkah-langkah:
1) Tampilkan gambar-gambar yang diprediksi oleh model beserta label yang
benar dan prediksi yang dihasilkan.
2) Hasilnya