0% menganggap dokumen ini bermanfaat (0 suara)
293 tayangan17 halaman

Modul Evaluasi Model

Modul ini membahas evaluasi model machine learning dengan menggunakan metrik seperti MAE, MSE, dan RMSE. Program Digital Talent Scholarship tahun 2023 akan menyertifikasi lulusan SMK dan diploma bidang STEM melalui delapan akademi termasuk Vocational School Graduate Academy untuk menyiapkan talenta digital berbasis kompetensi."

Diunggah oleh

T1T0 3L3K
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
293 tayangan17 halaman

Modul Evaluasi Model

Modul ini membahas evaluasi model machine learning dengan menggunakan metrik seperti MAE, MSE, dan RMSE. Program Digital Talent Scholarship tahun 2023 akan menyertifikasi lulusan SMK dan diploma bidang STEM melalui delapan akademi termasuk Vocational School Graduate Academy untuk menyiapkan talenta digital berbasis kompetensi."

Diunggah oleh

T1T0 3L3K
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 17

1

KATA PENGANTAR

Dunia saat ini berada pada era industri 4.0 yang lebih banyak menggunakan teknologi
digital dan Indonesia telah mempersiapkan diri untuk masuk ke dalam tahap industri
4.0 tersebut melalui agenda percepatan transformasi digital. Salah satu langkah yang
dilakukan dalam percepatan transformasi digital adalah penyiapan talenta digital.
Laporan Bank Dunia tahun 2019 menyatakan bahwa Indonesia memiliki kekurangan 9
juta pekerja berketerampilan teknologi informasi dan komunikasi, sehingga perlu
dilakukan penyiapan talenta digital untuk memenuhi kebutuhan tersebut dengan
alokasi 600.000 orang setiap tahun. Upaya penyiapan talenta digital dilakukan oleh
berbagai unsur baik pemerintah, institusi pendidikan, industri, komunitas masyarakat,
maupun media publik.

Sejak tahun 2018, Kementerian Komunikasi dan Informatika melalui Badan Penelitian
dan Pengembangan Sumber Daya Manusia menginisiasi Program Beasiswa Pelatihan
Digital bernama Digital Talent Scholarship (DTS) yang telah berhasil  dianugerahkan
kepada lebih dari 300.000 penerima pelatihan bidang teknologi informasi dan
komunikasi. Program Digital Talent Scholarship ini ditujukan untuk memberikan
pelatihan dan sertifikasi berbagai tema pada bidang informatika, komunikasi, dan
telekomunikasi, serta diharapkan melengkapi pemenuhan kebutuhan talenta digital
Indonesia. 

Program DTS tahun 2023 secara garis besar dibagi menjadi delapan akademi, salah
satunya Vocational School Graduate Academy (VSGA). VSGA merupakan program
pelatihan berbasis kompetensi kerja nasional bagi lulusan pendidikan vokasi
SMK/sederajat dan diploma bidang Science, Technology, Engineering, Mathematics
(STEM) yang belum mendapatkan pekerjaan atau sedang tidak bekerja.  Tujuan
Program VSGA adalah menyiapkan talenta digital dengan standar kompetensi sesuai
Standar Kompetensi Kerja Nasional Indonesia (SKKNI). Oleh karena itu, penyusunan
modul pelatihan untuk Program VSGA disusun dengan berbasis pada kompetensi
(Competency Based Training). Kami berpesan agar modul pelatihan berbasis
kompetensi yang telah disusun ini dapat menjadi referensi bagi peserta dan pengajar
agar pelatihan berjalan efektif dan efisien. 

Selamat mengikuti Pelatihan Digital Talent Scholarship, mari persiapkan diri kita
menjadi talenta digital Indonesia yang kompeten.

                                                                                             Jakarta,      Januari 2023


Kepala Badan Penelitian dan Pengembangan Sumber Daya Manusia
Kementerian Komunikasi dan Informatika Republik Indonesia

                                                                                           Dr. Hary Budiarto, M.Kom


PENDAHULUAN

Unit kompetensi ini berhubungan dengan pengetahuan, keterampilan, dan sikap kerja
yang dibutuhkan dalam dalam mengumpulkan data untuk data science.

A. Tujuan Umum
Setelah mempelajari modul ini peserta latih diharapkan mampu menjelaskan metode
evaluasi model.

B. Tujuan Khusus
Adapun tujuan mempelajari unit kompetensi melalui buku informasi Pelatihan
Associate Data Scientist ini guna memfasilitasi peserta latih sehingga pada akhir
pelatihan diharapkan memiliki kemampuan melakukan evaluasi model menggunakan
MAE, MSE, RMSE.

LATAR BELAKANG

Unit kompetensi ini dinilai berdasarkan tingkat kemampuan dalam merancang website.
Adapun penilaian dilakukan dengan menggabungkan serangkaian metode untuk
menilai kemampuan dan penerapan pengetahuan pendukung penting. Penilaian
dilakukan dengan mengacu kepada Kriteria Unjuk Kerja (KUK) dan dilaksanakan di
Tempat Uji Kompetensi (TUK), ruang simulasi atau workshop dengan cara:
1.1 Lisan
1.2 Wawancara
1.3 Tes tertulis
1.4 Demonstrasi
1.5 Metode lain yang relevan.

DESKRIPSI PELATIHAN

Materi ini berisi penjelasan mengenai pengolahan data menggunakan metode


clustering dengan menggunakan algoritma K-Means clustering

TUJUAN PEMBELAJARAN

Setelah mempelajari modul ini peserta latih diharapkan mampu menggunakan metode
AI untuk menyelesaikan suatu permasalahan.

KOMPETENSI DASAR

Mampu mengoperasikan aplikasi RapidMiner


Mampu menormalisasi data set untuk disiapkan sebagai input machine learning

1
INDIKATOR HASIL BELAJAR

Dapat melakukan analisis data menggunakan metode AI berbasis Evaluasi Model

INFORMASI PELATIHAN

Akademi Vocational School Graduate Academy

Pelaksana Pelatihan Kementerian Komunikasi dan Informatika

Tema Pelatihan Associate Data Scientist

Sertifikasi Sertifikasi kompetensi BNSP Associate Data Scientist

Persyaratan Sarana Peserta/spesifikasi device Memiliki laptop/komputer dengan spesifikasi


Tools/media ajar yang akan digunakan minimal :
● RAM minimal 2 GB (disarankan 4 GB)
● Laptop dengan 32/64-bit processor
● Laptop dengan Operating System Windows 7,
8, 10, MacOS X atau Linux
● Laptop dengan konektivitas WiFi dan memiliki
Webcam
● Akses Internet Dedicated 126 kbps per
peserta per perangkat
● Memiliki aplikasi Zoom
● Memiliki akun Google Colab

Aplikasi yang akan digunakan selama pelatihan ● RapidMiner

Tim Penyusun 1. Windy Gambetta, Ir., MBA (ITB) 


2. Muhaemin, Kom, MM, M.Kom (Universitas
Muhammadiyah Jakarta) 
3. Rizal Dwi Prayogo, S.Si, M.Si, M.Sc (ITB) 
4. Dr. Mujiono Sadikin (Universitas
Bhayangkara) 
5. Dr. Ir. Yaya Heryadi, M.Sc (Universitas Bina
Nusantara) 
6. Dr. Yaya Sudarya (Universitas Mercu
Buana/IAII)

INFORMASI PEMBELAJARAN

Unit Kompetensi Materi Kegiatan Durasi Rasio Sumber


pembelajaran pembelajaran Pelatihan Praktek : pembelajaran
Teori

Mampu Modul dan Slide Offline 2 JP 60:40


menjelaskan Analisis Evaluasi @ 45 Menit

2
Unit Kompetensi Materi Kegiatan Durasi Rasio Sumber
pembelajaran pembelajaran Pelatihan Praktek : pembelajaran
Teori

metode Evaluasi Model


Model dengan menggunakan
benar Metrik
pengukuran

Materi Pokok

Metode Evaluasi Model menggunakan MAE, MSE, RMSE

Sub Materi Pokok

- Evaluasi Model
- Metrik Pengukuran Evaluasi Model untuk Regresi
- Pengukuran Evaluasi Model untuk Klasifikasi
- Pengukuran Evaluasi Model untuk Klastering

3
Mengevaluasi Hasil Pemodelan

Tujuan dari model MLnya adalah mempelajari pola yang menggeneralisasi dengan baik
untuk data yang tak terlihat, bukan hanya menghafal data yang ditunjukkan selama
pelatihan. Setelah Anda memiliki model, penting untuk memeriksa apakah model Anda
berkinerja baik pada contoh tak terlihat yang belum Anda gunakan untuk melatih
model. Untuk melakukan ini, Anda menggunakan model untuk memprediksi jawaban
pada dataset evaluasi (diadakan data) dan kemudian membandingkan target yang
diprediksi dengan jawaban yang sebenarnya (ground truth). Sejumlah metrik digunakan
dalam ML untuk mengukur keakuratan prediktif model. Pilihan metrik akurasi
tergantung pada tugas ML-nya. Penting untuk meninjau metrik ini untuk memutuskan
apakah model Anda berkinerja baik.

Klasifikasi Biner
Output aktual dari banyak algoritma klasifikasi biner adalah skor prediksi. Skor
menunjukkan kepastian sistem bahwa pengamatan yang diberikan milik kelas positif.
Untuk membuat keputusan tentang apakah pengamatan harus diklasifikasikan sebagai
positif atau negatif, sebagai konsumen dari skor ini, Anda akan menafsirkan skor dengan
memilih ambang klasifikasi (cut-off) dan membandingkan skor terhadapnya. Setiap
pengamatan dengan skor yang lebih tinggi dari ambang batas kemudian diprediksi
sebagai kelas positif dan skor lebih rendah dari ambang yang diprediksi sebagai kelas
negatif.

4
Gambar 1: Distribusi Skor untuk Model Klasifikasi Biner

Prediksi sekarang jatuh ke dalam empat kelompok berdasarkan jawaban yang


sebenarnya diketahui dan jawaban yang diprediksi: prediksi positif yang benar (benar
positif), prediksi negatif yang benar (negative sejati), prediksi positif yang salah (false
positive) dan prediksi negatif yang salah (negatif palsu).
Metrik akurasi klasifikasi biner mengukur dua jenis prediksi yang benar dan dua jenis
kesalahan. Metrik tipikal adalah akurasi (ACC), presisi, recall, false positive rate,
F1-measure. Setiap metrik mengukur aspek yang berbeda dari model prediktif. Akurasi
(ACC) mengukur fraksi prediksi yang benar. Presisi mengukur fraksi positif aktual di
antara contoh-contoh yang diprediksi positif. Ingat mengukur berapa banyak positif
aktual yang diprediksi positif. F1-measure adalah mean harmonik presisi dan recall.

AUC adalah jenis metrik yang berbeda. Ini mengukur kemampuan model untuk
memprediksi skor yang lebih tinggi untuk contoh-contoh positif dibandingkan dengan
contoh-contoh negatif. Karena AUC tidak tergantung pada ambang batas yang dipilih,
Anda bisa merasakan kinerja prediksi model Anda dari metrik AUC tanpa memilih
ambang batas.

5
Tergantung pada masalah bisnis Anda, Anda mungkin lebih tertarik pada model yang
berkinerja baik untuk subset tertentu dari metrik ini. Misalnya, dua aplikasi bisnis
mungkin memiliki persyaratan yang sangat berbeda untuk model ML-nya:
• Satu aplikasi mungkin perlu sangat yakin tentang prediksi positif yang sebenarnya
positif (presisi tinggi) dan mampu mengklasifikasikan beberapa contoh positif sebagai
negatif (recall moderat).
• Aplikasi lain mungkin perlu memprediksi dengan benar sebanyak mungkin contoh
positif (recall tinggi) dan akan menerima beberapa contoh negatif yang salah
diklasifikasikan sebagai positif (presisi moderat).

Di Amazon IL, pengamatan mendapatkan skor yang diprediksi dalam kisaran [0,1].
Ambang batas skor untuk membuat keputusan mengklasifikasikan contoh sebagai 0
atau 1 diatur secara default menjadi 0,5. Amazon IL memungkinkan Anda untuk
meninjau implikasi memilih ambang skor yang berbeda dan memungkinkan Anda untuk
memilih ambang batas yang sesuai dengan kebutuhan bisnis Anda.

Klasifikasi Multiclass
Berbeda dengan proses untuk masalah klasifikasi biner, Anda tidak perlu memilih
ambang skor untuk membuat prediksi. Jawaban yang diprediksi adalah kelas (yaitu,
label) dengan skor prediksi tertinggi. Dalam beberapa kasus, Anda mungkin ingin
menggunakan jawaban yang diprediksi hanya jika diprediksi dengan skor tinggi. Dalam
hal ini, Anda dapat memilih ambang batas pada skor yang diprediksi berdasarkan mana
Anda akan menerima jawaban yang diprediksi atau tidak.

Metrik tipikal yang digunakan dalam multiclass sama dengan metrik yang digunakan
dalam kasus klasifikasi biner. Metrik dihitung untuk setiap kelas dengan
memperlakukannya sebagai masalah klasifikasi biner setelah mengelompokkan semua
kelas lain sebagai milik kelas kedua. Kemudian metrik biner rata-rata atas semua kelas
untuk mendapatkan rata-rata makro (memperlakukan setiap kelas sama) atau rata-rata
tertimbang (tertimbang dengan frekuensi kelas) metrik. Di Amazon ML-rata-rata makro
digunakan untuk mengevaluasi keberhasilan prediktif dari classifier multiclass.

6
Gambar 2: Kebingungan Matrix untuk model klasifikasi multiclass

Hal ini berguna untuk meninjaumatriks kebingunganuntuk masalah multiclass. Matriks


kebingungan adalah tabel yang menunjukkan setiap kelas dalam data evaluasi dan
jumlah atau persentase prediksi yang benar dan prediksi yang salah.

Regresi
Untuk tugas regresi, metrik akurasi khas adalah root mean square error (RMSE) dan
mean absolute percentage error (MAPE). Metrik ini mengukur jarak antara target
numerik yang diprediksi dan jawaban numerik aktual (ground truth). Di Amazon MLE,
metrik RMSE digunakan untuk mengevaluasi akurasi prediktif model regresi.

7
Gambar 3: Distribusi residu untuk model Regresi

Ini adalah praktik umum untuk meninjauresiduuntuk masalah regresi. Sisa untuk
pengamatan dalam data evaluasi adalah perbedaan antara target sebenarnya dan target
yang diprediksi. Residu mewakili bagian dari target bahwa model tidak dapat
memprediksi. Sisa positif menunjukkan bahwa model meremehkan target (target
sebenarnya lebih besar dari target yang diprediksi). Residual negatif menunjukkan
overestimation (target sebenarnya lebih kecil dari target yang diprediksi). Histogram
residu pada data evaluasi ketika didistribusikan dalam bentuk lonceng dan berpusat
pada nol menunjukkan bahwa model membuat kesalahan secara acak dan tidak secara
sistematis atas atau di bawah memprediksi kisaran tertentu nilai target. Jika residu
tidak membentuk bentuk lonceng berpusat nol, ada beberapa struktur dalam kesalahan
prediksi model. Menambahkan lebih banyak variabel ke model mungkin membantu
model menangkap pola yang tidak ditangkap oleh model saat ini.

Meningkatkan Akurasi Model


Mendapatkan model yang sesuai dengan kebutuhan Anda biasanya melibatkan iterasi
melalui proses ML-nya dan mencoba beberapa variasi. Anda mungkin tidak

8
mendapatkan model yang sangat prediktif dalam iterasi pertama, atau Anda mungkin
ingin meningkatkan model Anda untuk mendapatkan prediksi yang lebih baik. Untuk
meningkatkan kinerja, Anda dapat melakukan iterasi melalui langkah-langkah berikut:
1. Mengumpulkan data: Meningkatkan jumlah contoh pelatihan
2. Pengolahan fitur: Tambahkan lebih banyak variabel dan pemrosesan fitur yang
lebih baik
3. Penyetelan parameter model: Pertimbangkan nilai alternatif untuk parameter
pelatihan yang digunakan oleh algoritma pembelajaran Anda

Cocok model: Overfitting vs. Overfitting


Memahami model fit penting untuk memahami akar penyebab akurasi model yang
buruk. Pemahaman ini akan memandu Anda untuk mengambil langkah-langkah
korektif. Kita dapat menentukan apakah model prediktif adalah underfitting atau
overfitting data pelatihan dengan melihat kesalahan prediksi pada data pelatihan dan
data evaluasi.

Model Andaunderfittingdata pelatihan ketika model melakukan buruk pada data


pelatihan. Hal ini karena model tidak dapat menangkap hubungan antara contoh input
(sering disebut X) dan nilai target (sering disebut Y). Model AndaoverfittingData
pelatihan Anda ketika Anda melihat bahwa model bekerja dengan baik pada data
pelatihan tetapi tidak berkinerja baik pada data evaluasi. Hal ini karena model
menghafal data yang telah dilihat dan tidak dapat menggeneralisasi contoh yang tak
terlihat.

Kinerja yang buruk pada data pelatihan bisa jadi karena modelnya terlalu sederhana
(fitur input tidak cukup ekspresif) untuk menggambarkan target dengan baik. Kinerja

9
dapat ditingkatkan dengan meningkatkan fleksibilitas model. Untuk meningkatkan
fleksibilitas model, coba hal berikut:
• Tambahkan fitur khusus domain baru dan lebih banyak fitur produk Cartesian, dan
ubah jenis
pemrosesan fitur yang digunakan (misalnya, meningkatkan ukuran n-gram)
• Mengurangi jumlah regularisasi yang digunakan

Jika model Anda kelebihan data pelatihan, masuk akal untuk mengambil tindakan yang
mengurangi fleksibilitas model. Untuk mengurangi fleksibilitas model, coba hal berikut:
• Pilihan fitur: pertimbangkan untuk menggunakan kombinasi fitur yang lebih sedikit,
kurangi ukuran ngram,dan kurangi jumlah tempat sampah atribut numerik.
• Meningkatkan jumlah regularisasi yang digunakan.

Akurasi pada data pelatihan dan uji bisa menjadi buruk karena algoritma pembelajaran
tidak memiliki cukup data untuk dipelajari. Anda dapat meningkatkan kinerja dengan
melakukan hal berikut:
• Meningkatkan jumlah contoh data pelatihan.
• Tingkatkan jumlah pass pada data pelatihan yang ada.

Menggunakan Model untuk Membuat Prediksi


Sekarang setelah Anda memiliki model L yang berkinerja baik, Anda akan
menggunakannya untuk membuat prediksi. Di Amazon Machine Learning, ada dua cara
untuk menggunakan model untuk membuat prediksi:

10
Metrik Untuk Evaluasi Model

Pengukuran untuk Mengevaluasi Model Regresi digunakan


Mean Squared Error (MSE) adalah Rata-rata Kesalahan kuadrat diantara nilai aktual dan
nilai peramalan. Metode Mean Squared Error secara umum digunakan untuk mengecek
estimasi berapa nilai kesalahan pada peramalan. Nilai Mean Squared Error yang rendah
atau nilai mean squared error mendekati nol menunjukkan bahwa hasil peramalan
sesuai dengan data aktual dan bisa dijadikan untuk perhitungan peramalan di periode
mendatang. Metode Mean Squared Error biasanya digunakan untuk mengevaluasi
metode pengukuran dengan model regressi atau model peramalan seperti Moving
Average, Weighted Moving Average dan Analisis Trendline

Bagaimana Cara Menghitung Menghitung Mean Squared Error?


Cara menghitung Mean Squared Error (MSE) adalah melakukan pengurangan nilai data
aktual dengan data peramalan dan hasilnya dikuadratkan (squared) kemudian
dijumlahkan secara keseluruhan dan membaginya dengan banyaknya data yang ada. 
Rumus Mean Squared Error (MSE) sebagai berikut :

Dimana :

11
At = Nilai Aktual permintaan
Ft =Nilai hasil peramalan
n = banyaknya data

MAE (Mean Absolute Error) adalah rata-rata selisih mutlak nilai sebenarnya (aktual)
dengan nilai prediksi (peramalan).
MAE digunakan untuk mengukur keakuratan suatu model statistik dalam melakukan
prediksi atau peramalan.
MAE bersama dengan MAPE (Mean Absolute Percentage Error) merupakan ukuran
keakuratan yang paling sering digunakan dalam analisis deret waktu (time series).

12
Tugas Dan Proyek Pelatihan

1. Sebuah department store ingin menganalisa kelompok perilaku belanja dari pelanggannya, dengan
data set yang diberikan buatlah analisa:
a. gunakan kolom ke 2 hingga 4 sebagai input features
b. dengan metode elbow, analisa jumlah cluster yang tepat
c. gunakan K-Means clustering dan analisa hasilnya

2. Sebuah department store ingin menganalisa kelompok perilaku belanja dari pelanggannya, dengan
data set yang diberikan buatlah analisa:
a. gunakan kolom ke 2 hingga 4 sebagai input features
b. dengan dendogram diagram, analisa jumlah cluster yang tepat
c. gunakan Hierachical clustering dan analisa hasilnya
d. bandingkan hasilnya dengan menggunakan metode K-Means

3. Generate data set sebanyak 500 titik data pelatihan bola dengan label yang sesuai
a. lakukan normalisasi fitur pada proses pelatihan data,
b. gunakan DBSCAN dari library sklearn
c. buatlah untuk kasus spherical dan non-spherical data
d. Pada kasus non-spherical data, uji coba dengan metode K-Means dan bandingkan hasilnya

Link Referensi Modul Kesembilan

1. Video Pembelajaran
2. E-book
3. Link Youtube/Website rujukan

Link Pertanyaan Modul Kesembilan

13
Bahan Tayang

Bisa berupa Link/ Screen Capture Slide pelatihan

Link room Pelatihan dan Jadwal live sesi bersama instruktur

Penilaian

Komposisi penilaian Kuis: Nilai 100 (Range 0 -100)

Target Penyelesaian Modul Kesembilan

2 JP

14
15

Anda mungkin juga menyukai