Machine Learning
Konsep Belajar Machine Learning
Profil Dosen
I Gede Totok Suryawan, S.Kom., M.T.
v Dosen Tetap STIKI Indonesia (2015 – Sekarang)
v Tenaga Ahli Penyusunan Invesment Catalogue Ditjen
Industri Agro Kementerian Perindustrian RI (2019)
v Mahasiswa Program Doktor Ilmu Teknik UNUD
v Interesting Research : Deep Learning, Sedang melakukan
penelitian tentang Kain Tenun Ikat Gringsing di Desa
Tenganan Pegringsingan
v Founder Easy Exchange - @easyexchange.id
IG : @igt.suryawan
Machine Learning
Kelas :G
Kode Kelas: TIP-015-G
SKS :3
Hari : Jumat, R511
Waktu : 14.50 – 17.20 Wita
Penting:
1. Wajib bergabung di ELSA : https://elsa.instiki.ac.id/ menggunakan kode:
TIP-015-G
2. Wajib bergabung di WAG : https://bit.ly/TIP-015-G
Machine Learning Penilaian
Keaktifan Persentasi Kategori
10%
Tugas 30%
UTS 25%
UAS 25%
QUIS 10%
Total 100%
Mahasiswa yang presensinya
kurang dari 75%,
tidak bisa mengikuti UAS
Machine Learning
• Definisi dan aplikasi pemelajaran mesin
• Teknik Dimensionality Reduction
Materi • Unsupervised Learning dan Supervised
Pembelajaran Learning
• Pembelajaran Reinforcement
• Project Aplikasi Pembelajaran Mesin
Apa
Machine Learning?
Data Digital
• Pengguna
Internet dan
Media Sosial di
Dunia Tahun
2022
“Hootsuite (We Are
Social) : Digital 2022”
Data Digital
• Pengguna
Internet dan
Media Sosial di
Indonesia Tahun
2022
“Hootsuite (We Are
Social) : Digital 2022”
Data Digital
• Waktu Orang
Indonesia
Mengakses
Media Digital
Tahun 2022
“Hootsuite (We Are
Social) : Digital 2022”
Data Digital
• Tahun 2020 setiap manusia di bumi menghasilkan data
sebesar 1,7 MB per detik [1]
• Data juga dihasilkan oleh mesin-mesin, sensor, dan
peralatan elektronik lainya (Machine Generated Data –
MGD)
• Pada tahun 2025, 30% data yang ada di dunia akan
dihasilkan oleh mesin [2]
“[1] DOMO Report : Data Never Sleeps
[2] IDC Report : Data Age 2025”
Big Data
v Bigdata atau Mahadata adalah istilah
umum untuk segala himpunan data
(data set) dalam jumlah yang sangat
besar, rumit, dan tak terstruktur
sehingga menjadikannya sukar
ditangani apabila hanya
menggunakan perkakas manajemen
basis data biasa atau aplikasi pemroses
data tradisional
Price Alerts Traveloka
Karakteristik Big Data
Volume
• ukuran media penyimpanan data yang sangat besar
atau mungkin tak terbatas.
Velocity
• Big data memiliki aliran data yang yang cepat dan
real time. Velocity dapat diartikan sebagai kecepatan
proses.
Variety
• Big data memiliki bentuk format data yang beragam
baik terstruktur ataupun tidak terstruktur dan
bergantung pada banyaknya sumber data.
Meniru Cara Belajar Manusia
Meniru Cara Belajar Manusia
Machine Learning
“Ilmu yang mempelajari tentang algoritma komputer yang bisa
mengenali pola-pola di dalam data, dengan tujuan untuk
mengubah beragam macam data menjadi suatu tindakan yang
nyata dengan sesedikit mungkin campur tangan manusia"
“Dengan machine learning, kita dapat menciptakan mesin
(komputer) yang “belajar” dari data yang ada, selanjutnya dia
bisa membuat keputusan secara mandiri tanpa deprogram lagi.”
- Dios Kurniawan 2020
Machine Learning
Machine Learning
Ruang Lingkup Machine Learning
Data Science AI
Data Machine
Data
Mining Learning
Analytics
Profesi terkait dengan Data
• Data Analytic
• Data Scientist
“Dios Kurniawan 2020”
• Machine Learning Engineer
Apa
Mesin Mampu Belajar?
Autonomous Land Vehicle in
Neural Network (ALVINN)
• Sebuah kendaraan yang
mampu mempelajari tingkah
laku seorang sopir
• Setelah belajar menggunakan
metode Artificial Neural
Network, ALVNN mampu
berjalan secara otomatis
dengan kecepatan 80
Km/Jam
“Pomerleau 1998”
Imagenet
• Sebuah basis data citra (image) yang
berisi jutaan citra terkelompok ke
dalam ribuan kelas yang digunakan
untuk pembelajaran mesin bersekala
besar hingga mampu melakukan
klasifikasi citra dengan akurasi tinggi.
• Sejak 2010 imagenet telah digunakan
untuk menghasilkan ratusan program
computer yang mampu mempelajari
karateristik jutaan citra tersebut dan
mengklasifikasikanya ke dalam ribuan
kelas.
“VisionLab 2017”
Dragon Speak
• Sebuah program komputer yang mampu belajar
mengenali sinyal ucapan manusia dengan
akurasi sangat tinggi.
“Nuance 2017”
• Di masa depan komputer komputer dengan
kemampuan belajar diprediksi akan berkembang
semakin pesat dengan dukungan perangkat
keras dan Internet of Things (IoT) yang semakin
kuat.
Ruang Lingkup Machine Learning
Data Science AI
Data Machine
Data
Mining Learning
Analytics
Profesi terkait dengan Data
• Data Analytic
• Data Scientist
“Dios Kurniawan 2020”
• Machine Learning Engineer
Proses-Proses Machine Learning
• Ketiga komponen ini saling
ketergantungan, dan ketiga
Prosesor komponen ini juga saling mengacu
perkembangan yang lain.
• Suatu mesin dikatakan “belajar”
apabila mesin tersebut bisa
menggunakan data yang diberikan
padanya untuk meningkatkan
kualitas luaran.
• Manusia yang “normal” pada
Algoritma umumnya bisa belajar dari
Data pengalaman buruk agar tidak jatuh
Matematis ke lubang yang sama.
“Dios Kurniawan 2020”
Proses-Proses Machine Learning
Data Abstraksi Generalisasi
1. Pengumpulan Data : data hasil pengukuran dari tranksaksi, sensor,
catatan-catatan, tulisan, angka, gambar, suara, dsb
– Dataset : Sekelompok data yang memiliki keterkaitan satu sama lain yang dapat
dimanipulasi oleh komputer sebagai satu kesatuan.
2. Abstraksi : Proses penerjemahan data-data menjadi suatu model yang
lebih umum.
3. Generalisasi : Proses yang menggunakan model hasil abstraksi sebagai
dasar pembuatan keputusan atau kesimpulan.
Proses-Proses Machine Learning
Data Abstraksi Generalisasi
Proses-Proses Machine Learning
Data Abstraksi Generalisasi
Sebuah Mobil
MODEL (Intermeso)
Wanita Pria ?
Training Dataset
• Example : Rekaman yang menggambarkan suatu objek yang
sedang diamati.
Example • Contoh: Data transaksi penjualan dalam sebuah toserba adalah
sekumpulan example, dalam struktur data, satu baris data dalam tabel
mewakili satu example
• Feature : Karateristik atau atribut dari suatu example, seperti
jenis, ukuran, warna, usia, dan beragam hasil pengukuran
Feature
terkait dengan objek yang sedang diamati.
• Continuous : Nilai numerik seperti angka penjumlahan dan jumlah
pelanggan.
• Nominal : Eleman data dalam bentuk sekumpulan katagori, misalkan jenis
kelamin, katagori produk, kelompom penyakit,dsb.
Target • Ordinal : Katagori berupa daptar yang berbentuk urutan tertentu, seperti
Feature ukuran kecil/sedang/besar, usia anak-anak/remaja, dewasa, dsb.
• Binary : feature yang berisi elemen data yang memiliki dua kemungkinan
nilai, misalkan Ya atau Tidak.
Training Dataset
• Target Feature (disebut juga Label) : Feature yang ingin
diketahui atau diprediksi nilainya dengan bantuan machine
Example learning.
• Target feature harus didefinisikan dengan baik, karena
machine learning memerlukanya untuk membuat fungsi
matematis yang memetakan hubungan antara feature yang
Feature ada dengan target yang ingin diprediksi.
• Contoh target feature: • Contoh Target Feature
• Angka penjualan perusahaan • Calon pembeli produk atau
• Angka pertumbuhan ekonomi dan inflasi bukan calon pembeli
• Jenis kelamin laki-laki atau perempuan • Pesan email biasa atau sampah
Target
• Kelompok usia penduduk • Sentimen percakapan positif atau
Feature negative
• Transaksi illegal atau legal
• Transaksi kartu kredit yang jahat
atau normal
Training Dataset
Contoh Struktur Data
Merk Mobil Model Tahun Warna Mesin Transmisi
1 Toyota Kijang 2008 Hitam 2000 Manual
2 Toyota Corolla 2003 Putih 1800 Otomatis
3 Honda Accord 2005 Hitam 2400 Otomatis
4 Daihatsu Taft 2010 HIjau 2700 Manual
5 Chevrolet Captina 2012 Abu-abu 2400 Otomatis
6 VW Polo 1013 Putih 1400 Otomatis
7 Suzuki Carry 2007 Biru 1500 Manual
Jenis Machine Learning
• Supervised Learning
• Unsupervised Learning
• Reinforcement Learning
• Algoritma yang
membangkitkan suatu fungsi
yang memetakan input dan
output yang diinginkan.
• Kualitas hasil pembelajaran
sangat tergantung pada
kesesuain input dan ouput
tersebut.
• Argoritma ini sering disebut
dengan pembelajaran
terawasi (Supervised
Learning)
• Algoritma ini memodelkan
sekumpulan input secara
input tanpa adanya
panduan.
• Data-data yang dipelajari
tanpa adanya label kelas
(clustering).
• Algoritma ini mempelajari
suatu kebijakan bagaimana
melakukan aksi berdasarkan
hasil pengamatan terhadap
lingkungan.
• Setiap aksi menghasilkan
akibat bagi lingkungan
tersebut, dan lingkungan
memberikan umpan balik
(feedback) untuk memandu
algoritma tersebut.
Mengukur Kinerja Model
Bagaimana mengukur baik atau
tidaknya sebuah model?
• Setalah model dilatih dengan training dataset, model harus
diuji dengan dataset baru (disebut Test Dataset) untuk
mengukur kinerja model dengan dataset baru yang disebut
proses Scoring.
• Ukuran terpenting baik-buruk sebuah model adalah seberapa
akurat model tersebut bila dihadapkan dengan data baru.
Mengukur Kinerja Model
Darimana kita bisa mendapatkan
Test Dataset?
• Membagi dataset yang tersedia menjadi dua yaitu Training
Dataset dan Testing Dataset.
• Test Dataset jumlahnya lebih sedikit dari Training Dataset,
umumnya sekitar 20% dari jumlah dataset.
• Dalam pemilihan Test Dataset, harus dipastikan isinya dipilih
secara acak dan jumlahnya cukup besar serta mewakili
keseluruhan populasi dataset.
Test Dataset Training Dataset