Machine Learning Models
Machine Learning Models
berdasarkan ekspresi wajah. Jadi, membuat aplikasi seperti itu dimungkinkan dengan model
pembelajaran Mesin di mana kami akan melatih model dengan memberi makan gambar wajah dengan
berbagai emosi yang diberi label di dalamnya. Setiap kali aplikasi ini digunakan untuk menentukan
suasana hati pengguna, ia membaca semua data yang dimasukkan kemudian menentukan suasana hati
pengguna mana pun.
Oleh karena itu, dengan kata sederhana, kita dapat mengatakan bahwa model pembelajaran mesin
adalah representasi yang disederhanakan dari sesuatu atau proses. Dalam topik ini, kita akan
membahas berbagai model pembelajaran mesin serta teknik dan algoritmenya.
Pembelajaran Terawasi
Pembelajaran tanpa pengawasan
Pembelajaran Penguatan
Regresi
Aturan Asosiasi
Pengurangan Dimensi
Supervised Learning adalah model pembelajaran mesin yang paling sederhana untuk dipahami di
mana data input disebut data pelatihan dan memiliki label atau hasil yang diketahui sebagai output.
Jadi, ia bekerja berdasarkan prinsip pasangan input-output. Ini membutuhkan pembuatan fungsi yang
dapat dilatih menggunakan kumpulan data pelatihan, dan kemudian diterapkan pada data yang tidak
diketahui dan membuat beberapa kinerja prediktif. Pembelajaran yang diawasi berbasis tugas dan
diuji pada kumpulan data berlabel.
Kita dapat menerapkan model pembelajaran terawasi pada masalah kehidupan nyata yang sederhana.
Misalnya, kami memiliki kumpulan data yang terdiri dari usia dan tinggi badan; kemudian, kita dapat
membangun model pembelajaran terawasi untuk memprediksi tinggi badan seseorang berdasarkan
usianya.
Model Supervised Learning selanjutnya diklasifikasikan menjadi dua kategori:
Regresi
Dalam masalah regresi, outputnya adalah variabel kontinu. Beberapa model Regresi yang umum
digunakan adalah sebagai berikut:
a) Regresi Linier
Regresi linier adalah model pembelajaran mesin paling sederhana di mana kami mencoba
memprediksi satu variabel keluaran menggunakan satu atau lebih variabel masukan. Representasi
regresi linier adalah persamaan linier, yang menggabungkan sekumpulan nilai input (x) dan output
yang diprediksi (y) untuk himpunan nilai input tersebut. Direpresentasikan dalam bentuk garis:
Y = bx+c.
Jaringan saraf tiruan terdiri dari struktur multilayer, yang berisi satu lapisan input, satu atau lebih
lapisan tersembunyi, dan satu lapisan output. Karena setiap neuron terhubung dengan neuron lain, ia
mentransfer data dari satu lapisan ke neuron lain dari lapisan berikutnya. Akhirnya, data mencapai
lapisan terakhir atau lapisan keluaran dari jaringan saraf dan menghasilkan keluaran.
Jaringan saraf bergantung pada data pelatihan untuk mempelajari dan meningkatkan akurasinya.
Namun, jaringan saraf yang terlatih & akurat dapat mengelompokkan data dengan cepat dan menjadi
alat pembelajaran mesin dan AI yang andal. Salah satu jaringan saraf yang paling terkenal adalah
algoritma pencarian Google.
Klasifikasi
Model klasifikasi adalah tipe kedua dari teknik Supervised Learning, yang digunakan untuk
menghasilkan kesimpulan dari nilai-nilai yang diamati dalam bentuk kategoris. Misalnya, model
klasifikasi dapat mengidentifikasi apakah email tersebut adalah spam atau bukan; pembeli akan
membeli produk atau tidak, dll. Algoritma klasifikasi digunakan untuk memprediksi dua kelas dan
mengkategorikan output ke dalam kelompok yang berbeda.
Dalam klasifikasi, model pengklasifikasi dirancang yang mengklasifikasikan kumpulan data ke dalam
kategori yang berbeda, dan setiap kategori diberi label.
Ada dua jenis klasifikasi dalam pembelajaran mesin:
Klasifikasi biner: Jika masalah hanya memiliki dua kelas yang mungkin, disebut
pengklasifikasi biner. Misalnya, kucing atau anjing, Ya atau Tidak,
Klasifikasi multi-kelas: Jika masalah memiliki lebih dari dua kelas yang mungkin, itu adalah
pengklasifikasi multi-kelas.
Beberapa algoritma klasifikasi yang populer adalah sebagai berikut:
a) Regresi Logistik
Regresi Logistik digunakan untuk menyelesaikan masalah klasifikasi dalam pembelajaran mesin.
Mereka mirip dengan regresi linier tetapi digunakan untuk memprediksi variabel kategori. Itu dapat
memprediksi output baik Ya atau Tidak, 0 atau 1, Benar atau Salah, dll. Namun, alih-alih memberikan
nilai yang tepat, ini memberikan nilai probabilistik antara 0 & 1.
b) Mendukung Mesin Vektor
Mendukung mesin vektor atau SVM adalah algoritma pembelajaran mesin yang populer, yang banyak
digunakan untuk tugas klasifikasi dan regresi. Namun, secara khusus digunakan untuk menyelesaikan
masalah klasifikasi. Tujuan utama SVM adalah untuk menemukan batas keputusan terbaik dalam
ruang N-dimensi, yang dapat memisahkan titik data ke dalam kelas, dan batas keputusan terbaik
dikenal sebagai Hyperplane. SVM memilih vektor ekstrim untuk menemukan hyperplane, dan vektor
ini dikenal sebagai vektor pendukung.
c) Nave Bayes
Naïve Bayes adalah algoritma klasifikasi populer lainnya yang digunakan dalam pembelajaran mesin.
Disebut demikian karena didasarkan pada teorema Bayes dan mengikuti asumsi naif (independen)
antara fitur yang diberikan sebagai:
Setiap pengklasifikasi nave Bayes mengasumsikan bahwa nilai variabel tertentu tidak tergantung pada
variabel/fitur lainnya. Misalnya, jika suatu buah perlu diklasifikasikan berdasarkan warna, bentuk, dan
rasanya. Jadi kuning, lonjong, dan manis akan dikenali sebagai mangga. Di sini setiap fitur tidak
tergantung pada fitur lainnya.
Kekelompokan
Kekelompokan adalah teknik pembelajaran tanpa pengawasan yang melibatkan
pengelompokan atau meraba-raba titik data ke dalam cluster yang berbeda berdasarkan
persamaan dan perbedaan. Objek-objek dengan kemiripan paling banyak tetap berada dalam
kelompok yang sama, dan mereka tidak memiliki atau sangat sedikit kesamaan dari kelompok
lain.
Algoritma pengelompokan dapat digunakan secara luas dalam tugas yang berbeda seperti
Segmentasi gambar, Analisis data statistik, Segmentasi pasar, dll.Beberapa algoritma
Clustering yang umum digunakan adalah K-means Clustering, Hierarchal Clustering,
DBSCAN, dll.
Pengurangan Dimensi
Jumlah fitur/variabel yang ada dalam kumpulan data dikenal sebagai dimensionalitas
kumpulan data, dan teknik yang digunakan untuk mereduksi dimensionalitas dikenal sebagai
teknik reduksi dimensionalitas.
Meskipun lebih banyak data memberikan hasil yang lebih akurat, itu juga dapat memengaruhi
kinerja model/algoritma, seperti masalah pemasangan berlebih. Dalam kasus seperti itu,
teknik pengurangan dimensi digunakan.
"Ini adalah proses mengubah kumpulan data dimensi yang lebih tinggi menjadi kumpulan
data dimensi yang lebih rendah untuk memastikan bahwa itu memberikan informasi yang
serupa."
Metode pengurangan dimensi yang berbeda seperti PCA (Analisis Komponen Utama),
Dekomposisi Nilai Singular, dll.
Pembelajaran Penguatan
Dalam pembelajaran penguatan, algoritme mempelajari tindakan untuk serangkaian status tertentu
yang mengarah ke status tujuan. Ini adalah model pembelajaran berbasis umpan balik yang
mengambil sinyal umpan balik setelah setiap keadaan atau tindakan dengan berinteraksi dengan
lingkungan. Umpan balik ini berfungsi sebagai imbalan (positif untuk setiap tindakan baik dan negatif
untuk setiap tindakan buruk), dan tujuan agen adalah memaksimalkan imbalan positif untuk
meningkatkan kinerjanya.
Perilaku model dalam pembelajaran penguatan mirip dengan pembelajaran manusia, karena manusia
mempelajari sesuatu melalui pengalaman sebagai umpan balik dan berinteraksi dengan lingkungan.
Di bawah ini adalah beberapa algoritma populer yang termasuk dalam pembelajaran penguatan:
Q-learning: Q-learning adalah salah satu algoritma pembelajaran penguatan bebas model
yang populer, yang didasarkan pada persamaan Bellman.
Ini bertujuan untuk mempelajari kebijakan yang dapat membantu agen AI untuk mengambil tindakan
terbaik untuk memaksimalkan hadiah dalam keadaan tertentu. Ini menggabungkan nilai Q untuk
setiap pasangan keadaan-tindakan yang menunjukkan hadiah untuk mengikuti jalur keadaan tertentu,
dan mencoba untuk memaksimalkan nilai-Q.
Deep Q Network: DQN atau Deep Q Neural network adalah Q-learning dalam jaringan
neural. Ini pada dasarnya digunakan di lingkungan ruang negara besar di mana
mendefinisikan tabel-Q akan menjadi tugas yang kompleks. Jadi, dalam kasus seperti itu,
daripada menggunakan tabel-Q, jaringan saraf menggunakan nilai-Q untuk setiap tindakan
berdasarkan keadaan.