0% menganggap dokumen ini bermanfaat (0 suara)
3 tayangan

Algoritma_Machine_Learning_dalam_Data_Analysis-2

Dokumen ini memberikan pengantar tentang Machine Learning, menjelaskan langkah-langkah dalam prosesnya seperti preprocessing data, pemilihan fitur, dan pelatihan model. Selain itu, dokumen ini juga mencakup berbagai algoritma Machine Learning seperti regresi linier, pohon keputusan, dan K-Means clustering. Penekanan pada evaluasi model dan penggunaan model untuk prediksi juga disoroti.

Diunggah oleh

demialpha2
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
3 tayangan

Algoritma_Machine_Learning_dalam_Data_Analysis-2

Dokumen ini memberikan pengantar tentang Machine Learning, menjelaskan langkah-langkah dalam prosesnya seperti preprocessing data, pemilihan fitur, dan pelatihan model. Selain itu, dokumen ini juga mencakup berbagai algoritma Machine Learning seperti regresi linier, pohon keputusan, dan K-Means clustering. Penekanan pada evaluasi model dan penggunaan model untuk prediksi juga disoroti.

Diunggah oleh

demialpha2
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 14

Devia Kartika, S.Kom, M.

Kom
Email : [email protected]

Dosen Teknik Informatika Universitas Putra Indonesia YPTK Padang


Machine Learning
Machine Learning
Pengenalan Machine Learning

Algoritma Machine Learning adalah serangkaian instruksi atau


prosedur matematis yang digunakan oleh komputer untuk belajar dari
data, mengidentifikasi pola, dan membuat prediksi atau keputusan
tanpa perlu secara eksplisit diprogram.

Dalam konteks analisis data, algoritma machine learning digunakan


untuk menggali wawasan dari data yang besar dan kompleks.
Machine Learning
Pengenalan Machine Learning

Proses Machine Learning dapat dibagi menjadi beberapa langkah umum:

1.Preprocessing Data: Langkah awal dalam analisis data adalah


membersihkan dan mempersiapkan data untuk diproses. Ini mungkin
melibatkan mengisi nilai yang hilang, menghapus outlier, atau
melakukan normalisasi data.
2.Pemilihan Fitur (Feature Selection): Terkadang tidak semua fitur
dalam data diperlukan untuk analisis. Pemilihan fitur melibatkan
identifikasi fitur-fitur yang paling relevan atau penting untuk masalah
yang sedang dihadapi.
Machine Learning
Pengenalan Machine Learning

3. Pembagian Data (Data Splitting): Data dibagi menjadi set pelatihan


(training set) dan set pengujian (testing set). Set pelatihan
digunakan untuk melatih model machine learning, sedangkan set
pengujian digunakan untuk menguji kinerja model.
4. Pelatihan Model (Model Training): Model machine learning
diterapkan pada set pelatihan untuk belajar pola dari data.
Selama pelatihan, model disesuaikan dengan data sehingga dapat
membuat prediksi yang akurat.
Machine Learning
Pengenalan Machine Learning
5. Validasi Model (Model Validation): Setelah model dilatih, itu harus dievaluasi
menggunakan set pengujian untuk memastikan bahwa itu dapat membuat
prediksi yang akurat pada data yang tidak dilihat sebelumnya. Ini membantu
menghindari overfitting, di mana model terlalu cocok dengan data pelatihan
dan tidak dapat menggeneralisasi dengan baik pada data baru.
6. Optimasi Hyperparameter: Beberapa algoritma machine learning memiliki
parameter yang disebut hyperparameter yang harus ditetapkan sebelum
pelatihan model. Proses optimasi hyperparameter melibatkan penyesuaian
nilai-nilai ini untuk meningkatkan kinerja model.
Machine Learning
Pengenalan Machine Learning

7. Pengujian dan Evaluasi: Setelah model dioptimalkan, itu diuji dengan


data pengujian yang independen untuk mengukur kinerjanya. Metrik
evaluasi seperti akurasi, presisi, recall, dan F1-score digunakan
untuk mengevaluasi kinerja model.
8. Penggunaan Model: Setelah model dianggap memadai, itu dapat
digunakan untuk membuat prediksi atau keputusan tentang data
baru yang tidak dilihat sebelumnya
Algoritma Machine Learning
Algoritma Machine Learning
Algoritma Machine Learning

1. Regresi Linier: Digunakan untuk memodelkan hubungan linier


antara variabel dependen (output) dan variabel independen
(input). Cocok untuk memprediksi nilai berkelanjutan.

2. Regresi Logistik: Cocok untuk masalah klasifikasi biner di mana


outputnya berupa kategori biner (misalnya ya/tidak, benar/salah).
Algoritma Machine Learning
Algoritma Machine Learning

3. Pohon Keputusan (Decision Trees): Algoritma ini memecah data


menjadi segmen-segmen yang lebih kecil berdasarkan serangkaian
keputusan berhierarki. Mereka bisa digunakan untuk klasifikasi dan
regresi.

4. Random Forest: Sebuah ensemble learning method yang


menggunakan banyak pohon keputusan untuk meningkatkan
kinerja prediksi. Random forest biasanya memberikan hasil yang
lebih baik daripada pohon keputusan tunggal.
Algoritma Machine Learning
Algoritma Machine Learning

5. K-Means Clustering: Digunakan untuk mengelompokkan data tanpa


label menjadi kelompok-kelompok berdasarkan kemiripan. Ini
adalah teknik unsupervised learning.

6. Support Vector Machines (SVM): SVM mencari hyperplane terbaik


yang membagi data ke dalam kelas-kelas yang berbeda. Ini dapat
digunakan untuk klasifikasi atau regresi, tergantung pada formulasi
yang digunakan.
Algoritma Machine Learning
Algoritma Machine Learning

7. K-Nearest Neighbors (KNN): Algoritma ini mencari k tetangga


terdekat dari suatu titik data dan mengambil mayoritas kelas tetangga
sebagai prediksi atau menggunakan rata-rata nilai dari tetangga
terdekat untuk regresi.

8. Principal Component Analysis (PCA): Teknik ini digunakan untuk


mengurangi dimensi data dengan memproyeksikannya ke dalam
ruang fitur yang lebih rendah. Ini membantu dalam mempercepat
algoritma machine learning dan mengidentifikasi pola yang mendasari.
Algoritma Machine Learning
Algoritma Machine Learning

9. Gradient Boosting Machines (GBM): Sebuah teknik ensemble


learning yang membangun model prediksi dalam bentuk ansambel
model lemah, biasanya pohon keputusan. Ini adalah algoritma kuat
yang dapat digunakan untuk klasifikasi dan regresi.

10.Naive Bayes: Berdasarkan teorema Bayes, algoritma ini cocok untuk


klasifikasi dengan dataset yang besar dan memiliki banyak fitur.
Ini mengasumsikan independensi antar fitur.
Thank’s

Thanks for your attention

Anda mungkin juga menyukai