Salinan Modul 7 - Konsep Dasar Machine Learning

Dokumen ini membahas konsep dasar Machine Learning, termasuk pembagian metode seperti Supervised, Unsupervised, dan Reinforcement Learning. Selain itu, dijelaskan langkah-langkah dalam workflow Machine Learning, pembuatan model regresi, serta cara menghitung dan membandingkan metrik kinerja model seperti R-squared dan RMSE. Kriteria pemilihan model juga diuraikan berdasarkan tujuan analisis, baik untuk penjelasan variasi data maupun akurasi prediksi.

Diunggah oleh

wwaja685

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

12 tayangan11 halaman

Salinan Modul 7 - Konsep Dasar Machine Learning

Diunggah oleh

wwaja685

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

Anda di halaman 1/ 11

Konsep Dasar

Machine
Learning
Modul ketujuh
Pembagian Machine Learning
A. Supervised Learning
Regression
Classification

B. Unsupervised Learning
Clustering
Dimensionality Reduction

C. Reinforcement Learning
Workflow Machine Learning

1. Data Preparation
2. Model Selection
3. Training
4. Evaluation
5. Prediction
Load library yang diperlukan
library(MASS)
library(caret)

Load dan siapkan data

data(Boston)
set.seed(123)

Membagi data menjadi training dan testing

training_index <- createDataPartition(Boston$medv, p =
0.8, list = FALSE)
train_data <- Boston[training_index, ]
test_data <- Boston[-training_index, ]
1. MEMBUAT KETIGA MODEL
Model 1: Regresi Linear Sederhana
model_sederhana <- lm(medv ~ rm, data = train_data)
Model 2: Regresi Linear Berganda
model_berganda <- lm(medv ~ rm + lstat + age + dis, data =
train_data)
Model 3: Regresi Polinomial
model_poly <- lm(medv ~ rm + I(rm^2), data = train_data)

2. FUNGSI UNTUK MENGHITUNG R² DAN RMSE

calculate_metrics <- function(model, test_data) {
predictions <- predict(model, newdata = test_data)
Menghitung R-squared
r2 <- 1 - sum((test_data$medv - predictions)^2) /
sum((test_data$medv - mean(test_data$medv))^2)
Menghitung RMSE
rmse <- sqrt(mean((test_data$medv - predictions)^2))
return(c(R_squared = r2, RMSE = rmse))}
3. MENGHITUNG METRICS UNTUK SETIAP MODEL
metrics_sederhana <- calculate_metrics(model_sederhana,
test_data)
metrics_berganda <- calculate_metrics(model_berganda,
test_data)
metrics_poly <- calculate_metrics(model_poly, test_data)
Membuat tabel perbandingan
comparison_table <- rbind(
"Model Sederhana" = metrics_sederhana,
"Model Berganda" = metrics_berganda,
"Model Polinomial" = metrics_poly)
Print hasil perbandingan
cat("Perbandingan Model:\n")
print(round(comparison_table, 4))
4. VISUALISASI PERBANDINGAN METRICS
par(mfrow = c(1,2))
Plot R-squared
barplot(comparison_table[,1],
main = "Perbandingan R-squared",
ylim = c(0, 1),
col = c("skyblue", "lightgreen", "pink"))
grid()
Plot RMSE
barplot(comparison_table[,2],
main = "Perbandingan RMSE",
col = c("skyblue", "lightgreen", "pink"))
grid()
5. MENENTUKAN MODEL TERBAIK
best_r2 <- which.max(comparison_table[,1])
best_rmse <- which.min(comparison_table[,2])

cat("\nBerdasarkan R-squared tertinggi:")

cat("\nModel terbaik adalah:", rownames(comparison_table)
[best_r2])
cat("\nNilai R-squared:", round(comparison_table[best_r2,1],
4))

cat("\n\nBerdasarkan RMSE terendah:")

cat("\nModel terbaik adalah:", rownames(comparison_table)
[best_rmse])
cat("\nNilai RMSE:", round(comparison_table[best_rmse,2], 4))
6. VISUALISASI PREDIKSI MODEL TERBAIK
best_model <- if(best_rmse == best_r2) {
list(model = get(paste0("model_", tolower(strsplit(rownames(comparison_table)
[best_rmse], " ")[[1]][2]))),
name = rownames(comparison_table)[best_rmse])} else {cat("\n\nPerhatian: R-
squared dan RMSE menunjukkan model terbaik yang berbeda.")
cat("\nDisarankan untuk mempertimbangkan tujuan analisis dalam pemilihan model
final.")
list(model = get(paste0("model_", tolower(strsplit(rownames(comparison_table)
[best_rmse], " ")[[1]][2]))),
name = rownames(comparison_table)[best_rmse])}
Plot actual vs predicted untuk model terbaik
predictions <- predict(best_model$model, newdata = test_data)
plot(test_data$medv, predictions,
main = paste("Actual vs Predicted -", best_model$name),
xlab = "Actual Values",
ylab = "Predicted Values")
abline(0, 1, col = "red")
Cara menginterpretasikan hasil:

1. R-squared (R²):
Rentang nilai: 0 sampai 1
Semakin mendekati 1, semakin baik model menjelaskan
variasi data
Mengukur proporsi variasi yang dapat dijelaskan oleh
model
2. RMSE (Root Mean Square Error)
Semakin kecil nilainya, semakin baik model
Memiliki unit yang sama dengan variabel dependen
Mengukur rata-rata kesalahan prediksi
Kriteria pemilihan model:

1. Jika fokus pada kemampuan model menjelaskan variasi data:

Pilih model dengan R² tertinggi
Cocok untuk analisis explanatory
2. Jika fokus pada akurasi prediksi:
Pilih model dengan RMSE terendah
Cocok untuk tujuan prediktif
3. Jika R² dan RMSE menunjukkan model terbaik yang berbeda:
Pertimbangkan tujuan utama analisis
Pertimbangkan kompleksitas model
Pertimbangkan interpretabilitas model
Catatan penting:
R² yang tinggi tidak selalu berarti model memiliki prediksi yang akurat
RMSE memberikan gambaran langsung tentang kesalahan prediksi dalam unit asli
Pertimbangkan trade-off antara kompleksitas model dan peningkatan performa

Anda mungkin juga menyukai

Kapita
Belum ada peringkat
Kapita
27 halaman
Bab 2
Belum ada peringkat
Bab 2
9 halaman
Modul Praktik Pertemuan 5 (SVM Classifier)
Belum ada peringkat
Modul Praktik Pertemuan 5 (SVM Classifier)
11 halaman
Machine Learning Dengan Menggunakan Bahasa Python
Belum ada peringkat
Machine Learning Dengan Menggunakan Bahasa Python
11 halaman
Dataset Dan Penerapan Data Mining
Belum ada peringkat
Dataset Dan Penerapan Data Mining
13 halaman
POSB Kelompok 1 Wine Quality Using Linear Regression
Belum ada peringkat
POSB Kelompok 1 Wine Quality Using Linear Regression
25 halaman
Tugas Pertemuan 14 - Bootstrap
Belum ada peringkat
Tugas Pertemuan 14 - Bootstrap
8 halaman
Laporan Praktikum Analisis Deret Waktu Dengan Software R
Belum ada peringkat
Laporan Praktikum Analisis Deret Waktu Dengan Software R
29 halaman
Bootstrapping Dengan R
Belum ada peringkat
Bootstrapping Dengan R
12 halaman
Multivariate General Linear Model (MGLM)
Belum ada peringkat
Multivariate General Linear Model (MGLM)
19 halaman
Machine Learning Model2
Belum ada peringkat
Machine Learning Model2
7 halaman
BAB 3 Penalaran Dan Prediksi Berdasarkan Data
Belum ada peringkat
BAB 3 Penalaran Dan Prediksi Berdasarkan Data
6 halaman
Tutorial R
Belum ada peringkat
Tutorial R
4 halaman
Laporan Tugas 5 Data Mining PDF
Belum ada peringkat
Laporan Tugas 5 Data Mining PDF
7 halaman
Tugas Pert 8 YSW
Belum ada peringkat
Tugas Pert 8 YSW
37 halaman
LPR Week 8
Belum ada peringkat
LPR Week 8
24 halaman
Aplikasi Di R
Belum ada peringkat
Aplikasi Di R
8 halaman
Materi PKB
Belum ada peringkat
Materi PKB
17 halaman
LPR 8
Belum ada peringkat
LPR 8
22 halaman
PPT-Data Mining - Prediksi Laptop Bekas
Belum ada peringkat
PPT-Data Mining - Prediksi Laptop Bekas
19 halaman
JST Tubes
Belum ada peringkat
JST Tubes
15 halaman
TUGAS KELOMPOK CODING-dikonversi
Belum ada peringkat
TUGAS KELOMPOK CODING-dikonversi
16 halaman
Clustering Kmeans
Belum ada peringkat
Clustering Kmeans
44 halaman
LPR - Week 8 - Pandas
Belum ada peringkat
LPR - Week 8 - Pandas
64 halaman
Bank Note Excercises - Group 1
Belum ada peringkat
Bank Note Excercises - Group 1
3 halaman
Mala Tgas 2
Belum ada peringkat
Mala Tgas 2
4 halaman
Module 8
Belum ada peringkat
Module 8
89 halaman
(Modul3) Praktikum Pembelajaran Mesin
Belum ada peringkat
(Modul3) Praktikum Pembelajaran Mesin
18 halaman
Tugas Akhir Praktikum Komputasi Statistika Kelompok 1
Belum ada peringkat
Tugas Akhir Praktikum Komputasi Statistika Kelompok 1
14 halaman
Modul Komputasi Statistik Dengan R Software
Belum ada peringkat
Modul Komputasi Statistik Dengan R Software
34 halaman
8423 ArticleText 15909 1 10 20200423
Belum ada peringkat
8423 ArticleText 15909 1 10 20200423
8 halaman
Proyek Pemodelan Data Dengan Python
Belum ada peringkat
Proyek Pemodelan Data Dengan Python
28 halaman
Romi DM 07 Estimasi Mar2016
Belum ada peringkat
Romi DM 07 Estimasi Mar2016
44 halaman
Estimasi
Belum ada peringkat
Estimasi
32 halaman
Tugas Pertemuan 15 - Validasi Silang
Belum ada peringkat
Tugas Pertemuan 15 - Validasi Silang
5 halaman
Pertemuan 6 - Studi Kasus Model Regresi Linier Dan Implementasi Python-HDG
Belum ada peringkat
Pertemuan 6 - Studi Kasus Model Regresi Linier Dan Implementasi Python-HDG
24 halaman
Tugas M11 - Dinda Ayu Safira - 6003231020
Belum ada peringkat
Tugas M11 - Dinda Ayu Safira - 6003231020
13 halaman
Analisis Arima R
Belum ada peringkat
Analisis Arima R
17 halaman
Peran Python Dalam Prediksi Data
Belum ada peringkat
Peran Python Dalam Prediksi Data
21 halaman
Laporan Praktikum 3 672022337
Belum ada peringkat
Laporan Praktikum 3 672022337
22 halaman
Skripsi Agnes 2016710053 Revisi Bab 3
Belum ada peringkat
Skripsi Agnes 2016710053 Revisi Bab 3
57 halaman
Quiz 6
Belum ada peringkat
Quiz 6
20 halaman
Hitam Krem Modern Memphis Tugas Kelompok Presentasi
Belum ada peringkat
Hitam Krem Modern Memphis Tugas Kelompok Presentasi
18 halaman
Kelompok 5
Belum ada peringkat
Kelompok 5
25 halaman
ARW4
Belum ada peringkat
ARW4
9 halaman
Kelompok Tomodachi
Belum ada peringkat
Kelompok Tomodachi
28 halaman
Laporan 3
Belum ada peringkat
Laporan 3
9 halaman
Laporan Ladata Universitas Pertamina
Belum ada peringkat
Laporan Ladata Universitas Pertamina
17 halaman
Forecasting Menggunakan Metode ARIMA
Belum ada peringkat
Forecasting Menggunakan Metode ARIMA
24 halaman
R7. Best Subset Regression
Belum ada peringkat
R7. Best Subset Regression
7 halaman
UTS Data Science Ridhoghifari 2011010130
Belum ada peringkat
UTS Data Science Ridhoghifari 2011010130
4 halaman
Kevina Alal A'la 225091001111010 Tugas Analisis Data Saham Pengantar
Belum ada peringkat
Kevina Alal A'la 225091001111010 Tugas Analisis Data Saham Pengantar
9 halaman
Hasil Collab
Belum ada peringkat
Hasil Collab
2 halaman
Modul Praktikum 10-Bootstrap
Belum ada peringkat
Modul Praktikum 10-Bootstrap
8 halaman
Fundamental Data Analyst: Minggu Ke - 5
Belum ada peringkat
Fundamental Data Analyst: Minggu Ke - 5
23 halaman
Mini Project 1 - Pmte - Kelompok 4
Belum ada peringkat
Mini Project 1 - Pmte - Kelompok 4
20 halaman
Data Mining
Belum ada peringkat
Data Mining
8 halaman
Pemrograman Berorientasi Objek dengan Visual C#
Dari Everand
Pemrograman Berorientasi Objek dengan Visual C#
Risal
3.5/5 (6)
Membuat Aplikasi Bisnis Menggunakan Visual Studio Lightswitch 2013
Dari Everand
Membuat Aplikasi Bisnis Menggunakan Visual Studio Lightswitch 2013
Risal
3.5/5 (7)