0% menganggap dokumen ini bermanfaat (0 suara)

15 tayangan5 halaman

Hello World ML

Dokumen tersebut memberikan panduan lengkap tentang proses pembelajaran mesin mulai dari persiapan lingkungan (instalasi library), loading data, preprocessing, pemodelan, evaluasi, penyimpanan model, penggunaan kembali model, hingga deployment model menggunakan bahasa pemrograman Python. Prosesnya dijelaskan secara terperinci mulai dari persiapan data, pembuatan pipeline untuk memproses data, pelatihan model, evaluasi kinerja model, hingga penyimpanan dan pen

Diunggah oleh

abdulambia25

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

15 tayangan5 halaman

Hello World ML

Diunggah oleh

abdulambia25

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

Anda di halaman 1/ 5

Hello World

Machine Learning
[email protected]

1. Update the System Ubuntu 22.04

$ sudo apt-get update -y && sudo apt-get upgrade -y

2. Install Python3, pip, dan venv

$ sudo apt install python3 python3-pip python3-venv -y atau python3.10-venv atau
$ sudo pip3 install virtualenv
$ python3 -V
$ pip3 --version
$ pip –version
$ apt list python3-venv
$ sudo pip3 install --upgrade pip

3. Install Jupyter Notebook di Ubuntu 22.04

Jupyter Notebook adalah aplikasi klien server opensource and cross-platform yang ditulis dengan Bahasa pemrograman
Python. Nama “Jupyter” berasal dari beberapa bahasa pemrograman, yaitu: Julia (Ju), Python(py), dan R (er). Selain
ketiga Bahasa pemrograman ini, Jupyter juga mendukung PHP, Java, C++, dan Ruby. Jupyter Notebook dapat diakses
melalui browser web untuk tempat menuliskan kode sumber (source code), dan grafik atau teks keterangan. Aplikasi
Jupyter dapat dijalankan di PC Desktop/Laptop, local server atau di remote server.

$ mkdir jupy
$ cd jupy
$ virtualenv myenv atau
$ python3 -m venv myenv
$ source myenv/bin/activate
$ pip3 install jupyter
$ jupyter notebook

Process ML: identifity the data, prepare data, select the ML algoritm, split data, train model, evaluate, predict dan
deploy.

LANGKAH I: PEMBUATAN MODEL

- Data cleansing
- Feature Engineering
- Modeling
- Evaluasi
- Simpan Model
- Load Model
- Deployment

Karena menggunakan data Iris maka tidak perlu melakukan preprocessing, karena data di setting sudah bisa
digunakan untuk pemodelan, namun masih perlu proses scaling.

1
1. Cek Library
from __future__ import print_function

import IPython
print('IPython:', IPython.__version__)

import numpy
print('numpy:', numpy.__version__)

import pandas
print('pandas:', pandas.__version__)

import sklearn
print('scikit-learn:', sklearn.__version__)

2. Load Data Iris

from sklearn.datasets import load_iris
iris = load_iris()

#extract data menjadi data input dan target untuk mengetahui karakter datanya:
X, y = iris.data, iris.target

(cek type data input, jika model di train dgn data numpy maka input ke modelnya juga harus data numpy)
Sikitlearn terbaru bisa merge: di training dgn input numpy tapi di deployment inputnya dengan data pandas,
tapi tetap tidak di sarankan karena, data dari pandas ada nama kolom nya sedangkan data dari numpy
kolom direpresentasikan dengan nomor index datanya.

type(X)

(outputnya ternyata type data numpy)

#lihat isi data iris di tipe data numpy array, hanya 5 data teratas:
print(X[:5])
print(y[:5])
(outputnya seperti list tapi sebenarnya type data numpy)

Jika dilihat dari data Pandas data frame nya:

# data pandas data frame, import dulu library pandas
import pandas as pd

df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target

df.head()

dari kondisi data diatas sudah bisa di proses untuk pemodelan machine learning, karena telah memenuhi
syarat-syaratnya: tidak ada null, berupa matrik (angka)
namun masih perlu dilakukan preprocessing proses scaling sebelum di masukan dalam Machin Learning SVM
(terserah algoritmanya apa).

2
Perlu di ketahui bahwa: process scaling pasti menggunakan dot fit (.fit), segala sesuatu dalam pemodelan
yang menggunakan dot fit seperti: imputasi, normalisasi, dimension literrediraction bisa digabungkan
dengan modelnya dengan sesuatu yg disebut pipeline, jadi dataset dimasukan ke dalam pipeline yang mana
isi dari pipeline nya adalah scaling dan modeling, meskipun dalam pipeline bisa dimasukkan imputasinya,
normalisasinya dll.

3. Membuat 2 pipeline (pipeline untuk numpy dan pipeline untuk pandas), jika di real hanya 1 pipeline

# buat pipeline untuk data numpy

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import LinearSVC

pipe_numpy = make_pipeline(StandardScaler(), LinearSVC(dual='auto'))

# lakukan hal yang sama untuk data pandas, isinya sama dengan numpy hanya dibedakan variablenya saja:
pipe_pandas = make_pipeline(StandardScaler(), LinearSVC(dual='auto'))

4. #Split dataset
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

# split data numpy

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=46)

# split data pandas

df_train, df_test = train_test_split(df, test_size=0.2, random_state=46)

5. Training data
# train model data numpy
pipe_numpy.fit(X_train, y_train)

# evaluasi model numpy

y_pred = pipe_numpy.predict(X_test)
print(“Hasil Evaluasi Model Numpy”)
print(classification_report(y_test, y_pred))

# train model data pandas

#pisahkan dulu data input dan targetnya karena masih dalam satu data frame
X_train_df, y_train_df = df_train.drop(‘target’, axis=1), df_train[‘target’]
X_test_df, y_test_df = df_test.drop(‘target’, axis=1), df_test[‘target’]

#========== cara lain memisahkan X dan Y

pipe_pandas.fit(df_train.drop('target', axis=1), df_train['target'])

# evaluasi model
y_pred = model_pandas.predict(df_test.drop('target', axis=1))
print(classification_report(df_test['target'], y_pred))
#================ end cara lain

3
pipe_pandas.fit(X_train_df, y_train_df)

# evaluasi model numpy

y_pred_df = pipe_pandas.predict(X_test_df)
print(“Hasil Evaluasi Model Pandas”)
print(classification_report(y_test_df, y_pred_df))

6. # simpan model yg sudah di train

import pickle
#atau joblib
#numpy
with open("model_numpy.pkl", "wb") as model_file:
pickle.dump(pipe_numpy, model_file)

#pandas
with open("model_pandas.pkl", "wb") as model_file:
pickle.dump(pipe_pandas, model_file)

7. Load Model
#load model numpy
with open("model_numpy.pkl", "rb") as model_file:
loaded_numpy_model = pickle.load(model_file)

#cara pakai model yg terload, pastikan jumlah dan posisi fiture banar sama
dengan saat di training tidak boleh ketukar, misalnya kita punya new_data:

#new_data = [1,1,1,1]
#artinya: sl, sw, pl, pw nya 1 cm
#dan itu masih berupa vector padahal di ML mengasumsikannya selalu data majemuk (matrik), maka harus
diubah ke dalam data matrik:
new_data = [[1,1,1,1]]
loaded_numpy_model.predict(new_data)

#hasil prediksinya: aaray([1]), artinya? Cek artinya dengan:

iris.target_names
array([‘setosa’, ‘versicolor’, ‘virginica’], dtype=’<U10’) index 0, 1, 2, 3: berarti array([1]) artinya Versicolor.

#load model pandas

with open("model_pandas.pkl", "rb") as model_file:
loaded_pandas_model = pickle.load(model_file)

# inference model
new_data = [1, 2, 3, 4]
new_data = pd.DataFrame([new_data], columns=iris.feature_names)

#cek new_datanya:
new_data

#memprediksi data new_data:

loaded_pandas_model.predict(new_data)

4
LANGKAH II: DEPLOYMENT > SERVING (REPORTING, SCORING, API)

8. hj

Sumber:

https://linuxhint.com/install-jupyter-notebook-ubuntu-22-04/
https://www.digitalocean.com/community/tutorials/how-to-set-up-jupyter-notebook-for-python-3
https://www.rosehosting.com/blog/how-to-install-jupyter-notebook-on-ubuntu-22-04/

Anda mungkin juga menyukai

Panduan Praktikum Data Mining Menggunakan Python 2020
100% (1)
Panduan Praktikum Data Mining Menggunakan Python 2020
63 halaman
Pemrograman Berorientasi Objek dengan Visual C#
Dari Everand
Pemrograman Berorientasi Objek dengan Visual C#
Risal
3.5/5 (6)
Machine Learning Dengan Menggunakan Bahasa Python
Belum ada peringkat
Machine Learning Dengan Menggunakan Bahasa Python
11 halaman
5 Implementasi Machine Learning Menggunakan Bahasa Python
Belum ada peringkat
5 Implementasi Machine Learning Menggunakan Bahasa Python
22 halaman
Pemrograman Untuk Machine Learning
Belum ada peringkat
Pemrograman Untuk Machine Learning
5 halaman
Tool ML 3#2024
Belum ada peringkat
Tool ML 3#2024
48 halaman
Exca Wella Monica - G1A020018 - Tugas Praktikum DatMin
Belum ada peringkat
Exca Wella Monica - G1A020018 - Tugas Praktikum DatMin
3 halaman
Fadly Septian Haryono 21538144022 H S1-TE'21 SVM Using Phyton
Belum ada peringkat
Fadly Septian Haryono 21538144022 H S1-TE'21 SVM Using Phyton
9 halaman
G1A020034 - Rahmita Dwi Kurnia - Tugas Datming
Belum ada peringkat
G1A020034 - Rahmita Dwi Kurnia - Tugas Datming
5 halaman
G - L200200122 - Adi Mas Setiawan - Modul8 Dan 9
Belum ada peringkat
G - L200200122 - Adi Mas Setiawan - Modul8 Dan 9
17 halaman
Klasifikasi Beras Menggunakan Algoritma MobileNetV2
Belum ada peringkat
Klasifikasi Beras Menggunakan Algoritma MobileNetV2
21 halaman
Tugas ANN
Belum ada peringkat
Tugas ANN
10 halaman
Makalah Integrasi Pandas NumPy ScikitLearn
Belum ada peringkat
Makalah Integrasi Pandas NumPy ScikitLearn
4 halaman
Fadly Septian Haryono 21538144022 H S1-TE'21 SVM Using Phyton
Belum ada peringkat
Fadly Septian Haryono 21538144022 H S1-TE'21 SVM Using Phyton
10 halaman
Kelompok-3 7A Tugas-2 MachineLearningModelSelection IlmuData
Belum ada peringkat
Kelompok-3 7A Tugas-2 MachineLearningModelSelection IlmuData
11 halaman
Kelompok-3 - 7A - Tugas-3-Evaluation and Visualization - IlmuData
Belum ada peringkat
Kelompok-3 - 7A - Tugas-3-Evaluation and Visualization - IlmuData
12 halaman
Kelompok 3 7A Tugas 4 Cross Validation IlmuData
Belum ada peringkat
Kelompok 3 7A Tugas 4 Cross Validation IlmuData
13 halaman
Uas MCL
Belum ada peringkat
Uas MCL
7 halaman
G - L200200249 - Carissa Aprilia Pranowo - Modul8 Dan 9
Belum ada peringkat
G - L200200249 - Carissa Aprilia Pranowo - Modul8 Dan 9
15 halaman
25 Materi 6 Decision Tree
Belum ada peringkat
25 Materi 6 Decision Tree
9 halaman
Jobsheet 9 - Herlambang & Candra
Belum ada peringkat
Jobsheet 9 - Herlambang & Candra
30 halaman
Belajar Machine Learning Dengan Python (Bagian 1) - Inixindo Jogja
Belum ada peringkat
Belajar Machine Learning Dengan Python (Bagian 1) - Inixindo Jogja
8 halaman
Tugas 9
Belum ada peringkat
Tugas 9
3 halaman
LA Python
Belum ada peringkat
LA Python
7 halaman
Uraian Hasil Dan Pembahasan Detail
Belum ada peringkat
Uraian Hasil Dan Pembahasan Detail
3 halaman
Peran Python Dalam Prediksi Data
Belum ada peringkat
Peran Python Dalam Prediksi Data
21 halaman
Materi PKB
Belum ada peringkat
Materi PKB
17 halaman
Kelompok Tomodachi
Belum ada peringkat
Kelompok Tomodachi
28 halaman
Machine Learning - Kharisma Sda - 8020210009
Belum ada peringkat
Machine Learning - Kharisma Sda - 8020210009
4 halaman
1 Introduction To Machine Learning With Python
Belum ada peringkat
1 Introduction To Machine Learning With Python
17 halaman
コピー SOAL UTS -Data Scienc&Analitik Data-GANJIL 2023-2024
Belum ada peringkat
コピー SOAL UTS -Data Scienc&Analitik Data-GANJIL 2023-2024
10 halaman
Modelling Data
Belum ada peringkat
Modelling Data
2 halaman
Makalah Mata Kuliah Pengolahan Citra
Belum ada peringkat
Makalah Mata Kuliah Pengolahan Citra
15 halaman
Pertemuan 1.2 (Ok) - Praktikum
Belum ada peringkat
Pertemuan 1.2 (Ok) - Praktikum
15 halaman
Tugas Python
50% (2)
Tugas Python
6 halaman
03 - Modul Praktikum JST Untuk Memprediksi Harga Mobil Yang Dibeli - Final
Belum ada peringkat
03 - Modul Praktikum JST Untuk Memprediksi Harga Mobil Yang Dibeli - Final
18 halaman
Tugas Data Set
Belum ada peringkat
Tugas Data Set
3 halaman
Tugas Kelompok Desicion Tree
Belum ada peringkat
Tugas Kelompok Desicion Tree
2 halaman
Manual Book - Tiara Fatehana Aulia
Belum ada peringkat
Manual Book - Tiara Fatehana Aulia
31 halaman
Laporan Summary Modul 5
Belum ada peringkat
Laporan Summary Modul 5
17 halaman
Tugas Machine Learning
Belum ada peringkat
Tugas Machine Learning
6 halaman
Tugas Nb-Playtennis DataMining
Belum ada peringkat
Tugas Nb-Playtennis DataMining
9 halaman
Tugas Akhir Machine Learning
Belum ada peringkat
Tugas Akhir Machine Learning
6 halaman
Modul 4
Belum ada peringkat
Modul 4
7 halaman
UTS Data Science Ridhoghifari 2011010130
Belum ada peringkat
UTS Data Science Ridhoghifari 2011010130
4 halaman
Coding Penelitian C45
Belum ada peringkat
Coding Penelitian C45
5 halaman
Latihan Membuat Model Klasifikasi Gambar
Belum ada peringkat
Latihan Membuat Model Klasifikasi Gambar
10 halaman
LA2 - Mufid Kholid - 3IA16 - 50421852
Belum ada peringkat
LA2 - Mufid Kholid - 3IA16 - 50421852
8 halaman
Tugas 4 Neural Network
Belum ada peringkat
Tugas 4 Neural Network
4 halaman
Pertemuan 4 Ai
Belum ada peringkat
Pertemuan 4 Ai
31 halaman
Objek 6 Praktikum Analisis Sistem
Belum ada peringkat
Objek 6 Praktikum Analisis Sistem
10 halaman
Spesifikasi Tugas Besar - AI
Belum ada peringkat
Spesifikasi Tugas Besar - AI
4 halaman
Analisis Dan Pembahasan Klasifikasi Kanker Payudara Dengan Metode SVM & Naïve Bayes
Belum ada peringkat
Analisis Dan Pembahasan Klasifikasi Kanker Payudara Dengan Metode SVM & Naïve Bayes
9 halaman
Track 1 - 4 Months
Belum ada peringkat
Track 1 - 4 Months
7 halaman
Kuis Bda Kelompok2
Belum ada peringkat
Kuis Bda Kelompok2
10 halaman
LKM 6 - Kelompok 7 - PKB
Belum ada peringkat
LKM 6 - Kelompok 7 - PKB
12 halaman
IF3170 Inteligensi Buatan Tugas Besar II: Eksplorasi Scikit-Learn Pada Jupyter Notebook 25oktober 2017
Belum ada peringkat
IF3170 Inteligensi Buatan Tugas Besar II: Eksplorasi Scikit-Learn Pada Jupyter Notebook 25oktober 2017
1 halaman
Prediksi Kualitas Air Menggunakan Artifi
Belum ada peringkat
Prediksi Kualitas Air Menggunakan Artifi
34 halaman
5484-Article Text-21838-1-10-20230827
Belum ada peringkat
5484-Article Text-21838-1-10-20230827
8 halaman
Membuat Aplikasi Bisnis Menggunakan Visual Studio Lightswitch 2013
Dari Everand
Membuat Aplikasi Bisnis Menggunakan Visual Studio Lightswitch 2013
Risal
3.5/5 (7)