0% menganggap dokumen ini bermanfaat (0 suara)
185 tayangan7 halaman

Pembelajaran Machine Learning

Dokumen tersebut memberikan penjelasan tentang konsep dasar pembelajaran mesin, termasuk: 1. Penjelasan tentang fungsi, list, dictionary, conditional, iterasi, dan list comprehension dalam pemrograman Python. 2. Pengenalan tools seperti NumPy, Pandas, dan Scikit-learn yang berguna untuk mesin pembelajaran. 3. Cara menganalisis data frame menggunakan Pandas seperti head(), tail(), describe(), dan filtering data. 4. Teknik pra-pemrosesan data kategorikal seperti

Diunggah oleh

Panji Laksono
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
185 tayangan7 halaman

Pembelajaran Machine Learning

Dokumen tersebut memberikan penjelasan tentang konsep dasar pembelajaran mesin, termasuk: 1. Penjelasan tentang fungsi, list, dictionary, conditional, iterasi, dan list comprehension dalam pemrograman Python. 2. Pengenalan tools seperti NumPy, Pandas, dan Scikit-learn yang berguna untuk mesin pembelajaran. 3. Cara menganalisis data frame menggunakan Pandas seperti head(), tail(), describe(), dan filtering data. 4. Teknik pra-pemrosesan data kategorikal seperti

Diunggah oleh

Panji Laksono
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 7

PEMBELAJARAN 01

INTRODUCING TO MACHINE LEARNING

Syntax/Simbol/Button/Input Keterangan/Pengertian

LEARN #6

def nama_fungsi (input) :


Ini adalah bagian dari FUNGSI
return output

[ ____ , _____ , _____ ] Disebut dengan List

{ Key : Value} Disebut dengan Dictionary

if <kondisi>:
<action>
elif <kondisi>:
Disebut dengan Conditional
<action>
else<kondisi>:
<action>

for a in b : Disebut dengan Iterasi

for i in range (0, 5):


Disebut dengan Daftar Pangkat
a.append(i**2)

Disebut dengan List Comprehesion, list ini lebih efisien


[i**2 for in range (0, 5)]
mengkuadratkan langsung karena langsung dieksekusi didalam List

LEARN #7

Tools
#Numerical Python (Numpy) -> import Adalah Operation Math
co: import numpy

as Adalah sebagai singkatan contoh numpy as np

np.sum(variable)
Math Function
np.std(variable)dll

Klik SHIFT + TAB Melihat Deskripsi tools yanga kan digunakan


np.random.rand() Memunculkan angka random()

Arange Disusun

Mengacak dengan data tetapi dengan random acak yang tidak


Randomstate
berubah biasa disebut Controlled Randomness

LEARN #8

Pandas Untuk menganalisis data Panel Data's (PANDAS) as pd

Luwiji Adalah Package untuk Machine Learning

Membuat Data Frame - Objeck pada python yang berisi kolom dan
pd.DataFrame(variable)
index

Membaca Data dari File


df = pd.read.csv("alamat
df = Data Frame
file/cari/cari/")
CSV = Format pada file Excel (COMMA SEOARATED VALUE)

Method untuk menampilkan data paling atas default menampilkan 5


df.head()
teratas

Method untuk menampilkan data paling bawah default menampilkan


df.tail()
5 bawah

df.columns menampilkan semua kolom

df.index menampilkan index

df.shape menampilkan (data, kolom)

Slicing .iloc dan .loc = integer location & Location


df.loc(nama baris, nama kolom)
Mengambil data kolom sampai sebagian #Slice menggunakan nama

Mengambil data kolom sampai sebagian #Slice menggunakan


df.iloc(nama baris, nama kolom)
Angka

df = pd.read.csv("alamat/cari",
index_col='name') Mengganti Name menjadi kolom index
df.head()

Data Frame Summary Statistik


df.corr()
korelasi antar tabel

deskripsi seluruh data dengan munculnay angka


df.describe()
Untuk mencari jumlah data yang Numerikal'
Count
df.info() mencari tau jumlah data informasi yang terkumpul pada data
kategori

df.mfr.value_counts() melihat jumlah kategori pada kolom mfr

Uniqe
df.mfr.uniqe() menampilkan array kumpulan kategori yang terdapat pada kolom
mfr

df.nuique() melihat seluruh kolom secara unik yang berbeda

df.rating.head() menampilkan data rating seperti pandas berbentuk baris

Series Adalah Barisan

NaN value Singkatan dari Not a Number (Data Bolong)

df.isna().sum() melihat perjumalahan data yang bolong

data bolong bisa di Reprosessing (bisa dibuang bisa di isi)

df.dropna() menghapus data pada baris

df.fillna("value") mengisi data yang kosong

mengisi data data dengan memfilter perbagian kolom kalau di atas


filler = {"kolom" : "isi apa ?", dll}
kan mengubah untuk semua NaN

df.fillna(filler).head() panggil filler untuk mengubah data

mengubah isi data dengan rata rata setiap kolom tetapi ini khusus
df.fillna(df.mean()).head()
untuk bilangan numerikal

df.fillna(df.mean(), inplace=True) menimpa dengan variable yang sama dan sudah termasuk data
df.head() perubahan permanen

df.to_csv("Alamat file/namafile.csv",
Cara save to CSV
index_label="nama indeks bebas")

LEARN #9

Conditional and More Pandas

df[df.rating > 70] cara untuk mengambil data tertentu

illustration.nomenklaktur melihat deskripsi pada data

df[-(df.shelf == 1)] menampilkan 2 data dari 3 data

df[(df.rating> 50) & (df.fat == 0)] kombinasi untuk filtering antara 2 kebutuhan data yang ingin
dimunculkan (AND)

kombinasi untuk filtering antara 2 kebutuhan data yang ingin


df[(df.rating> 50) | (df.fat == 0)]
dimunculkan tetapi kondisi sesuai salah satu kebutuhan data (OR)

df[df.mfr.isin(['K', 'N']) | (df.rating > 70)] menampilkan data K, N dengan dating lebih dari 70

df_my_preferences = df[(df.rating > 70) hal ini bertujuan agar membuat data frame baru tanpa mengubat
& (df.mfr.isin(['K', 'N']))].copy() Data Frame di awal dengan tambahan .copy() dibelakang

SORTING
df_my_preferences.sort_value("rating")
Mengurutkan dari terkecil ke terbesar bisa :

df_my_preferences.sort_value("rating")
agar mengurutkan dari terbesar ke terkecil
, ascending=false

df_my_preferences.sort_value("rating")
agar data awal tidak berubah
, ascending=false, inplace=True

df.groupby("shelf").mean() GROUPBY (Optional)


df.groupby(["mfr", "shelf"]).mean() .mean() = melihat rata-rata
.count() = melihat jumlah
.size() = menjumlahkan semua dari Count()

df.pivot_table( index = "mfr", columns =


"vitamin", values = "rating", Menampilkan plot table index
aggfunc='mean')

NEW COLUMNS AND DROP


df["kolom_baru"] =
Menambahkan Kolom baru dengan value berisi angka acak
np.random.rand(len(df))
menggunakan package numpy

df.head() panggil data

df.drop[columns "kolom_baru",
Menghapus data kolom_baru
inplace=True]

Map :
df["shelf_name"] =
Memetakan/pemetaan contoh nya memetakan shelf 1 sebagai
df.shelf.map({1:"bawah", 2:"tengah",
bawah shelf 2 sebagai tengah dan shelf 3 sebagai atas
3:"atas"})
df.head()

Apply : Menambahkan pemrosesan data berkelanjutan misal dari awal


def convert_g_to_mg(x):
return 1000*x

df["fat_mg"] =
df.fat.apply(convert_g_to_mg) =
panggil Apply satuan data tersebut gram bisa dibuatkan function untuk convert
df.head() = Panggil data dimana data tersebut bisa di Apply menggunakan function yang
telah dibuat
df["protein_mg"] =
df.protein.apply(lambda x: x*1000)
cara tercepat apply tanpa harus
membuat function
df.head() = Panggil data

Transform :
df["scaled_rating"] =
df.rating.transform(lambda x: ((x-
x.min())/(x.max()-x.min()))) =
df.head()

Fungsi dari inplace=True Agar data berhasil ditimpa

LEARN #10

ML tidak bisa menerima Objek nya String = ML hanya bisa memasukkan angka
1.
Data dari Kategori berubah menjadi angka untuk bisa di Proses ke ML

2. ada 2 Tipe cara atau Proses :


1. Label Encoding / Ordinal Encoding
Mapping biasa co : bawah (0) - tengah (1) - atas (2)
Biasanya digunakan untuk tipe Boolean atau hanya memilik 2 variabel data tidak lebih
Biasa digunakan saat variabel data nya Berurutan

2. Dummy Variabel Encoding / One Hot Encoding


Lebih Efektif co :
Shelf = bawah (isBawah) - tengah (isTengah) - atas (isAtas)
Bawah (100) - tengah (010) - atas (001)
Digunakan kebalikan dari Label encoding (Metode ini lebih umum) bisa mendapatkan kelebihan
informasi

LEARN #11

Kernel -> Restart and All Cara untuk menjalankan Project yang sudah lama ketutup

df = pd.get.dummies(df, columns=
One Hot Encoding
['vitamin'], prefix_sep = "_ _")

merubah pembagian object pada column tertentu sehingga data


One Hot Encoding
yang dihasilkan dapat diolah nantinya di Machine Learning

Map dapat digunakan sebagai label encoding

Mengubah Kategori menjadi Numerik


disebut dengan co :
Umur dari Numerik menjadi Kategorical
0 - 5 balita
Binning 5 - 10 anak
10 - 18 remaja
18 - 40 dewasa
40 - 100 lansia
df.sodium.hist(bins=10)

Histogram adalah bentuk plot berbentuk diagram batang

df['sodium_bin'] = pd.cut(df.sodium,
menentukan nilai binning dengan jumlah saja
bins=3, labels=['low','medium','high'])

df['sodium_bin'] = pd.cut(df.sodium,
menentukan nilai binning dengan list interval 0-100, 100-200, dan
bins=[0, 100, 200, df.sodium.max()],
200-max
labels=['low','medium','high'])

df.sodium.max()/3 Melihat jumlah data sodium dibagi 3

LEARN #12

adalah plot untuk visualisasi


MATPLOTLIB
caranya mengimport : import matplotlib.pyplot as plt

X = np.linespace (0, 10, 10) membuat nilai X dari 0 hingga 10 yang terbagi menjadi 10 bagian
y = np.sqrt(X) mendapatkan nilai dari akar X

flg = plt.figure()
Inisialisasi Figure dan Axes (Koordinat)
ax = plt.axes()

fig = plt.figure(figsize=(6, 6))


ax = plt.axes()
Menambahkan Konten di dalam Figure
ax.plot(X, y1)
ax.plot(X, y2)

plt.figure(figsize=(6, 6)) Shorcut (Jalan Pintas)


plt.plot(X, y1, 'r', linewidth= ......) = merubah warna merah
plt.plot(X, y2, 'b', markersize = ......) = merubah warna biru
plt.xlim(0, 10) Menentukan limit yang dimunculkan pada nilai X
plt.ylim(-2, 2) Menentukan limit yang dimunculkan pada nilai y
plt.title("Sin dan Cos") Menamai Label Judul Plot
plt.xlabel ("Nilai X") Menamai Label X
plt.ylabel("Nilai Y") Menamai Label Y
plt.axis('equal') Menampilkan dengan skala ploting yang sama

Linewidth menentukan tebal nya plot

markersize menentukan ukuran jenis plot

Anda mungkin juga menyukai