Python For Data Processing - Rakamin Trial Class
Python For Data Processing - Rakamin Trial Class
(with python)
Session Outline
1. Pengenalan Python
2. Pengenalan Data Frame
3. Data Sorting
4. Data Filtering
5. Data Aggregation
Pengenalan
Python
Apa itu Python?
Mudahnya...
Python adalah bahasa pemrograman yang mudah dipahami oleh
manusia dan dapat digunakan untuk berbagai tujuan, mulai dari
analisis data, membuat website, aplikasi dll
Pemanfaatan Python Dalam Data Science
❖ Pengolahan Data
❖ Visualisasi Data
❖ Perhitungan Statistika
❖ Pemodelan Machine Learning
❖ Model Deployment
❖ dsb...
Jupyter Notebook
Kelebihan: Kekurangan:
● built-in-library data science yang lengkap ● harus online saat menggunakan
● tidak memakan space dalam memori komputer ● auto-restart setelah 12 jam
● data dapat diakses dan diedit dengan mudah ● butuh install ulang library lain
● mempermudah kolaborasi
● terintegrasi dengan tools Google lainnya
Hands On Information
bit.ly/DataProcessingRakamin
Source Code:
Hands On - Data Processing.ipynb
Dataset :
rakamin_class.csv
Variabel
Mudahnya. . .
Variabel adalah suatu element nama yang memiliki nilai dan nilai nya dapat ubah-ubah.
Contoh:
Maka tinggi badan dalam konteks ini adalah variabel yang didefinisikan memiliki nilai 173,
nilai dari 173 ini bisa berubah-ubah.
Pengenalan
Data Frame
Apa itu Data Frame?
row/baris
Apa itu Pandas?
Pandas Library
Data Frame
Membaca DataFrame dari File CSV
Operasi Sederhana Data Frame
no function kegunaan
Dadan 60 Memasak
nama umur hobi
Heru 17 Berkebun
Dadan 60 Memasak
Yonathan 55 Musik
Heru 17 Berkebun
Andaru 26 Basket
Format Code
Yonathan 55 Musik
df.sort_values(<column_name>, ascending = True )
Contoh Code
df.sort_values( ‘nama’, ascending = True )
Ascending vs Descending
umur terurut dari kecil ke besar umur terurut dari besar ke kecil
Code
df[filter]
Filtering Kolom
Code
df[df[‘<column>’] == <value>]
df[ df[‘sepatu’]==’adidas’ ]
Ambil data dengan nilai kolom sepatu adalah adidas
Operasi Perbandingan
df[df[‘<column>’] == <value>]
Operator Deskripsi
& AND
| OR
~ NOT
Data
Aggregation
Apa itu Data Aggregation?
Dadan 60 40 Memasak
Firman 15 39 Memasak
Ujang 33 43 Renang
Heru 17 41 Renang
Ilham 44 44 Musik
Joshua 22 39 Musik
Petra 37 40 Musik
Apa itu Data Aggregation?
Dadan 60 40 Memasak
Firman 15 39 Memasak
● Berapa rata-rata umur tiap grup
Ujang 33 43 Renang Hobi?
Heru 17 41 Renang
Andaru 26 41 Renang
Yonathan 55 40 Musik
Ilham 44 44 Musik
Joshua 22 39 Musik
Petra 37 40 Musik
Apa itu Data Aggregation?
Dadan 60 40 Memasak
Firman 15 39 Memasak
● Berapa rata-rata umur tiap grup
Ujang 33 43 Renang Hobi?
Heru 17 41 Renang
- Memasak = (60+15)/2
Andaru 26 41 Renang
Yonathan 55 40 Musik
Ilham 44 44 Musik
Joshua 22 39 Musik
Petra 37 40 Musik
Apa itu Data Aggregation?
Dadan 60 40 Memasak
Firman 15 39 Memasak
● Berapa rata-rata umur tiap grup
Ujang 33 43 Renang Hobi?
Heru 17 41 Renang
- Memasak = (60+15)/2
Andaru 26 41 Renang
Ilham 44 44 Musik
Joshua 22 39 Musik
Petra 37 40 Musik
Apa itu Data Aggregation?
Dadan 60 40 Memasak
Firman 15 39 Memasak
● Berapa rata-rata umur tiap grup
Ujang 33 43 Renang Hobi?
Heru 17 41 Renang
- Memasak = (60+15)/2
Andaru 26 41 Renang
Ilham 44 44 Musik
- Musik = (55+44+22+37)/4
Joshua 22 39 Musik
Petra 37 40 Musik
Apa itu Data Aggregation?
Dadan 60 40 Memasak
Firman 15 39 Memasak
● Berapa rata-rata umur tiap grup
Ujang 33 43 Renang Hobi?
Heru 17 41 Renang
● Berapa nomor sepatu terbesar tiap
Andaru 26 41 Renang grup Hobi?
Yonathan 55 40 Musik
● Ada berapa orang yang memiliki hobi
Ilham 44 44 Musik
Musik?
Joshua 22 39 Musik
Petra 37 40 Musik
Aggregation
Code
statistik kegunaan
.count() menghitung total baris
Dadan 60 L Memasak
Firman 15 L Memasak
Andaru 26 L Renang
Yonathan 55 L Musik
Ilham 44 L Musik
Andien 22 P Musik
Jessica 37 P Musik
Operasi Lain
(Sneak Peek)
Terima Kasih