0% menganggap dokumen ini bermanfaat (0 suara)
125 tayangan

Analysis Data Dengan Python

Jupyter Notebook memiliki antarmuka yang mudah digunakan untuk membuat dan berbagi dokumen yang interaktif dan dinamis. Notebook dapat dibuka melalui antarmuka grafis atau perintah terminal, dan menawarkan berbagai fitur seperti pengelolaan sel, penyunting kode, dan visualisasi data.

Diunggah oleh

Pear Library
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
125 tayangan

Analysis Data Dengan Python

Jupyter Notebook memiliki antarmuka yang mudah digunakan untuk membuat dan berbagi dokumen yang interaktif dan dinamis. Notebook dapat dibuka melalui antarmuka grafis atau perintah terminal, dan menawarkan berbagai fitur seperti pengelolaan sel, penyunting kode, dan visualisasi data.

Diunggah oleh

Pear Library
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 38

Analisis data

dengan Python

Nanda Fadhli

Pendidikan:

FMIPA, Pend. Matematika,

UNP (2011)

FMIPA, Statistika Terapan,

IPB University (2017)

Pengalaman Kerja:

Jr. Data Scientist Consultant di PT Kognitif Skema

Indonesia (Juli 2019 - Des 2019)

Data Scientist Associate Consultant di PT Metrodata

Eletronics, Tbk (Des 2019 - Des 2021)


Nanda Fadhli

Pengalaman Kerja:

Data Science and Analytics Speaker di Multiple Data

Analytics Platform (Okt 2021 - sekarang)

Data Science and Management Coordinator di PT

Petrosea, Tbk (Des 2021 - sekarang)

Microsoft Certified: Azure Data Scientist Associate (DP-100)

Apa yang kamu


peroleh di modul ini?

Mempelajari sintaks python untuk analisis data


Memahami tipe bilangan dan variabel pada python
Belajar cara membersihkan data dengan numpy 

dan pandas
Belajar mengeksplorasi data dengan visualisasi
Menganalisis data time series
Mengenal Python

Apakah Python = Ular ? 

Tidak guys 



Python merupakan bahasa pemrograman tingkat

tinggi yang banyak digunakan untuk pengembangan

aplikasi web, perangkat lunak, ilmu data (baca:

analisis data), serta machine learning.


Pentingnya Python
untuk Analisis Data

Kenapa harus Python?

Tingkat fleksibilitas python tergolong tinggi, di


antaranya*:

Dapat diunduh secara gratis


Mudah dipelajari
Dapat dijalankan di berbagai platform
Terintegrasi baik sistem manapun
Banyak komunitas diskusi developer
*Sumber: dimodifikasi dari Apa itu Python? - Panduan Pengguna Pemula Cloud
untuk Python - AWS (amazon.com)
IDE* terbaik untuk
Python

Pada 2020, KDnuggets mengadakan survey


terkait IDE yang digunakan developer Python.

Responden sebanyak 2500 orang, diberi


kesempatan untuk memilih hingga 3 buah editor.
Jupyter notebook muncul sebagai editor yang
terbanyak digunakan.
Jupyter : Julia, Python, R

Source : Here are the Most Popular Python IDEs/


Editors - KDnuggets

*(Integrated development editor)

Bagaimana
cara
mendapat Instalasi menggunakan
sintaks
Instalasi tidak perlu
sintaks

kan Jupyter Memerlukan coding yang


cukup kompleks pada
User friendly

Notebook?
beberapa kondisi Terdapat ribuan Pre-built
python library, khususnya
Pre-built library python untuk ilmu data
sedikit
Cara terbaik untuk install jupyter Terdapat fitur pengelolaan
Notebook adalah via Anaconda Membutuhkan pengetahuan dependensi library
software
dependensi library
Kenapa Anaconda ?

Anaconda repository Anaconda bisa di-


memiliki lebih dari 8000 compile untuk semua
open-source data science operating system dan
dan machine learning arsitektur

library. 

Kesimpulan

Berikut beberapa point yang bisa disimpulkan


pada video kali ini:

Python digunakan dalam berbagai bidang, salah


satunya adalah analisis data
Python merupakan bahasa pemrograman yang
populer*
Jupyter notebook adalah IDE paling banyak
digunakan developer
Perbandingan
analisis data
dengan
spreadsheet,
SQL, & python

Video Agenda

Pada video ini peserta diharapkan dapat :

Memahami kelebihan dan kekurangan

google spreadsheet, SQL, dan Python

Memahami contoh kasus analisis data

yang diselesaikan menggunakan

google spreadsheet, SQL, dan Python


Google spreadsheet vs Python

Google Spreadsheet Python

Kemudahan
Sangat mudah Sedang
penggunaan
Apakah harus
memilih salah satu? Batas jumlah Performa akan lambat
Big data
baris data jika baris >20.000 data
Tentu tidak. Python
dan spreadsheet Cepat untuk Lebih cepat untuk
adalah kolaborasi Kinerja
tugas sederhana tugas kompleks

yang sempurna

Kemampuan Bisa menggunakan Google Bisa menggunakan crontab, apscheduler,

otomatisasi App script, Zapier, dll task scheduler, dan cloud services

Konektivitas
On premise + Cloud On premise + Cloud
database
SQL vs Python

Kategori SQL Python


Apakah harus
memilih salah satu? Pengambilan Hanya mengambil Bisa mengambil data dari source
Tentu tidak. Kita data data dari database manapun, termasuk database

justru bisa
menggunakan Pemrosesan Menggunakan custom query Memiliki library untuk
keduanya data untuk memproses data memudahkan analisis data
sekaligus. Seperti Visualisasi Hanya bentuk tabular Tabular dan Grafik, punya
menggunakan data (e.g.:tabel pivot) library untuk visualisasi
library pyspark,
dask-snowflake, Kinerja
Manipulasi data Logika pemrograman
atau dask-mongo,
dsb. Melacak Bisa menggunakan Git, Bisa menggunakan Git,
perubahan code mercurial, dan SVN mercurial, dan SVN
Contoh kasus yang diselesaikan dengan
spreadsheet, SQL, dan Python

date pm25 AQI


site AQI Category
month year

12/21/2015 22 72 Jakarta Central


Moderate
12 2015

12/22/2015 22.0125
71.79166667
Jakarta Central
Moderate
12 2015

12/23/2015 19.45 66.54166667


Jakarta Central
Moderate
12 2015

12/24/2015 23.9625 76.08333333


Jakarta Central
Moderate
12 2015

12/25/2015 20.85
68.29166667
Jakarta Central
Moderate
12 2015

Data air quality index dari airnow.gov


Q : Sajikan rata-rata nilai PM2.5 dalam pertahun dan perbulan!

A : Menghitung rata-rata nilai PM2.5 dalam pertahun dan perbulan

Contoh case dengan versi Spreadsheet

Q : Bagaimana cara melihat sebaran rata-rata polusi udara (PM2.5) pertahun dan perbulan?

Caranya: Input Output


Klik Tab Insert
Pilih “pivot table”
Pilih year dan month
sebagai “rows”
Pilih pm25 sebagai
“values” dan pilih metrik
“average”
GUI based menu, user friendly

Contoh case dengan versi SQL

Q : Bagaimana cara melihat Input Output


sebaran rata-rata polusi udara
(PM2.5) pertahun dan
perbulan?

Tulis query yang sesuai


untuk menghitung rata-
rata berdasarkan tahun
dan bulan
menggunakan group by
dan order by

Contoh case dengan versi Python

Output
Q : Bagaimana cara melihat sebaran rata-rata
polusi udara (PM2.5) pertahun dan perbulan?

Kamu bisa menulis sintaks python untuk


solusi ini bahkan dalam 1 baris code saja

Input
Contoh kolaborasi Spreadsheet, SQL, 

dan Python dalam real case

Misalkan kamu memiliki bisnis dengan 4 toko yang berbeda daerah. Kamu ingin data

“penjualan” harian bisa disimpan secara teratur untuk dianalisis oleh tim Data Analyst.

Berikut adalah contoh skema solusi arsitekturnya.

Kesimpulan

Berikut beberapa point yang bisa disimpulkan


pada video kali ini:

Spreadsheet, SQL, dan Python memiliki


kelebihan dan kekurangan masing-masing
Ketiga tools tersebut dapat dikolaborasikan
untuk menyelesaikan suatu problem data
analisis
Anaconda
Installation -
Windows OS

Video Agenda

Pada video 3 ini peserta diharapkan dapat :

Melakukan proses instalasi software

anaconda versi windows OS secara

mandiri
Prosedur instalasi
software anaconda
Windows OS

Periksa spesifikasi laptop, windows logo + R


Buka web anaconda Anaconda | The World's
Most Popular Data Science Platform
Pilih versi anaconda yang sesuai
Unduh
Instal
Periksa spesifikasi laptop (keep)
+ screencast

Tekan windows+R

Terlihat bahwa laptop memiliki


Windows 10, 64-bit

Next pilih versi anaconda yang
sesuai dengan laptop

Kesimpulan

Berikut beberapa poin yang bisa disimpulkan


pada video kali ini:

Proses instalasi anaconda tergolong


mudah dan bisa dilakukan mandiri
Anaconda
Installation -
Mac OS

Video Agenda

Pada video 3 ini peserta diharapkan dapat :

Melakukan proses instalasi software

anaconda versi Mac OS secara mandiri


Prosedur instalasi
software anaconda
Mac OS

Periksa spesifikasi laptop


Buka web anaconda Anaconda | The World's
Most Popular Data Science Platform
Pilih versi anaconda yang sesuai
Unduh
Instal
Kesimpulan

Berikut beberapa poin yang bisa disimpulkan


pada video kali ini:

Proses instalasi anaconda tergolong


mudah dan bisa dilakukan mandiri
Jupyter
Notebook
Interface

Video Agenda

Pada video 4 ini peserta diharapkan dapat :

Mampu membuka Jupyter Notebook

menggunakan dua cara (GUI-based,

dan CMD sintaks)

Memahami antarmuka Jupyter

Notebook serta shortcut yang

dibutuhkan
Screencast : Jupyter Notebook Interface

Halaman depan

Path file : untuk memilih lokasi file/

folder yang ingin dibuka

Display semua daftar file

Menu untuk upload atau membuat

new file/folder

Tampilan file notebook python

Menu bar

Line cell : untuk membuat codingan

dan outputnya

Jupyter Notebook Shortcut

No Shortcut Fungsi

Menambah cell diatas cell


1 Esc + A

saat ini

Menambah cell dibawah


2 Esc + B
cell saat ini

Mengubah cell menjadi


3 Esc + M
markdown

Split cell pada posisi


4 Ctrl + Shift + “-”
krusor terakhir

Menggabung beberapa
5 Shift + M
cell menjadi satu

6 dll dll
Kesimpulan

Berikut beberapa point yang bisa disimpulkan


pada video kali ini:

Jupyter Notebook dapat dibuka melalui dua


cara: Anaconda GUI-based menu, dan CMD
sintaks
Jupyter Notebook interface memiliki fitur dan
shortcut yang memudahkan dalam bekerja
Ayo praktik
sintaks dasar
python

Video Agenda

Pada video 5 ini peserta diharapkan dapat :

Mampu membuat dan memodifikasi

file Jupyter Notebook baru

Mampu mengoperasikan sintaks-

sintaks dasar python


Kesimpulan

Berikut beberapa point yang bisa disimpulkan


pada video kali ini:

Python dapat melakukan berbagai operasi


matematika untuk numerik
Python juga memiliki operator untuk object
string
Perintah print dapat menampilkan multiple
output dalam satu cell codingan
Terima 


kasih!

Anda mungkin juga menyukai