0% menganggap dokumen ini bermanfaat (0 suara)
73 tayangan

Data Visualization With Python Matplotlib For Beginner

Modul ini menjelaskan visualisasi data dengan Python Matplotlib untuk pemula, meliputi pengolahan dataset, membuat grafik dasar, dan modifikasi komponen visualisasi seperti axis, label, dan legenda."

Diunggah oleh

Regina Caeli
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
73 tayangan

Data Visualization With Python Matplotlib For Beginner

Modul ini menjelaskan visualisasi data dengan Python Matplotlib untuk pemula, meliputi pengolahan dataset, membuat grafik dasar, dan modifikasi komponen visualisasi seperti axis, label, dan legenda."

Diunggah oleh

Regina Caeli
Hak Cipta
© © All Rights Reserved
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 6

Data Visualization with Python Matplotlib for Beginner - Part 1

Dalam modul ini, akan dijelaskan beberapa hal yang dapat dilakukan dengan matplotlib. Di
antaranya:

 Pengolahan dataset (menggunakan library NumPy & Pandas).


 Membuat grafik dasar menggunakan matplotlib.
 Melakukan modifikasi komponen visualisasi, seperti axis, labels, title, dan legend.
 Menyimpan plot visualisasi yang sudah dibuat

Menambahkan kolom pada eksisting table di python

1. import datetime
2. dataset['order_month']= dataset['order_date'].apply(lambda
x:datetime.datetime.strptime(x, "%Y-%m-%d").strftime('%Y-%m'));
3. print(dataset.head());

Ada beberapa function yang berperan di sini:

 apply & lambda biasa digunakan untuk membuat kolom baru, berdasarkan suatu kolom
lain yang sudah ada (misal .apply(lambda x: x*2) berarti setiap input x di dalam kolom,
akan diubah menjadi x*2). Dalam hal ini kolom yang sudah ada adalah
dataset['order_date'], lalu tiap nilai di dalamnya kita proses agar menjadi month-nya saja
 Function datetime.datetime.strptime digunakan untuk mengubah date/time dalam bentuk
string menjadi tipe data datetime.
 Function  strftime digunakan untuk mengubah format suatu data bertime datetime, dalam
hal ini diubah menjadi '%Y-%m', yang berarti outputnya adalah waktu dengan bentuk
YYYY-MM atau tahun dan bulan saja, tanggalnya sudah tidak ada. 

Penambahan Kolom GMV pada Dataset


Selanjutnya, bagaimana dengan GMV? Definisikan GMV adalah perkalian setiap entri di kolom
item_price dan kolom quantity. Bisa saja menggunakan fungsi apply & lambda seperti tadi,
tetapi ada cara yang lebih mudah yaitu dengan mengalikan kedua kolom yang disebutkan secara
langsung.

1. dataset['gmv']= dataset['item_price']*dataset['quantity']
2. print('Ukuran dataset: %d baris dan %d kolom\n' % dataset.shape)
3. print('Lima data teratas:')
4. print(dataset.head())

Membuat Data Aggregat

1. monthly_amount = dataset.groupby('order_month')['gmv'].sum().reset_index()
2. print(monthly_amount)

Plot Pertama: Membuat Line Chart Trend Pertumbuhan GMV

1. import matplotlib.pyplot as plt


2. plt.plot(monthly_amount['order_month'], monthly_amount['gmv'])
3. plt.show()

Cara Alternatif: Fungsi .plot() pada pandas Dataframe

Dengan pendekatan lain, dimungkinkan juga melakukan visualisasi dengan matplotlib tanpa
membuat variabel baru

1. import matplotlib.pyplot as plt


2. dataset.groupby(['order_month'])['gmv'].sum().plot()
3. plt.show()

catatan singkat seputar dua cara untuk membuat plot menggunakan matplotlib:

1. Kita dapat menggunakan fungsi plt.plot() dari library matplotlib.pyplot as plt


2. atau dengan menggunakan fungsi .plot() langsung dari variabel dataframe, yaitu dataset
pada kasus kita sebelumnya. 

Anatomi dari Figure


“Karena saya lihat kamu cukup antusias belajar visualisasi data, saya mau share insight baru,
Aksara. Ini tentang kustomisasi grafik. Saya pikir ini akan membantumu mengerjakan grafik dari
data hasil rapat tadi.”

Aku menggeser bangku untuk mendekatkan diri ke sebelah Senja agar bisa mendengar lebih
jelas.

“Sebelum mulai kustomisasi, ada baiknya kita pahami dulu anatomi dari sebuah Figure di
maplotlib. Bisa dilihat sesuai di gambar berikut,” jelas Senja sambil menampilkan layar berisi
contoh gambar:
Ada beberapa istilah dan komponen di sebuah plot, nanti akan mempermudah mengingat
function apa yang digunakan untuk memodifikasinya.

 Figure adalah keseluruhan visualisasi yang kita plot dalam 1 kali menjalankan code.
 Sedangkan satu plot (yang dibuat saat memanggil .plot() atau .scatter()) disebut Axes.
Sebuah Figure bisa terdiri dari beberapa Axes. 
 Setiap Axes biasanya memiliki sumbu-X (X-axis) dan sumbu-Y (Y-axis). Masing-
masing sumbu memiliki komponen sebagai berikut:
o Axis Label: Nama dari sumbu yang ditampilkan.
o Tick: Penanda berupa titik/garis kecil yang berjajar di sumbu, sebagai referensi
skala nilai.
o Tick Label: Tulisan di tiap tick yang menyatakan nilainya.
 Untuk isi grafiknya sendiri, bisa berupa line (untuk line plot), atau marker (untuk scatter
plot), bisa juga bentuk lain seperti bar (untuk bar plot / histogram).
 Aksesoris lain yang bisa ditambahkan, di antaranya Grid untuk mempermudah melihat
tick yang sejajar, dan Text untuk memberikan informasi tambahan berbentuk teks di
grafik.

 
Memahami komponen-komponen di atas sudah cukup untuk melakukan berbagai visualisasi
dengan matplotlib. Untuk anatomi yang lebih lengkap, bisa dilihat di link berikut:
https://matplotlib.org/3.1.3/gallery/showcase/anatomy.html.

 Mengubah Figure Size


ubah ukuran grafiknya dulu? Soalnya kalau ukuran grafiknya yang diubah belakangan, biasanya
banyak komponen lain yang berubah bentuknya

1. import matplotlib.pyplot as plt


2. plt.figure(figsize=(15,5))
3. dataset.groupby(['order_month'])['gmv'].sum().plot()
4. plt.show()

Menambahkan Title and Axis Labels


Beberapa hal yang lazim dimodifikasi pada sebuah grafik adalah judul (title) dan label di sumbu-
x & sumbu-y (axis labels).

Untuk menambahkannya, tinggal menambah plt.title, plt.xlabel, dan plt.ylabel di code sebelum
plt.show()

1. import matplotlib.pyplot as plt


2. plt.figure(figsize=(15, 5))
3. dataset.groupby(['order_month'])['gmv'].sum().plot()
4. plt.title('Monthly GMV Year 2019')
5. plt.xlabel('Order Month')
6. plt.ylabel('Total GMV')
7. plt.show()

Kustomisasi Title and Axis Labels


Kita bisa melakukan berbagai modifikasi dengan menambahkan parameter ke dalam function-
nya. Misalnya, untuk judul/title, parameter yang bisa ditambahkan:

 loc: digunakan untuk menentukan posisi title, misalnya ‘left’ untuk membuat rata
kiri, ‘right’ untuk rata kanan, dan ‘center’ untuk meletakkannya di tengah. Jika
tidak didefinisikan, maka defaultnya title ada di tengah.
 pad: digunakan untuk menambahkan jarak antara judul ke grafik (dalam satuan
px), misalnya kita tidak ingin judulnya terlalu menempel dengan grafiknya, jadi
kita beri jarak.
 fontsize: digunakan untuk mengganti ukuran font/huruf (dalam satuan px).
 color: digunakan untuk mengganti warna huruf judul. Kita bisa menggunakan
warna dasar dengan kata seperti ‘blue’, ‘red’, ‘orange’, dsb. Bisa juga dengan hex
string, misalnya '#42DDF5' untuk warna biru muda
1. import matplotlib.pyplot as plt
2. plt.figure(figsize=(15, 5))
3. dataset.groupby(['order_month'])['gmv'].sum().plot()
4. plt.title('Monthly GMV Year 2019', loc='center', pad=40, fontsize=20,
color='blue')
5. plt.xlabel('Order Month', fontsize=15)
6. plt.ylabel('Total Amount', fontsize=15)
7. plt.show()

Kustomisasi Line dan Point


Untuk mengubah style dari garis maupun titik di chart, cukup dengan menambahkan parameter
di function .plot(). Beberapa parameter yang bisa dikustomisasi:

 color: mengubah warnanya (sama seperti di title)


 linewidth: mengubah ketebalan line/garisnya (dalam satuan px)
 linestyle: mengubah jenis dari garis. Misalnya '-' atau 'solid' untuk garis tak terputus
(seperti pada default), '--' atau 'dashed' untuk garis putus-putus, ':' atau 'dotted' untuk
garis berupa titik-titik, bisa juga '-.' atau ‘dashdot’ untuk garis dan titik bergantian.
 marker: mengubah tipe points/titik data di chart. Ada banyak sekali kemungkinan
nilai untuk marker ini, yang biasanya digunakan yaitu ‘.’ untuk bulatan kecil/titik, ‘o’
untuk bulatan agak besar, ‘s’ untuk persegi, ‘D’ untuk diamond/wajik, dan bentuk-
bentuk lain seperti ‘+’, ‘x’, ‘|’, ‘*’.

1. import matplotlib.pyplot as plt


2. plt.figure(figsize=(15, 5))
3. dataset.groupby(['order_month'])['gmv'].sum().plot(color='green', marker='o',
linestyle='-.', linewidth=2)
4. plt.title('Monthly GMV Year 2019', loc='center', pad=40, fontsize=20,
color='blue')
5. plt.xlabel('Order Month', fontsize=15)
6. plt.ylabel('Total Amount', fontsize=15)
7. plt.show()

Kustomisasi Grid
Caranya dengan menambahkan plt.grid() dengan parameter yang mirip dengan line.

1. import matplotlib.pyplot as plt


2. plt.figure(figsize=(15, 5))
3. dataset.groupby(['order_month'])['gmv'].sum().plot(color='green', marker='o',
linestyle='-.', linewidth=2)
4. plt.title('Monthly GMV Year 2019', loc='center', pad=40, fontsize=20, color='blue')
5. plt.xlabel('Order Month', fontsize=15)
6. plt.ylabel('Total Amount', fontsize=15)
7. plt.grid(color='darkgray', linestyle=':', linewidth=0.5)
8. plt.show()

Kustomisasi Axis Ticks

Anda mungkin juga menyukai