0% menganggap dokumen ini bermanfaat (0 suara)
64 tayangan

VIsualisasi Dengan Matplotlib

Dokumen tersebut membahas tentang visualisasi data menggunakan library Matplotlib pada Python. Terdapat berbagai jenis grafik yang dapat digunakan seperti bar plot, histogram, scatter plot, dan line plot untuk menganalisis data kategorik maupun numerik. Matplotlib juga dapat mevisualisasikan data time series dengan grafik seperti double line plot dan double area plot.

Diunggah oleh

siburukrupa1991
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
64 tayangan

VIsualisasi Dengan Matplotlib

Dokumen tersebut membahas tentang visualisasi data menggunakan library Matplotlib pada Python. Terdapat berbagai jenis grafik yang dapat digunakan seperti bar plot, histogram, scatter plot, dan line plot untuk menganalisis data kategorik maupun numerik. Matplotlib juga dapat mevisualisasikan data time series dengan grafik seperti double line plot dan double area plot.

Diunggah oleh

siburukrupa1991
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 9

Visualisasi Data Matplotlib

Visualisasi Data adalah adalah tampilan berupa grafis atau visual dari informasi dan data. Dengan
kata lain, data visualization mengubah kumpulan data menjadi hal lebih sederhana untuk
ditampilkan. Dengan menggunakan elemen visual tersebut, pembaca akan lebih mudah memahami
tren, outliers, dan pola dalam suatu data. Dalam bisnis, data visualization memungkinkan para
pembuat keputusan untuk melihat analitik yang disajikan secara visual.

Dalam python sebenarnya banyak sekali library untuk melakukan analisis dengan metode visualisasi
data. Beberapa librarynya adalah matplotlib dan seaborn. Pada pertemuan kali ini, kita akan
membahas visualisasi data menggunakan matplotlib. Untuk menggunakan library tersebut
sebelumnya perlu mengetik pip install matplotlib==3.4.0 serta pip install numpy pada cmd untuk
menginstall library matplotlib dan numpy.

Setelah selesai dalam melakukan proses instalasi, langkah pertama adalah mengimport library yang
akan digunakan yaitu

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

selanjutnya, kita mengenal terlebih dahulu pembuatan grafik dasar menggunakan matplotlib
dengan perintah sebagai berikut

barh=plt.bar(["a","b","c"], [1,2,3])

disini terlihat bahwa penggunakan sumbu x dan sumbu y dengan tipe data list. setelah kita paham
tipe data yang diinginkan oleh matplotlib selanjutnya kita dapat mengimport file csv untuk
dilakukan analisis. kita dapat menggunakan file cereal.csv seperti analisis pada pandas minggu
kemarin.

df=pd.read_csv("cereal.csv")

sebelum kita lebih jauh melangkah ada baiknya kita tahu perbedaan data kategoris dan data
numerik untuk membedakan analisis data berdasarkan jenis data tersebut. berikut penjelasannya,

Data kategoris adalah nilai untuk variabel kualitatif, seringkali berupa angka, kata, atau simbol.
Mereka menunjukkan fakta bahwa variabel dalam kasus yang dipertimbangkan termasuk dalam
salah satu dari beberapa pilihan yang tersedia

Data numerik adalah nilai-nilai yang diperoleh untuk variabel kuantitatif, dan mengandung arti
besarnya yang terkait dengan konteks variabel (oleh karena itu, selalu berupa angka atau simbol
yang membawa nilai numerik)

selanjutnya, mari kita mulai kebeberapa grafik pada analisis visualisasi data.
1. Barplot
Pembuatan analisis visualisasi data dengan menggunakan barplot biasanya digunakan untuk
menganalisa 1 variable categorical contohnya sebagai berikut.

plt.rcParams.update({'font.size': 30})

plt.figure(figsize=(20,20))
bar=plt.bar(df_histogram['mfr'], df_histogram['name'], color='#444444')

Gambar 1 Barplot

2. Horizontal Bar Plot


Pembuatan analisis visualisasi data dengan menggunakan Horizontal barplot biasanya digunakan
untuk menganalisa 1 variable categorical. Pada dasarnya mirip seperti barplot namun tampilannya
dibuat menjadi horizontal sehingga, tampilannya sebagai berikut.

x_high=[]
x_small=[]
y_high=[]
y_small=[]

for y,x in zip(df_histogram['name'],df_histogram['mfr']):


if (y > 20):
x_high.append(x)
y_high.append(y)
else:
x_small.append(x)
y_small.append(y)

plt.figure(figsize=(15,15))
plt.xlabel('pabrik')
plt.ylabel('jumlah barang')
plt.title('Produksi Cereal')
bar1=plt.barh(x_small, y_small, color='#a9a9a9')
bar2=plt.barh(x_high,y_high, color='#444444')
plt.bar_label(bar1, padding=3)
plt.bar_label(bar2, padding=3)

Gambar 2 Horizontal Barplot

3. Histogram
Pembuatan analisis visualisasi data dengan menggunakan Horizontal barplot biasanya digunakan
untuk menganalisa 1 variable numerik. Biasanya, histogram digunakan untuk menghitung jumlah
frekuensi pada sebuah data atau rentang tertentu.

plt.figure(figsize=(20,20))
plt.hist(df['calories'])
plt.xlabel('calories')
plt.ylabel('Frequency')
plt.title('Histogram of Calories')
plt.show()
Gambar 3 Histogram

4. Stacked Bar Chart


Pembuatan analisis visualisasi data dengan menggunakan Stacked Bar Chart biasanya digunakan
untuk menganalisa 2 variable numerik.

df_stacked=df.groupby('mfr').mean().reset_index()
df_stacked

plt.figure(figsize=(20,20))
width = 0.35
bar3=plt.bar(df_stacked['mfr'], df_stacked['protein'], width, label='protein')
bar4=plt.bar(df_stacked['mfr'], df_stacked['fat'],width,label='fat')
plt.legend()
plt.bar_label(bar3)
plt.bar_label(bar4)
plt.title('Grafik Perbandingan Rata-Rata Protein dan fat pada Data Pabrik Cereal')
Gambar 4 Stacked Bar Chart

5. Group Bar Chart


Pembuatan analisis visualisasi data dengan menggunakan Group Bar Chart biasanya digunakan
untuk menganalisa 2 variable numerik. pada dasarnya mirip seperti stacked bar chart.

import numpy as np

plt.figure(figsize=(20,20))

x = np.arange(len(df_stacked['mfr'])) # the label locations


width = 0.35 # the width of the bars

bar4 = plt.bar(x - width/2, df_stacked['protein'], width, label='protein')


bar5 = plt.bar(x + width/2, df_stacked['fat'],width,label='fat')
# plt.xlabel(["a"])
plt.xticks(x, ['A', 'G', 'K', 'N', 'P','Q',"R"])
plt.legend()
plt.bar_label(bar4)
plt.bar_label(bar5)
plt.title('Grafik Perbandingan Rata-Rata Protein dan fat pada Data Pabrik Cereal')
Gambar 5 Grouped Bar Chart

Selain data Kategorik dan Numerik kita juga dapat melakukan visualisasi data pada data time series.
analisis time series adalah cara khusus untuk menganalisis urutan titik data yang dikumpulkan
selama interval waktu tertentu. berikut penggunaan grafiknya seperti pada grafik dibawah ini,

6. Line Plot
line plot digunakan untuk melakukan plotting pada data time series, biasanya kita kenal sebagai
grafik garis.

minutes = [1, 2, 3, 4, 5, 6, 7, 8, 9]
player1 = [1, 2, 3, 3, 4, 4, 4, 4, 5]
player2 = [1, 1, 1, 1, 2, 2, 2, 3, 4]
player3 = [1, 1, 1, 2, 2, 2, 3, 3, 3]

plt.figure(figsize=(10,10))
plt.plot(minutes,player1, color = 'r')
Gambar 6 Line Plot

7. Dot Plot / Scatter Plot


Pada dasarnya mirip seperti line plot, namun scatter plot adalah kumpulan dari ploting yang
berbentuk titik saja.

plt.figure(figsize=(10,10))
plt.scatter(minutes,player1, color = 'r')

Gambar 7 Scatter Plot

8. Area Plot
Pada dasarnya mirip seperti line plot, namun Area plot adalah kumpulan line plot dan membentuk
arsiran pada grafiknya.
plt.figure(figsize=(10,10))
plt.fill_between(minutes,player1, color = 'r')

Gambar 8 Area Plot

9. Double Line Plot


pada dasarnya sama seperti line plot, namun terdapat dua plotting line yang berfungsi
membandingkan antar plot tersebut sehingga bisa kita ambil insight dari data visualisasi yang
disajikan.

plt.figure(figsize=(10,10))
plt.plot(minutes,player1, color = 'r')
plt.plot(minutes,player2, color = 'b')

Gambar 9 Double Line Plot


10. Double Area Plot
pada dasarnya sama seperti area plot, namun terdapat dua plotting area yang berfungsi
membandingkan antar plot tersebut sehingga bisa kita ambil insight dari data visualisasi yang
disajikan.

labels = ['player1', 'player2', 'player3']


colors = ['#008fd5','#fc4f30', '#6d904f']
plt.figure(figsize=(20,20))
plt.stackplot(minutes, player1, player2, player3, labels=labels, colors=colors)
plt.legend(loc='upper left')

plt.title("My Awesome Stack Plot")


plt.tight_layout()
plt.show()

Gambar 10 Double Area Plot

sumber:
- https://matplotlib.org/
- https://matplotlib.org/stable/gallery/lines_bars_and_markers/categorical_variables.html
- https://medium.com/@ranggaantok/intro-to-descriptive-statistic-memahami-tipe-data-
d3555757f9eb
- https://www.dqlab.id/kenali-jenis-data-statistik-yang-sering-digunakan-beserta-
contohnya#:~:text=Data%20kuantitatif%20dibagi%20dua%20jenis,manik%20dalam%20kantong%2
C%20dan%20lain

Anda mungkin juga menyukai