VISUALISASI
VISUALISASI
ASRUL ABDULLAH
plt.pie(
votes,
labels=mata_kuliah,
)
plt.show()
x_coords = np.arange(len(countries))
plt.bar(x_coords, populations)
plt.show()
PRODI TEKNIK INFORMATIKA www.unmuhpnk.ac.id
Line Graphs
Line Graph adalah bentuk visualisasi lainya selain diagram lingkaran dan diagram
batan. Meskipun diagram lingkaran dan diagram batang berguna untuk
menunjukkan bagaimana kelas data saling terkait, diagram garis lebih berguna
untuk menunjukkan bagaimana kemajuan data selama beberapa periode
import matplotlib.pyplot as plt
temperature_c = [2, 1, 0, 0, 1, 5, 8, 9, 8, 5, 3,
2, 2]
hour = [0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20,
22, 24]
plt.plot(
hour,
temperature_c
)
plt.show()
plt.scatter(population, gdp)
plt.show()
PRODI TEKNIK INFORMATIKA www.unmuhpnk.ac.id
Heatmap
Heatmap adalah jenis visualisasi yang menggunakan kode warna untuk mewakili nilai / kepadatan relatif
data di seluruh permukaan. Seringkali ini adalah bagan tabel, tetapi tidak harus terbatas pada itu. Untuk
data tabular, terdapat label pada sumbu x dan y. Nilai di persimpangan label tersebut dipetakan ke warna.
Warna-warna ini kemudian dapat digunakan untuk memeriksa data secara visual guna menemukan
kelompok dengan nilai serupa dan mendeteksi tren dalam data.
months = ['J', 'F', 'M', 'A', 'M', 'J', 'J', 'A', 'S', 'O', 'N', 'D']
temperatures = [
[10, 10, 14, 19, 23, 26, 30, 31, 27, 22, 17, 12], # Tokyo
[20, 24, 30, 37, 40, 39, 35, 34, 34, 33, 28, 22], # Delhi
[ 8, 10, 14, 20, 24, 28, 32, 32, 27, 23, 17, 11], # Shanghai
[29, 29, 28, 27, 23, 23, 23, 25, 25, 26, 27, 28], # Sao Paulo
[31, 32, 33, 33, 34, 32, 30, 30, 31, 34, 34, 32], # Mumbai
[22, 24, 26, 27, 27, 26, 24, 25, 24, 24, 23, 23], # Mexico City
[ 2, 5, 12, 21, 27, 30, 31, 30, 26, 19, 10, 4], # Beijing
[ 9, 10, 14, 20, 25, 28, 32, 33, 29, 23, 18, 12], # Osaka
[19, 21, 24, 29, 33, 35, 35, 35, 34, 30, 25, 21], # Cairo
[ 4, 6, 11, 18, 22, 27, 29, 29, 25, 18, 13, 7], # New York
[25, 29, 32, 33, 33, 32, 32, 32, 32, 31, 29, 26], # Dhaka
[26, 28, 32, 35, 36, 35, 33, 32, 33, 35, 32, 28], # Karachi
]
sns.heatmap(temperatures, yticklabels=cities, xticklabels=months)
PRODI TEKNIK INFORMATIKA www.unmuhpnk.ac.id
Visualisasi Statistik
• Histogram
• Correlation dan Causation
Karena nilai p adalah $<$ 0,001, korelasi antara wheel-base dan harga signifikan secara statistik, meskipun
hubungan liniernya tidak terlalu kuat (0,588)
pearson_coef, p_value = stats.pearsonr(df['horsepower'], df['price'])
print("The Pearson Correlation Coefficient is", pearson_coef, " with a P-value of P =
", p_value)
The Pearson Correlation Coefficient is 0.809574567003656 with a P-value of P =
6.369057428259557e-48
Karena nilai p adalah < 0,001, korelasi antara horsepower dan harga signifikan secara statistik, dengan korelasi
linear positif yang cukup kuat(~0,805)
df.describe()
df.describe(include=['object'])