Visualisasi Data Dengan Python
Visualisasi Data Dengan Python
Pastikan Anda telah mengunduh data Case.csv dan PatientInfo.csv dan menyimpannya pada
folder kode python Anda.
Membaca Data
Baca kedua data dan simpan dalam data frame selanjutnya tampilkan 5 data pertama.
Grafik yang akan dibuat adalah grafik mengenai jumlah kasus COVID-19 yang terkonfirmasi
pada beberapa provinsi di Korea Selatan. Untuk menghasilkan data tersebut, Anda perlu
mengolah data yang terdapat pada Case.csv (perhatikan kolom province dan kolom
confirmed).
Untuk menampilkan masing-masing provinsi dan menghilangkan duplikasi value, data frame
ditampilkan menggunakan fungsi unique().
Lakukan penjumlahan untuk mendapatkan nilai akumulasi kasus pada setiap provinsi. Dari
hasil data tersebut, diketahui bahwa kasus tertinggi dari sumber data tersebut ditemukan pada
provinsi Daegu, sebanyak 6066 kasus.
Tampilkan bar chart untuk menghasilkan visualisasi data untuk akumulasi kasus COVID-19
pada setiap provinsi.
Membuat Pie Chart
Grafik yang akan dibuat adalah grafik mengenai prosentase sebaran usia pasien yang
teridentifikasi COVID-19 di Korea Selatan. Anda perlu mengolah data yang terdapat pada
PatientInfo.csv (perhatikan kolom age).
Hitung jumlah pasien pada masing-masing tingkat usia menggunakan fungsi value_counts().
Dapat disimpulkan bahwa kasus terbanyak dialami oleh masyarakat berusia 50 tahunan
sejumlah 394.
Masih terdapat null value pada kolom age, sehingga Anda perlu menyimpan kembali data
frame kedua setelah menghilangkan null value seperti pembahasan minggu lalu.
Tampilkan pie chart untuk mengetahui prosentase sebaran usia pasien yang teridentifikasi
COVID-19 di Korea Selatan.