Modul 2,3. Data Dan Aesthetic Mapping
Modul 2,3. Data Dan Aesthetic Mapping
Plot bisa menerima input data, dan dari data tersebut bisa dipilih beberapa kolom yang akan "dipetakan"
sebagai input untuk komponen visual.
Untuk jelasnya, mari kita lihat data yang dibuka dengan aplikasi Excel pada gambar berikut. Data ini
adalah data luas wilayah dan kependudukan Pemerintah Provinsi DKI Jakarta.
Pada gambar terlihat banyak kolom informasi seperti TAHUN, NAMA PROVINSI, NAMA
KABUPATEN/KOTA, dll.
Ada tiga kolom yang di-highlight dengan warna kuning, hijau dan biru muda. Ketiga kolom ini masing-
masing akan dipetakan di dalam grafik untuk komponen visual x, y dan color (warna). Pemetaan data ini
disebut dengan aesthetic mapping.
Pada praktek selanjutnya, kita akan membaca data dan melakukan pemetaan. Input data
pada ggplot2 harus bertipe data.frame, tidak boleh yang lain.
Data tipe apa yang bisa diberikan sebagai input untuk plot?
JAWABAN
Matrix
List
Vector
Semuanya Benar
Data Frame
Dari text penjelasan pada Pendahuluan, manakah yang merupakan variabel aesthetic mapping?
JAWABAN
plot
data.frame
color
Nah, atas dasar itulah data kependudukan dipilih untuk course visualisasi data kali ini.
Berikut adalah tampilan data kependudukan DKI Jakarta tersebut jika dibuka di aplikasi Notepad.
Perhatikan tanda pemisah antar kolom menggunakan koma.
Dan ini adalah tampilan jika data tersebut dibuka di aplikasi Excel.
1. TAHUN: Tahun
2. NAMA PROVINSI: Nama provinsi di DKI Jakarta, dan nilainya hanya ada satu
3. NAMA KABUPATEN/KOTA: Nama kabupaten/kota di DKI Jakarta
4. NAMA KECAMATAN: Nama kecamatan di DKI Jakarta
5. NAMA KELURAHAN: Nama kelurahan di DKI Jakarta
6. LUAS WILAYAH (KM2): Luas wilayah (km persegi)
7. KEPADATAN (JIWA/KM2): Kepadatan penduduk (jiwa/km2)
8. 35-39 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur 35-39 tahun
9. 35-39 Perempuan: Jumlah penduduk perempuan dengan rentang umur 35-39 tahun
10. 40-44 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur 40-44 tahun
11. 40-44 Perempuan: Jumlah penduduk perempuan dengan rentang umur 40-44 tahun
12. 45-49 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur 45-49 tahun
13. 45-49 Perempuan: Jumlah penduduk perempuan dengan rentang umur 45-49 tahun
14. 50-54 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur 50-54 tahun
15. 50-54 Perempuan: Jumlah penduduk perempuan dengan rentang umur 50-54 tahun
16. 55-59 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur 55-59 tahun
17. 55-59 Perempuan: Jumlah penduduk perempuan dengan rentang umur 55-59 tahun
18. 60-64 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur 60-64 tahun
19. 60-64 Perempuan: Jumlah penduduk perempuan dengan rentang umur 60-64 tahun
20. 65-69 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur 65-69 tahun
21. 65-69 Perempuan: Jumlah penduduk perempuan dengan rentang umur 65-69 tahun
22. 70-74 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur 70-74 tahun
23. 70-74 Perempuan: Jumlah penduduk perempuan dengan rentang umur 70-74 tahun
24. >75 Laki-Laki: Jumlah penduduk laki-laki dengan rentang umur di atas 75 tahun
25. >75 Perempuan: Jumlah penduduk perempuan dengan rentang umur di atas 75 tahun
Perhatikan seluruh kolom berisi informasi berupa angka, kecuali empat kolom berikut: NAMA
PROVINSI, NAMA KABUPATEN/KOTA, NAMA KECAMATAN, dan NAMA KELURAHAN.
Dataset ini memiliki detail sampai ke tingkat kelurahan. Contoh yang cukup bagus untuk kita olah.
Example
ggplot(data = …)
Untuk contoh data kependudukan kita, maka perintah lengkapnya adalah sebagai berikut :
ggplot(data = penduduk.dki)
Tugas Praktek
Pada code editor, ganti bagian […] dengan :
Variabel plot.dki yang menyimpan plot dengan input data variabel penduduk.dki.
Tampilkan summary dari plot.dki.
Jika berhasil dijalankan, maka Anda harusnya mendapatkan output summary sebagai berikut. Terlihat saat
ini plot memiliki komponen data, yang tidak tampil ketika kita membuat plot pada bab sebelumnya.
Example :
Komponen Deskripsi
Kembali ke awal kebutuhan kita, mari kita lihat gambar berikut. Terlihat kita ingin memetakan x, y dan
color ke kolom NAMA KABUPATEN/KOTA, LUAS WILAYAH (KM2) dan KEPADATAN
(JIWA/KM2).
Tetapi kita lihat di bagian bawah gambar, nama-nama kolom yang akan dimapping mengalami sedikit
perubahan ketika dibaca di R, dimana spasi dan non huruf maupun angka diubah menjadi titik. Sebagai
contoh, NAMA KABUPATEN/KOTA diubah menjadi NAMA.KABUPATEN.KOTA.
Berikut adalah contoh penggunaan aes berdasarkan kebutuhan tersebut.
Dan function aes ini harus dipasangkan dengan function ggplot yang telah memiliki data, sehingga
konstruksi lengkap code-nya adalah sebagai berikut.
ggplot(data=penduduk.dki, aes(x = LUAS.WILAYAH..KM2.,
y=KEPADATAN..JIWA.KM2., color=NAMA.KABUPATEN.KOTA))
Untuk lebih jelasnya mari kita lakukan tugas praktek berikut.
Tugas Praktek
Pada code editor, ganti bagian […] dengan aesthetic mapping dengan pemetaan berikut:
x = LUAS.WILAYAH..KM2.,
y = KEPADATAN..JIWA.KM2.
color = NAMA.KABUPATEN.KOTA
Jika berhasil dijalankan, maka Anda harusnya mendapatkan output summary sebagai berikut. Terlihat
bagian data dan mapping sudah terisi sesuai keinginan kita.
Example :
Tugas Praktek
Perhatikan seluruh perintah yang ada pada code editor, ini merupakan kumpulan code yang telah kita
pelajari pada bab ini.
Jika berhasil dijalankan, maka hasilnya akan terlihat sebagai berikut. Terlihat plot tidak kosong, tapi sudah
terisi dengan label LUAS.WILAYAH..KM2. pada sumbu x, label KEPADATAN..JIWA.KM2 pada
sumbu y, dan sudah ada garis-garis penjelas grid pada plot.
Example
Kesimpulan
Plot memerlukan dua input sebagai bahan bakunya agar bisa digunakan lebih jauh,
yaitu data dan aesthetic mapping (pemetaan beberapa kolom data ke elemen visual).