0% menganggap dokumen ini bermanfaat (0 suara)
14 tayangan

Modul 2,5. Histogram

Diunggah oleh

apriansyah1024
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
14 tayangan

Modul 2,5. Histogram

Diunggah oleh

apriansyah1024
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 4

Pendahuluan

Histogram adalah tipe visualisasi yang sangat cocok untuk menggambarkan data distribusi dari jumlah
populasi data. Dan dataset kependudukan adalah contoh yang baik dimana kita bisa menggambarkan
distribusi kepadatan penduduk dengan jumlah kelurahan.
Untuk membuat histogram, kita gunakan geom bertipe histogram dan stat bin, yang bisa diwakili
oleh function geom_histogram.

Layer geom_histogram dan Lebar Interval


Untuk menghasilkan histogram maka kita gunakan function geom_histogram untuk ditambahkan ke plot.
Layer histogram ini memerlukan stat bertipe bin, yaitu membagi data menjadi interval. Namun dengan
penggunaan geom_histogram, stat ini sudah menjadi bin secara default jadi tidak perlu lagi
dispesifikasikan.
Secara default geom histogram tidak memerlukan aesthetic mapping untuk sumbu y, cukup
menggunakan sumbu x.
Namun ada parameter yang perlu diinput, yaitu besarnya interval bin. Ini menggunakan
parameter binwidth.
Contoh untuk membuat layer geom_histogram adalah sebagai berikut :

[objek plot] + geom_histogram(binwidth=5000)

Berikut adalah penjelasan lengkap elemen-elemen perintah di atas.

Komponen Deskripsi

[objek plot] Objek plot dari hasil function ggplot() ditambah dengan
komponen visual atau layer

+ Tanda plus, operator untuk menambahkan komponen lain


ke dalam plot

geom_histogram Function untuk menghasilkan layer dengan geom


histogram

binwidth Lebar interval data, dalam hal ini 5000

Tugas Praktek
Pada code editor telah tersedia code untuk membaca data kependudukan DKI. Ganti bagian […] dengan
layer histogram dan dengan interval 10000.
Jika berhasil maka grafik yang tampil adalah sebagai berikut. Terlihat bahwa jumlah kelurahan dengan
penduduk antara 10 s/d 20 ribu adalah yang terbanyak.
Example

Penggunaaan aesthetic fill


Kita dapat melakukan banyak penambahan informasi pada histogram sebelumnya. Salah satunya adalah
melihat porsi jumlah kelurahan berdasarkan nama kabupaten / kota pada tiap rentang histogram seperti
berikut.
Untuk ini kita menggunakan aesthetic fill dengan syntax berikut :

aes(fill = NAMA.KABUPATEN.KOTA)

Catatan: aesthetic color sebenarnya juga bisa digunakan namun hasilnya akan tampak sebagai berikut.

Tugas Praktek
Lengkapi code editor dimana histogram yang dihasilkan bisa ditambahkan dengan aesthetic fill – input
berupa kolom NAMA.KABUPATEN.KOTA.

Question
Kesimpulan
Histogram adalah tipe visualisasi yang sangat cocok untuk menggambarkan data distribusi dari jumlah
populasi data. Dan dataset kependudukan adalah contoh yang baik dimana kita bisa menggambarkan
distribusi kepadatan penduduk dengan jumlah kelurahan.
Praktek pada bab ini cukup simpel dan straightforward, dimana kita telah
menggunakan function geom_histogram dengan parameter binwidth untuk menghasilkan grafik
distribusi.

Anda mungkin juga menyukai