0% menganggap dokumen ini bermanfaat (0 suara)
7 tayangan3 halaman

03 +Tipe+Data+Visualization

Diunggah oleh

Khofifah
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
7 tayangan3 halaman

03 +Tipe+Data+Visualization

Diunggah oleh

Khofifah
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 3

Tipe Data Visualization

Ada 2 tipe data yang dapat diproses:

1. Data Numerikal : berwujud angka

• Data continuous : data hasil pengukuran, nilai lebih beragam pada suatu interval, ex :
temperature ruangan

• Data diskrit : data hasil perhitungan, hanya bisa mempunyai nilai tertentu pada suatu
interval, ex : jumlah customer

2. Data Kategorikal : berwujud variable atau kelompok

• Data binary : terdiri atas 2 kelompok, misal : ya atau tidak, loyal atau tidak loyal

• Data nominal : data yang tidak mempunyai tingkatan, misal : region, jenis tabungan,
jenis kendaraan, dll

• Data ordinal : data yang memiliki tingkatan, misal : tingkat Pendidikan, kepuasan
pelanggan, rating, dll

https://www.geeksforgeeks.org/

Python dapat mengenali data kategori dan data numerik. Secara deskriptif dapat diperlihatkan

• Numerik : count, mean, standard deviation, min, q1, q2, q3, max

• Kategorikal : count, unique item, top column, frequent

Pemisahan data pada python dapat menggunakan select_dtypes

Contoh tipe data menggunakan dataset employee

Data Numerikal :
• Data continuous : Daily rate, monthly rate, monthly income

• Data diskrit : Age, DistanceFromHome

Data Kategorikal :

• Data binary : Attrition, Gender, MaritalStatus

• Data nominal : EducationField, Department

• Data ordinal : BusinessTravel, JobRole

Dalam suatu dataset, ada beberapa kolom dan baris. Kolom ini merupakan atribut dalam
dataset. Sedangkan baris adalah nilai dari individu data dengan format mengikuti kolomnya.
Dalam dunia data science, kolom ini disebut juga feature.

Agar lebih memahami lagi tentang tipe data, mari kita lihat contoh dari data berikut

Berikut adalah contoh data dari sebuah perusahaan asuransi. Perusahaan asuransi ingin
menentukan kira-kira berapa premi yang harus dibayarkan oleh seorang customer dengan
melihat beberapa attribut :
1. Age (Umur) : semakin tua maka semakin banyak penyakit dan dapat meningkatkan
resiko kematian. Biasanya perusahaan akan meningkatkan nilai premi dari asuransinya.
2. Sex (Jenis kelamin) : Ada beberapa kecenderungan pemakaian asuransi yang berbeda
untuk jenis kelamin yang berbeda, seperti penggunaan untuk proses persalinan bagi
wanita. Selain itu karena laki-laki kebanyakan bekerja, maka resiko sakitnya juga
semakin tinggi.
3. bmi (body mass index) : semakin gemuk seseorang maka semakin rentan sakit
4. children : biasanya perusahaan sudah memasukkan anak untuk diikutsertakan dengan
orang tua. Sehingga biasanya premi yang dibayarkan juga berbeda.
5. smoker : perokok aktif biasanya lebih rentan terkena penyakit terutama kanker paru-
paru
6. region : masing-masing region mempunyai kondisi yang berbeda baik berupa harga
layanan rumah sakit, polusi, transportasi, dll
7. charge : nilai premi yang harus dibayarkan oleh customer tiap bulannya.

Dengan melihat dari definisi diatas, maka data tersebut dapat dikelompokkan menjadi.

Data Numerikal :

• Data continuous : charge, bmi


• Data diskrit : children, age

Data Kategorikal :

• Data binary : sex


• Data nominal : region, smoker
• Data ordinal : -

Anda mungkin juga menyukai