Bab 6 Visualisasi Data: Oleh
Bab 6 Visualisasi Data: Oleh
VISUALISASI DATA
Oleh:
1. Dewa Ayu Jasmine Maylani Utami (06 X.E.4)
2. I Made Dio Bagaswara Dipayana (14 X.E.4)
3. Ni Putu Arisya Suaridewi (32 X.E.4)
Puji syukur penyusun ucapkan kepada Tuhan Yang Maha Esa yang
telah memberikan rahmat dan karunia-Nya sehingga makalah
Visualisasi data informatika ini dapat diselesaikan dengan baik. Kami
juga mengucapkan terima kasih kepada semua pihak yang telah
memberikan arahan serta bimbingannya selama ini sehingga
penyusunan makalah dapat dibuat dengan sebaik-baiknya. Kami
menyadari masih banyak kekurangan dalam penulisan makalah ini
sehingga kami mengharapkan kritik dan saran yang bersifat
membangun demi penyempurnaan makalah ini.
Kami mohon maaf jika di dalam makalah ini terdapat banyak
kesalahan dan kekurangan, karena kesempurnaan hanya milik Yang
Maha Kuasa yaitu Allah SWT, dan kekurangan pasti milik kita
sebagai manusia. Semoga makalah ini dapat bermanfaat bagi kita
semuanya.
I.PRA-PEMROSESAN DATA
Data Preprocessing atau praproses data biasanya dilakukan melalui cara eliminasi
data yang tidak sesuai. Selain itu dalam proses ini data akan diubah dalam bentuk
yang akan lebih dipahami oleh sistem.Proses ini utamanya dilakukan untuk
memastikan kualitas data baik sebelum digunakan saat analisis data. Dalam proses
ini Anda dapat memastikan enam hal, yakni akurasi data, kelengkapan, konsistensi,
ketepatan waktu, tepercaya, dan dapat diinterpretasi dengan baik.
1. Data Cleaning Tahapan pertama adalah data cleaning atau tahapan
membersihkan data. Tahapan yang dilakukan pertama ini adalah
: Memperhalus noisy data Mengisi nilai yang hilang Mengkonsistensikan
data Dalam tahapan ini, akan terjadi proses pengklasifikasian data, yaitu
dengan membagi data sesuai kualifikasinya sesuai dengan ukurannya, yang
kemudian di haluskan. Proses ini dikenal dengan proses binning. Sebelum
data mining, tahapan ini berfungsi agar data dalam keadaan bersih. Apabila
data sudah bersih, akan berimbas pada tingkat akurasi mining yang tinggi.
Banyak hal yang bisa menyebabkan kurangnya akurasi data. Penyebab yang
paling umum : Kesalahan komputer atau manusia Terjadi kegagalan pada
instrumen data Dan kesalahan lainnya Data yang harus dilakukan
pembersihan, seperti : Data yang tidak konsisten Ada data ganda Data noisy
Dan data tidak lengkap Proses pembersihan dapat mengatasi permasalahan-
permasalahan tersebut.
2. Data integration Tahapan kedua adalah data integration atau proses
mengintegrasikan data. Data integration akan melakukan penyatuan data.
Terutama data yang memiliki representasi berbeda karena berbagai konflik.
Kemudian diselesaikan masalahnya. Jadi, tahapan ini adalah tahap lanjutan
dari proses yang pertama. Dalam tahap kedua ini, tyang telah di bersihkan,
kemudian di satukan dan data tersebut di buat lebih halus.
3. Data transformation Tahapan ketiga adalah mentransformasikan data.
Dalam tahapan ini, data yang sudah diintegrasikan, kemudian dinormalisasi
dan dilakukan proses generalisasi data. Proses ini untuk memastikan agar
tidak ada data yang berlebihan. Jadi, dalam prosesnya, data akan dihimpun
dalam sebuah tempat penyimpanan, yang dependensinya harus masuk akal.
Data juga akan ditransformasikan dalam bentuk yang sesuai. Selain itu, pada
tahapan ini, data akan di konversikan atau di ubah bentuknya. Contohnya
seperti mengubah bentuk data angka menjadi suatu bentuk kategori data
yang berbeda. Tahapan transformasi data ini berguna untuk mengurangi
jumlah data. Cara untuk transformasi data adalah : Aggregate data,
smoothing, attribute construction, normalisasi data dan discretization data.
4. Data reduction Tahapan terakhir adalah data reduction atau mereduksi
data. Kita tahu bahwa data mining menggunakan data yang jumlahnya
sangat besar. Karena jumlah data yang besar, maka tingkat akurasinya pun
dikhawatirkan akan rendah atau bahkan tidak akurat. Oleh sebab itu, data
perlu di reduksi. Reduksi merupakan suatu proses untuk mengurangi jumlah
data namun dengan tidak mempengaruhi proses analisis data. Dengan
melakukan pengurangan data, maka akan menjadikan proses penyimpanan
menjadi lebih efisien. Data yang bisa dikurangi dalam proses ini adalah data
yang memiliki kapasitas berlebihan. Seperti contohnya data transaksi
keuangan yang dalam hitungan menit saja sudah mencapai Terabyte. Proses
terakhir data reduction ini membutuhkan waktu yang cukup lama. Karena
waktu untuk mengurangi data dengan jumlah sangat besar. Prosesnya tidak
mungkin dikerjakan dalam waktu singkat.
Berikut kode program untuk membuat chart bar atau diagram batang:
fig = plt.figure(figsize=(6,4))
ax = plt.axes()
ax.bar(data['Type 1'],data['Count'])
plt.xticks(rotation=90)
plt.show()