0% menganggap dokumen ini bermanfaat (0 suara)
34 tayangan19 halaman

Temu4 - Konsep Data Dan Representasi Data

Dokumen tersebut membahas tentang pengertian data dan representasi data, jenis-jenis data berdasarkan sifat, sumber, cara memperoleh dan waktu pengumpulannya, serta teknik pengukuran data."

Diunggah oleh

Zanita Fitri
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
34 tayangan19 halaman

Temu4 - Konsep Data Dan Representasi Data

Dokumen tersebut membahas tentang pengertian data dan representasi data, jenis-jenis data berdasarkan sifat, sumber, cara memperoleh dan waktu pengumpulannya, serta teknik pengukuran data."

Diunggah oleh

Zanita Fitri
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 19

Konsep Data dan

Representasi Data

Temu 4

Murien Nugraheni, S.T., M.Cs.


Pengertian Data
 Merupakan suatu fakta yang bisa digambarkan dengan
kode, simbol, angka dan lain-lain
 Merupakan data diartikan sebagai hasil pencatatan
peneliti, baik itu berupa fakta maupun angka
 Adalah semua hasil pengukuran atau observasi yang
sudah dicatat guna suatu keperluan tertentu
 Adalah suatu bahan yang masih mentah yang
membutuhkan pengolahan lebih lanjut sehingga
menghasilkan informasi atau keterangan, baik
kuantitatif maupun kualitatif yang menunjukkan suatu
fakta
Jenis-jenis Data

 Menurut sifatnya
 Menurut sumbernya
 Menurut cara memperolehnya
 Menurut waktu pengumpulannya
Data Menurut Sifatnya
 Data Kualitatif
 Data Kuantitatif
Data Kategorik
Data Nominal
Data Ordinal
Data Bukan Kategorik
Data Interval
Data Rasio
Data Menurut Sifatnya (2)

 Data Kualitatif
Data yang disajikan dalam bentuk kata-kata (tulisan),
gambar (audio) atau video yang memiliki makna.
Data-data tersebut diperoleh dari wawancara,
pengamatan, pemotretan, perekaman dan lain-lain.
Pada intinya data kualitatif adalah data yang bukan
merupakan bilangan angka sehinga tidak dianalisis
dengan ilmu statistik (statistika).
Data Menurut Sifatnya (3)

 Data Kuantitatif
Data yang disajikan dalam bentuk bilangan angka,
sehingga data kualitatif diolah secara statistik.
Data kualitatif terbagi lagi menjadi dua jenis yaitu
data kategorik dan data numerik.
Data Menurut Sifatnya (4)
 Data Kategorik
Data Nominal
Data yang diperoleh dengan mengelompkkan
suatu objek dengan tidak memperhatikan urutan
atau tingkatan.
Contohnya adalah jenis kelamin (laki-laki dan
perempuan), status perkawinan (belum kawin,
kawin, cerai hidup dan cerai mati).
Data Ordinal
Data ordinal adalah data yang mengelompokkan
suatu objek dengan memperhatikan urutan atau
tingkatan.
Contohnya adalah tingkat pendidikan (tidak
sekolah, SD, SMP, SMA dan Peguruan Tinggi).
Data Menurut Sifatnya (5)
Data Bukan Kategorik
Data Interval
Data interval adalah data yang tidak memiliki
nilai nol (0) mutlak, yang berarti bahwa nilai 0
tersebut memiliki arti misalnya data suhu, tahun
dll.
Data Rasio
Data rasio adalah data yang memiliki nilai nol
(0) mutlak, yang berarti bahwa nilai 0 benar-
benar tidak memiliki nilai contohnya adalah
data tingkat pengangguran, tingkat
kemiskinan, rata-rata nilai mahasiswa dll.
Data Menurut Sumbernya
 Data Internal
Data yang menggambarkan situasi dan kondisi dlam
suatu organisasi secara internal.
Contohnya adalah data mahasiswa, data pegawai,
data keuangan dan penjualan.
 Data Eksternal
Data yang menggambarkan situasi dan kondisi di luar
organisasi.
Contohnya adalah data tingkat kepuasan konsumen,
data kebahaian masyarakat dan lain-lain.
Data Menurut Cara Memperolehnya
 Data Primer
 Data yang secara langsung diambil dari objek penelitian oleh
peneliti perorangan atau organisasi.
 Pengumpulan data dapat berupa wawancara atau observasi.
 Contohnya adalah data hasil wawancara langsung tentang
kepuasan suatu produk kepada pelanggan.
 Data Sekunder
 Data yang tidak diperoleh secara langsung dari objek
penelitian.
 Data ini biasanya diperoleh dari data yang sudah jadi yang
dikumpulkan oleh pihak lain.
 Contohnya adalah data-data yang diperoleh dari buku, jurnal,
laporan, surat kabar, dan lain-lain.
Data Menurut Waktu Pengumpulannya

 Data Cross Section


Data yang menunjukkan titik waktu tertentu.
Misalnya adalah data pengangguran tahun 2020.
 Data Deret Waktu Time Series
Data yang menggambarkan sesuatu dari waktu ke
waktu.
Misalnya adalah data inflasi per bulan dari tahun
2010-2020.
Indikator Data yang Berkualitas
 ACCURACY
 Data yang tersimpan nilainya benar (name cocok dengan
alamatnya).
 DOMAIN INTEGRITY
 Nilai attributnya sesuai batasan yang diperkenankan (nilai
attribut laki & perempuan).
 DATA TYPE
 Nilai data disimpan dalam tipe data yang sesuai (data nama
disimpan dengan tipe text).
 CONSISTENCY
 Nilai sebuah field data akan sama semua dalam berbagai
berkas (field produk A dgn kode 123, akan selalu sama kodenya
di setiap berkas lain).
Indikator Data yang Berkualitas (2)
 REDUDANCY
 Tidak boleh ada data yang sama disimpan di tempat yang
berbeda dalam satu system.
 COMPLETENESS
 Tidak ada nilai atttribut salah yang diberikan dalam system.
 DATA ANOMALY
 Sebuah field hanya digunakan sesuai kegunaannya. (field
address3 digunakan untuk mencatat baris ketiga dalam
alamat bukan untuk telp atau fax).
 CLARITY
 Kejelasan arti kegunaan dan cara penulisan sebuah data
(penamaan khusus).
Indikator Data yang Berkualitas (3)

 TIMELY
Merepresentasikan waktu dari data yang dimasukkan
(jika data digunakan perhari maka data pada
warehaouse harus juga dibuat per hari).
 USEFULNESS
Setiap data harus benar digunakan oleh user.
 ADHERENCE TO DATA INTEGRITY RULES
Taat pada aturan keterhubungan data.
Data Preprocessing

 Adalah suatu proses/langkah yang dilakukan untuk


membuat data mentah menjadi data yang berkualitas
Preprocessing data dibutuhkan karena data
mentah masih memiliki :
 Incomplete, yaitu data yang kekurangan nilai atribut
atau hanya mengandung agregat data (contoh :
address = " ").
 Noisy, yaitu data yang masih mengandung error dan
outliers (contoh : salary = -10).
 Inconsistent, yaitu data yang mengandung discrepansi/
perbedaan dalam code dan nama atau singkatnya
datanya tidak konsisten (contoh : dulu rating = 1,2,3
sekarang a,b,c).
Data Preparation dibutuhkan karena :

 Jika data masukan tidak berkualitas, maka hasil data


mining juga tidak akan berkualitas.
 Keputusan yang berkualitas pasti berasal/berdasarkan
data yang berkualitas.
 Data Warehouse membutuhkan integrasi yang konsisten
dari data yang berkualitas.
 Jangan sampai terjadi Garbage In Garbage Out
(GIGO) artinya jika inputnya sampah outputnya pasti
sampah juga
Langkah-langkah dalam Data Preparation
 Data Cleaning
 Dalam data cleaning yang akan kita lakukan antara lain mengisi missing value,
mengidentifikasi outlier, menangani data noise, mengoreksi data yang tidak konsisten,
dan menyelesaikan masalah redudansi data akibat integrasi data.
 Data Integration
 Data integration adalah suatu langkah untuk menggabungkan data dari beberapa
sumber.
 Langkah yang dilakukan antara lain mengintegrasikan skema, mengidentifikasi
masalah entitas, dan mendeteksi sekaligus menyelesaikan konflik pada nilai data.

 Data Tranformation
 Data transformation yaitu mengubah suatu data supaya diperoleh data yang lebih
berkualitas.
 Langkah yang dilakukan antara lain menghilangkan noise dari data (smoothing),
meng-agregasi data, generalisasi data, normalisasi data, dan pembentukan
atribut/fitur.

 Data Reduction
 Data Reduction yaitu langkah untuk mereduksi dimensi, atribut ataupun jumlah data.
 Langkah yang dilakukan antara lain agregasi data cube, reduksi dimensi, diskretisasi,
dan kompresi data.
Teknik Pengukuran Data
 Skala Nominal
adalah skala yang hanya bisa membedakan benda,
peristiwa, ataupun objek yang diteliti antara satu
dengan yang lainnya berdasarkan nama atau
predikatnya.
 Skala Ordinal
adalah skala yang mengandung pengertian
tingkatan.
 Skala Interval
Adalah skala yang biasa digunakan dalam
pengukuran data numerik, yaitu skala interval.

Anda mungkin juga menyukai