0% menganggap dokumen ini bermanfaat (0 suara)
20 tayangan26 halaman

Database Big Data

Diunggah oleh

Deswita Salsabila
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
20 tayangan26 halaman

Database Big Data

Diunggah oleh

Deswita Salsabila
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 26

Data, Database, Big Data

Apa itu Database ?


 Database adalah kumpulan data yang disimpan dengan sistem tertentu,
dan saling berhubungan, sehingga dapat dikelola dengan mudah.
 Database penting untuk mengatur data yang jumlahnya banyak, dan
selalu bertambah. Sebagai contoh, program website, aplikasi, dan
lainnya.
Terdapat 5 Komponen database:
1. Data →file-file yang berisi informasi, baik teks, log, gambar, dan lainnya.
2. Hardware→perangkat keras yang digunakan untuk menyimpan dan
mengelola data.
3. Sistem Operasi→bertanggung jawab atas semua sistem yang ada di
komputer atau server.
4. Database Management System (DBMS)→aplikasi pengelolaan database.
Dengan DBMS, Anda bisa lebih mudah ketika menginput dan mengupdate
data. (MySQL)
5. Database Access Language→ahasa yang digunakan untuk menulis
perintah, seperti mengakses, menambah, memperbarui, dan menghapus
Alfian Dharma Kusuma, Intern Junior Content Writer di Dicoding Naning Nur Wijayanti .
Strutur dari data
Fungsi Database
1. Mempercepat dan Mempermudah Identifikasi Data
2. Mengontrol Data Secara Terpusat
3. Menghindari Duplikasi Data
4. Menyimpan Data dengan Lebih Aman
5. Menghemat Biaya
6. Dapat Diakses Multi-User
Tipe atau jenis Database
1. Operational Database → database OLTP (On Line Transaction Processing)
adalah jenis database yang dapat mengelola data dinamis secara real-
time. Contoh Operational Database: Microsoft SQL Server, AWS Dynamo,
Apache Cassandra, dan MongoDB.
2. Relational Database
 Relational Database→ data disimpan dalam
beberapa tabel yang saling terkait atau
berhubungan (membentuk relasi).
 Relational database juga memiliki empat sifat
yang dikenal sebagai ACID, yaitu:
 Atomicity – Memastikan data sukses
dioperasikan atau tidak sama sekali. Jadi, jika
satu data gagal dioperasikan, maka semua
data juga akan gagal.
Memerlukan RDBMS atau Relational  Consistency – Data dapat dikembalikan dalam
Database Management System keadaan sebelumnya, jika proses data gagal.
Contoh Relational
 Isolation – Data yang sedang diproses akan
Database: MySQL, PostgreSQL,
terisolasi dari proses-proses lainnya.
MongoDB, MariaDB, Oracle Database,
IBM DB2, SAP HANA, MemSQL,  Durability – Memastikan data tersimpan di
Interbase, dan Firebird. dalam sistem dan tetap aman, bahkan dalam
keadaan restart system
3. Distributed Database
Merupakan sistem penyimpanan
yang terdistribusi yang terdiri dari
dua berkas atau lebih serta terletak
di situs yang berbeda, baik di
jaringan yang sama maupun di
jaringan yang berbeda sama sekali

Artinya, data disimpan dalam


beberapa komputer di tempat
yang sama dan dihubungkan
melalui jaringan.
4. Analytical Database
 Analytical database merupakan d
atabase yang dapat menyimpan
dan mengelola big data, termasuk
bisnis, pasar, dan data pelanggan
untuk analisis business intelligence
(BI).
 Terdiri dari data dan informasi yang
diringkas agar mudah untuk
dibaca.
 Selain itu dioptimalkan secara
khusus untuk
skalabilitas dan query yang lebih
cepat.
5. Database Warehouse
 Database warehouse adalah sistem
database yang sering kali digunakan
untuk pelaporan dan analisis data.
 Database warehouse dapat
menyimpan data dari sumber yang
berbeda-beda dan dapat diupload
dari sistem operasi. Itu mengapa
dinamakan warehouse atau
“gudang”.
 Bidang business
intelligence menggunakan database
ini sebagai pusat data sebelum
diolah.
Contoh Database Warehouse: Microsoft Access (Office), Oracle.
Data Warehouse

 Data warehouse (DW) memiliki tujuan


untuk menyimpan data dari waktu ke
waktu. Data yang tersimpan
merupakan database operasional.
 Basis data pada warehouse bisa
menjadi sumber utama dalam
mencari informasi yang telah
diperiksa, diubah, dan terintegrasi.
 Basis data ini biasanya digunakan
oleh para manajer dan end-
user lainnya yang memiliki izin untuk
mengaksesnya.
6. End-User Database

 End-User Database artinya semua


data dapat diakses, dikelola, dan
dikembangkan oleh pengguna.
Pengguna akhir yang berhubungan
langsung dengan database inilah
yang disebut end-user database.
 Data yang sudah berinteraksi dengan
end-user biasanya data siap pakai.
Artinya, data bisa dibaca oleh
manusia, sudah bukan berupa data
pemrograman lagi. Misalnya,
Contoh End-User Database: SQLite spreadsheet, dokumen, dan lainnya.
7. Cloud Database
 Cloud database merupakan sistem yang
menyimpan data secara virtual, bukan
disimpan dalam server fisik.
 pemeliharaannya pun tidak serumit
server fisik, karena database dapat
dijalankan melalui cloud computing
platform.
Contoh Cloud Database: Amazon Web
Service (AWS), Oracle Database, Microsoft
Azure, Google Cloud Platform, IBM DB2,
MongoDB Atlas, OpenStack.
8. Real-Time Database
 Real-time database adalah model data yang sistem
pengolahannya dibuat guna menangani beban
kerja suatu lembaga besar seperti negara.
 Real-time database biasa digunakan oleh lembaga
akuntansi, hukum, perbankan, multimedia, analisis
data ilmiah, serta catatan medis.
 Pengolahan data tersebut bisa berubah-ubah
sesuai dengan permintaan dan bersifat terus-
menerus. Seperti berubahnya harga mata uang
dollar yang berubah setiap menit. Di balik itu semua,
terdapat basis data real-time yang bekerja dengan
cepat.
Pengantar Big Data

 Big Data “meledak” di awal dekade abad 21


Perusahaan online dan startup, misalnya
Google, Amazon, eBay, LinkedIn, Facebook,
dibangun dari data yang besar
 Data yang sangat besar dapat memengaruhi
banyak hal, di berbagai bidang: medis, industri,
ekonomi dan perbankan, dll
Perkembangan Data
Apa itu Big Data?
 Big Data → mirip dengan ‘small data’, namun jauh lebih besar ukurannya→
banyak perdebatan tentang apa itu Big Data
 Dengan data sangat besar perlu pendekatan berbeda→ Teknik, alat
bantu, arsitektur
 Tujuan: menyelesaikan masalah baru atau masalah lama dengan cara
lebih baik
 Big Data memberikan nilai dari penyimpanan dan pemrosesan dari
kuantitas sangat besar yang tidak bisa dianalisis dengan teknik komputasi
tradisional
• Walmart menangani > 1 juta transaksi dari customer tiap jam

• Facebook menangani 40 miliar foto dari user base
• Decoding genome , awalnya memerlukan pemrosesan selama 10 tahun → sekarang 1
minggu
Gambaran Umum Big Data

• McKinsey Global (2011)


Big Data dapat didefinisikan dengan data yang memiliki skala (volume),
distribusi (velocity), keragaman (variety) yang sangat besar, dan atau
abadi, sehingga membutuhkan penggunaan arsitektur teknikal dan
metode analitis yang inovatif untuk mendapatkan wawasan yang dapat
memberikan nilai bisnis baru (informasi yang bermakna).
• Hurwitz, et al. (2013)
Big data merupakan istilah untuk sekumpulan data yang begitu besar
atau kompleks dimana tidak bisa ditangani lagi dengan sistem teknologi
komputer konvensional
• Kapan suatu data dapat dikatakan sebagai “Big Data”?
5 V Pada Big Data

• Volume
3V
(Awal)
• Velocity
• Variety

5V • Veracity
(Sekarang) • Value
5 V Pada Big Data: Volume (1)
• Facebook menghasilkan 10TB data baru setiap hari, Twitter 7TB
• Sebuah Boeing 737 menghasilkan 240 terabyte data penerbangan
selama penerbangan dari satu wilayah bagian AS ke wilayah yang lain
• Microsoft kini memiliki satu juta server, kurang dari Google, tetapi lebih
dari Amazon, kata Ballmer (2013).

• Catatan: Kita dapat menggunakan semua data ini untuk memberitahu


kita sesuatu, jika kita mengetahui pertanyaan yang tepat untuk
bertanya.

Bentuk infrastruktur data center Google Cloud Platform


5 V Pada Big Data: Volume (2)

Traditional Approach Big Data Approach

Analyzed All available


information information
analyzed

All available
information

Analyze small Analyze all data


subsets of data
5 V Pada Big Data: Velocity
• Kecepatan data yang masuk (per jam, per detik, etc). Clickstreams (web
log) dan transfer data asynchronous yang dapat menangkap apa saja
yang dilakukan oleh jutaan atau lebih pengguna yang lakukan saat ini.

Traditional Approach Big Data Approach

Hypothesis Question Data Exploration

Answer Data Insight Correlation

Start with hypothesis and test Explore all data and


against selected data identify correlations
5 V Pada Big Data: Variety

• Kumpulan dari berbagai macam data, baik data


yang terstruktur, semi terstruktur maupun data
tidak terstruktur (bisa dipastikan lebih
mendominasi).
• Tampilan data semakin komprehensif (lengkap dan
menyeluruh).
5 V Pada Big Data: Veracity

• Ketidakpastian akan data.


• Business process rawan akan kesalahan, tergantung
datanya
• Bagaimana suatu data dapat dipercaya mengingat
keandalan sumbernya
• Bagaimana mengelola, mengolah data mana yang
benar dan mana yang salah
5 V Pada Big Data: Value

• Data yang besar seharusnya berdampak (secara


moneter) terhadap suatu perusahaan yang
menggunakan komputasi Big Data
• Akan sia-sia bila memiliki data yang sangat besar
tapi tidak tahu bagaimana cara mengolah dan
menganalisisnya, hanya akan buang-buang resource

Anda mungkin juga menyukai