0% menganggap dokumen ini bermanfaat (0 suara)
51 tayangan11 halaman

What Is Data Lake

Dokumen membahas tentang konsep data lake, data warehouse, dan perbedaan antara keduanya. Data lake merupakan tempat penyimpanan berbagai jenis data dalam format aslinya tanpa struktur tertentu, sedangkan data warehouse berfokus pada data terstruktur untuk tujuan khusus. [/ringkasan]

Diunggah oleh

Aruarak Albahari
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
51 tayangan11 halaman

What Is Data Lake

Dokumen membahas tentang konsep data lake, data warehouse, dan perbedaan antara keduanya. Data lake merupakan tempat penyimpanan berbagai jenis data dalam format aslinya tanpa struktur tertentu, sedangkan data warehouse berfokus pada data terstruktur untuk tujuan khusus. [/ringkasan]

Diunggah oleh

Aruarak Albahari
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 11

DATA LAKE

Pertemuan 1
 Data is everywhere
yet ...
 Saya tidak bisa menemukan data yang saya cari
◦ data tersebar dimana-mana (lintas jaringan)
◦ menggunakan versi yang berbeda
 Tidak bisa mendapatkan data yang diperlukan
◦ perlu orang yang expert untuk mendapatkan data tersebut
 Data sudah ditemukan, tapi tidak mengerti maksud data tersebut
◦ dokumentasi data yang kacau
 Data sudah ditemukan, tapi saya tidak bisa menggunakannya
◦ hasil data yang tidak terduga
◦ data perlu ditransformasi dari bentuk satu ke bentuk yang lain
KONSEP
BigData
Data Warehouse
Data Lake
Big Data
Data Warehouse
Empat karakteristik Data Warehouse

 Subject Oriented
 Integrated
 Time – Variant
 Non volatile
Data Lake
 Pusat berkumpulnya data-data dalam format dan skala
aslinya.
 Data dapat disimpan tanpa perlu menyusunnya dalam
struktur, pengelompokan, atau hierarki tertentu.
 Data yang terdapat dalam data lake adalah data mentah
yang belum diproses atau dianalisis.
 Menyimpan data dari beragam sumber.
 Data-data di dalamnya pun terdiri dari berbagai tipe dan
skema.
 Berbagai macam pengguna dari mana saja dapat
mengakses data lake dan mengambil sampel data dari
dalamnya.
Komponen Penyusun Data Lake

 Data Ingestion and Storage


 Data Processing
 Data Analysis
 Data Integration
Mengapa Data Lake penting?

 1. Mengindeks data
 2. Machine learning
 3.
Mengembangkan interaksi dengan
konsumen
 4. Analisis
DATA WAREHOUSE VS DATA LAKE

Anda mungkin juga menyukai