0% menganggap dokumen ini bermanfaat (0 suara)
68 tayangan12 halaman

01-Modul DW Intro

Modul ini membahas pengantar data warehouse. Data warehouse adalah koleksi data besar dan kompleks yang disimpan secara elektronik untuk memfasilitasi pelaporan dan analisis data menjadi informasi bernilai. Modul ini menjelaskan sejarah, komponen, dan perbedaan data warehouse dengan database management system.

Diunggah oleh

Syarief Hidayat
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
68 tayangan12 halaman

01-Modul DW Intro

Modul ini membahas pengantar data warehouse. Data warehouse adalah koleksi data besar dan kompleks yang disimpan secara elektronik untuk memfasilitasi pelaporan dan analisis data menjadi informasi bernilai. Modul ini menjelaskan sejarah, komponen, dan perbedaan data warehouse dengan database management system.

Diunggah oleh

Syarief Hidayat
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 12

MODUL DATA WAREHOUSE

(CSD310)

MODUL 1
PENGANTAR DATA WAREHOUSE

DISUSUN OLEH
Ir. Munawar, MMSI., M.Com., PhD

UNIVERSITAS ESA UNGGUL


2020

Universitas Esa Unggul


http://esaunggul.ac.id 0 / 12
PENGANTAR

A. Kemampuan Akhir Yang Diharapkan

Setelah mempelajari modul ini, diharapkan mahasiswa mampu :


1. Merinci topik-topik perkuliahan Data Warehouse
2. Memahami sejarah dan pentingnya data warehouse
3. Mengidentifikasi buku referensi serta komponen dan proporsi penilaian mata
kuliah Data Warehouse.

B. Uraian Perkuliahan
1. Materi Dasar Perkuliahan
1.1. Pendahuluan
Data warehouse ialah repository (koleksi /kumpulan sumber daya yang bisa
diakses untuk mendapatkan informasi) dari sebuah data organisasi yang tersimpan
secara elektronis. Data warehouse di desain untuk memfasilitasi pelaporan dan
analis data menjadi bentuk informasi yang bernilai lebih.
Secara sederhana, data warehouse dapat disebut sebagai koleksi dari data
yang sangat besar dan kompleks. Fokus data warehouse lebih dititikberatkan pada
penyimpanan data, dimana sumber data utama akan dibersihkan, di
transformasikan, lalu dikategorikan, hingga bisa digunakan oleh manager dan
profesional lain dengan memanfaatkan data mining, OLAP (online
Analytical processing), DSS dan berbagai jenis dashboard lainnya.
Secara singkat bisa dikatakan bahwa untuk mendapatkan dan melakukan
analisis data, perlu dilakukan proses yang disebut extract, transform dan loading
(ETL) di datawarehouse. Karena banyak hal yang bisa dilakukan oleh
datawarehouse, definisi lebih lanjut dari datawarehouse termasuk business
intelligence tools, tools untuk extract, transform dan load data ke repository, dan
tools untuk manajemen metadata.

1.2. Sejarah
Awal mula data warehouse berangkat dari tahun 80 an, dimana peneliti IBM
Barry Devlin and Paul Murphy mengembangkan “business data warehouse”, yang

Universitas Esa Unggul


http://esaunggul.ac.id 1 / 12
tujuan dasarnya adalah untuk menyediakan model arsitektur untuk perubahan data
dari sistem operasional menuju sistem DSS.
Beberapa hal penting berkisar sejarah data warehouse adalah :
1960an — General Mills dan Dartmouth College, mengembangkan
istilah dimensions and facts.
1970an — ACNielsen dan IRI menyediakan imensional data marts untuk
penjualan retail
1983 — Teradata memperkenalkan sistem database yang khusus untuk DSS
1988 — Barry Devlin dan Paul Murphy mempublikasikan artikel An architecture for
a business and information systems in yang memperkenalkan istilah
“business data warehouse“.
1990 — Red Brick Systems memperkenalkan Red Brick Warehouse, sistem
manajemen database khusus untuk data warehousing.
1991 — Bill Inmon mempublikasikan buku Building the Data Warehouse.
1995 — The Data Warehousing Institute, organisasi profit yang mempromosikan
data warehouse didirikan
1996 — Ralph Kimball mempublikasikan buku The Data Warehouse Toolkit.
2000 — Daniel Linstedt mempublikasikan the Data Vault, yang memungkinkan
audit data warehose.

1.3. Pengertian datawarehouse


Data warehouse (DW) adalah suatu sistem penyimpanan data dari berbagai
sumber yang biasanya diterapkan dalam sebuah perusahaan atau institusi tertentu
sebagai bahan pertimbangan manajemen. Adapun kata kerja dengan istilah data
warehousing yang memiliki makna sebagai kegiatan mengumpulkan data dari
berbagai sumber yang kemudian diolah menjadi informasi yang lebih mudah dibaca
dan dipahami untuk kepentingan strategi bisnis. Teknik ini merupakan perpaduan
antara pemanfaatan teknologi dan komponen yang membantu penggunaan data
secara strategis.
Data warehouse merupakan penyimpanan dalam bentuk elektronik di sebuah
komputer induk maupun data cloud di internet. Menyimpan berbagai informasi dalam
jumlah besar yang dirancang untuk query dan analisis dalam menjalankan
bisnis. Data warehousing merupakan proses mengubah data menjadi informasi
yang siap disajikan ketika sedang dibutuhkan oleh divisi tertentu dalam sebuah

Universitas Esa Unggul


http://esaunggul.ac.id 2 / 12
perusahaan. Informasi dari data warehouse dapat menentukan pengambilan
keputusan dalam menjalankan sebuah perusahaan.
Terciptanya sistem penyimpanan data dalam skala besar ini terwujud dari
keinginan untuk memisahkan antara data pendukung dengan database operasional.
Hal ini karena data warehouse bukanlah sebuah produk atau objek, namun sebuah
lingkungan. Data warehouse ibarat arsitektur dengan konstruksi tertentu
sebagai sistem informasi pendukung yang susah untuk diakses dari operasional
penyimpanan data konvensional.
Data warehouse merupakan sistem yang telah diterapkan di banyak
perusahaan dan institusi tertentu dalam masyarakat. Mulai dari perusahaan
penerbangan, bank, rumah sakit, lembaga-lembaga pemerintahan, perusahan
asuransi dan investasi, perusahaan komunikasi, dan masih banyak lagi. Sistem
informasi data pendukung ini biasanya digunakan sebagai informasi yang lebih
mendalam. Mulai dari mengukur profit, trend pasar, dan kebutuhan data yang
membutuhkan analisis.
Data Warehouse dapat didefinisikan sebagai suatu koleksi data yang
berorientasi subjek (subject oriented), terintegrasi (integrated), memiliki variasi
waktu (time-variant), dan tidak berubah (non volatile), yang bertujuan untuk
mendukung proses pembuatan keputusan manajemen. Data pada DW hanya data
statis hasil agregasi data dari satu atau beberapa basis data yang telah dibersihkan,
disaring, digabung, dan/atau diformat ulang dengan tujuan untuk mempermudah
dalam melakukan analisis dan pelaporan. DW ditempatkan terpisah dari basis data
operasional.
Maksud berorientasi subjek adalah :
 data pada DW terorganisasi berdasarkan subjek utama, seperti pelanggan,
penjualan, atau produk;
 difokuskan untuk pemodelan dan analisis data untuk pembuat keputusan, bukan
untuk operasi sehari-hari atau pemrosesan transaksi; dan
 menyediakan pandangan yang sederhana dan padat mengenai masalah subjek
tertentu dengan mengindahkan data yang tidak berguna bagi proses mendukung
keputusan. Misalnya, pada tingkat middle di organisasi supermarket hanya ada
manajer keuangan dan penjualan, maka data yang dikumpulkan di DW adalah
data agregasi dari nilai transaksi pembelian dan penjualan dan jumlah barang

Universitas Esa Unggul


http://esaunggul.ac.id 3 / 12
dalam transaksi penjualan dan pembelian yang dibutuhkan oleh manajer
keuangan dan penjualan.
DW terintegrasi maksudnya adalah
 dibangun dengan mengintegrasikan berbagai sumber data yang heterogen
menjadi satu;
 teknik pembersihan data dan integrasi data digunakan -- saat data dipindahkan ke
DW, data dikonversi dan penyamaan pada penamaan, struktur encoding, dan
ukuran atribut dilakukan supaya konsisten. Misalnya, pada contoh supermarket
sebelumnya, bila ada lebih dari satu supermarket maka akan ada lebih dari satu
basis data (diasumsikan jika supermarket tersebut tidak terhubung ke satu pusat
basis data). Supaya analisis dan pelaporan dapat dilakukan untuk semua data
supermarket tersebut maka semua basis data haruslah digabungkan menjadi satu,
terintegrasi, ke dalam satu basis data di DW.
DW memiliki variasi waktu maksudnya adalah:
 rentang waktu data lebih lama dari pada data di sistem operasional. Pada
basis data operasional rentang waktu dari data yang tersimpan yaitu pada masa
sekarang dan beberapa minggu atau bulan sebelumnya, sementara pada DW
informasi disediakan pada rentang waktu keseluruhan untuk memberikan
perspektif secara historis (misalnya, sampai 10-15 tahun lalu, tergantung dari
sejak kapan sistem informasi digunakan).
 Setiap struktur kunci pada DW memiliki elemen waktu, baik secara eksplisit
maupun implisit. Pada basis data operasional bisa atau bisa tidak memiliki elemen
waktu. Misalnya, untuk laporan keuangan bagi manajer keuangan bisa saja
membutuhkan data perhari, perminggu, atau perbulan, maka data yang ada di
dalam DW berisi data sejak awal sistem informasi berbasis data digunakan oleh
sistem supermarket sampai sekarang.
DW tidak berubah maksudnya adalah karena tempat penyimpanan fisik data
pada DW terpisah dari data operasional, perubahan pada data tidak terjadi di DW
tapi di basis data operasional. Operasi pada DW hanya pemuatan awal dan akses
(insert dan read), tidak ada operasi update, delete, recovery, dan mekanisme kontrol
konkuren. Hal ini untuk menjaga konsistensi antara data operasional dan DW. Oleh
karena itu sebelum data masuk ke DW haruslah ada pemrosesan seperti
pembersihan, penyaringan, dan validasi sebelumnya

Universitas Esa Unggul


http://esaunggul.ac.id 4 / 12
1.4. Perbedaan Database Management System dengan Datawarehouse
Database atau basisdata dalam bidang teknologi informasi yaitu ilmu yang
mempelajari tentang teori penyimpanan data. Di dalam bidang bisnis, penggunaan
basisdata dipermudah oleh sebuah perangkat lunak yang secara khusus berinteraksi
dengan pengguna atau aplikasi yang disebut dengan Database Management
System (DBMS). DBMS digunakan untuk pemrosesan transaksi dengan mencatat
dan menyimpan data yang diperlukan oleh pengguna atau dikenal juga dengan
istilah Online Transaction Processing (OLTP).
Pada basis data relasional data tersebut disimpan dalam bentuk tabel-tabel
dalam basis data yang di-normalisasi untuk mengurangi redundansi data dan
menghemat penggunaan media penyimpanan. Pemetaan objek dari dunia bisnis ke
sistem aplikasi berbasis data menjadi tabel menggunakan teknik pemodelan entity-
relationship (ER), yaitu pemodelan yang berorientasi pada objek-pelaku dalam
sistem beserta keterhubungan dan transaksi antara objek-pelaku.
Penggunaan basis data dalam sistem operasional dioptimasi dan dirancang
untuk pencatatan, sehingga apabila dibutuhkan analisis terhadap data maka
performansi dari basis data akan berpengaruh yang bisa saja menyebabkan lambat
atau lebih parahnya kegagalan proses pencatatan data pada saat proses analisis
berjalan. Sebagai contohnya, pada sistem basis data supermarket dengan rata-rata
transaksi perhari ratusan ribu penjualan. Untuk mendapatkan laporan penjualan
bulan lalu maka pengguna harus mengakses sistem basis data yang sama, dengan
beban transaksi yang sedang berjalan, sehingga tidak hanya mengganggu proses
transaksi juga melambatkan proses pengeluaran laporan. Tentu saja hal ini bisa
diatasi dengan melakukan pelaporan di luar jam kerja operasional, misalnya setelah
supermarket ditutup, namun tidak akan efisien bila data supermarket yang dianalisis
lebih dari satu basis data atau membutuhkan waktu yang lama pada saat
pemrosesan. Berikut ini adalah ringkasan dari perbedaan antara DBMS dengan DW.

Table 1.1. Perbedaan antara OLTP dan OLAP


Fitur OLTP OLAP
Orientasi Pengguna dan Operasional - Pelanggan Middle/Strategi - Pasar
Sistem
Isi data Sekarang dan terinci Berdasarkan riwayat dan
terkonsolidasi

Universitas Esa Unggul


http://esaunggul.ac.id 5 / 12
Fungsi Operasional bisnis sehari- Pendukung keputusan
hari
Rancangan basis data Berorientasi ke aplikasi Berorientasi ke subyek
Sudut pandang Sekarang dan lokal Evolusinari dan
terintegrasi
Pola akses Insert, Update, Delete Pembacaan saja dengan
Index/ hash pada primary query yang kompleks
key
Penggunaan Berulang-ulang Khusus
Unit kerja Pendek, transaksi Query yang kompleks
sederhana
Jumlah record yang Puluhan Jutaan
diakses
Jumlah pengguna Ribuan Ratusan
Ukuran database 100 MB – GB 100 GB – TB
Metrik pengukuran Hasil transaksi Hasil query dan lama
respon

1.5. Kenapa harus ada datawarehouse?


Seiring dengan semakin ketatnya kompetisi bisnis, tiap organisasi harus dapat
melakukan tindakan bisnis yang tepat. Di masa yang lampau keputusan bisnis
didasarkan pada intuisi para manajemen organisasi khususnya yang ada di
manajemen puncak.
Hanya saja, kondisi saat ini mutlak dibutuhkan informasi yang menunjang,
tepat, cepat dan efisien dalam pengambilan keputusan. Informasi yang dibutuhkan
berupa informasi yang telah tersumarisasi (summarized), dan terspesialisasi
(spesialized) hasil dari analisis data operasional organisasi. Informasi yang
dibutuhkan bisa berupa laporan khusus, dan forecasting (peramalan) berdasarkan
trend. Bentuk akhir informasi yang dihasilkan data warehouse biasanya dalam
bentuk dashboard yang dikombinasikan dengan Business Intelligence, sistem
informasi eksekutif (Executive Support System), DSS (Decision Support System) dan
lain-lain.

Universitas Esa Unggul


http://esaunggul.ac.id 6 / 12
1.6. Kenapa membangun datawarehouse?
Datawarehouse yang dikombinasikan dengan BI (Business Intelligence) dapat
digunakan untuk mendapatkan informasi dalam rangka:
1. Lebih memahami apa yang terjadi pada bisnis
2. Menentukan trend historis
3. Prediksi kesempatan di masa datang
4. Mengukur performance
Data warehouse yang digunakan untuk sistem BI (Business Intelligence) akan
mempunyai nilai lebih khususnya dalam hal :
1. Tracking and trending key performance indicators
2. Measuring business performance
3. Reporting and understanding financial results
4. Understanding customers and their behavior
5. Identifying high-value customers
6. Better selection or development of new products
7. Understanding which products should be scaled back or eliminated
8. Understanding business competitors

1.7. Sumber Data Datawarehouse


Sumber data DW berasal dari berbagai sumber (biasanya heterogen).
Beberapa sumber data yang biasanya dipakai organisasi untuk datawarehouse
dantaranya adalah:
 Order processing di supermarket, distribusi dan berbagai organisasi yang
melayani penjualan
 Production scheduling di perusahaan manufaktur yang memproduksi barang
 Financial trading systems di organisasi/ perusahaan yang melakukan transaksi
pertukaran barang/ jasa
 Claims handling di perusahaan asuransi atau sejenisnya yang biasanya
menangani klaim yang berkaitan dengan potensi kerugian
 Accounts payable/receivable terkait dengan hutang/ piutang dagang
 Employee payroll terkait dengan data penggajian
 Dan lain-lain.

Universitas Esa Unggul


http://esaunggul.ac.id 7 / 12
1.8. Komponen Data Warehouse
Secara dasar, data warehouse dibangun dari 3 komponen berikut:
1. Teknologi
Data warehouse saat ini lebih berperan sebagai data integrator sehingga lebih
mengarah ke optimasi proses ETL, dan dukungan untuk data mining dan business
intelligent dalam volume yang besar.
2. Business Requirement
Pengembangan data warehouse sangat bergantung pada kebutuhan, ruang
lingkup dari bisnis perusahaan.
3. Data
Data yang digunakan DW dapat berasal dari berbagai sumber yang berbeda. Oleh
karena itu harus melalui proses ETL (Extract-Transform-Loading), dimana data
transaksional yang ada harus di proses (extract), lalu di ubah formatnya
(transform) sesuai spesifikasi DW, baru kemudian dimuat (load) ke database DW.

2. Topik Perkuliahan
Topik mata kuliah Datawarehouse terbagi menjadi 2 bagian, yakni bagian ke-1
lebih kearah konseptual dan bagian ke-2 lebih kearah praktek pemanfaatan
datawarehouse ke dalam studi kasus. Bagian pertama diselesaikan sebelum ujian
tengah semester (UTS), sedangkan bagian kedua diselesaikan setelah UTS atau
sebelum ujian akhir semester (UAS).
Adapun topik-topik perkuliahan sebelum UTS adalah :
a. Topik 1 - Pengantar datawarehouse
b. Topik 2 - Arsitektur datawarehouse
c. Topik 3 - Fase-fase pembangunan datawarehouse
d. Topik 4 - Analisis kebutuhan (data-driven, goal-driven)
e. Topik 5 - Analisis kebutuhan (user-driven, process-driven & externally-
driven)
f. Topik 6 - Disain konseptual
g. Topik 7 - Identifikasi fakta, dimensi, ukuran dan agregasi
Untuk topik-topik perkuliahan setelah UTS adalah :
a. Topik 08 - Disain logikal (Pemodelan Dimensional)
b. Topik 09 - Disain logical (ROLAP, MOLAP dan HOLAP)
c. Topik 10 - Konsep ETL

Universitas Esa Unggul


http://esaunggul.ac.id 8 / 12
d. Topik 11 - ETL dengan memanfaatkan Pentahoo
e. Topik 12 - Data Mart
f. Topik 13 - Enterprise Data Warehouse
g. Topik 14 - Review dan presentasi tugas

3. Buku Referensi dan Komponen Penilaian

Mata kuliah Data Warehouse memiliki tujuan perkuliahan yang harus diwujudkan
dalam satu semester perkuliahan. Setelah selesai pembelajaran diharapkan
mahasiswa mampu:
a. Menjelaskan pengertian sejarah datawarehouse dan pentingnya
datawarehouse bagi organisasi.
b. Menguraikan perbedaan database konvensional dengan datawarehouse
c. Menjelaskan fase-fase yang diperlukan untuk pembangunan datawarehouse
d. Melakukan analisis kebutuhan untuk pembangunan datawarehouse
e. Merancang disain konseptual untuk pembangunan datawarehouse
f. Merancang disain logikal untuk pembangunan datawarehouse
g. Merancang disain ETL untuk transformasi data dari database sumber ke
database datawarehouse
h. Menggunakan tool Pentahoo untuk melakukan transformasi otomatis dari
database sumber ke database datawarehouse
i. Merancang data mart
j. Merancang enterprise datawarehouse
k. Mengintegrasikan kualitas data ke seluruh fase pembangunan datawarehouse
l. Menerapkan pengetahuan dan pemahaman konsep datawarehouse ke studi
kasus riil

Untuk mencapai tujuan tersebut, mata kuliah Data Warehouse menggunakan


berbagai buku referensi. Ada beberapa buku yang direkomendasikan untuk dipelajari,
yakni :
1. The Data Warehouse Development Life Cycle. Kimball et al. (2007). Wiley
Publishing Inc.
2. Data Warehouses and OLAP: Concepts, Architectures and Solutions. Wrembel R
and Koncilia C. (2006)

Universitas Esa Unggul


http://esaunggul.ac.id 9 / 12
3. Data Warehouse Development Framework with Data Quality Consideration.
Munawar. 2016

Untuk penilaian akhir, komponen penilaian yang digunakan terdiri dari UTS,
UAS dan tugas. Dalam kuliah online komponen penugasan ditambah dengan kuis,
sedangkan komponen kehadiran tidak diperhitungkan karena ditekankan pada aspek
aktivitas di website. Adapun proporsi penilaiannya sebagai berikut :
a. UTS = 20 %
b. UAS = 30 %
c. Kuis = 15 %
d. Tugas = 35 %
Khusus untuk tugas, bisa dilakukan secara kelompok dengan perincian sebagai
berikut:
 Tugas bisa dilakukan secara kelompok dengan jumlah maksimal 3 orang
 Data yang digunakan harus data riil dari perusahaan/ organisasi bisnis
 Jumlah data minimal 5 tahun transaksi (tidak perlu harus data terkini. Hanya saja
kalau bisa dapat data 5 tahun terakhir akan lebih baik)
 Data harus ada data transaksi agar bisa dilakukan drill-down dan drill-up serta
analisis trend

C. Latihan
a. Mengapa data warehouse kian dibutuhkan banyak organisasi bisnis?
b. Manfaat paling mendasar apa yang diharapkan oleh organisasi bisnis saat
membangun datawarehouse?
c. Apakah semua data yang dimiliki organisasi/ perusahaan bisa
diintegrasikan ke dalam datawarehouse?
d. Apa perbedaan mendasar dari database konvensional dengan
datawarehouse?

D. Kunci Jawaban

a. Pertumbuhan volume data yang sangat besar telah menimbulkan


gunungan data, namun miskin informasi. Padahal siapa yang menguasai
informasi akan memiliki kekuatan. Dengan datawarehouse, data yang

Universitas Esa Unggul


http://esaunggul.ac.id 10 /
12
tersebar di berbagai unit atau berbagai aplikasi bisa diintegrasikan guna
mendukung pengambilan keputusan.
b. Manfaat paling dasar dari adanya datawarehouse adalah sebagai data
integrator dari berbagai sumber yang heterogen sehingga bisa
mendukung proses pengambilan keputusan oleh eksekutif
c. Tidak semua data yang dimiliki organisasi/ perusahaan bisa diintegrasikan
ke datawarehouse. Umumnya yang diintegrasikan ke dalam database
datawarehouse adalah transaksi bisnis/ OLTP.
d. Perbedaan mendasar antara database konvensional dengan
datawarehouse terletak dari sifat penggunaannya. Kalau database
konvensional digunakan untuk OLTP (online transaction processing),
sementara datawarehouse digunakan untuk OLAP (online analytical
processing)

Referensi
Amin, M.R and Arefin, M.T. (2010). The Empirical Study on the Factors Affecting
Data Warehousing Success. International Journal of Latest Trends in
Computing (E-ISSN: 2045-5364) Volume 1, Issue 2, December 2010
Marotta, A. Ruggia, R. (2002). Data Warehouse Design: A schema-transformation
approach. SCCC’2002. Chile.
Nemoni, R and Konda, R. (2009). A Framework for Data Quality in Datawarehouse.
In J. Yang et. Al (Eds): UNISCON 2009, LNBIP 20, pp 292 – 297. Springer-
Verlag Berlin Heidelberg
Pighin and Leronutti, (2008). A Methodology Supporting the Design and Evaluating
the Final Quality of Data Warehouses. IGI Global

Universitas Esa Unggul


http://esaunggul.ac.id 11 /
12

Anda mungkin juga menyukai