01-Modul DW Intro
01-Modul DW Intro
(CSD310)
MODUL 1
PENGANTAR DATA WAREHOUSE
DISUSUN OLEH
Ir. Munawar, MMSI., M.Com., PhD
B. Uraian Perkuliahan
1. Materi Dasar Perkuliahan
1.1. Pendahuluan
Data warehouse ialah repository (koleksi /kumpulan sumber daya yang bisa
diakses untuk mendapatkan informasi) dari sebuah data organisasi yang tersimpan
secara elektronis. Data warehouse di desain untuk memfasilitasi pelaporan dan
analis data menjadi bentuk informasi yang bernilai lebih.
Secara sederhana, data warehouse dapat disebut sebagai koleksi dari data
yang sangat besar dan kompleks. Fokus data warehouse lebih dititikberatkan pada
penyimpanan data, dimana sumber data utama akan dibersihkan, di
transformasikan, lalu dikategorikan, hingga bisa digunakan oleh manager dan
profesional lain dengan memanfaatkan data mining, OLAP (online
Analytical processing), DSS dan berbagai jenis dashboard lainnya.
Secara singkat bisa dikatakan bahwa untuk mendapatkan dan melakukan
analisis data, perlu dilakukan proses yang disebut extract, transform dan loading
(ETL) di datawarehouse. Karena banyak hal yang bisa dilakukan oleh
datawarehouse, definisi lebih lanjut dari datawarehouse termasuk business
intelligence tools, tools untuk extract, transform dan load data ke repository, dan
tools untuk manajemen metadata.
1.2. Sejarah
Awal mula data warehouse berangkat dari tahun 80 an, dimana peneliti IBM
Barry Devlin and Paul Murphy mengembangkan “business data warehouse”, yang
2. Topik Perkuliahan
Topik mata kuliah Datawarehouse terbagi menjadi 2 bagian, yakni bagian ke-1
lebih kearah konseptual dan bagian ke-2 lebih kearah praktek pemanfaatan
datawarehouse ke dalam studi kasus. Bagian pertama diselesaikan sebelum ujian
tengah semester (UTS), sedangkan bagian kedua diselesaikan setelah UTS atau
sebelum ujian akhir semester (UAS).
Adapun topik-topik perkuliahan sebelum UTS adalah :
a. Topik 1 - Pengantar datawarehouse
b. Topik 2 - Arsitektur datawarehouse
c. Topik 3 - Fase-fase pembangunan datawarehouse
d. Topik 4 - Analisis kebutuhan (data-driven, goal-driven)
e. Topik 5 - Analisis kebutuhan (user-driven, process-driven & externally-
driven)
f. Topik 6 - Disain konseptual
g. Topik 7 - Identifikasi fakta, dimensi, ukuran dan agregasi
Untuk topik-topik perkuliahan setelah UTS adalah :
a. Topik 08 - Disain logikal (Pemodelan Dimensional)
b. Topik 09 - Disain logical (ROLAP, MOLAP dan HOLAP)
c. Topik 10 - Konsep ETL
Mata kuliah Data Warehouse memiliki tujuan perkuliahan yang harus diwujudkan
dalam satu semester perkuliahan. Setelah selesai pembelajaran diharapkan
mahasiswa mampu:
a. Menjelaskan pengertian sejarah datawarehouse dan pentingnya
datawarehouse bagi organisasi.
b. Menguraikan perbedaan database konvensional dengan datawarehouse
c. Menjelaskan fase-fase yang diperlukan untuk pembangunan datawarehouse
d. Melakukan analisis kebutuhan untuk pembangunan datawarehouse
e. Merancang disain konseptual untuk pembangunan datawarehouse
f. Merancang disain logikal untuk pembangunan datawarehouse
g. Merancang disain ETL untuk transformasi data dari database sumber ke
database datawarehouse
h. Menggunakan tool Pentahoo untuk melakukan transformasi otomatis dari
database sumber ke database datawarehouse
i. Merancang data mart
j. Merancang enterprise datawarehouse
k. Mengintegrasikan kualitas data ke seluruh fase pembangunan datawarehouse
l. Menerapkan pengetahuan dan pemahaman konsep datawarehouse ke studi
kasus riil
Untuk penilaian akhir, komponen penilaian yang digunakan terdiri dari UTS,
UAS dan tugas. Dalam kuliah online komponen penugasan ditambah dengan kuis,
sedangkan komponen kehadiran tidak diperhitungkan karena ditekankan pada aspek
aktivitas di website. Adapun proporsi penilaiannya sebagai berikut :
a. UTS = 20 %
b. UAS = 30 %
c. Kuis = 15 %
d. Tugas = 35 %
Khusus untuk tugas, bisa dilakukan secara kelompok dengan perincian sebagai
berikut:
Tugas bisa dilakukan secara kelompok dengan jumlah maksimal 3 orang
Data yang digunakan harus data riil dari perusahaan/ organisasi bisnis
Jumlah data minimal 5 tahun transaksi (tidak perlu harus data terkini. Hanya saja
kalau bisa dapat data 5 tahun terakhir akan lebih baik)
Data harus ada data transaksi agar bisa dilakukan drill-down dan drill-up serta
analisis trend
C. Latihan
a. Mengapa data warehouse kian dibutuhkan banyak organisasi bisnis?
b. Manfaat paling mendasar apa yang diharapkan oleh organisasi bisnis saat
membangun datawarehouse?
c. Apakah semua data yang dimiliki organisasi/ perusahaan bisa
diintegrasikan ke dalam datawarehouse?
d. Apa perbedaan mendasar dari database konvensional dengan
datawarehouse?
D. Kunci Jawaban
Referensi
Amin, M.R and Arefin, M.T. (2010). The Empirical Study on the Factors Affecting
Data Warehousing Success. International Journal of Latest Trends in
Computing (E-ISSN: 2045-5364) Volume 1, Issue 2, December 2010
Marotta, A. Ruggia, R. (2002). Data Warehouse Design: A schema-transformation
approach. SCCC’2002. Chile.
Nemoni, R and Konda, R. (2009). A Framework for Data Quality in Datawarehouse.
In J. Yang et. Al (Eds): UNISCON 2009, LNBIP 20, pp 292 – 297. Springer-
Verlag Berlin Heidelberg
Pighin and Leronutti, (2008). A Methodology Supporting the Design and Evaluating
the Final Quality of Data Warehouses. IGI Global