0% menganggap dokumen ini bermanfaat (0 suara)
341 tayangan

Database Management System

Dokumen ini membahas tentang pengantar sistem database, meliputi pengertian DBMS dan database, sejarah DBMS, definisi data, informasi, metadata, evolusi teknologi database, jenis database, manfaat DBMS, tingkat abstraksi dalam DBMS, query dalam DBMS, komponen sistem database, model data, dan desain database.
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
341 tayangan

Database Management System

Dokumen ini membahas tentang pengantar sistem database, meliputi pengertian DBMS dan database, sejarah DBMS, definisi data, informasi, metadata, evolusi teknologi database, jenis database, manfaat DBMS, tingkat abstraksi dalam DBMS, query dalam DBMS, komponen sistem database, model data, dan desain database.
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 286

PERTEMUAN 1

PENGENALAN DBMS
PENGENALAN SISTEM DATABASE

Database:
Database adalah kumpulan data, biasanya menggambarkan
kegiatan dari satu atau lebih organisasi terkait.
DBMS:
Database Management System (DBMS), adalah software yang
dirancang untuk membantu dalam memelihara, memanfaatkan, dan
menggunakan sekumpulan data yang besar dan sangat berkembang
pesat
SEJARAH DBMS
Sejak awal adanya komputer, menyimpan dan memanipulasi data
telah menjadi fokus utama sebuah aplikasi.Awalnya DBMS yang
didesain oleh Charles Bachman di General Electric pada awal tahun
1960 disebut Integrated Data Store. Ini membentuk dasar untuk
model data jaringan, yang distandarisasi oleh Conference On Data
System Languages (CODASYL) dan sangat berarti bagi sistem
database pada tahun 1960-an. Bachman adalah penerima
penghargaan pertama dari ACM Turing Award (penghargaan ilmu
komputer setara hadiah Nobel) yang bekerja di bidang database
pada tahun 1973.
Definisi
• Data
Fakta, teks, hasil pengukuran, gambar, suara, dan video yang
bernilai informasi.
• Informasi
Data yang telah diproses sebagai bahan dalam proses pengambilan
keputusan.
• Database
Kumpulan data yang terorganisir berdasarkan suatu struktur
hubungan.
• Metadata
Data yang mendeskripsikan data lain.

4
Informasi
Informasi - dapat dimanfaatkan sebagai dasar untuk
pengambilan keputusan dan memahami
permasalahan/situasi

5
Metadata
Deskripsi tentang format dan karakteristik data, termasuk
tipenya, ukurannya, nilai-nilai yang absah, dan
dokumentasi lainnya.

6
Evolusi Teknologi Database

• Flat File  1960an - 1980an


• Hierarchical  1970an - 1990an
• Network  1970an - 1990an
• Relational  1980an - sekarang
• Object-oriented  1990an - sekarang
• Object-relational  1990an - sekarang

7
Database Flat File
Database flat file sama dengan file data pada spreadsheet
(misal MS Excel™), berupa satu file berisi baris-baris
dengan jumlah kolom tetap yang disimpan berurutan dalam
file.
NIP Nama Nama Depan Telp
123-45-6789 Malik Abdul 021-555-1234
987-65-4321 Silalahi Roy 022-543-9876
987-65-4321 Mariano Arie 021-234-5678
567-89-0123 Iskandar Dony 021-987-6431

8
Database Hierarchical

9
Database Network

10
Sistem Berbasis File

11
DBMS
Aplikasi
1

Aplikasi
2

DBMS Basis data


sebagai pusat
data organisasi

DBMS mengelola sumber


Aplikasi
3 daya data sebagaimana
operating system (OS)
mengelola sumber daya
perangkat keras

12
Sistem File Versus DBMS

• Kapasitas penyimpanan data


• Kemampuan mengakses data
• Konkurensi data
• Perlindungan data dari kegagalan
• Keamanan data

Sistem / Teknologi Basis Data 13


Manfaat DBMS
• Independensi data
• Akses data efisien
• Integritas dan keamanan data
• Administrasi data
• Akses konkuren dan Crash Recovery
• Waktu pengembangan aplikasi terkurangi

14
TINGKAT ABTRAKSI DALAM DBMS
1. Model Relasional
2. Tingkat Abstraksi dalam DBMS
3. Independensi Data
MODEL RELASIONAL

• Dalam membangun deskripsi tentang pusat data


dalam model adalah suatu hubungan, yang
dapat dianggap sebagai kumpulan record.
• Deskripsi data dalam istilah model data disebut
skema. Dalam model relasional, skema
digunakan untuk relasi menentukan nama, nama
setiap field (atau atribut atau kolom), dan tipe
setiap field.
Independensi Data
• Indepedensi data adalah program aplikasi yang
telah terisolasi dari perubahan dalam struktur
data yang disimpan.
• Independensi data dicapai melalui penggunaan
dari tiga tingkat data abstraksi ; khususnya,
skema konseptual dan skema eksternal yang
mempunyai manfaat yang berbeda pada bidang
ini.
TINGKAT ABSTRAKSI DALAM DBMS

Data dalam sebuah DBMS dibagi menjadi tiga


tingkatan yaitu:
• Skema Konseptual
• Skema Fisik
• Skema Eksternal
TINGKAT ABSTRAKSI DALAM DBMS

External Schema 1 External Schema 2 External Schema 3

Logical Data
Independen
Conceptual Schema
Physical Data
Independen
Physical Schema

DISK
QUERY DALAM DBMS
• Query berfungsi untuk memudahkan mendapatkan
informasi dari database yang nantinya akan
digunakan untuk menentukan nilai informasi bagi
seorang pengguna
Lanjutan
• Queries: pertanyaan yang melibatkan data di dalam DBMS.
• Bahsa Query: bahasa khusus yang dapat digunakan untuk
menapilkan query yang diinginkan.
• Kalkulus relasional: adalah bahasa query formal berdasarkan
logika matematika, dan query yang ditampilkan dalam bahasa
ini memiliki arti dan maksud yang tepat.
• Aljabar relasional: merupakan bahasa query formal
berdasarkan kumpulan operator untuk memanipulasi relasi,
yang setara dengan kalkulus.
Independensi Data
• Indepedensi data adalah program aplikasi yang telah
terisolasi dari perubahan dalam struktur data yang
disimpan.
• Independensi data dicapai melalui penggunaan dari
tiga tingkat data abstraksi ; khususnya, skema
konseptual dan skema eksternal yang mempunyai
manfaat yang berbeda pada bidang ini.
Komponen Sistem Database

• Repositori  Pusat penyimpanan metadata.


• Database Management System (DBMS)  Perangkat
lunak untuk mengelola database.
• Database  Pusat penyimpanan data.
• Program Aplikasi  Perangkat lunak pengguna data.
• User Interface  Fasilitas interaksi antara pengguna
dan data secara tekstual atau grafis.
• CASE Tools  Computer - Aided Software
Engineering.

Sistem / Teknologi Basis Data 23


Lanjutan
• Administrator Data  Personil yang bertanggung-
jawab memelihara database.
• Developer Sistem  Personil yang bertanggung-
jawab merancang program aplikasi beserta struktur
datanya dalam database.
• End User  Orang yang menggunakan aplikasi dan
database.

Sistem / Teknologi Basis Data 24


Komponen Sistem Database

25
Model Data
• Model Data
Kumpulan konstruksi deskripsi data level tinggi yang
menyembunyikan banyak detail penyimpanan level rendah. DBMS
memungkinkan pengguna untuk menentukan data yang disimpan
dalam model data.
• Skema Logis
Mendeskripsikan data yang disimpan dalam model data DBMS
berupa semua relasi yang disimpan dalam database.
• Skema Fisik
Menentukan detail penyimpanan data berupa mendeskripsikan
bagaimana relasi dalam skema Logis disimpan pada alat
penyimpanan sekunder seperti disk atau tape.

26
Contoh Skema Logis

27
Contoh Skema Fisik

28
Tujuan
– Menjelaskan konsep model data Entity-Relationship
(ER)
– Menjelaskan peran model data ER sebagai tahap
awal proses perancangan basisdata
Topik
• Model Data
• Model Entity-Relationship
– Apa model ER
– Mengapa model ER
– Konsep model ER
– Skema dan Instance
– Skema model ER
– Diagram ER
– Notasi Diagram ER
– Contoh Diagram ER
– Komentar mengenai model ER
DESAIN DATABASE
Proses desain database dapat dibagi menjadi enam langkah

1. Analisis Persyaratan : Langkah yang sangat penting


dalam merancang aplikasi database adalah untuk
memahami data apa yang akan disimpan dalam
database
2. Database Desain Konseptual: Informasi yang
dikumpulkan secara konseptual.
3. Desain Database Logical: memilih sebuah DBMS untuk
desain, dan mengubah desain dari bentuk konseptual
ke skema database dalam data model DBMS
DESAIN DATABASE
4. Skema perbaikan : menganalisis koleksi hubungan
dalam skema relasional database
5. Database Desain Fisik: beban kerja database yang
melibatkan indeks pada beberapa tabel dan clustering
6. Keamanan Desain: mengidentifikasi bagian-bagian
dari database yang dapat mengakses sebuah DBMS
Model Data
• Model data adalah kumpulan konsep yang digunakan
untuk menjelaskan struktur basis data, yang meliputi:
– hubungan (relationship) antar data
– arti (semantic) data
– batasan (consistency constraint) data
– representasi data
MODEL DATA
Model data adalah kumpulan perangkat konseptual data tingkat
tinggi yang menyembunyikan detail tentang bagaimana data
disimpan.

Model data semantik adalah model data abstrak yang


membuatnya lebih mudah bagi pengguna untuk memulai
dengan deskripsi awal yang baik dari data dalam suatu
organisasi. Model ini mengandung berbagai macam konsep yang
menggambarkan susunan aplikasi nyata.

Model Relasional adalah model data yang menggambarkan data


dengan relasinya.
SKEMA
 Deskripsi data dalam istilah model data disebut skema

 Dalam model relasional, skema untuk suatu relasi


menentukan nama dari setiap field (atribut atau kolom), dan
jenis dari masing-masing field.

• contoh, informasi mahasiswa dalam sebuah database


universitas dapat disimpan dalam suatu relasi dengan skema
sebagai berikut:

Mahasiswa(sid: string, nama: string, login: string, umur: integer,


IPK: real)
Model Data
• Macam-macam Model Data

– Object-based Logical Model


• Misalnya: Entity-Relationship (ER), Object-
oriented, Semantic, dan Functional Data Model

– Record-based Logical Model


• Misalnya: Relational, Hierarchy, dan Network Data
Model
Model ER
• Apakah Model ER?
– Model data konseptual
– Tidak mendeskripsikan cara data disimpan didalam
komputer
– Mendekati pengamatan pemakai terhadap data riil
– Digunakan pada tahap awal perancangan basisdata
MODEL E-R (Entity Relationship)
Model E-R menggambarkan data yang terlibat dalam organisasi,
hubungan objek serta dapat digunakan untuk mengembangkan
desain awal database

Model ER sangat penting terutama perannya dalam desain


database. Model ER menyediakan konsep yang memungkinkan
untuk berpindah dari deskripsi apa yang pengguna inginkan
pada database , untuk menjelaskan lebih rinci dan dapat
diimplementasikan dalam DBMS.
Model ER
Mengapa Model ER?
High level
Mudah dimengerti karena tidak termasuk
perincian implementasi
Sebagai alat komunikasi dengan pemakai
nonteknis lain
Untuk memastikan apakah semua kebutuhan
data pemakai sudah tercakup dan tidak ada
konflik
Bagaimana data disimpan bisa diabaikan
untuk sementara
ENTITAS, ATRIBUT, DAN ENTITY SET
Model ER didasarkan atas entity dan hubungan antar
entity, dimana
– entity:
• Objek riil yang dapat dibedakan satu sama lain
• Dapat berupa objek yang ada secara fisik (orang,
mobil, …)
• Dapat berupa objek yang ada secara konsep
(organisasi, pekerjaan, mata kuliah, …)
HIMPUNAN ENTITAS KARYAWAN

• Himpunan entitas diwakili oleh persegi panjang.


• Atribut diwakili oleh oval.
• Atribut kunci primer digarisbawahi.

nama

ssn alamat

karyawan
Lanjutan
– attribute:
• Sifat-sifat yang dimiliki oleh entity
• Contoh: entity Karyawan, atribute: nama, alamat,
umur, ...
– relationship:
• Hubungan antar entitas melalui atribut pada suatu
entitas yang merujuk ke entitas lainnya
• Hubungan dapat dinyatakan secara implisit, atau
eksplisit
• Hubungan memiliki batasan-batasan, yaitu: rasio
hubungan, dan partisipasi hubungan
Model ER
• Schema, Instance
– Model data memisahkan deksripsi data dari datanya
sendiri
– Deskripsi data disebut skema (schema, intension)
– Data didalam basisdata pada suatu saat disebut
instance (extension)
– Data didalam basisdata dapat berubah setiap saat,
akan tetapi skema lebih bersifat statis
Model ER
• Contoh Schema, dan Instance

Schema: EMPLOYEE(Name, Age, Salary)


COMPANY(Name, Headquarter, President)

Instance: EMPLOYEE COMPANY


Budi 55 80k Bimoli Depok Budi
Lisa 40 30k IDM Bogor Bob
Martin 25 20k
Model ER
• Schema model ER terdiri atas
– Entitas (entity)
– Attribute & Nilainya (attribute value sets)
– Attribute kunci (key attribute)
– Hubungan (relationship)
Model ER
• Entitas (entity)
– Tipe entitas (entity type, entity set)
• Adalah kumpulan entitas yang memiliki atribut-
atribut yang sama
– Entitas lemah (weak entity)
• Adalah entitas yang tidak mempunyai cukup atribut
untuk membentuk suatu key yang unik
Model ER
• Macam-macam atribut:
– Simple/Atomic: atribut yang tidak dapat dibagi, eg.
Gaji
– Composite:
– Atribut yang dapat dibagi menjadi beberapa
atribut dasar
– eg. Nama (First_Name, Last_Name), Alamat
(Street, Number, City)
– Single-valued: hanya memiliki satu harga, eg. Gaji
– Multi-valued: memiliki lebih dari satu harga, biasanya
punya batas bawah dan batas atas, eg. Gelar
Model ER
– Derived:
• nilainya diturunkan dari atribute lain yang disimpan (stored
atribute), eg. Umur diturunkan dari atribut: Tgl_lahir
– Null-valued
• Suatu nilai husus bagi suatu atribut
• Digunakan apabila nilai suatu atribut dari suatu entitas
– Tidak diketahui apakah nilai dari atribut tsb ada atau
tidak
– Memiliki nilai, hanya tidak diketahui nilainya (missing)
– Value set (domain) dari atribut:
• Adalah kumpulan nilai/harga yang dapat dimiliki oleh atribut
suatu entitas
Model ER
• Atribut kunci
– Atribut yang unik dari suatu entitas
– Berfungsi sebagai identitas
– Suatu entitas dapat lebih dari satu, atau berupa
composite attribute

• Atribut kunci bagi weak entity


– Hanya bersifat parsial.
– Atribut kunci yang sesungguhnya merupakan
gabungan dari atribut kunci entitas kuat dan atribut
kunci parsial dari entitas lemahnya
Model ER
• Relationship Type
– Kumpulan hubungan antar entitas-entitas tertentu
– Disebut berhubungan apabila ada satu atribut dari suatu
entitas merujuk ke atribut entitas lainnya, contoh:
• Atribute Manager dari entitas DEPARTMENT merujuk
ke entitas EMPLOYEE yang memimpin suatu
departemen
• Atribut ControllingDepartment dari entitas PROJECT
merujuk ke entitas DEPARTMENT yang menangani
suatu proyek
• Atribut Supervisor dari entitas EMPLOYEE merujuk ke
EMPLOYEE yang menjadi pengawas karyawan ybs.
HIMPUNAN RELASI Work_In

Pada gambar diatas membahas tentang relasi yang saling


berhubungan dimana setiap relasi meliputi divisi dengan para
pekerjanya. Catatan untuk relasi tersebut mungkin termasuk
kedalam kumpulan entitas yang sama. Sebagai contoh, kita
mungkin bisa mengatur sekumpulan relasi antara para pekerja
dengan divisinya
since

name dname

ssn lot did budget

Employee Work_I Departeme


n n
PERTEMUAN 3

Model E-R (Lanjutan)


Model ER

• Relationship Constraints
– Merupakan kendala yang membatasi kemungkinan
kombinasi entitas yang terlibat dalam relationship
instance
– Contoh: setiap pegawai hanya bekerja untuk satu
departemen

• Jenis Relationship Constraints


– Cardinality ratio (kardinalitas)
– Participation Constraint
Model ER
1:1
• Cardinality Ratio
– Menunjukan banyaknya relationship instance
dimana entitas dapat berpartisipasi kedalamnya
– Jenisnya: 1:1, 1:N, dan M:N
– Contoh: DEPARTMENT: EMPLOYEE adalah 1:N
Model ER
 Participation Constraint
Menunjukan batasan keterlibatan suatu entitas
dalam suatu relationship
Jenisnya: Total, dan Partial
Total: setiap entitas harus terlibat dalam suatu
relationship
Partial: tidak harus seluruh entitas terlibat dalam
suatu relationship
Model ER

1:1
Model ER
M:1
Model ER

M:N
Lanjutan
• Attribute dari Relationship type
– Memiliki attribute yang menunjukkan sifat-sifat yang
dimiliki oleh relationship type
– Contoh :
• WORKS_ON
– Atrribute HOURS untuk menyimpan data
lamanya karyawan bekerja untuk suatu proyek
perminggu
• MANAGES
– Attribute STARTDATE untuk menyimpan data
kapan seorang employee menjadi manager
DIAGRAM ER

• DIAGRAM ER
– Merepresentasikan skema ER secara diagram
– Ada alat bantu untuk model ER (CASE TOOLS) :
• Analisa
• Menggambar
• Mapping ke data model lain
NOTASI DIAGRAM ER
Case study
CASE 1: Perancangan Basisdata COMPANY

• Phase-1: Deskripsi mengenai COMPANY


-- 1 --
– Perusahaan memiliki beberapa departemen.
– Setiap departemen memiliki nama dan kode
departemen yang unique, dan seorang pegawai yang
me-manage departemen tsb.
– Database menyimpan tanggal mulai bekerja dari
setiap Manager departemen
– Sebuah departemen dapat memiliki beberapa lokasi
Case study...
-- 2 --
Sebuah departemen mengawasi sejumlah proyek.
Setiap proyek memiliki nama yang unik, kode
yang unik, dan sebuah lokasi
Case study…

-- 3 --
– Bagi setiap pegawai, database menyimpan nama,
ssn, alamat, gaji, jenis_kelamin, dan tanggal_lahir.
– Seorang pegawai ditugaskan pada sebuah
departemen, namun dapat bekerja untuk beberapa
proyek yang tidak selalu berada dibawah
pengawasan departemen yg sama.
– Database menyimpan data jumlah jam kerja per-
minggu setiap pegawai pada setiap proyek yang
dikerjakannya.
– Database menyimpan data atasan langsung setiap
pegawai
Case study…
-- 4 --
Untuk keperluan asuransi, database juga
menyimpan data tanggungan (dependents) setiap
pegawai
Atribut setiap tanggungan: Name, Sex, BirthDate,
Relationship
Case study…
 Phase-2: Rancangan Konseptual Awal

(1). Entity Type: DEPARTMENT


Atribut: Name, Number, {Locations}, Manager,
ManagerStartDate
Atribut Locations: multi-valued atribut

(2). Entity Type: PROJECT


Atribut: Name, Number, Location,
ControllingDepartment
Case study…
(3). Entity Type: EMPLOYEE
Atribut: Name(FName, MInit, LName), SSN, Sex,
Address, Salary, BirthDate, Department, Supervisor,
{WorksOn(Project, Hours)}
Atribute Name, dan Address dapat merupakan
Composite attribute (harus dicek kembali dengan
kebutuhan pemakai)

(4). Entity Type: DEPENDENT


Atribut: Employee, DependentName, Sex, BirthDate,
Relationship
Case study...

 Implicit relationship:
Atribut Manager (DEPARTMENT) menunjuk ke
Pegawai yang menjadi Manager suatu
departemen
Atribut ControllingDepartment (PROJECT)
menunjuk ke departemen yang mengawasi
proyek tsb
Atribut Supervisor(EMPLOYEE) menunjuk ke
pegawai yang menjadi pengawas pegawai tsb
Case study...
 Penghalusan Rancangan Konseptual:
 MANAGES:
Relasi antara EMPLOYEE dengan DEPARTMENT
Cardinality Ratio= 1:1
Partisipasi EMPLOYEE: parsial
Partisipasi DEPARTMENT: tidak dinyatakan secara jelas
oleh hasil dari Phase-1
 Perlu ditanyakan kepada pemakai: adakah yang
menyatakan bahwa suatu departemen harus selalu
memiliki Manager
Tipe Relasi MANAGES memiliki atribut: StartDate
Case study...

 WORKS_FOR:
Relasi antara DEPARTMENT dengan EMPLOYEE
Cardinality Ratio= 1:N
Partisipasi EMPLOYEE: total
Partisipasi DEPARTMENT: total
Case study...
CONTROLS:
Relasi antara DEPARTMENT dengan PROJECT
Cardinality Ratio= 1:N
Partisipasi DEPARTMENT: ditetapkan sebagai
parsial (sesudah konsultasi dengan para
pemakai)
Partisipasi PROJECT: total
Case study...

 SUPERVISION:
Relasi antara EMPLOYEE (peran yang diawasi) dengan
EMPLOYEE (peran Supervisor)
Cardinality Ratio= 1:N
Partisipasi kedua EMPLOYEE: parsial
Hasil wawancara: Tidak semua pegawai adalah
Supervisor, dan tidak semua pegawai memiliki
Supervisor
Case study...
 WORKS_ON:
Relasi antara EMPLOYEE dengan PROJECT
Cardinality Ratio= M:N
Partisipasi EMPLOYEE: total
Partisipasi PROJECT: total
Hasil wawancara: Sebuah proyek dapat memiliki
beberapa pegawai yang bekerja didalamnya.
Case study...

 DEPENDENTS_OF:
Relasi antara EMPLOYEE dengan DEPENDENT
Cardinality Ratio= 1:N
DEPENDENT adalah sebuah weak entity
Partisipasi EMPLOYEE: parsial
Partisipasi DEPENDENT: total
Case study...
Case study...
• Diagram ER skema COMPANY (Alternatif)
PERTEMUAN 4
Model Data Relational

(Chap. 4 – Conoly)

(Hal 51-83 – Ramakrishnan)


Tujuan
– Menjelaskan model data relasional
– Menjelaskan langkah-langkah pemetaan dari diagram
ER ke model data relasional
Topik
• asal-usul dari model relasional.
• terminologi dari model relasional.
• bagaimana tabel digunakan untuk merepresentasikan
data
• sifat hubungan database.
• Bagaimana mengidentifikasi candidate, primary,
alternate, and foreign keys.
Model Data Relasional

• E.J. Codd, 1970


• Merupakan model data lojikal yang populer
• Secara intuitif dapat dilihat sebagai data yang disimpan
dalam sekumpulan tabel-tabel dua dimensi, dengan sifat
khusus
• Konsep tabel ~ konsep “relation” pada matematik
• Tabel terdiri atas sekumpulan kolom lengkap dengan
namanya dan sejumlah baris yang tidak bernama
Model Data Relasional

 Setiap kolom memiliki domain tertentu


 Hubungan antar tabel dinyatakan secara eksplisit
dengan duplikasi kolom dari satu tabel pada tabel lain
 Setiap relasi harus memiliki sebuah kolom atau
gabungan kolom yang memberikan identifikasi unik
untuk setiap baris dari relasi. Identitas ini sering disebut
key attribute (atribut kunci)
Terminologi
 Tabel/Relasi/Relation:
 Sebuah bentuk pernyataan data secara grafis dua
dimensi yang terdiri dari sekumpulan kolom bernama
dan sejumlah baris
 Relasi adalah tabel dengan kolom dan baris.

 Baris/Tuple:
 Baris-baris yang ada didalam sebuah tabel yang
menyatakan isi dari tabel tersebut

 Attribute:
 Suatu dikaitkan adalah kolom bernama relasi.
lanjutan
 Tupel adalah panah relasi.
 Derajat relasi adalah jumlah atribut yang dikandungnya.
 Kardinalitas relasi adalah jumlah tuple yang
dikandungnya.
 Domain:
 Kumpulan nilai-nilai yang berlaku untuk sebuah kolom
dari sebuah tabel
 Setiap atribut dalam relasi didefinisikan pada
domain.
 Setiap kolom mempunyai domain tertentu dan
beberapa kolom dapat mempunyai sebuah domain
yang sama. Contoh: telp_rumah, telp_kantor
Lanjutan
 Relation instance:
 Kumpulan baris-baris dari relasi yang masing-masing
terdiri dari nilai-nilai tertentu yang menyatakan nilai dari
informasi yang disimpan pada saat tertentu
Attribute

TEMAN No Nama Telp_r Telp_k


1 Yudho 3673576 7270162
2 Yova 4327843 7608566
Tuples 3 Budi 5438733 9673444
4 Dwi 6989832 6982454
Sifat-sifat khusus Tabel
 Entri dalam kolom bernilai atomik (tidak dp dibagi)
 Entri dalam kolom berjenis sama
 Setiap baris adalah unik
 Urutan kolom (dari kiri ke kanan) bersifat bebas, tetapi
urutan nilai harus mengikuti urutan kolom
 Urutan baris (dari atas ke bawah) bersifat bebas
 Setiap kolom mempunyai nama yang unik
Nilai atribut pada tuple
 Harus atomic (bernilai tunggal)
 Multivalued attribute harus direpresentasikan pada relasi
lain
 Composite attribute dinyatakan dalam simple attribute
 Null value bisa disebabkan karena tidak ada harga, atau
tidak berguna
Key attribute pada Relasi

 Setiap baris dari suatu relasi mempunyai identifier yang


unik, Satu atau gabungan kolom dapat menjadi identifier
 Superkey: kumpulan dari atribut yang bersifat unik

 Key:
 Superkey yang minimal (tidak ada atribut yang dapat
dihilangkan dari superkey yang membuat superkey
tetap unik)
 Candidate key: Sebuah relasi mungkin mempunyai
lebih dari satu key. Masing-masing key disebut
candidate key
lanjutan
 Primary key:
 Candidate key yang dipilih untuk mengidentifikasi
tuple/baris pada suatu relasi
 Nilai primary key tidak boleh mengandung NULL dan
harus unik.

 Foreign key:
 Satu/beberapa atribut yang merujuk pada relasi lain
yang merupakan primary key atrribute(s) di relasi lain
tsb dengan domain yang sama
Skema Model Relasional

Dinyatakan dengan nama relasi diikuti dengan nama-nama


kolomnya. Contoh:

EMPLOYEE

FNAME MINIT LNAME SSN BDATE ADDRESS SEX SALARY SUPERSSN DNO

DEPARTMENT DEPARTMENT
DNAME DNUMBER MGRSSN MGRSTARTDATE DNUMBER DLOCATIONS
PROJECT
WORKS_ON
PNAME PNUMBER PLOCATION DNUM
ESSN PNO HOURS
DEPENDENT

ESSN DEPENDENTNAME SEX BDATE RELATIONSHIP


Skema Model Relasional
 Contoh alternatif penulisan

DEPARTMENT (DNAME, DNUMBER, MGRSSN,


MGRSTARTDATE)

dom(DNAME) = Department-names
dom(DNUMBERS) = Department-numbers
Batasan Model Relasional
 Batasan diperlukan agar basis data selalu berada pada
kondisi konsisten meski telah dilakukan pengubahan
terhadap basis data tsb
 Batasan tsb disebut integrity constraint
 Macam-macam batasan:
 key constraint: nilai candidate key harus unik
 entity integrity: nilai primary key tidak boleh null
Batasan Model Relasional

 Referential integrity: batasan untuk dua relasi yang


saling berhubungan dimana bila tuple pada suatu
relasi menunjuk tuple pada relasi lain, maka harus
merujuk pada tuple yang benar-benar ada pada relasi
lain tsb
 Semantic integrity constraint: batasan yang lebih
umum, seperti gaji karyawan biasa tidak boleh lebih
besar dari gaji manajer.

 Operasi pengolahan data pada relasi seperti insert,


delete, dan modify harus menjaga agar batasan-
batasan tsb tidak dilanggar
Batasan Model Relasional
EMPLOYEE
FNAME MINIT LNAME SSN BDATE ADDRESS SEX SALARY SUPERSSN DNO

DEPARTMENT DEPT_LOCS

DNAME DNUMBER MGRSSN MGRSTARTDATE DNUMBER DLOCATIONS

PROJECT WORKS_ON

PNAME PNUMBER PLOCATION DNUM ESSN PNO HOURS

DEPENDENT

ESSN DEPENDENTNAME SEX BDATE RELATIONSHIP


PERTEMUAN 5

Model Data Relational


(Lanjut)
Pemetaan Diagran ER
ke Model Relasional
 Untuk setiap entity type E pada diagram ER, buat
satu relasi R yang mengandung semua simple
attribute dari E.
 Untuk composite attribute, masukkan komponen-
komponen simple attribute-nya
 Pilih salah satu dari key attribute E sebagai
primary key dari R
 Kalau primary key-nya bersifat composite maka
kumpulan simple attribute yang membentuknya
menjadi primary key juga
Pemetaan Diagran ER
ke Model Relasional
 Untuk setiap weak entity type W pada diagram ER
dengan owner entity type E, buatlah suatu relasi R
yang mengandung semua simple attribute W
sebagai atribut dari R
 Masukkan primary key dari E sebagai foreign key
dari R
 Primary key dari R adalah kombinasi dari primary
key E dan partial key dari W
 Contoh: relasi DEPENDENT
Pemetaan Diagran ER
ke Model Relasional
 Untuk setiap 1:1 binary relationship type R pada diagram
ER, tentukan relasi S dan T yang berpartisipasi pada
relationship type R
 Pilih salah satu relasi, misalkan S, masukkan primary key
dari T sebagai foreign key S. Sebaiknya S adalah entity
dengan total participation
 Masukkan semua atribut dari relationship type R sebagai
atribut dari S. (Lihat relationship Manages, Department
berpartisipasi total, muncul MGRSSN)
Pemetaan Diagran ER
ke Model Relasional

Alternatif: gabungkan kedua entity type


dan relationship menjadi satu relasi.
Hal ini dilakukan bila kedua entity yang
berpartisipasi pada relationship
mempunyai total participation dan entity
tidak terlibat pada relationship lainnya.
Pemetaan Diagran ER
ke Model Relasional
Untuk setiap 1:N binary relationship type R,
tentukan relasi S pada sisi N dari relasi yang
berpartisipasi pada relationship R.
Masukkan primary key dari T sebagai foreign key
dari S. Atribut dari R diambil sebagai atribut S
(Lihat relastionship WORKS_FOR dan
SUPERVISION, muncul DNO dan SUPERSSN)
Pemetaan Diagran ER
ke Model Relasional

 Untuk M:N binary relationship type R, buat relasi S baru


yang merepresentasikan R.
 Masukkan sebagai foreign key dari S, primary key dari
entity-entity yang berpartisipasi pada relationship.
 Kombinasi dari foreign key tsb membentuk primary key dari
S. Masukkan juga atribut dari relationship sebagai atribut S
(Lihat relasi WORKS_ON)
 Relationship 1:1 dan 1:N dapat dipetakan dengan cara 5.
Berguna bila instance hanya sedikit.
Pemetaan Diagran ER
ke Model Relasional
Untuk setiap multivalued attribute A, buat suatu
relasi R dengan memasukkan atribut A ditambah
dengan primary key K dari relasi yang menyatakan
entity/relationship type yang mempunyai A sebagai
atribut.
Primary key dari R ialah kombinasi dari A dan K
(Lihat relasi DEPT_LOCS)
Pemetaan Diagran ER
ke Model Relasional

Untuk tiap n-ary relationship type R dimana (n > 2),


buat relasi baru S untuk menyatakan R.
Masukkan primary key dari relasi-relasi yang
berpartisipasi pada relationship sebagai foreign key
dari S. Simple attribute dari R turut dimasukkan.
Primary key dari S adalah kombinasi dari semua
foreign key (Lihat contoh SUPPLIER)
Pemetaan Diagran ER ke Model Relasional
DIAGRAM MODEL ER
Pemetaan Diagram ER ke
Model Relasional
SKEMA MODEL RELASIONAL
EMPLOYEE f.k f.k
FNAME MINIT LNAME SSN BDATE ADDRESS SEX SALARY SUPERSSN DNO

p.k

DEPARTMENT f.k DEPT_LOCS

DNAME DNUMBER MGRSSN MGRSTARTDATE DNUMBER DLOCATIONS

p.k p.k

PROJECT WORKS_ON

PNAME PNUMBER PLOCATION DNUM ESSN PNO HOURS

p.k p.k

DEPENDENT

ESSN DEPENDENTNAME SEX BDATE RELATIONSHIP


p.k
Pemetaan Diagram ER ke Model Relasional

Gambar Diagram ER Quantity


SName ProjName

SUPPLIER SUPPLY PROJECT

PartNo

PART

Gambar Model Relational

SUPPLIER
PROJECT
SNAME ...
PROJNAME ...

PART SUPPLY

PARTNO ... SNAME PROJNAME PARTNO QUANTITY


CRITICAL SUCCESS FACTOR PERANCANGAN
BASISDATA

 Bekerja secara interaktif dengan pemakai(user)


 Memakai metodologi yang terstruktur
 Memakai pendekatan data-driven
 Memperhatikan struktur dan integritas dari model
 Memakai konsep visualisasi, normalisasi, validasi
transaksi pada model
 Memakai diagram untuk menggambarkan model
 Melengkapi model dengan data-dictionary
 Mau mengulang langkah yang belum tepat.
lanjutan
 Ada beberapa model data yang ada dan yang paling
populer saat ini adalah model data relasional.
 Produk-produk yang mengimplementasikan model
data relasional juga telah banyak tersedia.
 Untuk membentuk model data relasional dari diagram
ER telah tersedia langkah-langkah penuntunnya.
Perbedaan antara model Relational dengan Model ER
Model Relasional
Model ER  entity relation
 Entity type  foreign key atau realtionship
 1:1 atau 1:M relationship relation
 M:N relationship  relationship relation + 2 foreign key
 n-ary relationship  relationship relation + n foreign key
 simple attribute  attribute
 composite sttribute  kumpulan dari simple attribute
 multivalued attribute  relation + foreign key
 value set  domain
 key attribute  primary key
PERTEMUAN 6

Normalisasi Database
(Conoly-chap 14)

(Ramakisman -chap 15)


Normalisasi
• Normalisasi adalah teknik desain database yang dimulai
dengan memeriksa hubungan antar atribut.
• Dimana atribut menjelaskan dari data atau hubungan
antara data. Normalisasi menggunakan serangkaian tes
untuk membantu mengidentifikasi pengelompokan
optimal untuk atribut-atribut yang akhirnya
mengidentifikasi seperangkat hubungan sesuai dengan
kebutuhan data perusahaan.
Bagaimana Normalisasi Mendesign Database

Dua pendekatan utama menggunakan normalisasi:

1. Pendekatan pertama menunjukkan bagaimana


normalisasi dapat digunakan sebagai teknik bottom-up
desain database mandiri
2. Pendekatan 2 menunjukkan bagaimana normalisasi
dapat digunakan sebagai teknik validasi untuk
memeriksa struktur hubungan, yang mungkin telah
dibuat dengan menggunakan pendekatan top-down
Bagaimana normalisasi digunakan untuk desain
database.
Pengantar Penyempurnaan Skema:
Persoalan yang Ditimbulkan oleh Redundansi

• Redundansi ruang penyimpanan: beberapa data


disimpan secara berulang
• Update anomaly: Jika satu copy data terulang tsb
diubah, inkonsistensi data dpt terjadi kecuali kalau
semua copy dari data tsb diubah dengan cara yang
sama
• Insertion anomaly: Mungkin dpt terjadi kesulitan utk
menyisipkan data tertentu kecuali kalau beberapa data
tidak terkait lainnya juga ikut disisipkan
• Deletion anomaly: Mungkin dpt terjadi kesulitan utk
menghapus data tertentu tanpa harus kehilangan
beberapa data tidak terkait lainnya
Persoalan yang Ditimbulkan oleh
Redundansi: Contoh
• Redundansi ruang penyimpanan: nilai rating 8 yang
berkorespondensi dg wages 10 diulang tiga kali

• Update anomaly: Nilai wages (yg terkait dengan nilai


rating) dlm baris pertama dpt diubah tanpa membuat
perubahan yg sama pada baris kedua dan kelima
Persoalan yang Ditimbulkan oleh
Redundansi: Contoh (cont’d)
• Insertion anomaly: Kesulitan utk menyisipkan employee baru kecuali
nilai wage untuk rating dari employee tsb sudah diketahui

• Deletion anomaly: Jika semua baris yang terkait dg nilai rating


tertentu dihapus (misalnya baris utk employee ‘Smethurst’ dan
‘Guldu’ dihapus), maka kita akan kehilangan informasi
ketergantungan antara nilai rating dan nilai wages yang
diasosiasikan dengan nilai rating tsb (yaitu rating = 5 dan wages =
7)
Penyebab Anomali
Mengapa anomali - anomali ini terjadi ?
• Karena menggabungkan dua tema (konsep entitas)
dalam satu relasi. Ini mengakibatkan duplikasi – duplikasi
sebagai akibat dari ketergantungan antar atribut yang
tidak pada tempatnya.
Solusi : Normalisasi

8
Normalisasi
• Normalisasi adalah proses pembentukan struktur basis
data sehingga sebagian besar ambiguity bisa
dihilangkan.
• Tahap Normalisasi dimulai dari tahap paling ringan
(1NF) hingga paling ketat (5NF)
• Biasanya hanya sampai pada tingkat 3NF atau BCNF
karena sudah cukup memadai untuk menghasilkan
tabel-tabel yang berkualitas baik.
Normalisasi
Sebuah tabel dikatakan baik (efisien) atau normal jika
memenuhi 3 kriteria sbb:
1. Jika ada dekomposisi (penguraian) tabel, maka
dekomposisinya harus dijamin aman (Lossless-Join
Decomposition). Artinya, setelah tabel tersebut diuraikan /
didekomposisi menjadi tabel-tabel baru, tabel-tabel baru
tersebut bisa menghasilkan tabel semula dengan sama
persis.
2. Terpeliharanya ketergantungan fungsional pada saat
perubahan data (Dependency Preservation).
3. Tidak melanggar Boyce-Code Normal Form (BCNF) (-akan
dijelaskan kemudian-)
Normalisasi
Jika kriteria ketiga (BCNF) tidak dapat
terpenuhi, maka paling tidak tabel tersebut
tidak melanggar Bentuk Normal tahap
ketiga (3rd Normal Form / 3NF).
Langkah – Langkah Normalisasi

Sistem / Teknologi Basis Data


12
Tabel Universal
Tabel Universal (Universal / Star Table)  sebuah tabel
yang merangkum semua kelompok data yang saling
berhubungan, bukan merupakan tabel yang baik.

Misalnya:
Tabel Universal
Functional Dependency
• Notasi: A  B
A dan B adalah atribut dari sebuah tabel. Berarti secara
fungsional A menentukan B atau B tergantung pada A,
jika dan hanya jika ada 2 baris data dengan nilai A yang
sama, maka nilai B juga sama

• Notasi: A  B atau A x B
Adalah kebalikan dari notasi sebelumnya.
Functional Dependency
Contoh tabel nilai
Functional Dependency
Functional Dependency dari tabel nilai

• Nrp  namaMhs
Karena untuk setiap nilai nrp yang sama, maka nilai
namaMhs juga sama.
• {Namakul, nrp}  NiHuruf
Karena attribut Nihuruf tergantung pada Namakul dan nrp secara
bersama-sama. Dalam arti lain untuk Namakul dan nrp yang sama,
maka NiHuruf juga sama, karena Namakul dan nrp merupakan key
(bersifat unik).
• NamaKul  nrp
• Nrp  NiHuruf
Bentuk-bentuk Normal
1. Bentuk Normal Tahap Pertama (1st Normal Form /
1NF)
2. Bentuk Normal Tahap Kedua (2nd Normal Form / 2NF)
3. Bentuk Normal Tahap (3rd Normal Form / 3NF)
4. Boyce-Code Normal Form (BCNF)
5. Bentuk Normal Tahap (4th Normal Form / 4NF)
6. Bentuk Normal Tahap (5th Normal Form / 5NF)
Bentuk Normal Tahap Pertama
(1st Normal Form / 1NF)
• Bentuk normal 1NF terpenuhi jika sebuah tabel tidak
memiliki atribut bernilai banyak (multivalued attribute),
atribut composite atau kombinasinya dalam domain data
yang sama.

• Setiap atribut dalam tabel tersebut harus bernilai atomic


(tidak dapat dibagi-bagi lagi)
Contoh 1
Misal data mahasiswa sbb:

Atau:

Tabel-tabel di atas tidak memenuhi syarat 1NF


Contoh 1
Didekomposisi menjadi:
• Tabel Mahasiswa

• Tabel Hobi
Contoh 2 (composite)
Jadwal Kuliah
Kodekul NamaKul Dosen Kelas Jadwal

• Dimana nilai pada atribut jadwal berisi gabungan antara


Hari dan Jam.
• Jika asumsi hari dan jam memegang peranan penting
dalam sistem basis data, maka atribut Jadwal perlu
dipisah sehingga menjadi JadwalHari dan JadwalJam
sbb:
JadwalKuliah
Kodekul NamaKul Dosen Kelas JadwalHari JadwalJam
Bentuk Normal Tahap Kedua
(2nd Normal Form)
• Bentuk normal 2NF terpenuhi dalam sebuah tabel jika
telah memenuhi bentuk 1NF, dan semua atribut selain
primary key, secara utuh memiliki Functional
Dependency pada primary key
• Sebuah tabel tidak memenuhi 2NF, jika ada atribut yang
ketergantungannya (Functional Dependency) hanya
bersifat parsial saja (hanya tergantung pada sebagian
dari primary key)
• Jika terdapat atribut yang tidak memiliki ketergantungan
terhadap primary key, maka atribut tersebut harus
dipindah atau dihilangkan
Contoh
Tabel berikut memenuhi 1NF tapi tidak termasuk 2NF:
Mhs_nrp mhs_nama mhs_alamat mk_kode mk_nama mk_sks nihuruf

• Tidak memenuhi 2NF, karena {Mhs_nrp, mk_kode} yang


dianggap sebagai primary key sedangkan:
{Mhs_nrp, mk_kode}  mhs_nama
{Mhs_nrp, mk_kode}  mhs_alamat
{Mhs_nrp, mk_kode}  mk_nama
{Mhs_nrp, mk_kode}  mk_sks
{Mhs_nrp, mk_kode}  nihuruf

• Tabel di atas perlu didekomposisi menjadi beberapa tabel


yang memenuhi syarat 2NF
Contoh
Functional dependencynya sbb:

{Mhs_nrp, mk_kode}  nihuruf (fd1)


Mhs_nrp  {mhs_nama, mhs_alamat} (fd2)
Mk_kode  {mk_nama, mk_sks} (fd3)

fd1 (mhs_nrp, mk_kode, nihuruf)  Tabel Nilai


fd2 (Mhs_nrp, mhs_nama, mhs_alamat)  Tabel Mahasiswa
fd3 (mk_kode, mk_nama, mk_sks)  Tabel MataKuliah
Bentuk Normal Tahap Ketiga
(3rd Normal Form /3NF)
• Bentuk normal 3NF terpenuhi jika telah memenuhi
bentuk 2NF, dan jika tidak ada atribut non primary key
yang memiliki ketergantungan terhadap atribut non
primary key yang lainnya.

• Untuk setiap Functional Dependency dengan


notasi X  A, maka:
• X harus menjadi superkey pada tabel tsb.
• Atau A merupakan bagian dari primary key pada tabel
tsb.
Contoh
Tabel berikut memenuhi 2NF, tapi tidak memenuhi 3NF:
Mahasiswa

Nrp Nama Alm_Jalan Alm_Kota Alm_Provinsi Alm_Kodepos

 karena masih terdapat atribut non primary key (yakni alm_kota dan
alm_Provinsi) yang memiliki ketergantungan terhadap atribut non
primary key yang lain (yakni alm_kodepos):
alm_kodepos  {alm_Provinsi, alm_kota}
 Sehingga tabel tersebut perlu didekomposisi menjadi:
Mahasiswa (Nrp, nama, alm_jalan, alm_kodepos)
Kodepos (alm_kodepos, alm_provinsi, alm_kota)
Boyce-Code Normal Form
(BCNF)
• Bentuk BCNF terpenuhi dalam sebuah tabel, jika untuk
setiap functional dependency terhadap setiap atribut
atau gabungan atribut dalam bentuk: X  Y maka X
adalah super key
• tabel tersebut harus di-dekomposisi berdasarkan
functional dependency yang ada, sehingga X menjadi
super key dari tabel-tabel hasil dekomposisi
• Setiap tabel dalam BCNF merupakan 3NF. Akan tetapi
setiap 3NF belum tentu termasuk BCNF .
Perbedaannya, untuk functional dependency X  A,
BCNF tidak membolehkan A sebagai bagian dari primary
key.
Bentuk Normal Tahap Keempat
(4th Normal Form /4NF)
• Bentuk normal 4NF terpenuhi dalam sebuah tabel jika
telah memenuhi bentuk BCNF, dan tabel tersebut tidak
boleh memiliki lebih dari sebuah multivalued atribute

• Untuk setiap multivalued dependencies (MVD) juga


harus merupakan functional dependencies
Contoh
Misal, tabel berikut tidak memenuhi 4NF:

Setiap employee dapat bekerja di lebih dari project dan dapat


memiliki lebih dari satu skill. Untuk kasus seperti ini tabel
tersebut harus di-dekomposisi menjadi:

(Employee, Project)
(Employee, Skill)
Bentuk Normal Tahap Keempat
(5th Normal Form /5NF)
• Bentuk normal 5NF terpenuhi jika tidak dapat memiliki
sebuah lossless decomposition menjadi tabel-tabel yg
lebih kecil.

• Jika 4 bentuk normal sebelumnya dibentuk berdasarkan


functional dependency, 5NF dibentuk berdasarkan
konsep join dependence. Yakni apabila sebuah tabel
telah di-dekomposisi menjadi tabel-tabel lebih kecil,
harus bisa digabungkan lagi (join) untuk membentuk
tabel semula
PERTEMUAN 9

Penyempurnaan Skema
dan
Bentuk-bentuk Normal
Pokok Bahasan
• Persoalan-persoalan apa yang dapat ditimbulkan oleh adanya
redundansi penyimpanan informasi?
• Apa yang dimaksud dengan functional dependencies?
• Apa yang dimaksud dengan bentuk-bentuk normal (normal forms)
dan apa tujuannya?
• Apa manfaat dari BCNF dan 3NF?
• Apa pertimbangan dalam mendekomposisi relasi-relasi menjadi
bentuk-bentuk normal?
• Dimana proses normalisasi dapat digunakan dalam proses desain
basis data?
• Adakah bentuk kebergantungan (dependency) umum yang lebih
bermanfaat dalam desain basis data?
Pengantar Penyempurnaan Skema:
Persoalan yang Ditimbulkan oleh Redundansi

• Redundansi ruang penyimpanan: beberapa data


disimpan secara berulang
• Update anomaly: Jika satu copy data terulang tsb
diubah, inkonsistensi data dpt terjadi kecuali kalau
semua copy dari data tsb diubah dengan cara yang
sama
• Insertion anomaly: Mungkin dpt terjadi kesulitan utk
menyisipkan data tertentu kecuali kalau beberapa data
tidak terkait lainnya juga ikut disisipkan
• Deletion anomaly: Mungkin dpt terjadi kesulitan utk
menghapus data tertentu tanpa harus kehilangan
beberapa data tidak terkait lainnya
Persoalan yang Ditimbulkan oleh Redundansi: Contoh

• Redundansi ruang penyimpanan: nilai rating 8 yang


berkorespondensi dg wages 10 diulang tiga kali

• Update anomaly: Nilai wages (yg terkait dengan nilai


rating) dlm baris pertama dpt diubah tanpa membuat
perubahan yg sama pada baris kedua dan kelima
Persoalan yang Ditimbulkan oleh Redundansi: Contoh

• Insertion anomaly: Kesulitan utk menyisipkan employee baru kecuali


nilai wage untuk rating dari employee tsb sudah diketahui

• Deletion anomaly: Jika semua baris yang terkait dg nilai rating


tertentu dihapus (misalnya baris utk employee „Smethurst‟ dan
„Guldu‟ dihapus), maka kita akan kehilangan informasi
ketergantungan antara nilai rating dan nilai wages yang
diasosiasikan dengan nilai rating tsb (yaitu rating = 5 dan wages = 7)
Persoalan yang Ditimbulkan
oleh Redundansi: Null Values
• Untuk kasus-kasus khusus, adanya nilai-nilai null yang berlebihan
dalam suatu relasi dpt menimbulkan pemborosan pengunaan ruang
penyimpanan.

• Hal ini terutama dpt terjadi pada suatu relasi dengan jumlah attribut
yang besar dan jumlah baris yang juga besar, sehingga untuk kasus
tertentu dapat terjadi banyak nilai-nilai kolom yang tidak memenuhi
(not applicable) untuk sejumlah baris dalam relasi harus dibiarkan
bernilai null .

• Sebagai contoh, utk relasi “Hourly Employees”, misalkan ditambah


satu kolom baru (OfficeLocCode) utk mencatat kode lokasi kantor
dari para pemimpin perusahaan. Jika misalnya terdapat ribuan
employee, dan hanya ada sekitar 10% pemimpin, maka sebagian
besar (90%) nilai kolom tersebut akan terisi dengan nilai null
(pemborosan ruang penyimpan).
Pengantar Penyempurnaan Skema:
Dekomposisi Skema Relasi
• Proses Dekomposisi sebuah skema relasi R berupa penggantian
skema relasi menjadi dua (atau lebih) skema-skema baru yang
masing-masing berisikan subset dari attribut-attribut relasi R dan
kesemuanya memuat semua attribut yang ada dalam relasi R.
- Proses dekomposisi dilakukan dengan menggunakan konsep
ketergantungan fungsional (functional dependencies)

• Contoh: skema relasi “Hourly_Employees” dpt didekomposisi


menjadi:
– Hourly_Emps2 (ssn, name, lot, rating, hours)
– Wages (rating, wages)
Dekomposisi Skema Relasi:
Beberapa Persoalan Terkait
• Dekomposisi terhadap suatu skema relasi harus digunakan dengan
penuh pertimbangan. Dua pertanyaan yang harus selalu
dipertimbangkan:
1. Adakah alasan untuk mendekomposisi suatu relasi ?
2. Persoalan-persoalan apa saja (jika ada) yang akan diakibatkan
oleh dekomposisi ?
• Jawaban thdp pertanyaan pertama dpt dibantu dengan bentuk-
bentuk normal (Normal Forms/NF) terhadap relasi yang akan
didekomposisi. Utk ini jika suatu skema relasi berada dlm salah satu
NF, maka beberapa persoalan yang terkait dengan dekomposisi
tidak akan muncul
• Untuk jawaban thdp pertanyaan kedua, dua sifat penting dari
dekomposisi harus dipertimbangkan:
– Sifat lossless-join yang memungkinkan untuk membentuk
kembali (recover) nilai-nilai relasi yang didekomposisi dari relasi-
relasi hasil dekomposisi
– Sifat dependency-preservation yang memungkinkan untuk
memaksa agar constraints yang berlaku pada relasi asal tetap
berlaku pada sejumlah relasi-relasi yang lebih kecil
Functional Dependencies (FDs)

• Suatu functional dependency X Y dikatakan berlaku pada relasi R


jika, utk setiap nilai r dari R yang diperbolehkan, berlaku keadaan:
– t1  r , t2 r, X (t1) = X (t2) mengimplikasikan Y (t1) = Y (t2)
– yaitu, jika diberikan dua tuples dalam r, jika nilai proyeksi X pada kedua
tuples sama, maka nilai proyeksi Y pada kedua tuples juga sama. (X
dan Y adalah sets dari attributes pada relasi yang sama.)

• Sebuah FD adalah pernyataan yang berlaku pada semua relasi-


relasi yang dimungkinkan.
– Harus diidentifikasi berdasarkan semantik dari aplikasi
– Jika diberikan beberapa nilai r1 dari R yang mungkin, kita dpt
melakukan pengecekan apakah nilai tersebut melanggar beberapa FD
f, tetapi kita tidak dapat mengatakan bahwa f berlaku pada R!

• Jika K adalah sebuah candidate key untuk R, maka berarti bahwa K


R
– Tetapi, K  R tidak mengharuskan K terdiri dari satu set attribut yang
minimal !
Contoh: Constraints pada Entity Set

• Perhatikan relasi Hourly_Emps berikut:


– Hourly_Emps (ssn, name, lot, rating, hrly_wages, hrs_worked)

• Notasi: Utk penyederhaan penulisan, skema relasi tsb


akan dinotasikan dengan menggabungkan singkatan
dari attribut-attributnya: SNLRWH
– Notasi ini menyatakan satu set attributes {S,N,L,R,W,H}.
– Dalam beberapa kasus, nama sebuah relasi akan digunakan
untuk mengacu ke semua attribut dari relasi tersebut. (contoh,
Hourly_Emps untuk SNLRWH)

• Beberapa FD yang berlaku pada Hourly_Emps:


– ssn adalah sebuah key: S  SNLRWH
– rating menentukan hrly_wages: R  W
Contoh (Lanjutan)

• Beberapa persoalan akibat R  W :


– Update anomaly: Dapatkah W diubah hanya pada tuple pertama dari
SNLRWH ?
– Insertion anomaly: Bgm jika diinginkan utk menyisipkan seorang
employee tetapi hourly wage utk rating yang bersangkutan tidak
diketahui ?
– Deletion anomaly: Jika semua employee dengan rating 5 dihapus, maka
informasi mengenai hourly wage utk rating 5 juga akan ikut terhapus
Penyempurnaan ER Diagram

• Pemetaan diagram pertama:


Workers(S,N,L,D,S)
Departments(D,M,B)
– Lots diasosiasikan dengan relasi workers.
• Jika diasumsikan bhw semua workers dlm sebuah dept ditentukan
sebuah lot yang sama, maka D  L (Redundansi)
• Redundansi dpt diatasi dg:
Workers2(S,N,D,S)
Dept_Lots(D,L)
Departments(D,M,B)
• Dapat disempurnakan
(fine-tune) menjadi:
Workers2(S,N,D,S)
Departments(D,M,B,L)
Alasan Mengenai FD
• Jika diberikan satu set FDs, kita dapat menurunkan (infer) tambahan
FDs: ssn  did, did  lot mengimplikasikan ssn  lot

• Sebuah FD f dikatakan dapat diimplikasikan oleh (implied by) satu


set FDs F jika f berlaku bilamana semua FDs dalam F berlaku.
– F+ (closure of F) adalah set dari semua FDs yang diimplikasikan
oleh F.

• Aksioma Armstrong (X, Y, Z adalah sets dari attributes):


– Reflexivity: Jika X  Y, maka X  Y
– Augmentation: Jika X  Y, maka XZ  YZ utk sembarang Z
– Transitivity: Jika X  Y dan Y  Z, maka X  Z

• Aksioma di atas merupakan aturan-aturan penyimpulan (inference


rules ) untuk FDs yang logis (sounds) dan lengkap (complete) !
• Dua aturan tambahan yang menyertai Aksioma Armstrong:
– Union: Jika X  Y dan X  Z, maka X  YZ
– Decomposition: Jika X  YZ, maka X  Y dan X  Z
Alasan Mengenai FD (Lanjutan)

• Suatu FD disebut trivial jika sisi kanan dari FD hanya terdiri dari
attribut yang juga muncul di sisi kiri dari FD (akibat rumus
reflexivity). Selain trivial FDs, selebihnya disebut nontrivial FDs.
– Dengan menggunakan rumus reflexivity, semua trivial
dependencies dapat diturunkan.

• Contoh: Contracts(cid,sid,jid,did,pid,qty,value), dan:


– C adalah key: C  CSJDPQV
– Project membeli setiap part menggunakan contract tunggal: JP
C
– Dept membeli paling banyak satu part dari sebuah supplier: SD
P
• Nontrivial FDs yang dapat diperoleh dari relasi „Contracts‟:
– JP  C, C  CSJDPQV mengimplikasikan JP  CSJDPQV
– SD  P mengimplikasikan SDJ  JP
– SDJ  JP, JP  CSJDPQV mengimplikasikan SDJ 
CSJDPQV
Alasan Mengenai FD: Attribute Closure
• Hanya untuk mengecek apakah sebuah dependensi, misalnya X 
Y terdapat dlm closure dari satu set FDs F, kita dapat melakukannya
secara efisien tanpa harus menghitung F+:
– Hitung attribute closure X+ dg mengacu pada F, yaitu hitung
satu attributes A sehingga X  A dpt diturunkan menggunakan
Aksioma Armstrong (Algoritma utk menghitung attribute closure
X+ dari set attribut X dg mengacu pada satu set FDs F):
closure = X;
REPEAT
{
IF there is an FD U  V in F such that U  closure THEN
set closure = closure  V
} UNTIL there is no change;
– Kemudian cek apakah Y ada dalam X+
• Latihan: Apakah F = {A  B, B  C, CD  E} mengimplikasikan
AE?
• Algoritma di atas dpt dimodifikasi utk memperoleh “keys” dari suatu
skema relasi dengan cara memulai dengan set X yang terdiri dari
satu attribut tunggal dan berhenti begitu closure berisikan semua
attribut dari skema relasi.
Bentuk-Bentuk Normal (Normal Forms)
• Normal Forms (NF) digunakan utk membantu kita utk memutuskan
apakah suatu skema relasi sudah merupakan hasil desain yang
“baik” atau masih perlu didekomposisi menjadi relasi-relasi yang
lebih kecil.

• Jika suatu relasi skema sudah berada dalam salah satu NF, berarti
bhw beberapa jenis persoalan redundansi dapat
dihindari/diminimalkan.

• NF yang didasarkan pada FDs: 1NF, 2NF, 3NF dan Boyce-Codd NF


(BCNF):
– Setiap relasi dlm BCNF juga berada dlm 3 NF
– Setiap relasi dlm 3 NF juga berada dlm 2 NF, dan
– Setiap relasi dlm 2 NF juga berada dlm 1NF
Bentuk-Bentuk Normal (Normal Forms)
• Setiap relasi yang berada dlm 1NF berlaku constraint bhw setiap
field hanya berisikan nilai-nilai atomic (tidak boleh berisikan lists
atau sets).
– Dlm perkuliahan, constraint ini dianggap berlaku sebelum
dilakukan proses normalisasi

• Oleh karena 2NF dibuat atas dasar sejarah perkembangan


database (dari network model ke relational model), maka
pembahasan hanya ditekankan pada proses pembentukan 3NF dan
BCNF yang merupakan langkah penting dalam proses desain
database.
Bentuk-Bentuk Normal (Normal Forms)
• Peran FD dalam mendeteksi redundansi: Perhatikan sebuah relasi
R dengan 3 attributes ABC.

– Jika tidak ada FD yang berlaku pada relasi R, maka dapat


dipastikan tidak akan terdapat persoalan redundansi.

– Namun, jika dimisalkan berlaku A  B, maka jika terdapat


beberapa tuples yang mempunyai nilai A yang sama maka baris-
baris tersebut juga harus mempunyai nilai B yang sama. Untuk
ini, potensi terjadinya redundansi dapat diperkirakan dengan
menggunakan informasi FDs
Boyce-Codd Normal Form (BCNF)
• Relasi R dg FDs F dikatakan berada dalam BCNF jika, utk semua
FD X  A dalam F, salah satu dari pernyataan berikut harus
berlaku:
– A  X (disebut trivial FD), atau
– X adalah key dari R.

• Dengan kata lain, R dikatakan berada dalam BCNF jika non-trivial


FDs yang berlaku pada R hanya berupa key constraints.
– Tidak ada redundansi yang dpt diprediksi hanya
dengan menggunakan FDs saja
– Jika terdapat dua tuples yang mempunyai nilai X
yang sama, maka kita tidak dapat menyimpulkan
nilai A dalam satu tuple dari nilai A dalam
tuple lainnya
– Namun, jika relasi contoh berada dalam BCNF, maka
kedua tuples harus identik (karena X adalah sebuah key).
Third Normal Form (3NF)

• Relasi R dg FDs F dikatakan berada dlm 3NF jika, untuk semua FD


X  A dalam F, salah satu dari pernyataan berikut harus berlaku:
– A  X (disebut trivial FD), atau
– X adalah key dari R, atau
– A adalah bagian dari beberapa key dari R (A adalah prime
attribute)

• Minimality dari key dalam kondisi ketiga di atas menjadi sangat


penting !

• Jika R berada dlm BCNF, sudah tentu juga berada dlm 3NF
• Jika R berada dlm 3NF, beberapa redundansi masih mungkin
terjadi.
– Bentuk 3NF dapat dipakai sebagai bentuk yang kompromistis
dan digunakan bilamana BCNF tidak dapat diupayakan
(misalnya karena tidak ada dekomposisi yang “baik”, atau
karena alasan pertimbangan kinerja dari database)
Apa yang Dapat Dicapai oleh 3NF?
• Jika depedensi X  A menyebabkan pelanggaran dari 3NF, maka
salah satu kasus di bawah ini akan terjadi:
– X adalah subset dari beberapa key K (partial dependency)
• Pasangan nilai (X, A) yang sama akan tersimpan secara
redundan
– X bukan subset dari sembarang key K (transitive dependency)
• Terdapat mata rantai FDs K  X  A, yang berarti bhw kita
tdk dpt mengasosiasikan sebuah nilai X dengan sebuah nilai
K kecuali kalau kita juga mengasosiasikan sebuah nilai A
dengan sebuah nilai X

• Namun demikian, walaupun seandainya relasi berada dalam 3NF,


persoalan-persoalan berikut masih dpt terjadi:
– Contoh: relasi Reserves SBDC (C=Credit Card ID), S  C, C
 S berada dalam 3NF, tetapi utk setiap reservasi dari sailor S,
pasangan nilai (S, C) yang sama akan tersimpan dalam
database.
• Dengan demikian, 3NF memang merupakan bentuk normal yang
relatif kompromistis terhadap BCNF.
Proses Dekomposisi dari sebuah
Skema Relasi
• Asumsikan relasi R terdiri dari attributes A1 ... An.
Proses dekomposisi dari R meliputi penggantian R oleh dua atau
lebih relasi sehingga :
– Setiap skema relasi yang baru terdiri dari subset attribut dari R (dan
tidak satupun attribut yang tidak muncul dalam R), dan
– Setiap attribut dari R muncul sebagai sebuah attribut dari salah satu
relasi-relasi yang baru

• Secara intuitif, pendekomposisian R berarti bahwa kita akan


menyimpan nilai-nilai dari skema-skema relasi yang dihasilkan oleh
proses dekomposisi, bukan nilai-nilai dari relasi R

• Contoh, relasi SNLRWH dapat didekomposisi menjadi SNLRH dan


RW (lihat slide berikutnya).
Contoh Dekomposisi
• Proses dekomposisi sebaiknya digunakan hanya bilamana
diperlukan.
– SNLRWH mempunyai FDs S  SNLRWH dan R  W
– FD kedua menimbulkan pelanggaran 3NF; nilai-nilai W secara
berulang diasosiasikan dg nilai-nilai R. Cara yang termudah utk
memperbaiki ini adalah menciptakan relasi baru RW utk
menyimpan asosiasi-asosiasi tersebut, dan untuk menghapus W
dari skema utama, yaitu:
• Kita dekomposisi SNLRWH menjadi SNLRH dan RW

• Informasi yang akan disimpan terdiri dari SNLRWH tuples. Jika kita
hanya menyimpan proyeksi dari tuples ini pada SNLRH dan RW,
adakah persoalan-persoalan potensial lain yang perlu
dipertimbangkan? (lihat slide berikutnya)
Persoalan-persoalan yang Dapat
Ditimbulkan oleh Dekomposisi
• Terdapat 3 persoalan potensial yang perlu diperhatikan:
– Beberapa queries menjadi lebih mahal.
• Contoh, Brp gaji yang diterima oleh Joe? (gaji = W*H)
– Untuk nilai-nilai relasi hasil dekomposisi, mungkin kita tidak
dapat merekonstruksi nilai-nilai relasi asal yang bersesuaian
(losless joins) !
• Kebetulan tidak terjadi pada contoh relasi SNLRWH
– Pengecekan beberapa dependensi bisa jadi membutuhkan
penggabungan (joining) nilai-nilai relasi hasil dekomposisi
(dependency preservation) !
• Kebetulan tidak terjadi pada contoh relasi SNLRWH

• Tradeoff: Harus mempertimbangkan issue ini, selain


issue redundansi.
Dekomposisi yang Bersifat
Lossless Join
• Dekomposisi R menjadi X dan Y disebut lossless-join dg
mengacu pada satu set FDs F jika, untuk setiap instance
r yang memenuhi F, berlaku:
– X (r) Y (r) = r

• Keadaan yang selalu harus benar: r  X (r) Y (r)


– Secara umum, arah sebaliknya tidak berlaku! Jika berlaku,
maka dekomposisi bersifat lossless-join.

• Definisi di atas dapat secara mudah diperluas utk proses


dekomposisi menjadi 3 relasi atau lebih
• Penting untuk diperhatikan bhw semua jenis
dekomposisi yang digunakan untuk menangani
redundansi harus bersifat lossless! (Hindari persoalan
ke-2)
Lossless Join (Lanjutan)

• Dekomposisi R menjadi X dan Y


bersifat lossless-join dg mengacu
pada FDs F, jika dan hanya jika
closure dari F (F+) berisikan:
– X  Y  X, atau
– XYY

• Secara umum, dekomposisi R


menjadi UV dan R - V bersifat
lossless-join jika U  V berlaku
pada R dan U  V =  .
Dekomposisi yang Mempertahankan
Dependensi
• Perhatikan CSJDPQV, C adalah key, JP  C dan SD  P.
– Dekomposisi BCNF : CSJDQV dan SDP
– Persoalan: Utk mengecek JP  C diperlukan operasi join!

• Dekomposisi yg mempertahankan dependensi (Intuitif):


– Jika R didekomposisi menjadi X, Y dan Z, dan kita memaksa agar FDs
tetap berlaku pada X, Y dan Z, maka semua FDs yang diberikan utk
berlaku pada R hrs juga tetap berlaku. (Menghindari persoalan ke-3)

• Projection dari set FDs F: Jika R didekomposisi menjadi X, ...


projection dari F pada X (disimbolkan FX ) adalah set dari FDs U 
V dalam F+ (closure of F) sedemikian rupa sehingga U, V ada
dalam X.
Dekomposisi yang Mempertahankan
Dependensi (Lanjutan)
• Dekomposisi R menjadi X dan Y bersifat mempertahankan
dependensi (dependency preserving) jika (FX  FY )+ = F +, yaitu:
– Jika kita hanya memperhatikan dependensi dalam F + yang
dapat dicek dalam X tanpa memperhatikan Y, dan dalam Y
tanpa memperhatikan X, maka hal ini mengimplikasikan bahwa
semua dependensi ada dalam F +.

• Penting utk memperhatikan F +, BUKAN F, dalam definisi ini:


– ABC, A  B, B  C, C  A, didekomposisi menjadi AB dan
BC.
– Apakah bersifat dependency preserving? apakah C  A
dipertahankan??

• Dependency preserving tidak mengimplikasikan lossless join:


– ABC, A  B, didekomposisi menjadi AB dan BC.

• Demikian juga sebaliknya, sifat lossless-join tidak mengimplikasikan


dependency preserving
Dekomposisi menjadi BCNF

• Perhatikan relasi R dengan FDs F. Jika X  Y


melanggar BCNF, lakukan dekomposisi R menjadi R - Y
and XY.
– Penggunaan secara berulang dari ide ini akan menghasilkan
sekumpulan relasi yang berada dalam BCNF dan lossless join
decomposition, dan dijamin utk mengalami terminasi.
– Contoh, CSJDPQV, key C, JP  C, SD  P, J  S
– Utk menangani SD  P, dekomposisi menjadi SDP, CSJDQV.
– Utk menangani J  S, dekomposisi CSJDQV menjadi JS dan
CJDQV

• Secara umum, beberapa dependensi yang diberikan


dapat menimbulkan pelanggaran BCNF. Ingat, urutan
“penanganan” dekomposisi seperti di atas dapat
memberikan relasi hasil dekomposisi yang berbeda !
BCNF dan Dependency Preservation

• Secara umum, dimungkinkan dekomposisi menjadi


BCNF tidak mempertahankan dependensi.
– Contoh, CSZ, CS  Z, Z  C
– Tdk dapat didekomposisi utk mempertahankan FD pertama
(tidak dpt dilakukan dekomposisi BCNF).

• Dengan cara yang sama, dekomposisi CSJDQV


menjadi SDP, JS dan CJDQV tidak mempertahankan
dependensi (dengan mengacu ke FDs JP  C, SD  P
dan J  S).
– Namun demikian, dekomposisi di atas bersifat lossless-join.
– Dalam kasus ini, penambahan JPC pada kumpulan relasi akan
mememberikan dekomposisi yang dpt mempertahankan
dependensi.
• Penyimpanan tuples JPC hanya untuk tujuan pengecekan FD!
(Persoalan Redundansi!)
Dekomposisi menjadi 3NF

• Algoritma untuk lossless join decomposition menjadi


BCNF dapat digunakan utk memperoleh lossless join
decomposition menjadi 3NF (dapat berhenti lebih awal).

• Untuk menjamin dependency preservation, suatu ide:


– Jika X  Y tdk dipertahankan, tambahkan relasi XY.
– Persoalan yang timbul adalah XY dpt melanggar 3NF! Contoh,
perhatikan penambahan CJP utk mempertahankan JP  C.
Apa yang terjadi jika juga berlaku J  C ?

• Penyempurnaan: Sebagai pengganti set dari FDs F,


gunakan minimal cover dari F.
Minimal Cover untuk Set dari FDs
• Minimal cover G utk sebuah set dari FDs F:
– Closure dari F = closure dari G.
– Bagian sisi kanan dari setiap FD dalam G berupa sebuah attribut
tunggal.
– Jika G diubah dengan menghapus sebuah FD atau dengan
menghapus beberapa attributes dari sebuah FD dalam G, maka
closure akan berubah.

• Secara intuitif, setiap FD dalam G diperlukan, dan harus seminimal


mungkin untuk memperoleh closure yang sama seperti F.
• Contoh, A  B, ABCD  E, EF  GH, ACDF  EG mempunyai
minimal cover berikut:
– A  B, ACD  E, EF  G dan EF  H

• Minimal Cover dapat menghasilkan dekomposisi yang bersifat


Lossless-Join dan Dependency Preserving. Decomp !!
Rangkuman
• Jika sebuah relasi berada dalam BCNF, maka relasi tersebut bebas
dari redundansi yang dapat dideteksi dengan menggunakan FDs.
– Dengan demikian, upaua untuk menjamin bhw semua relasi
berada dalam BCNF merupakan upaya heuristik yang baik.

• Jika sebuah relasi tidak berada dalam BCNF, coba lakukan


dekomposisi menjadi sekumpulan relasi-relasi BCNF.
– Harus mempertimbangkan apakah semua FDs dipertahankan.
Jika dekomposisi menjadi BCNF yang bersifat lossless-join dan
dependency preserving tidak dimungkinkan (atau tidak cocok,
untuk beberapa queries yang tipikal), pertimbangkan
dekomposisi menjadi 3NF.
– Dekomposisi sebaiknya dilakukan dan/atau diperiksa kembali
dengan mempertimbangkan performance requirements yang
diinginkan.
PERTEMUAN 10
SQL : Data Manipulation
(Chap. 6 – Conoly)
TUJUAN DAN PENTINGNYA SQL
SQL adalah sebuah bahasa yang dipergunakan untuk
mengakses data dalam basis data relasional.

• SQL adalah sebuah bahasa permintaan database yang terstruktur.


Bahasa SQL dibuat sebagai bahasa yang dapat merelasikan
beberapa tabel dalam database maupun merelasikan antar
database
• Idealnya, suatu bahasa database harus memungkinkan user untuk
:
- membuat struktur database dan hubungan (relasi)
- melakukan tugas dasar mengelola data, seperti penyisipan
(insert), perubahan (modify), dan penghapusan (delete) data
dari hubungan
- melakukan pertanyaan sederhana dan rumit
QUERY DALAM SQL
• Query adalah bahasa perintah dalam SQL
SQL memiliki 2 komponen utama :
1. Data Definition Language (DDL) untuk mendefinisikan
struktur database dan mengendalikan akses ke data
- CREATE : membuat tabel atau database
- DROP : menghapus tabel atau database
- ALTER : mengubah struktur tabel, seperti
menambah Field (Add), mengganti
nama Field (change) atau rename
QUERY DALAM SQL

2. Data Manipulation Language (DML) untuk mengambil


dan memperbarui data
- INSERT : menginput/memasukkan data pada tabel
- UPDATE : memperbaharui data
- DELETE : menghapus data pada Tabel
SEJARAH SQL

• Tahun 1970
EF Codd  publikasi paper sejarah model relasional
• Tahun 1974
D. Chamberlin  Sructured English Query Language
(SEQUEL)
• Tahun 1976
D. Chamberlin  edisi revisi SEQUEL/2, kemudian
berubah menjadi SQL untuk alasan hukum
banyak orang masih mengucapkan SQL sebagai
"See-Quel", meskipun lafal resminya adalah "S-Q-L".
SEJARAH SQL

• 1976
IBM menghasilkan prototipe DBMS  Sistem R
akar dari SQL ada di bahasa SQUARE (Specifying
Queries As Relational Expressions)
• 1981-1983
RDBMS komersial pertama  SQL/DS, untuk DOS/VSE
dan VM/CMS, kemudian sebagai DB2 untuk MVS
• 1984
ANSI & ISO  Relational Database Language (RDL)
• 1992
ISO  SQL2 atau SQL-92 (ISO, 1992)
Sejarah SQL
• 1999
ISO  SQL:1999 (ISO, 1999a)
• 2003
ISO  SQL: 2003
• 2008
ISO  SQL: 2008
MENULIS PERINTAH SQL

• Sebuah pernyataan SQL terdiri dari :


- Reserved words adalah bagian tetap dari bahasa SQL dan
memiliki makna tetap.
- User-defined words dibuat oleh pengguna (sesuai
dengan aturan sintaks tertentu) dan mewakili nama-
nama berbagai objek database seperti tabel, kolom,
tampilan, indeks, dan sebagainya.

Kebanyakan komponen pernyataan SQL bersifat case-insensitive,


yang berarti peka terhadap penggunaan huruf besar dan huruf kecil.
Contoh : jika kita menyimpan nama seseorang sebagai "SMITH"
dan kemudian mencari dengan menggunakan string "Smith,"
baris tidak akan ditemukan.
MENULIS PERINTAH SQL

• notasi Backus Nur Form (BNF) untuk mendefinisikan


pernyataan SQL :
• huruf besar digunakan untuk mewakili reserved words dan
harus dieja persis seperti yang ditampilkan;
• huruf kecil digunakan untuk mewakili user-defined words;
• sebuah bar vertikal ( | ) menunjukkan pilihan di
antara alternatif, misalnya, a b | C;
• kurung kurawal menunjukkan elemen yang diperlukan,
misalnya, {a};
• tanda kurung persegi
untuk menunjukkan elemen opsional, misalnya, [a];
• ellipsis (...) Digunakan untuk menunjukkan pengulangan
opsional item nol atau lebih.
MANIPULASI DATA

• pernyataan Data Manipulation Language (DML) SQL:


• SELECT - untuk query data dalam database;
• INSERT - untuk memasukkan data ke dalam tabel;
• UPDATE - untuk memperbarui data dalam tabel;
• DELETE - menghapus data dari tabel.
• Semua nilai data nonnumeric harus diapit tanda kutip tunggal,
semua nilai data numerik tidak harus diapit tanda kutip
tunggal.
Contoh :
INSERT INTO PropertyForRent(propertyNo, street, city,
postcode, type, rooms, rent, ownerNo, staffNo, branchNo)
VALUES (‘PA14’, ‘16 Holhead’, ‘Aberdeen’, ‘AB7 5SU’, ‘House’,
6, 650.00, ‘CO46’, ‘SA9’, ‘B007’);
QUERY SEDERHANA

• Tujuan dari pernyataan SELECT adalah untuk mengambil dan


menampilkan data dari satu atau lebih tabel database.
• SELECT adalah perintah SQL yang paling sering digunakan dan
memiliki bentuk umum sebagai berikut :

SELECT [DISTINCT | ALL] { * | [columnExpression


[AS newName]] [,. . .])
FROM TableName [alias] [, . . .]
[WHERE condition]
[GROUP BY columnList] [HAVING condition]
[ORDER BY columnList]
QUERY SEDERHANA

• Urutan pengolahan dalam sebuah pernyataan SELECT adalah :


FROM spesifik tabel atau tabel yang akan digunakan
WHERE filter baris subjek pada beberapa kondisi
GROUP BY bentuk kelompok baris dengan nilai kolom yang sama
HAVING filter kelompok subjek pada beberapa kondisi
SELECT menentukan kolom mana yang muncul dalam output
ORDER BY menentukan urutan output
CONTOH QUERY SEDERHANA

cara cepat untuk mengungkapkan "semua kolom" di SQL, dengan


menggunakan tanda bintang (*)

• CONTOH : Mengambil semua kolom, semua baris


Daftar lengkap rincian semua staf.
SELECT staffNo, fName, IName, position, sex, DOB, salary, branchNo
FROM Staff;

• Cara cepat :
SELECT *
FROM Staff;
CONTOH QUERY SEDERHANA

• Tabel Hasil
CONTOH QUERY SEDERHANA

• CONTOH 6.2 Mengambil kolom tertentu, semua baris


Menghasilkan daftar gaji untuk semua staf hanya menampil kan jumlah
staf, nama pertama dan terakhir, dan rincian gaji.

SELECT staffNo, fName, IName, salary


FROM Staff;

Tabel Hasil
Menggunakan Fungsi Agregat SQL

Standar ISO mendefinisikan lima fungsi agregat :

• COUNT — menghasilkan jumlah nilai dalam sebuah kolom


tertentu
• SUM — menghasilkan jumlah nilai dalam kolom tertentu
• AVG — menghasilkan rata-rata nilai dalam sebuah kolom
tertentu
• MIN — menghasilkan nilai terkecil pada kolom yang ditentukan
• MAX — menghasilkan nilai terbesar dalam satu kolom tertentu
MENGGUNAKAN COUNT(*)

• CONTOH Menggunakan COUNT(*)


Berapa banyak biaya properti lebih dari £350 per bulan untuk
menyewa?
SELECT COUNT(*) AS myCount
FROM PropertyForRent
WHERE rent >350;

• Contoh Menggunakan COUNT(DISTINCT)


Berapa banyak properti yang berbeda ditampilkan bulan Mei 2008?
SELECT COUNT(DISTINCT propertyNo) AS myCount
FROM Viewing
WHERE viewDate BETWEEN ‘1-May-08’ AND ‘31-May-08’;
MENGGUNAKAN COUNT DAN SUM

• Contoh Menggunakan COUNT dan SUM

Mencari jumlah Manajer dan jumlah gaji mereka.


SELECT COUNT(staffNo) AS myCount, SUM(salary) AS mySum
FROM Staff
WHERE position = ‘Manager’;

Tabel Hasil
myCount mySum

2 54000.00
MENGGUNAKAN MIN, MAX, AVG

• CONTOH Menggunakan MIN, MAX, AVG

Mencari minimum, maksimum, dan rata-rata gaji staf.


SELECT MIN(salary) AS myMin, MAX(salary) AS myMax,
AVG(salary) AS myAvg
FROM Staff;

• TABEL Hasil

myMin myMax myAvg

9000.00 30000.00 17000.00


Memperbaharui Database

Tiga pernyataan SQL yang tersedia untuk memodifikasi isi


dari tabel dalam database :

• INSERT : menambah baris baru dari data ke tabel


• UPDATE : memodifikasi data yang ada dalam tabel
• DELETE : menghapus baris data dari tabel
MENAMBAHKAN DATA KE DALAM DATABASE
(INSERT)

• Ada dua bentuk pernyataan INSERT.


• Yang pertama memungkinkan satu baris untuk dimasukkan ke tabel
bernama dan memiliki format berikut :
INSERT INTO TableName [(columnList)]
VALUES (dataValueList)

CONTOH INSERT. . . VALUES


Menyisipkan baris baru ke dalam tabel Staff untuk memasok data untuk
semua kolom.
INSERT INTO Staff
VALUES (‘SG16’, ‘Alan’, ‘Brown’, ‘Assistant’, ‘M’, DATE ‘1957-05-25’,
8300, ‘B003’);
MENAMBAHKAN DATA KE DALAM DATABASE
(INSERT)

• Bentuk kedua dari pernyataan INSERT memungkinkan beberapa baris


untuk disalin dari satu atau lebih tabel yang lain, dan memiliki format berikut
:
• INSERT INTO TableName [(columnList)]
SELECT...

CONTOH INSERT... SELECT


INSERT INTO StaffPropCount
(SELECT s.staffNo, fName, IName, COUNT(*)
FROM Staff s, PropertyForRent p
WHERE s.staffNo = p.staffNo
GROUP BY s.staffNo, fName, IName)
UNION
(SELECT staffNo, fName, IName, 0
FROM Staff s
WHERE NOT EXISTS (SELECT *
FROM PropertyForRent p
WHERE p.staffNo = s.staffNo));
MODIFIKASI DATA PADA DATABASE (UPDATE)

Pernyataan UPDATE memungkinkan isi baris yang ada di tabel


bernama diubah. Format, perintah adalah :
UPDATE TableName
SET columnName1 = dataValue1 [,columnName2 = dataValue2 . . . ]
[WHERE searchCondition]

Jika klausa WHERE diterapkan, hanya baris yang memenuhi


searchCondition yang diperbarui. Para dataValue baru harus sesuai
dengan tipe data untuk kolom yang sesuai.
Lanjutan
 CONTOH UPDATE semua baris

Berikan semua staf kenaikan gaji 3%.

UPDATE Staff
SET salary = salary*1.03;

 CONTOH UPDATE baris spesifik

Berikan Manajer minyak kenaikan gaji 5%.

UPDATE Staff
SET salary = salary*1.05
WHERE position = ‘Manager’;

 CONTOH UPDATE banyak kolom

• Promosikan David Ford (staffNo = 'SGI4') untuk Manajer dan mengubah gajinya menjadi £18.000.

• UPDATE Staff
SET position = ‘Manager’, salary = 18000
WHERE staffNo = ‘SGI4’;
Menghapus Data dari Database (DELETE)

• Pernyataan DELETE memungkinkan baris yang akan dihapus dari


tabel bernama. Format perintahnya adalah :
DELETE FROM TableName
[WHERE searchCondition]

• CONTOH DELETE baris yang spesifik


Hapus semua tampilan yang berhubungan dengan properti PG4.
DELETE FROM Viewing
WHERE propertyNo = ‘PG4’;

• CONTOH DELETE semua baris


Hapus semua baris dari tabel Viewing.
DELETE FROM Viewing;
PERTEMUAN 11
SQL (lanjutan): Queries,
Constraints & Triggers

(Chap. 5 – Ramakrishnan)
Overview
Structure Query Language (SQL) adalah bahasa
database relasional komersial yang paling banyak
digunakan. SQL pada awalnya dikembangkan oleh
IBM dalam SEQUEL-XRM dan Proyek System-R
(1974-1977). Kemudian SQL berkembang
mengikuti standar ANSI/ISO untuk SQL, yang
disebut SQL-92.
Beberapa Aspek Bahasa SQL
Data Definition Language (DDL) : subset SQL yang mendukung
pembuatan, penghapusan, dan modifikasi struktur tabel beserta
tampilannya.

Data Manipulation Language (DML) : subset SQL dapat digunakan


untuk menspesifikasikan queries, menyisipkan, menghapus, dan
memodifikasi baris-baris tabel.

Embedded dan Dinamic SQL : Fitur-fitur embedded SQL yang


memungkinkan SQL untuk memanggil host language seperti C atau
COBOL.

Triggers : Standar SQL/1999 memberikan dukungan untuk triggers,


yang bertindak secara otomatis dan memanipulasi database ketika
kondisi terpenuhi.
Beberapa Aspek Bahasa SQL

Security : SQL menyediakan mekanisme untuk mengendalikan akses


pengguna ke objek database seperti tables dan views.

Transaction Management : perintah SQL yang memungkinkan


seseorang pengguna melakukan secara eksplisit untuk mengendalikan
aspek, bagaimana sebuah transaksi harus dijalankan.

Client-Server Execution & Remote Database Access : perintah-perintah


SQL ini dapat digunakan untuk mengendalikan bagaimana suatu
program aplikasi dapat dihubungkan ke sebuah SQL database server,
atau mengakses data dari sebuah database melalui jaringan.
Contoh Instance
B1 S1
bid
bid bname
bname colorcolor
102
101 Interlake
Interlake Red
Blue
104
103 Marine
Clipper Red
Green
B2 sid sname rating age
22 Dustin 7 45.0
29 Brutus 1 33.0
31 Lubber 8 55.5
32 Andy 8 25.5
58 Rusty 10 35.0
64 Horatio 7 35.0
71 Zorba 10 16.0
74 Horatio 9 35.0
85 Art 3 25.5
95 Bob 3 63.5
Contoh Instance
S2
R1
sid sname rating age
Sid bid day 28 Yuppy 9 35.0
22 101 10/10/98 31 Lubber 8 55.5
22 102 10/10/98 44 Guppy 5 35.0
22 103 10/8/98 58 Rusty 10 35.0
22 104 10/7/98
31 102 11/10/98 R2
31 103 11/6/98 Sid bid day
31 104 11/12/98 22 101 10/10/96
64 101 9/5/98 58 103 10/12/96
64 102 9/8/98
74 103 9/8/98
Bentuk Dasar SQL Query
SELECT [DISTINCT] select-list
FROM from-list
WHERE qualification

• FROM-list : Sebuah nama tabel dapat diikuti oleh berbagai variabel yang sangat berguna
ketika nama tabel yang sama muncul lebih dari sekali dalam daftar.

• Select-list : list dari (ekspresi yang melibatkan) nama kolom atau field dari tabel.

• Qualification : klausa WHERE kombinasi boolean (AND, OR, dan NOT) di dalam bentuk
ekspresi op ekspresi, dimana op adalah salah satu operator perbandingan {<, <=, =,< >,>=,
>}.

• DISTINCT : keyword yang opsional. Hal ini menunjukkan bahwa tabel yang dihitung sebagai
hasill dan tidak harus mengandung duplicate, yaitu dua baris data yang sama. Defaultnya
adalah duplicate yang tidak dihilangkan.
Contoh Basic SQL Query

• Tampilkan nama dan umur dari tabel Sailors :


SELECT DISTINCT S.sname,S.age FROM Sailors S
Strategi Evaluasi Konseptual
• Hitung hasil cross product dari form list.
• Hapus tuples hasil jika tuples tersebut tidak memenuhi
qualifications.
• Hapus attributes yang tidak ada dalam select list.
• Jika digunakan DISTINCT, lakukan eliminasi baris-baris yang
terduplikasi.

Contoh Strategi Konseptual :


• Tentukan nama nama pelaut yang telah memesan sejumlah 103
perahu.

SELECT S.sname
FROM Sailors S, Reserves R
WHERE S.sid=R.sid AND R.bid=103
sql
Ekspresi & String
SELECT S.age
FROM Sailors S
WHERE S.sname LIKE ’B_%B’

Union, Intersect & Except
UNION : dapat digunakan untuk menghitung union dari dua union-
compatible yang merupakan kumpulan record dari hasil dua queries.

INTERSECT : dapat digunakan untuk menghitung intersect dari dua


intersect yang merupakan kumpulan dari record.

Menampilkan name dari Sailors yang telah melakukan reservasi sebuah


red boat atau green boat.
SELECT S.sname SELECT S.sname
FROM Sailors S, Reserves R, Boats B FROM Sailors S, Reserves R, Boats B
WHERE S.sid = R.sid AND R.bid = B.bid WHERE S.sid = R.sid AND R.bid = B.bid AND
AND (B.color = ‘red’ OR B.color = ‘green’) B.color = ‘red’
UNION
SELECT S2.sname
FROM Sailors S2, Boats B2, Reserves R2
WHERE S2.sid = R2.sid AND R2.bid = B2.bid AND
B2.color = ‘green’
Union, Intersect & Except
EXCEPT : dapat digunakan untuk menghitung set difference dari dua union-
compatible yang merupakan kumpulan record dari hasil dua queries.

• Cari sids dari semua pelaut yang


telah memesan Boat red tetapi
tidak memesan Boat green. SELECT S.sid
FROM Sailors S, Reserves R, Boats B
WHERE S.sid = R.sid AND R.bid = B.bid AND
SELECT S.sname B.color = ‘red’
FROM Sailors S, Reserves R, Boats B EXCEPT
WHERE S.sid = R.sid AND R.bid = B.bid AND SELECT S.sid
B.color = ‘red’ FROM Sailors S2, Reserves R2, Boats B2
INTERSECT WHERE S2.sid = R2.sid AND R2.bid = B2.bid
SELECT S2.sname AND B2.color = ‘green’
FROM Sailors S2, Boats B2, Reserves R2
WHERE S2.sid = R2.sid AND R2.bid = B2.bid
AND B2.color = ‘green’
Nested Queries
Tentukan nama-nama pelaut yang telah memesan boat bernomor
103.

SELECT S.sname FROM Sailors WHERE


S.sid IN ( SELECT R.sid FROM Reserves RWHERE R.bid = 103 )

Operator IN memungkinkan kita untuk menguji apakah nilai dalam


himpunan elemen; sebuah query SQL yang digunakan untuk
menghasilkan data pada query yang akan diuji.
Untuk menampilkan name pada tabel Sailors yang tidak
melakukan reservasi boat bernomor 103 gunakan NOT IN.
Korelasi Nested Queries
Tentukan nama-nama sailors yang telah memesan boat bernomor 103
SELECT S.sname FROM Sailors S WHERE EXISTS (
SELECT * FROM Reserves R WHERE R.bid = 103 AND R.sid = S.sid )

EXIST : bentuk operator perbandingan yang jika bernlai TRUE akan


dijadikan subquery sebagai parameter yang tidak menghilangkan set
kosong.
Untuk menampilkan name pada tabel Sailors yang tidak memesan boat
bernomor 103 dengan menggunakan NOT EXIST.
sql
Set-Comparison Operators

Sebelumnya telah dibahas penggunaan EXIST, IN, dan UNIQUE. SQL juga
mendukung op ANY dan op ALL, dimana op adalah salah satu operator
perbandingan aritmatika {<, <=, =, <>,> =,>}. (SOME juga tersedia, tapi itu
hanya sinonim untuk ANY)

Contoh : Cari sailors yang mempunyai rating yang lebih besar dari sailors
Horatio

SELECT S.sid
FROM Sailors S
WHERE S.rating > ANY (SELECT S2.rating
FROM Sailors S2
WHERE S2.sname = 'Horatio')
Division dalam SQL
SELECT S.sname
FROM Sailors S
WHERE NOT EXISTS (( SELECT B.bid FROM Boats B )
EXCEPT
(SELECT R.bid FROM Reserves R
WHERE R.sid = S.sid ))

Tentukan nama sailors yang telah melakukan reservasi semua boats.


Dengan menggunakan EXCEPT :

SELECT S.sname
FROM Sailors S
WHERE NOT EXISTS ( SELECT B.bid FROM Boats B
WHERE NOT EXISTS ( SELECT R.bid
FROM Reserves R
WHERE R.bid = B.bid AND
Cara yang lebih sulit
R.sidtanpa
= S.sidmenggunakan
)) ECXEPT :
sql
Operator Agregasi
SELECT COUNT (*) SELECT COUNT (DISTINCT S.sname)
FROM Sailors S FROM Sailors S

SELECT AVG (S.age)


FROM Sailors S
WHERE S.rating=10

SELECT S.sname, S.age


FROM Sailors S
WHERE S.age=(SELECT MAX (S2.age)
FROM Sailors S2)

COUNT ([DISTINCT] A) : Jumlah dari semua nilai-nilai dalam kolom A.


SUM ([DISTINCT] A) : Jumlah dari semua (unik) nilai-nilai dalam kolom A.
AVG ([DISTINCT] A) : Rata-rata dari semua (unik) nilai-nilai dalam kolom A.
MAX (A) : Nilai maksimum di kolom A.
MIN (A) : Nilai minimim dalam kolom A.
sql
Hasil dari : SELECT COUNT (*) FROM Sailors S
sql
Hasil dari : SELECT AVG (S.age) FROM Sailors S
WHERE S.rating=10
sql
Hasil dari : SELECT S.sname, S.age FROM Sailors S
WHERE S.age=(SELECT MAX (S2.age) FROM Sailors S2)
GROUP BY & HAVING CLAUSE

 Sejauh ini telah dibahas penggunaan operasi agregasi untuk semua tuples
(yang memenuhi kualifikasi). Seringkali kita ingin menerapkan operasi
agregasi untuk sejumlah kelompok (groups) dari baris (tuples) dalam suatu
relasi.

 Contoh : Cari usia sailors termuda untuk setiap tingkat rating yang ada.

SELECT MIN(S.age)
FROMSailors S
WHERE S.rating=i

Jika misalnya, kita ketahui bahwa nilai rating berada dalam range 1 s.d 10,
maka i pada pernyataan diatas = 1,2,3,...,10.
Queries dengan GROUP BY & HAVING

 Bentuk umum SQL Query dengan GROUP BY & HAVING

SELECT [DISTINCT] select-list


FROM from-list
WHERE qualification
GROUP BY grouping-list
HAVING group-qualification

 Contoh : Carilah usia sailors termuda yang memenuhi syarat (misalnya, setidaknya
>=18 tahun) untuk setiap tingkat rating dengan setidaknya terdiri dari dua sailors
untuk setiap tingkat ratingnya.
SELECT S.rating, MIN (S.age) AS minage
FROM Sailors S
WHERE S.age >=18
GROUP BY S.rating
HAVING COUNT (*) >1
sql
NULL VALUES
• Nilai-nilai fields dalam sebuah tuple kadang-kadang tidak diketahui
(unknown). Misalnya : sebuah nilai rating tidak diberikan atau tidak dapat
digunakan (inapplicable). Maka SQL menyediakan nilai kolom khusus yang
disebut null untuk digunakan dalam situasi tersebut.

NULL VALUES dan Operator Perbandingan serta Logical Connectives AND, OR,
NOT

• SQL menyediakan operator perbandingan khusus IS NULL untuk menguji


apakah kolom nilai nol yang akan mengevaluasi dengan benar pada AND
yang mewakili baris. Disini juga terdapat IS NOT NULL, yang akan
mengevaluasi nilai false pada baris untuk AND.
Dampak NULL VALUES dalam
Membangun SQL
• Untuk kualifikasi dalam klausa WHERE clause, keberadaan null values
dapat menghilangkan baris (dalam garis-produk dari tabel disebutkan
dalam klausa FROM) yang kualifikasi tidak mengevaluasi nilai TRUE.
- Menghilangkan baris yang mengevaluasi unknown mempunyai dampak
yang halus namun signifikan pada queries, terutama nested queries yang
melibatkan EXISTS atau UNIQUE.

• Persoalan lain adalah definisi SQL yang menyatakan bahwa dua baris
duplikat jika kolom yang sesuai adalah sama baik, atau keduanya bersifat
null. Dalam kenyataannya jika kita membandingkan dua nilai null
menggunakan =, hasilnya adalah unknown! Dalam konteks duplikat,
perbandingan ini secara implisit diperlakukan sebagai nilai true, yang
merupakan anomali.

• Operator aritmatika +, -, *, dan / semua menghasilkan nilai null jika salah


satu dari argumennya bernilai null.
Dampak NULL VALUES dalam
Membangun SQL (Lanjutan)
• Null Values dapat menimbulkan hal yang tidak diharapkan untuk
operatorr-operator agegasi :
- COUNT (*) menangani nilai null seperti halnya nilai-nilai lainnya (ikut
diperhitungkan).
- Operasi-operasi agregasi lainnya (COUNT, SUM, AVG, MIN, MAX, dan
variasi penggunaan DISTINCT) hanya mengabaikan null values.
OUTER JOINS

• Beberapa varian menarik dari operasi join yang mengandalkan null values
disebut outer joins.

• Terdapat tiga variasi outer join :


1. Left Outer Join
2. Right Outer Join
3. Full Outer Join

• Sebagai contoh, query berikut adalah daftar sid, pasangan sesuai dengan
pelaut dan mereka yang telah memesan perahu:

SELECT Sailors.sid, Reserves.bid


FROM Sailors NATURAL LEFT OUTER JOIN Reserve R
sql
Tidak Membolehkan Null Values

• Melarang nilai bersifat null dengan menetapkan NOT NULL sebagai bagian
dari definisi sebuah field, misalnya :
sname CHAR (20) NOT NULL

• Selain itu, field dalam PRIMARY KEY tidak diperbolehkan bernilai null.
Dengan demikian, ada kendala penggunaan NOT NULL secara implisit
untuk setiap field yang tercantum dalam PRIMARY KEY.
PERTEMUAN 12
Keamanan dan Administrasi Database

(Chap. 20 – Conolly)
Keamanan Database
Keamanan Database : Mekanisme yang
melindungi database terhadap ancaman disengaja atau tidak
disengaja.

Keamanan database dalam kaitannya dengan situasi berikut:


1. pencurian dan penipuan;
2. hilangnya kerahasiaan;
3. hilangnya privasi;
4. hilangnya integritas;
5. hilangnya ketersediaan.

Ancaman
• Ancaman : Setiap situasi atau peristiwa, baik disengaja atau tidak
disengaja, yang bisa mempengaruhi sistem dan
akibatnya organisasi.
TABEL Contoh ancaman.
Gambar Ringkasan potensi ancaman sistem komputer.
Penanggulangan-Komputer Berbasis Kontrol

Keamanan untuk lingkungan multi-user (beberapa di


antaranya mungkin tidak tersedia di lingkungan PC):

1. Otorisasi dan otentikasi


Otorisasi :
Pemberian hak atau hak istimewa yang
memungkinkan subjek untukmemiliki akses yang sah ke
sistem atau objek sistem
Otentikasi :
Sebuah mekanisme yang menentukan apakah seorang pengguna
bertanggung jawab untuk mengakses komputer dengan
menciptakan account individu. Dimana setiap
user diberikan pengenal unik, yang digunakan oleh sistem
operasi untuk menentukan siapa mereka.
lanjutan
2. Akses kontrol : DAC, MAC
Akses kontrol untuk sistem database didasarkan pada pemberian dan pencabutan hak-
hak istimewa. Sebuah hak istimewa memungkinkan pengguna untuk membuat atau
akses (yaitu membaca, menulis, atau memodifikasi) beberapa objek database
(seperti relasi, melihat,atau indeks) atau untuk menjalankan utilitas tertentu DBMS.

Discretionary Access Control (DAC)


DBMS yang paling komersial menyediakan pendekatan untuk mengelola hak istimewa yang
menggunakan SQL Discretionary Access Control disebut (DAC). Standar
SQL mendukung DAC melalui GRANT dan REVOKE perintah. Perintah GRANT
memberikan hak istimewa kepada pengguna, dan perintah REVOKE menghapus hak
istimewa.

Mandatory Access Control (MAC)


Dalam pendekatan ini setiap objek database diberikan sebuah keamanan kelas dan setiap
pengguna diberikan izin untuk kelas keamanan, dan aturan dikenakan pada membaca dan
menulis objek database oleh pengguna
lanjutan
3. Views,
adalah hasil dinamik dari satu atau lebih operasi relasional operasi pada
relasi untuk menghasilkan relasi lainnya. View adalah relasi virtual yang
tidak benar-benar ada dalam database, tetapi dihasilkan atas
permintaanpengguna tertentu, pada saat ada nya permintaan.
Mekanisme Tampilannya menyediakan keamanan yang kuat dan fleksibel
dengan menyembunyikan bagian-bagian dari database dari pengguna
tertentu.

4. Backup dan Journal,


Backup : Proses periodik menyalin database dan file log (dan
mungkin program) ke mediapenyimpanan offline.
Journal : Proses memelihara sebuah file log (atau jurnal) dari semua
perubahan yang dibuat oleh database secara efektif .
lanjutan
5. Enkripsi,
Pengkodean data dengan algoritma khusus yang
membuat data terbaca oleh program tanpa kunci dekripsi.
Beberapa DBMS menyediakan fasilitas enkripsi yang dapat mengakses
data (setelah decoding itu),meskipun ada degradasi dalam
performa karena waktu yang dibutuhkan untuk memecahkan kode
tersebut . Enkripsi juga melindungi data yang dikirimkan melalui. jalur
komunikasi.

6. RAID Teknologi.
RAID awalnya berdiri untuk Redundant Array of Independent Disk.
RAID bekerja pada sebuah array disk besar terdiri dari
susunan beberapa disk yang diselenggarakan untuk meningkatkan
kehandalan dan kinerja waktu pada tingkatan yang sama.
LANJUTAN

RAID tingkat. Angka-angka mewakili blok sekuensial data


dan surat-surat menunjukkan segmen blok data
Keamanan di Microsoft Office Access DBMS
Microsoft Office Access menyediakan metode berikut
untuk mengamankan database:
1. Memisahkan database;
Cara yang paling aman untuk melindungi data dalam database
adalah untuk menyimpan tabel database terpisah
dari objek aplikasi database seperti formulirdan
laporan. Tindakan ini disebut sebagai "pemisahan" database;
LANJUTAN
LANJUTAN
2. Menetapkan password untuk database; Sebuah cara sederhana untuk
mengamankan database adalah untuk menetapkan password untuk
membuka database. Menyetel kata sandi tersedia melalui Enkripsikan
dengan opsi Password di bagian database Tools.
3. Mempercayai (memungkinkan) isi dinonaktifkan dalam database;
4. Kemasan, penandatanganan, dan menggunakan database
Keamanan di Oracle DBMS

• Keistimewaan :
Beberapa contoh hak Oracle mencakup hak untuk : Terhubung
ke database (membuat sesi); Membuat tabel; Pilih baris dari
tabel pengguna lain.
Dalam Oracle, ada dua kategori yang berbeda dari hak istimewa : Sistem
hak istimewa; Obyek hak istimewa.

• Sistem hak istimewa


Hak istimewa sistem yang diberikan kepada, atau dicabut dari, pengguna
dan peran (dibahas di bawah) menggunakan salah satu dari berikut:
 Hibah Keistimewaan Sistem/kotak Peran dialog
dan Mencabut KeistimewaanSistem/Peran kotak
dialog Manajer Keamanan Oracle;
 SQL GRANT dan laporan REVOKE
LANJUT
DBMS dan Keamanan Web
1. Proxy Server :
Dalam lingkungan Web, proxy server adalah sebuah
komputer yang berada di antara Web browser dan
server Web.

Proxy server memiliki dua tujuan utama:


a. Meningkatkan kinerja, yaitu proxy server menyimpan hasil
dari semua permintaan untuk jumlah waktu tertentu secara
signifikan
b. Filter permintaan yaitu Proxy server dapat digunakan
untuk menyaring permintaan. Sebagai contoh, sebuah
organisasi yang menggunakan server proxy untuk mencegah
karyawan mengakses satu set spesifik situs Web.
LANJUTAN
2. Firewall , adalah sebuah sistem yang dirancang untuk
mencegah akses tidak sah ke atau dari jaringan
pribadi. Firewall dapat diimplementasikan baik
sebagaiperangkat keras dan perangkat lunak atau kombinasi
keduanya.

3. Algoritma Message Digest dan Digital Signatures


Sebuah tanda tangan digital terdiri dari dua potongan
informasi: string bit yangdihitung dari data yang
sedang "ditandatangani," bersama dengan kunci privat dari
individu atau organisasi yang ingin tanda tangannya. Tanda
tangan dapat digunakan untuk memverifikasi bahwa data
berasal dari individu atau organisasi.
LANJUTAN
4. Digital Certificates
adalah lampiran ke sebuah pesan elektronik yang digunakan
untuk tujuan keamanan, verifikasi pengguna akan mengirimkan
sebuah pesan yang dia klaim, untuk penerima dengan
menyediakan kodekan jawaban. standar paling banyak
digunakan adalah sertifikat digital X.509.

5. Kerberos , Kerberos memiliki fungsi mirip dengan server


sertifikat: untuk mengidentifikasi dan memvalidasi pengguna
Pentingnya Kerberos adalah bahwa ia menyediakan satu server
keamanan terpusat untuk semua data dan sumber daya pada
jaringan. Akses database, login, kontrol otorisasi, dan fitur
keamanan lainnya yang terpusat di server
LANJUTAN
6. Secure Socket Layer dan Secure HTTP
Secure Socket Layer (SSL) yang dikembangkan oleh Netscape untuk transmisi
dokumen pribadi melalui Internet.SSL bekerja dengan menggunakan sebuah
kunci pribadi untuk mengenkripsi data yang ditransfer melalui sambungan
SSL. Baik Firefox dan Internet Explorer mendukung SSL, dan banyak situs
Web menggunakan protokol ini untuk mendapatkan informasi pengguna
rahasia,

7. Transaksi Elektronik Aman dan Aman Teknologi


Transaksi Secure Electronic Transaction (SET) adalah protokol standar,
VVterbuka interoperabel untuk pemrosesan cardtransactions kredit melalui
VVInternet,yang diciptakan bersama oleh Netscape, Microsoft,
VVVisa, Mastercard, GTE, SAlC,Terisa Sistem, dan VeriSign. SETS tujuannya
VVadalah untuk memungkinkantransaksi kartu kredit menjadi sesederhana dan
VVaman di Internet seperti yang di toko-toko ritel.

Sistem / Teknologi Basis Data 18


LANJUTAN

Gambar Transaksi Elektronik Aman dan Aman Teknologi


PERTEMUAN 13

ARSITEKTUR
&
MODEL DATA MINING
bagan
lanjut
Keterangan :
1. Data cleaning (Pembersihan Data) : untuk membuang
data yang tidak konsisten dan noise)
2. Data integration : penggabungan data dari beberapa
sumber
3. Data Mining Engine : Mentranformasikan data menjadi
bentuk yang sesuai untuk di mining
4. Pattern evaluation : untuk menemukan yang bernilai
melalui knowledge base
5. Graphical User Interface (GUI) : untuk end user
Semua tahap bersifat interaktif di mana user terlibat
langsung atau dengan perantaraan knowledge base
Model Data Mining
- Prediction Methods
Menggunakan beberapa variabel untuk memprediksi
sesuatu atau suatu nilai yang akan datang.

- Description Methods
Mendapatkan pola penafsiran (humaninterpretable
patterns) untuk menjelaskan data.
Data Mining

Prediktif Deskriptif
• Klasifikasi • Klastering
• Decision tree • Summarization
• Analisis Time series • Aturan Asosiasi
• Regresi • (Assosiation Rule)
• Prediksi • Sequence Discovery
• Jaringan syaraf tiruan
• Data Mining
Klasifikasi

• Proses untuk menemukan model atau fungsi yang


menjelaskan atau membedakan konsep atau kelas data
dengan tujuan untuk dapat memprediksi kelas dari suatu
objek yang labelnya tidak diketahui
• Contoh : Mendeteksi Penipuan
• Tujuan : Memprediksi kasus kecurangan transaksi kartu
kredit.
• Pendekatan :
- Menggunakan transaksi kartu kredit dan informasi
dilihat dari atribut account holder
lanjut

- Kapan customer melakukan pembelian, Dengan cara


apa customer membayar, sebarapa sering customer
membayar secara tepat waktu, dll
- Beri nama/tanda transaksi yang telah dilaksanakan
sebagai transaksi yang curang atau yang baik. Ini
sebagai atribut klass ( the class attribute.)
- Pelajari model untuk class transaksi
- Gunakan model ini untuk mendetekdi kecurangan
dengan meneliti transaksi kartu kredit pada account.
Regression

Digunakan untuk memetakan data dengan prediksi


atribut bernilai real
Contoh:
– Memprediksi jumlah penjualan produk baru pada
advertising expenditure.
– Memprediksi kecepatan memutar (wind velocities) pada
fungsi temperatur, tekanan udara , dll
Decision tree (Pohon keputusan)
Salah satu model klasifikasi yang mudah di interpretasikan
Contoh : identifikasi pembeli komputer ( dari decision tree di bawah
ini ternyata salah satu kelompok yang potensial adalah orang yang
berusia < 30 dan pelajar
lanjut
Neural Network (Jaringan syaraf tiruan)
- Jaringan syaraf buatan di mulai dengan layer input, dimana tiap
simpul
berkorespondensi dengan variabel prediktor.
- Simpul- simpul input ini terhubung kebeberapa simpul dalam hidden
layer. Dan simpul dalam hidden layer dapat terhubung ke simpul
lain dalam hidden layer atau ke output layer.
- Output layer terdiri dari satu atau beberapa variable respon
lanjut
• Telekomunikasi
Data mining digunakan untuk melihat jutaan transaksi
yang masuk dengan tujuan menambah layanan otomatis
• Keuangan
Data mining digunakan untuk mendeteksi
transaksitransaksi keuangan yang mencurigakan dimana
akan susah dilakukan jika menggunakan analisis
standar.
• Asuransi
Australian Health Insurance Commision menggunakan
data mining untuk mengidentifikasi layanan kesehatan
dan berhasil menghemat satu juta dollar pertahun
lanjut
• Olah raga
IBM Advanced Scout menggunakan data mining untuk
menganalisis statistik permainan NBA dalam rangka
competitive advantage untuk tim New York Knicks
• Astronomi
Jet Propulsion Laboratory (JPL) di Pasadena dan
Pulomar Observatory menemukan 22 quasar dengan
bantuan data mining.
• Internet Web Surf-Aid
IBM Surf-Aid menggunakan algoritma data mining untuk
mendata akses halaman Web khususnya berkaitan
dengan pemasaran melalui web.
lanjut
Tools Data Mining
• Karateristik-karateristik penting dari tool data mining meliputi :
– Data preparation facilities
– Selection of data mining operation (algorithms)
– Product scalability and performance
– Facilities for visualization of result

• Data mining tool, meliputi :


– Integral Solution Ltd’s Clementine
– DataMind Corp’s Data Crusher
– IBM’s Intelligent Miner
– Silicon Graphics Inc.’s MineSet
– Informations Discovery Inc.’s Data Mining Suite
– SAS Institute Inc.’s SAS System and Right Information
System’Thought.
Evolusi Database
• Th 1960
– Pengumpulan data, pembuatan data, IMS dan network DBMS
• Th 1970
– Model data relasional, Implementasi DBMS relasional
• Th 1980
– RDBMS, Model data lanjutan (extended-relational, OO, deductive)
• Th 1990
– Data mining, data warehouse, database multimedia, dan Web
database.
• Th 2000
– Stream data managemen dan mining – Data mining dengan
berbagai variasi aplikasi – Teknologi web dan sistem informasi
global
Teknik – teknik Database
Searching
• Searching dilakukan untuk memeriksa serangkaian item yang
memiliki sifatsifat yang diinginkan.
• Tindakan untuk menemukan suatu item tertentu baik yang diketahui
keberadaannya maupun tidak.
• Memasukkan kata dalam suatu program komputer untuk
membandingkan dengan informasi yang ada dalam database.

Indexing
• Indexing adalah struktur-struktur akses yang digunakan untuk
mempercepat respon dalam mendapatkan record-record pada
kondisi-kondisi pencarian tertentu.
• Indexing field adalah suatu struktur akses index yang biasanya
menjelaskan field tunggal dari suatu file.
• Indexing organization memberikan efisiensi akses ke record-record
secara berurut atau random.
Data Reduction
• Data reduction adalah transformasi suatu masalah ke masalah lain
dan dapat digunakan untuk mendefinisikan serangkaian masalah
yang kompleks.

• Data reduction merupakan teknik yang digunakan untuk


mentransformasi dari data mentah ke bentuk format data yang lebih
berguna. Sebagai contoh groupping, summing dan averaging data.

• Data reduction dilakukan untuk mengatasi ukuran data yang terlalu


besar. Ukuran data yang terlalu besar dapat menimbulkan
ketidakefisienan proses dan peningkatan biaya pemrosesan.

• Data reduction dilakukan dalam tahap data preprocessing pada


rangkaian proses Knowledge Discovery Databases (KDD) sebelum
data mining dengan tujuan mengurangi ukuran data yang besar.
OLAP (On-line analytical processing)
• OLAP adalah suatu sistem atau teknologi yang dirancang untuk
mendukung proses analisis kompleks dalam rangka mengungkapkan
kecenderungan pasar dan faktor-faktor penting dalam bisnis

• OLAP ditandai dengan kemampuannya menaikkan atau menurunkan


dimensi data sehingga kita dapat menggali data sampai pada level
yang sangat detail dan memperoleh pandangan yang lebih luas
mengenai objek yang sedang kita analisis.

• OLAP secara khusus memfokuskan pada pembuatan data agar dapat


diakses pada saat pendefinisian kembali dimensi.
OLAP ( ONLINE ANALYTICAL PROCESSING)

• OLAP dapat digunakan membuat rangkuman dari


multidimensi data yang berbeda, rangkuman baru dan
mendapatkan respon secara online, dan memberikan
view dua dimensi pada data cube multidimensi secara
interaktif.
• Aplikasi OLAP didominasi oleh ad hoc, query kompleks. Dalam
istilah SQL, ini adalah query yang melibatkan kelompok-oleh
dan operator agregasi.Cara alami untuk berpikir tentang query
OLAP adalah dalam hal model data multidimensi.Kita mulai
bagian ini dengan menyajikan model data multidimensi dan
membandingkannya dengan representasi data relasional.
MODEL DATA MULTIDIMENSIONAL

• Dalam model data multidimensi, fokusnya adalah pada koleksi


langkah-langkah numerik.Setiap ukuran tergantung pada set
dimensi.
• Beberapa sistem OLAP, misalnya, Essbase dari Software Arbor,
sebenarnya menyimpan data dalam array multidimensi. Sistem
OLAP yang menggunakan array untuk menyimpan dataset
multidimensi disebut OLAP multidimensi (MOLAP) sistem.
OLAP QUERY

• Operasi yang didukung oleh model ini sangat dipengaruhi oleh


alat pengguna akhir seperti spreadsheet. Tujuannya adalah
untuk memberikan pengguna akhir yang bukan ahli SQL
antarmuka yang intuitif dan kuat untuk umum tugas analisis
businessoriented. Pengguna diharapkan untuk menimbulkan
ad hoc query secara langsung, tanpa bergantung pada
programmer aplikasi database.
PERTEMUAN 14

DATA WAREHOUSE
Data Warehouse

Definisi :
• Data Warehouse adalah Pusat repositori informasi yang mampu
memberikan database berorientasi subyek untuk informasi yang
bersifat historis yang mendukung DSS (Decision Suport System)
dan EIS (Executive Information System).
• Salinan dari transaksi data yang terstruktur secara spesifik pada
query dan analisa.
• Salinan dari transaksi data yang terstruktur spesifik untuk query dan
laporan

Tujuan :
• Meningkatkan kualitas dan akurasi informasi bisnis dan
mengirimkan informasi ke pemakai dalam bentuk yang dimengerti
dan dapat diakses dengan mudah.
4 KARAKTERISTIK DATA WAREHOUSE
1. Subject oriented
• Data yang disusun menurut subyek berisi hanya informasi yang
penting bagi pemrosesan decision support.
• Data yang disusun menurut subyek berisi hanya informasi
yang penting bagi pemrosesan decision support.
• Database yang semua informasi yang tersimpan
dikelompokkan berdasarkan subyek tertentu misalnya :
pelanggan, gudang, pasar, dsb.
• Semua informasi tersebut disimpan dalam suatu system data
warehouse.
• Datadata disetiap subyek dirangkuman ke dalam dimensi,
misalnya: periode waktu, produk, wilayah, dsb, sehingga
dapat memberikan nilai sejarah untuk bahan analisa.
lanjut
2. Integrated
Jika data terletak pada berbagai aplikasi yang terpisah dalam suatu
lingkungan operasional, encoding data sering tidak seragam
sehingga bila data dipindahkan ke data warehouse maka coding
akan diasumsikan sama seperti lazimnya.

3. Time-variant
Data warehouse adalah tempat untuk storing data selama 5
sampai 10 tahun atau lebih, data digunakan untuk perbandingan
atau perkiraan dan data ini tidak dapat diperbaharui.

4. Non volatile
Data tidak dapat diperbaharui atau dirubah tetapi hanya dapat
ditambah dan dilihat.
MASALAH-MASALAH DALAM
MENERAPKAN DATA WAREHOUSE
• Dokumentasi dan pengelolaan metadata dari data warehouse.
• Penentuan aturan dalam proses transformasi untuk
menetapkan berbagai sumber legacy data yang akan
dimasukkan ke dalam data warehouse.
• Pencapaian proses pengembangan yang handal, baik dalam
membangun, mengimplementasikan, maupun memelihara
data warehouse.
KEUNTUNGAN DATAWAREHOUSE

• Datawarehouse menyediakan model data yang bervariasi, dan tidak


bergantung pada satu sumber data saja. Hal ini memudahkan
pimpinan perusahaan/manager membuat laporan dan menganalisa.
• Saat me-load data ke dalam datawarehouse, data yang tidak
konsisten akan diketahui dan secepatnya dirubah. Mendukung
proses pembuatan laporan, agar keputusan yang diambil adalah
keputusan yang benar sesuai data.
• Keamanan informasi didalam datawarehouse terjamin, karena
datawarehouse selalu digunakan dan dimonitor oleh pengguna
datawarehouse tersebut.
• Dalam membuat laporan tidak membuat proses transaksi yang ada
menjadi lambat, karena datawarehouse terpisah dengan database
operasional.
• Datawarehouse menyediakan berbagai macam bentuk laporan yang
terbaru.
KERUGIAN DATAWAREHOUSE
• Datawarehouse tidak cocok untuk data yang tidak struktur.
• Data perlu di extract, diubah, dan di load ke datawarehouse,
sehingga membutuhkan waktu (delay) kerja untuk
datawarehouse yang belum terbentuk.
• Semakin lama masa hidup bisnis yang menggunakan
datawarehouse, maka semakin banyak biaya yang dikeluarkan
oleh perusahaan untuk memodifikasi teknologi
datawarehouse atau perawatan berjalan datawarehouse.
• Jika data yang diambil lambat, maka data yang dimiliki di
datawarehouse tidak berkulitas/ sehingga laporan tidak
optimal.
MENCIPTAKAN SEBUAH DATA WAREHOUSE

Ada banyak tantangan dalam menciptakan dan memelihara sebuah


data warehouse yang besar. Sebuah skema database yang baik
harus dirancang untuk menahan koleksi terpadu dari data yang
disalin dari berbagai sumber. Sebagai contoh, sebuah warehouse
perusahaan mungkin termasuk persediaan dan database personil
departemen ', bersama-sama dengan database penjualan dikelola
oleh kantor di negara yang berbeda. Karena source database sering
dibuat dan dipelihara oleh kelompok yang berbeda, ada sejumlah
ketidaksesuaian semantik di database ini, seperti unit mata uang
yang berbeda, nama yang berbeda untuk atribut yang sama, dan
perbedaan dalam bagaimana tabel dinormalisasi atau terstruktur;
perbedaan-perbedaan ini harus didamaikan ketika data dibawa ke
warehouse. Setelah skema warehouse dirancang, warehouse harus
diisi, dan dari waktu ke waktu, itu harus tetap konsisten dengan
database sumber.
Ciri-ciri Data Warehouse

Terdapat 4 karateristik data warehouse

1. Subject oriented
– Data yang disusun menurut subyek berisi hanya informasi yang
penting bagi pemprosesan decision support.
– Database yang semua informasi yang tersimpan di kelompokkan
berdasarkan subyek tertentu misalnya: pelanggan, gudang, pasar,
dsb.
– Semua Informasi tersebut disimpan dalam suatu sistem data
warehouse.
– Data-data di setiap subyek dirangkum ke dalam dimensi, misalnya :
periode waktu, produk, wilayah, dsb, sehingga dapat memberikan
nilai sejarah untuk bahan analisa.
Ciri-ciri Data Warehouse

2. Integrated
– Jika data terletak pada berbagai aplikasi yang terpisah dalam suatu
lingkungan operasional, encoding data sering tidak seragam
sehinggga bila data dipindahkan ke data warehouse maka coding
akan diasumsikan sama seperti lazimnya.

3. Time-variant
– Data warehouse adalah tempat untuk storing data selama 5 sampai
10 tahun atau lebih, data digunakan untuk perbandingan atau
perkiraan dan data ini tidak dapat diperbaharui.

4. Non volatile
– Data tidak dapat diperbaharui atau dirubah tetapi hanya dapat
ditambah dan dilihat.
Data Preprocessing
• Data preprocessing menerangkan tipe-tipe proses yang melaksanakan
data mentah untuk mempersiapkan proses prosedur yang lainnya.
• Dalam data mining menstrasformasi data ke suatu format yang prosesnya
lebih mudah dan efektif untuk kebutuhan pemakai, contohnya Neural
Network.
• Terdapat beberapa alat dan metode yang berbeda yang digunakan untuk
preprocessing seperti :
– Sampling : menyeleksi subset representatif dari populasi data yang
besar.
– Transformation : memanipulasi data mentah untuk menghasilkan input
tunggal.
– Denoising : menghilangkan noise dari data
– Normalization : mengorganisasi data untuk pengaksesan yang lebih
spesifik
–Feature extration : membuka spesifikasi data yang signifikan dalam
konteks tertentu.
KNOWLEDGE DISCOVERY IN DATABASE
(KDD)

• KDD berhubungan dengan teknik integrasi dan


penemuan ilmiah, interprestasi dan visualisasi dari pola-
pola sejumlah kumpulan data.

• Knowledge discovery in databases (KDD) adalah


keseluruhan proses non-trivial untuk mencari dan
mengidentifikasi pola (pattern) dalam data, dimana pola
yang ditemukan bersifat sah, baru, dapat bermanfaat
dan dapat dimengerti.
lanjut
TAHAPAN PROSES KDD

1. Data Selection
– Menciptakan himpunan data target , pemilihan himpunan data, atau
memfokuskan pada subset variabel atau sampel data, dimana
penemuan (discovery) akan dilakukan.
– Pemilihan (seleksi) data dari sekumpulan data operasional perlu
dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.
Data hasil seleksi yang akan digunakan untuk proses data mining,
disimpan dalam suatu berkas, terpisah dari basis data operasional.
lanjut

2. Pre-processing/ Cleaning
– Pemprosesan pendahuluan dan pembersihan data merupakan
operasi dasar seperti penghapusan noise dilakukan.
– Sebelum proses data mining dapat dilaksanakan, perlu dilakukan
proses cleaning pada data yang menjadi fokus KDD.
– Proses cleaning mencakup antara lain membuang duplikasi data,
memeriksa data yang inkonsisten, dan memperbaiki kesalahan
pada data, seperti kesalahan cetak (tipografi).
– Dilakukan proses enrichment, yaitu proses “memperkaya” data yang
sudah ada dengan data atau informasi lain yang relevan dan
diperlukan untuk KDD, seperti data atau informasi eksternal.
lanjut
3. Transformation
– Pencarian fitur-fitur yang berguna untuk
mempresentasikan data bergantung kepada goal yang
ingin dicapai.
– Merupakan proses transformasi pada data yang telah
dipilih, sehingga data tersebut sesuai untuk proses data
mining. Proses ini merupakan proses kreatif dan sangat
tergantung pada jenis atau pola informasi yang akan
dicari dalam basis data
lanjut
4. Data mining
– Pemilihan tugas data mining; pemilihan goal dari proses
KDD misalnya klasifikasi, regresi, clustering, dll.
– Pemilihan algoritma data mining untuk pencarian
(searching)
– Proses Data mining yaitu proses mencari pola atau
informasi menarik dalam data terpilih dengan
menggunakan teknik atau metode tertentu. Teknik,
metode, atau algoritma dalam data mining sangat
bervariasi. Pemilihan metode atau algoritma yang tepat
sangat bergantung pada tujuan dan proses KDD secara
keseluruhan.
lanjut
5. Interpretation/ Evaluation
– Penerjemahan pola-pola yang dihasilkan dari data
mining.
– Pola informasi yang dihasilkan dari proses data mining
perlu ditampilkan dalam bentuk yang mudah dimengerti
oleh pihak yang berkepentingan.
– Tahap ini merupakan bagian dari proses KDD yang
mencakup pemeriksaan apakah pola atau informasi
yang ditemukan bertentangan dengan fakta atau
hipotesa yang ada sebelumnya.

Anda mungkin juga menyukai