0% menganggap dokumen ini bermanfaat (0 suara)
1K tayangan22 halaman

Optimasi Query Pada Sistem Database Paralel

Dokumen tersebut membahas tentang optimisasi query pada sistem database paralel. Sistem database paralel mampu memanfaatkan paralelisme untuk meningkatkan kinerja dan ketersediaan. Optimisasi query bertujuan untuk menemukan strategi eksekusi query yang paling optimal dengan mempertimbangkan faktor komunikasi antar fragmen data yang terdistribusi.

Diunggah oleh

Dadang Handaru
Hak Cipta
© Attribution Non-Commercial (BY-NC)
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PPT, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
1K tayangan22 halaman

Optimasi Query Pada Sistem Database Paralel

Dokumen tersebut membahas tentang optimisasi query pada sistem database paralel. Sistem database paralel mampu memanfaatkan paralelisme untuk meningkatkan kinerja dan ketersediaan. Optimisasi query bertujuan untuk menemukan strategi eksekusi query yang paling optimal dengan mempertimbangkan faktor komunikasi antar fragmen data yang terdistribusi.

Diunggah oleh

Dadang Handaru
Hak Cipta
© Attribution Non-Commercial (BY-NC)
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PPT, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 22

OPTIMISASI QUERY

PADA SISTEM
DATABASE PARALEL
PENDAHULUAN
 TeknologiDistributed Database dapat
diimplementasikan menjadi paralel
database sistem.
 Sistem database paralel
memanfaatkan paralelism pada
manajemen data untuk menghasilkan
database server yang memiliki
performansi dan availability yang
tinggi.
 Sebuah paralel DBMS (Database Management
System) dapat didefinisikan sebagai DBMS yang
diimplementasikan pada multiprosesor komputer.
 DBMS tersebut melakukan query dengan dua cara,
yaitu :
1. Inter-query paralelism
Inter-query mampu melakukan eksekusi paralel
dengan menggunakan multiple query yang
dilakukan oleh transaksi–transaksi yang berjalan
secara konkuren.
2. Intra–query paralelism
Mampu membuat eksekusi paralel berjalan
sendiri–sendiri meskipun dengan query yang sama.
Karakteristik DBMS Paralel
 Paralel database adalah sebuah database yang file-
filenya disimpan di tiap–tiap komputer yang terhubung
dengan jaringan. Untuk membuat sebuah DDB, data
secara lojik saling berhubungan dimana hubungan
tersebut terdefinisi dalam bentuk yang lebih terstruktur.
 Sistem tersebut harus memiliki fungsionalitas penuh
sebagai sebuah DBMS.
 Distribusi data dari multiprosesor tidak terlihat oleh user,
ini disebut transparency. Transparent access berarti user
hanya melihat sebuah database meskipun pada
kenyataannya database tersebut terdistribusi.
Idealnya sebuah paralel DBMS memiliki dua
keuntungan, yaitu :
 Linier scaleup

Linier scaleup menyatakan bahwa


performansi database bergantung pada
ukuran database, processing dan storage
power.
 Linier speedup

Linier speedup menunjukan bahwa


peningkatan performansi untuk sebuah
ukuran database yang tetap adalah linear
dan peningkatan linear di dalam
pemrosesan dan sumber daya.
Arsitektur
 Shared-nothing

Setiap processor mempunyai akses eksklusive ke


memory utama dan unit disk.
Arsitektur shared-nothing memiliki tiga
keuntungan : cost, extensibility, dan availability.
Di lain sisi, shared-nothing memiliki kompleksitas
yang tinggi dan berpotensi terjadi masalah
keseimbangan.
 Shared-memory

Processor manapun memiliki akses ke modul


memory atau unit manapun melalui interkoneksi
yang cepat. Shared-memory memiliki dua
keunggulan simpel dan seimbang, dan terdapat
tiga kerugian : cost, limited extensibility, dan
avalaibility yang rendah.
 Shared-disk
Setiap prosesor memiliki akses ke setiap disk
melalui interkoneksi tetapi eksklusif (non-
shared) akses hanya pada main memory saja.
Setiap prosesor dapat melakukan akses
halaman–halaman database pada shared-disk
dan mengkopinya ke cache-nya sendiri.
Keunggulannya: cost, ekstensibility, plot
balancing, availability, dan kemudahan migrasi
dari sistem uniprosesor. Di lain pihak juga
memiliki masalah kompleksitas yang tinggi dan
performansi.
Query processing dan
optimasi
 Query prosesing adalah sebuah proses
dimana deklarasi query di terjemahkan
menjadi operasi manipulasi data pada level
rendah.
 SQL adalah bahasa query standar yang
dimiliki oleh DBMS pada saat ini.
 Optimisasi query merujuk pada proses
memilih strategi eksekusi query yang
terbaik dari beberapa alternative yang
diberikan.
Pada DBMS terpusat proses tersebut
melibatkan dua langkah:
1. Query Dekomposisi
Query dekomposisi mengambil sebuah
SQL query dan menterjemahkannya ke
dalam aljabar relasional. Pada proses
tersebut query dianalisa secara semantik
sehingga query yang tidak benar dapat
terdeteksi dan dikeluarkan dengan
mudah, sedangkan query yang benar
dapat diterima.
2. Query optimisasi
Jika kita diberikan SQL query maka
dimungkinkan ada lebih dari satu query
aljabar. Beberapa dari query aljabar
dibandingkan dengan query alajbar yang lain.
Kualitas dari query aljabar ditentukan oleh
performansi yang terbaik. Query tersebut
kemudian ditransformasikan menggunakan
aturan-aturan transformasi aljabar, menjadi
query aljabar yang terbaik nantinya. Aljabar
query yang terbaik ini dinilai berdasarkan
cost function dengan menghitung cost yang
terjadi pada saat eksekusi query tersebut.
Proses inilah yang disebut query optimisasi.
Pada DBMS terdistribusi, selain
menggunakan langkan query dekomposisi
dan query optimisasi, DBMS ini juga
menggunakan data lokalisasi dan global
query optimisasi.

Masukan dari data lokalisasi didapatkan


dari langkah query dekomposisi. Query
aljabar ini dispesifikasikan pada global
relation irrespective pada fragmentasi atau
distribusi.
Data Localization
Tujuan utama dari data localization adalah:

untuk melokalisasi hasil data query dengan menggunakan


informasi data terdistribusi. Pada langkah ini, fragmen-
fragmen yang terlibat pada query ditransformasikan
menjadi satu fragmen yang menjalankan relasi secara
global. Sebuah relasi terdistribusi dapat direkonstruksi
dengan menerapkan kebalikan aturan aturan fragmentasi.
Inilah yang disebut localization program.
Untuk menghasilkan query yang baik dilakukan dengan
langkah: data localization setiap relasi global
digantikan oleh localization programnya dan kemudian
menghasilkan fragmen query yang lebih sederhana dan
terstruktur.
Global Query Optimisasi
 Tujuan dari query optimisasi adalah :
Untuk menemukan strategi eksekusi untuk query
yang paling optimal. Optimisasi query
menemukan sebuah plan terbaik dari beberapa
kandidat plan yang telah ditemukan.
Query optimizer memiliki tiga komponen yaitu:
1. Sebuah ruangan/space untuk search(search
space)
Kumpulan dari alternative execution plans yang
merepresentasikan inputan query. Plan-plan
tersebut ekuivalen dan memiliki hasil yang sama
tetapi memiliki perbedaan urutan eksekusi dari
operasi-opersasi dan perbedaan bagaimana
operasi tersebut diimplementasikan.
2. Sebuah cost model
Cost model memprediksi cost dari
execution plans yang terbentuk. Cost
model harus memiliki pengetahuan
yang akurat tentang eksekusi secara
parallel.
3. Sebuah search strategy
Search strategy menggali search
space yang telah dibuat dan memilih
plan terbaik.
 Pada lingkungan terdistribusi fungsi cost
biasanya didefinisikan dengan time units,
merujuk pada sumberdaya seperti alokasi
ruang disk, I/O disk, buffer space, CPU
cost, communication cost, dsb.
 Sebuah cost diambil dengan
mempertimbangkan bahwa
communication cost pada DBMS
terdistribusi merupakan faktor yang paling
utama.
Contoh Kasus
 Implementasi pada Wide Area Network (WAN)
dimana bandwidth yang terbatas membuat
communication menjadi lebih mahal dibanding
biaya pemrosesan local. Untuk memilih operasi-
operasi yang terurut sangat penting dengan
memperhitungkan eksekusi cost dari urut-urutan
dari kandidatnya. Dengan memperhitungkan cost
eksekusi sebelum query dilakukan seperti static
optimization didasarkan pada statistic-statistik
fragmen dan berbagai formula untuk
memperhitungkan kardinalitas hasil operasi-
operasi relasional. Oleh karenanya pemilihan
optimisasi sangat bergantung pada ketersediaan
statistic-statistik di fragmen.
 Aspek yang sangat penting dari query
optimisasi adalah join ordering,
karena permutasi dari join dapat
meningkatkan magnitude dari
beberapa permintaan-permintaan.
 Salah satu dari teknik optimisasi yang
mendasar adalah sequence
distributed join operation
menggunakan semi join operator.
Keuntungan utama dari semijoin pada
sistem terdistribusi adalah untuk
mengurangi cost komunikasi pada
operan-operan join.
Parallel query optimization
 Memiliki kesamaan dengan distributed query
processing. Dimana parallel query optimization
memiliki keuntungan dari intra operation parallelism
dan juga inter-operation parallelism.
1. Intra operation parallelism
Intra-operation parallelism didapatkan dengan cara
mengeksekusi sebuah operasi yang terdapat pada
node-node sebuah mesin multiprosesor. Ini
membutuhkan operan-operan yang sebelumnya telah
dipartisi, contohnya horizontal fragmentasi, melalui
node-node.
Optimizer mungkin seringkali menemukan bahwa
proses repartisi tersebut sangat menguntungkan.
Parallel optimization menggunakan intra-operation
parallelism dapat membuat beberapa teknik dari
database-database yang terdistribusi.
2. Inter-operation parallelism
Muncul ketika terdapat dua atau lebih
operasi-opersai yang dieksekusi secara
parallel yang memiliki sebuah dataflow.
Kita menggambarkan dataflow parallelism
dengan cara menggunakan pipelining.
Independent parallelism muncul ketika
operasi dieksekusi pada saat yang sama
atau terurut permintaan. Independent
parallelism mungkin terjadi ketika operasi-
operasi tidak menggunakan data yang
sama.
Kesimpulan
Kemajuan dari teknologi Database
Management System (DBMS) telah
mencapai pada penggunaan teknologi
multiprocessing.
Oleh karena itu penggunaan DBMS yang
mampu menggunakan teknologi
multiprocessing sekaligus multiuser
sangat diperlukan.
Sistem ini telah menjadi tools
manajemen data yang dominan pada
lingkungan data yang sangat besar
END
Thankyu

Anda mungkin juga menyukai