Data Mining
Data Mining
• Model
Renca
na
• Dasar
Model
ling
1. Latar Belakang
Korupsi di Indonesia yang masih masif dan merupakan
problem serius meskipun pemerintah memerangi
korupsi sejak dulu
Masifnya korupsi diantaranya dapat terlihat dari
seringnya KPK melakukan OTT, banyaknya pengaduan
masyarakat kpd KPK, IPK Indonesia yang masih
rendah
Selain itu, luasnya wilayah Indonesia, banyaknya KL,
sedang sdm KPK terbatas
Dibutuhkan terobosan untuk membuat program
kerja pemberantasan korupsi yang lebih efektif
dan efisien
Terdapat
beberapa data yang
dimungkinkan untuk dimanfaatkan
untuk menyusun program kerja
pemberantasan korupsi yang lebih
efektif
2. Tujuan Analisa
Untuk mengetahui prediksi indikasi
dugaan korupsi yang akan terjadi
Dimungkinkan untuk mendapatkan
indikasi sesuai atribut yang ada yaitu
pada instansi, lokasi suatu daerah,
bidang kegiatan sesuai core business,
atau bahkan jabatan atau kelompok
pekerjaan
3. Nilai Manfaat
Hasil analisa data diharapkan dapat menjadi
masukan dalam penyusunan program
kerja di bidang pencegahan, misal
jika hasil analisa ditemukan kegiatan
pengadaan barang dan jasa memiliki potensi
korupsi tertinggi maka Dit Litbang dapat
membuat kajian terkait
Jika Riau menjadi daerah tertinggi potensi tpk
maka Dit Gratifikasi dan Dit Dikyanmas atau
Korsupgah bisa mengadalan workshop terkait
tpk
4. Kebutuhan Data dan
Sumbernya
Beberapa data yang akan digunakan;
Data pengaduan masyarakat tahun
2014 – 2016
Data perkara yg pernah dituntut
Jaksa KPK dari tahun 2004 -2015
Data survey integritas (tentative)
5. Deskripsi Data
Data dumas
Instansi = K/L terlapor bekerja
Kabupaten = lokasi instansi terlapor
Delik = dugaan tpk yg dilakukan
Klasifikasi sub bidang = pengelompokan bidang
kerja bisnis proses instansi terlapor
Rekomendasi = kesimpulan sementara penerima
laporan
Tindak lanjut = tindakan berikutnya atas
pengaduan
Klasifikasi jabatan = kelompok jabatan terlapor
Data perkara penuntutan
Predicate crime = tpk sangkaan
Jabatan = posisi/ kedudukan tsk di
pekerjaan
Instansi tsk = K/L tsk bekerja
Lokasi instansi tsk = kedudukan geografis
instansi tsk
Rencana Modelling
Model yang akan digunakan adalah decision tree
Umum digunakan untuk data besar tanpa struktur
rumit
Efektif untuk klasifikasi, prediksi, interpretasi, dan
manipulasi data (Song, Y.Y & Ying, L.U, 2015)
Dapat membagi kumpulan data besar menjadi
himpunan record lebih kecil (Berry, M. J & Linoff, G.S,
2004)
Tidak memerlukan analisa untuk memberikan input
Dapat menggunakan metode pemangkasan (tahap
pruning) untuk meminimalkan kesalahan prediksi
(Sumanthi, S., & Sivanandam, S.N., 2006)