0% menganggap dokumen ini bermanfaat (0 suara)
31 tayangan31 halaman

DATA MINING P5 Fix

Data Mining Pert. 5

Diunggah oleh

Hasbunaim Syaddad
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
31 tayangan31 halaman

DATA MINING P5 Fix

Data Mining Pert. 5

Diunggah oleh

Hasbunaim Syaddad
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PPTX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 31

Latihan: Penentuan Mine/Rock

1. Lakukan training pada data Sonar (ambil dari


repositories rapidminer) dengan menggunakan
algoritma decision tree (C4.5)
2. Tampilkan himpunan data (dataset) dan pengetahuan
(model tree) yang terbentuk

1
Latihan: Rekomendasi Contact Lenses
1. Lakukan training pada data Contact Lenses (contact-lenses.xls)
dengan menggunakan algoritma decision tree
2. Gunakan operator Read Excel (on the fly) atau langsung
menggunakan fitur Import Data (persistent)
3. Tampilkan himpunan data (dataset) dan pengetahuan (model
tree) yang terbentuk

2
Read Excel Operator

3
Import Data Function

4
Latihan: Estimasi Performance
CPU
1. Lakukan training pada data CPU (cpu.xls) dengan
menggunakan algoritma linear regression
2. Lakukan pengujian terhadap data baru (cpu-
testing.xls), untuk model yang dihasilkan dari
tahapan 1. Data baru berisi 10 setting konfigurasi,
yang belum diketahui berapa performancenya
3. Amati hasil estimasi performance dari 10 setting
konfigurasi di atas

5
Estimasi Performace cpu-testing.xls

cpu.xls

Performance CPU = 0.038 * MYCT


+ 0.017 * MMIN
+ 0.004 * MMAX
+ 0.603 * CACH
cpu-testing.xls + 1.291 * CHMIN
+ 0.906 * CHMAX
- 43.975
6
Latihan: Prediksi Elektabilitas
Caleg
1. Lakukan training pada data pemilu
(datapemilukpu.xls) dengan algoritma yang
tepat
2. Data bisa ditarik dari Import Data atau
operator Read Excel
3. Tampilkan himpunan data (dataset) dan
pengetahuan (pola/model) yang terbentuk
4. Gunakan model yang dihasilkan untuk
memprediksi datapemilukpu-testing.xls

7
Proses Prediksi Elektabilitas
Caleg

8
Latihan: Estimasi Konsumsi Minyak
1. Lakukan training pada data konsumsi minyak (HeatingOil.csv)
• Dataset jumlah konsumsi minyak untuk alat pemanas ruangan di
rumah pertahun perrumah
• Atribut:
• Insulation: Ketebalan insulasi rumah
• Temperatur: Suhu udara sekitar rumah
• Heating Oil: Jumlah konsumsi minyak pertahun perrumah
• Number of Occupant: Jumlah penghuni rumah
• Average Age: Rata-rata umur penghuni rumah
• Home Size: Ukuran rumah
2. Gunakan operator Set Role untuk memilih Label (Heating Oil),
tidak langsung dipilih pada saat Import Data
3. Pilih metode yang tepat supaya menghasilkan model
4. Apply model yang dihasilkan ke data pelanggan baru di file
HeatingOil-Scoring.csv, supaya kita bisa mengestimasi berapa
kebutuhan konsumsi minyak mereka, untuk mengatur stok
penjualan minyak
9
Proses Estimasi Konsumsi
Minyak

Heating Oil = 3.323 * Insulation - 0.869 * Temperature + 1.968 * Avg_Age


+ 3.173 * Home_Size + 134.511

10
Latihan: Matrix Correlation Konsumsi Minyak

1. Lakukan training pada data konsumsi minyak


(HeatingOil.csv)
• Dataset jumlah konsumsi minyak untuk alat pemanas
ruangan di rumah pertahun perrumah
• Atribut:
• Insulation: Ketebalan insulasi rumah
• Temperatur: Suhu udara sekitar rumah
• Heating Oil: Jumlah konsumsi minyak pertahun perrumah
• Number of Occupant: Jumlah penghuni rumah
• Average Age: Rata-rata umur penghuni rumah
• Home Size: Ukuran rumah
2. Tujuannya ingin mendapatkan informasi tentang
atribut apa saja yang paling berpengaruh pada
konsumsi minyak
11
12
Tingkat Korelasi 4 Atribut terhadap Konsumsi Minyak

Jumlah
Penghuni
Rumah
Rata-Rata 0.381
Umur 0.848
Konsumsi
Ketebalan 0.736 Minyak
Insulasi
Rumah

-0.774
Temperatur

13
Latihan: Aturan Asosiasi Data Transaksi

1. Lakukan training pada data transaksi


(transaksi.xlsx)

2. Pilih metode yang tepat supaya


menghasilkan pola

14
15
Latihan: Klasifikasi Data Kelulusan Mahasiswa

1. Lakukan training pada data kelulusan


mahasiswa (datakelulusanmahasiswa.xls)

2. Gunakan operator Split Data untuk


memecah data secara otomatis menjadi
dua dengan perbandingan 0.9:0.1, di mana
0.9 untuk training dan 0.1 untuk testing

3. Pilih metode yang tepat supaya


menghasilkan pola yang bisa menguji data
testing 10%
16
17
Latihan: Forecasting Harga Saham
1. Lakukan training pada data Harga Saham
(hargasaham-training.xls) dengan
menggunakan algoritma yang tepat
2. Tampilkan himpunan data (dataset) dan
pengetahuan (model regresi) yang terbentuk
3. Lakukan pengujian terhadap data baru
(hargasaham-testing.xls), untuk model yang
dihasilkan dari tahapan 1
4. Lakukan visualisasi berupa grafik dari data
yang terbentuk dengan menggunakan Line
atau Spline
18
19
20
Latihan: Forecasting Harga Saham (Univariat)

21
Parameter dari Windowing
• Window size: Determines how many “attributes”
are created for the cross-sectional data
• Each row of the original time series within the window
width will become a new attribute
• We choose w = 6
• Step size: Determines how to advance the window
• Let us use s = 1
• Horizon: Determines how far out to make the
forecast
• If the window size is 6 and the horizon is 1, then the
seventh row of the original time series becomes the first
sample for the “label” variable
• Let us use h = 1
22
Latihan
• Lakukan training dengan menggunakan
linear regression pada dataset hargasaham-
training-uni.xls
• Gunakan Split Data untuk memisahkan
dataset di atas, 90% training dan 10% untuk
testing
• Harus dilakukan proses Windowing pada
dataset
• Plot grafik antara label dan hasil prediksi
dengan menggunakan chart

23
Forecasting Harga Saham (Data Lampau)

24
Forecasting Harga Saham (Data Masa Depan)

25
26
Latihan: Penentuan Kelayakan Kredi

1. Lakukan training dengan algoritma yang


tepat pada dataset: creditapproval-
training.xls

2. Ujicoba model yang dibentuk dari training di


atas ke dataset di bawah: creditapproval-
testing.xls

27
Latihan: Deteksi Kanker
Payudara
1. Lakukan training pada data kanker payudara
(breasttissue.xls)

2. Dataset adalah di sheet 2, sedangkan sheet 1


berisi penjelasan tentangd ata

3. Bagi dataset dengan menggunakan operator


Split Data, 90% untuk training dan 10% untuk
testing

4. Pilih metode yang tepat supaya menghasilkan


pola, analisis pola yang dihasilkan
28
Latihan: Deteksi Serangan
Jaringan
1. Lakukan training pada data serangan
jaringan (intrusion-training.xls)

2. Pilih metode yang tepat supaya


menghasilkan pola

29
Latihan: Klasifikasi Resiko Kredit
1. Lakukan training pada data resiko kredit
(CreditRisk.csv)
(http://romisatriawahono.net/lecture/dm/dataset/)

2. Pilih metode yang tepat supaya


menghasilkan pola

30
Latihan: Klasifikasi Music Genre
1. Lakukan training pada data Music Genre
(musicgenre-small.csv)

2. Pilih metode yang tepat supaya


menghasilkan pola

31

Anda mungkin juga menyukai