0% menganggap dokumen ini bermanfaat (0 suara)
268 tayangan14 halaman

Tutorial Rapidminer - 5

Tutorial ini menjelaskan cara mengekspor data dari RapidMiner dengan menuliskannya ke file Excel atau menyimpannya di repositori. Operator Write Excel digunakan untuk menulis dataset ke file Excel, sementara operator Store digunakan untuk menyimpan data di repositori RapidMiner.
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
268 tayangan14 halaman

Tutorial Rapidminer - 5

Tutorial ini menjelaskan cara mengekspor data dari RapidMiner dengan menuliskannya ke file Excel atau menyimpannya di repositori. Operator Write Excel digunakan untuk menulis dataset ke file Excel, sementara operator Store digunakan untuk menyimpan data di repositori RapidMiner.
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 14

Tutorial Belajar Rapidminer (Bagian 14) - Macros sebagai

Variabel Proses dan Sampling


Dalam tutorial ini, Anda akan belajar tentang konsep RapidMiner yang sangat berguna
yaitu macro. Makro adalah variabel yang dapat kita gunakan untuk menyimpan dan memuat nilai
secara dinamis dalam proses kita. Dalam tutorial ini, kita akan menggunakan macro untuk mengurangi
ukuran data sebesar 50% untuk melakukan perhitungan menggunakan ukuran yang baru.

Langkah 1. menyiapkan data.

1. Tarik data Titanic ke dalam jendela process.

2. Cari operator Set Macro dan tambahkan ke prosesnya.

3. Hubungkan Set Macro dengan Retrieve Titanic.


4. Klik Set Macro dan buat perubahan berikut pada Parameternya:

Atur macro ke fraction, atur value ke 0.5.

Makro dapat digunakan untuk menyimpan sembarang nilai alfanumerik. Setiap makro memiliki
nama dan nilai. Set Macro hanyalah salah satu cara untuk mengatur makro, kita akan melihat
beberapa cara lain nantinya.

Langkah 2 : Mengekstrak makro dari data.

Dengan Set Macro, kita akan membuat makro dan menentukan nilainya secara manual. Kita juga
dapat membuat makro di mana nilainya mengambil dari bagian proses yang lain, seperti jumlah
contoh dalam dataset. Berikut langkahnya :

1. Tambahkan operator Extract Macro ke dalam proses dan hubungkan.


2. Dalam parameternya, atur opsi macro ke size, atur jenis macro ke number_of_examples.

Langkah 3 : Menghitung makro yang baru

Kita dapat menghasilkan nilai makro menggunakan ekspresi sewenang-wenang dengan cara yang
sama seperti membuat kolom baru dengan operator Generate Attributes. Di sini kita akan
menghitung ukuran contoh himpunan baru dengan mengalikan pecahan yang telah kita definisikan
sebelumnya (Set Macro) dengan ukuran lama (Extract Macro) dan membulatkan hasilnya ke bilangan
bulat.

Berikut langkahnya :

1. Mencari operator Generate Macro dan masukan dalam proses, kemudian hubungkan.

2. Di Parameternya, klik pada function descrption.


3. Tambahkan entri baru dengan new size sebagai macro name dan round (eval (% {size}) * eval (%
{fraction})) sebagai function expressions.

Harap diperhatikan: Bila kita mendefinisikan makro, kitaa bisa menggunakan sembarang teks
sebagai nama, misal. “nama makro" . Tapi bila kita menggunakan parameter makro pada operator
lain, kita harus menggunakan format % {nama makro}.

Fungsi eval memberitahu ekspresi parser pada RapidMiner bahwa nilai makro harus dievaluasi.
Dalam kasus ini, ini mengubah dua makro menjadi angka sehingga dapat digunakan dalam perkalian
(contohnya bagaimana kita dapat memperbanyak dua buah teks?). Fungsi eval sering diperlukan jika
kita ingin menggunakan macro sebagai bagian dari ekspresi fungsi namun kita tidak perlu
menggunakannya jika kitaa hanya menggunakan makro sebagai parameter nilai pada operator lain.

Langkah 4 : Melakukan Sampel data.

1. Seret operator sample ke dalam proses dan hubungkan.

2. Atur parameter sample size ke % {new size}.

3. Hubungkan output of Sample ke port result di sebelah kanan.


4. Jalankan prosesnya.

Perlu diketahui lagi bahwa kita harus menggunakan format % {new size} untuk mengakses nilai
makro ini dalam pengaturan parameter.
Tutorial Belajar Rapidminer (Bagian 15) - Perulangan dan
Percabangan
Perulangan dan percabangan adalah konsep yang sangat berguna yang dikenal di hampir semua
bahasa pemrograman. RapidMiner menawarkan puluhan operator untuk perulangan contoh, atribut,
atau nilai atribut tertentu. Dalam tutorial ini, kita akan membangun sebuah proses yang membahas
tiga kelas penumpang yang berbeda dari data Titanic dan memeriksa apakah jumlah sampelnya lebih
tinggi dari angka yang telah ditentukan sebelumnya. Jika lebih tinggi, kita menurunkan subkelompok
ini ke jumlah sebelumnya, jika tidak kita akan menyimpan semua contohnya saja. Proses seperti ini
misalnya, dapat digunakan untuk menyeimbangkan kelas dalam kasus di mana beberapa kelas yang
sangat besar mendominasi beberapa kelas minoritas.

Langkah 1 Menyiapkan data dan makro.

1. Seret data Titanic ke dalam proses.

2. Tambahkan operator Set Macro ke proses dan hubungkan.


3. Gunakan ukuran max size sebagai makro dan 400 sebagai value pada Parameters.

Kita akan menggunakan 400 contoh sebagai jumlah maksimum untuk masing-masing dari tiga
kelas penumpang. Dengan mendefinisikan ukuran max size dengan makro pada awal proses, akan
memudahkan untuk membuat perubahan pada pengaturannya nanti. Hal ini sangat berguna jika kita
menggunakan nilai di banyak bagian proses.

Langkah 2 . Melakukan perulangan nilai atribut.

Kita akan melakukan perulangan pada tiga kelas penumpang dan memeriksa sebuah kondisi untuk
masing-masing kelas. Dalam kasus ini, kondisinya adalah bahwa kelas harus memiliki nilai lebih
kecil dari max size sampel. Berikut langkahnya :

1. Cari operator Loop Values dan seret ke dalam proses. Kemudian hubungkan operator.
2. Pada Parameter, atur attribut ke Passenger Class.

Langkah 3. Pengaturan di dalam perulangan

Apakah Anda memperhatikan ikon kecil di sudut kanan bawah Nilai Loop operator? Ikon ini
menunjukkan bahwa operator ini dapat memiliki operator lain yang bersarang di dalamnya. Klik dua
kali operator Loop Values untuk melihat isinya.

1. Klik dua kali Loop Values.

Di dalam perulangan kita dapat menentukan sub-proses yang akan dijalankan untuk masing-
masing dari tiga kelas penumpang yang sedang dilakukan proses perulangan. Kapan pun kita berada
dalam sub-proses nested, kita bisa menemukan nama sub-proses di pojok kiri atas. Di bagian atas
panel Process, kita juga akan menemukan jalur yang dapat digunakan untuk navigasi kembali ke
proses utama.

Langkah 4. Menyimpan sampel untuk kelas .

Konsep operator bersarang memungkinkan proses yang sangat berguna. Kita akan sering melihat
ini dalam proses selanjutnya saat kita memvalidasi model atau mengoptimalkan pengaturan
parameter. Untuk saat ini, kita mendefinisikan apa yang terjadi di dalam perulangan.

1. Pastikan kita berada di dalam operator Loop dengan mengklik dua kali,

2. Di dalam operator Loop Values, lakukan hal berikut:


3. Tambahkan Operator Filter Examples.

4. Hubungkan input filter dengan port di sebelah kiri sub-proses. Ini akan memungkinkan data set
dikirimkan ke Operator Loop untuk mengalir menuju sub-proses. Pada Parameters dari Filter Example,
tambahkan filter baru dengan setting Passenger Class, equals, dan %{loop_value}

Macro loop_value adalah makro yang telah ditentukan dari operator Loop Values yang dapat
digunakan di dalam operator. Dalam setiap iterasi, makro diatur ke nilai atribut loop saat ini. Kita bisa
menggunakan makro pada operator lain seperti misalnya, Filter Example. Kita hanya menyimpan
sekumpulan sampel asli yang memiliki nilai atribut dari iterasi loop saat ini.
Tutorial Belajar Rapidminer (Bagian 16) - Mengekspor Data
dari Rapidminer
Sampai sejauh ini, kita hanya berfokus untuk memanipulasi data di RapidMiner, namun kita
mungkin bertanya: bagaimana cara kita mendapatkan data dari RapidMiner? Misalnya untuk
kolaborasi, analisis lanjutan, atau redundansi, di mana mengekspor data merupakan tugas penting
untuk dapat dilakukan. Tutorial ini akan menunjukkan bagaimana dengan mudah mengekspor data
kita pada RapidMiner.

Langkah 1. Menuliskan data ke file.

1. Tarik data Titanic ke dalam proses.

2. Cari operator Write Excel dan seret ke dalam proses, hubungkan operator.

3. Di Parameters dari Write Excel, tentukan lokasi file untuk file parameter excel. Pastikan bahwa
Anda memiliki ijin untuk menulis file ke lokasi ini.
Kita dapat menentukan path secara bebas untuk lokasi file Excel. Operator akan mengambil data
Titanic dan menulis dataset lengkap ke dalam file excel. Ada puluhan operator yang tersedia untuk
format file yang berbeda, serta format untuk penulisan ke database. Kita juga dapat menemukan
operator untuk menulis hasilnya kembali ke aplikasi untuk bisnis, seperti sistem CRM atau ERP. Jenis
koneksi ke aplikasi bisnis lainnya sangat penting. Kapan pun kita mengambil keputusan bisnis dengan
menggunakan model prediktif, ki ta dapat mengoperasionalkan permodelannya

Jika kita membutuhkan lebih banyak operator, misalnya untuk penulisan ke dalam format yang
berbeda, cobalah tautan Get More Operators di bagian bawah panel Operator. Tautan ini akan
membuka RapidMiner Marketplace yang menawarkan ekstensi ratusan operator tambahan.

Langkah 2. Menyimpan ke dalam repositori.

Bila memungkinkan, kita sangat merekomendasikan penggunaan repositori atau database, bukan
file, karena RapidMiner juga menyimpan data meta di repositori. Data meta ini kemudian digunakan
selama proses desain. Misalnya, RapidMiner dapat menggunakannya untuk menampilkan nama
atribut yang berbeda pada dialog pilihan. Kita telah melihat sebelumnya bahwa kita dapat menyimpan
data dalam repositori dengan mengimpornya. Sekarang, kita akan belajar bagaimana cara
menggunakan operator untuk menyimpan data, model, atau hasil lainnya ke dalam repositori .
1. Tambahkan operator Store ke proses dan hubungkan.

2. Tentukan parameter entri repositori dan pilih lokasi di Repositori Lokal Anda.

Hubungkan output Store juga dengan port "res" di sebelah kanan.


3. Jalankan prosesnya.

Anda mungkin juga menyukai