Tutorial Rapidminer - 5
Tutorial Rapidminer - 5
Makro dapat digunakan untuk menyimpan sembarang nilai alfanumerik. Setiap makro memiliki
nama dan nilai. Set Macro hanyalah salah satu cara untuk mengatur makro, kita akan melihat
beberapa cara lain nantinya.
Dengan Set Macro, kita akan membuat makro dan menentukan nilainya secara manual. Kita juga
dapat membuat makro di mana nilainya mengambil dari bagian proses yang lain, seperti jumlah
contoh dalam dataset. Berikut langkahnya :
Kita dapat menghasilkan nilai makro menggunakan ekspresi sewenang-wenang dengan cara yang
sama seperti membuat kolom baru dengan operator Generate Attributes. Di sini kita akan
menghitung ukuran contoh himpunan baru dengan mengalikan pecahan yang telah kita definisikan
sebelumnya (Set Macro) dengan ukuran lama (Extract Macro) dan membulatkan hasilnya ke bilangan
bulat.
Berikut langkahnya :
1. Mencari operator Generate Macro dan masukan dalam proses, kemudian hubungkan.
Harap diperhatikan: Bila kita mendefinisikan makro, kitaa bisa menggunakan sembarang teks
sebagai nama, misal. “nama makro" . Tapi bila kita menggunakan parameter makro pada operator
lain, kita harus menggunakan format % {nama makro}.
Fungsi eval memberitahu ekspresi parser pada RapidMiner bahwa nilai makro harus dievaluasi.
Dalam kasus ini, ini mengubah dua makro menjadi angka sehingga dapat digunakan dalam perkalian
(contohnya bagaimana kita dapat memperbanyak dua buah teks?). Fungsi eval sering diperlukan jika
kita ingin menggunakan macro sebagai bagian dari ekspresi fungsi namun kita tidak perlu
menggunakannya jika kitaa hanya menggunakan makro sebagai parameter nilai pada operator lain.
Perlu diketahui lagi bahwa kita harus menggunakan format % {new size} untuk mengakses nilai
makro ini dalam pengaturan parameter.
Tutorial Belajar Rapidminer (Bagian 15) - Perulangan dan
Percabangan
Perulangan dan percabangan adalah konsep yang sangat berguna yang dikenal di hampir semua
bahasa pemrograman. RapidMiner menawarkan puluhan operator untuk perulangan contoh, atribut,
atau nilai atribut tertentu. Dalam tutorial ini, kita akan membangun sebuah proses yang membahas
tiga kelas penumpang yang berbeda dari data Titanic dan memeriksa apakah jumlah sampelnya lebih
tinggi dari angka yang telah ditentukan sebelumnya. Jika lebih tinggi, kita menurunkan subkelompok
ini ke jumlah sebelumnya, jika tidak kita akan menyimpan semua contohnya saja. Proses seperti ini
misalnya, dapat digunakan untuk menyeimbangkan kelas dalam kasus di mana beberapa kelas yang
sangat besar mendominasi beberapa kelas minoritas.
Kita akan menggunakan 400 contoh sebagai jumlah maksimum untuk masing-masing dari tiga
kelas penumpang. Dengan mendefinisikan ukuran max size dengan makro pada awal proses, akan
memudahkan untuk membuat perubahan pada pengaturannya nanti. Hal ini sangat berguna jika kita
menggunakan nilai di banyak bagian proses.
Kita akan melakukan perulangan pada tiga kelas penumpang dan memeriksa sebuah kondisi untuk
masing-masing kelas. Dalam kasus ini, kondisinya adalah bahwa kelas harus memiliki nilai lebih
kecil dari max size sampel. Berikut langkahnya :
1. Cari operator Loop Values dan seret ke dalam proses. Kemudian hubungkan operator.
2. Pada Parameter, atur attribut ke Passenger Class.
Apakah Anda memperhatikan ikon kecil di sudut kanan bawah Nilai Loop operator? Ikon ini
menunjukkan bahwa operator ini dapat memiliki operator lain yang bersarang di dalamnya. Klik dua
kali operator Loop Values untuk melihat isinya.
Di dalam perulangan kita dapat menentukan sub-proses yang akan dijalankan untuk masing-
masing dari tiga kelas penumpang yang sedang dilakukan proses perulangan. Kapan pun kita berada
dalam sub-proses nested, kita bisa menemukan nama sub-proses di pojok kiri atas. Di bagian atas
panel Process, kita juga akan menemukan jalur yang dapat digunakan untuk navigasi kembali ke
proses utama.
Konsep operator bersarang memungkinkan proses yang sangat berguna. Kita akan sering melihat
ini dalam proses selanjutnya saat kita memvalidasi model atau mengoptimalkan pengaturan
parameter. Untuk saat ini, kita mendefinisikan apa yang terjadi di dalam perulangan.
1. Pastikan kita berada di dalam operator Loop dengan mengklik dua kali,
4. Hubungkan input filter dengan port di sebelah kiri sub-proses. Ini akan memungkinkan data set
dikirimkan ke Operator Loop untuk mengalir menuju sub-proses. Pada Parameters dari Filter Example,
tambahkan filter baru dengan setting Passenger Class, equals, dan %{loop_value}
Macro loop_value adalah makro yang telah ditentukan dari operator Loop Values yang dapat
digunakan di dalam operator. Dalam setiap iterasi, makro diatur ke nilai atribut loop saat ini. Kita bisa
menggunakan makro pada operator lain seperti misalnya, Filter Example. Kita hanya menyimpan
sekumpulan sampel asli yang memiliki nilai atribut dari iterasi loop saat ini.
Tutorial Belajar Rapidminer (Bagian 16) - Mengekspor Data
dari Rapidminer
Sampai sejauh ini, kita hanya berfokus untuk memanipulasi data di RapidMiner, namun kita
mungkin bertanya: bagaimana cara kita mendapatkan data dari RapidMiner? Misalnya untuk
kolaborasi, analisis lanjutan, atau redundansi, di mana mengekspor data merupakan tugas penting
untuk dapat dilakukan. Tutorial ini akan menunjukkan bagaimana dengan mudah mengekspor data
kita pada RapidMiner.
2. Cari operator Write Excel dan seret ke dalam proses, hubungkan operator.
3. Di Parameters dari Write Excel, tentukan lokasi file untuk file parameter excel. Pastikan bahwa
Anda memiliki ijin untuk menulis file ke lokasi ini.
Kita dapat menentukan path secara bebas untuk lokasi file Excel. Operator akan mengambil data
Titanic dan menulis dataset lengkap ke dalam file excel. Ada puluhan operator yang tersedia untuk
format file yang berbeda, serta format untuk penulisan ke database. Kita juga dapat menemukan
operator untuk menulis hasilnya kembali ke aplikasi untuk bisnis, seperti sistem CRM atau ERP. Jenis
koneksi ke aplikasi bisnis lainnya sangat penting. Kapan pun kita mengambil keputusan bisnis dengan
menggunakan model prediktif, ki ta dapat mengoperasionalkan permodelannya
Jika kita membutuhkan lebih banyak operator, misalnya untuk penulisan ke dalam format yang
berbeda, cobalah tautan Get More Operators di bagian bawah panel Operator. Tautan ini akan
membuka RapidMiner Marketplace yang menawarkan ekstensi ratusan operator tambahan.
Bila memungkinkan, kita sangat merekomendasikan penggunaan repositori atau database, bukan
file, karena RapidMiner juga menyimpan data meta di repositori. Data meta ini kemudian digunakan
selama proses desain. Misalnya, RapidMiner dapat menggunakannya untuk menampilkan nama
atribut yang berbeda pada dialog pilihan. Kita telah melihat sebelumnya bahwa kita dapat menyimpan
data dalam repositori dengan mengimpornya. Sekarang, kita akan belajar bagaimana cara
menggunakan operator untuk menyimpan data, model, atau hasil lainnya ke dalam repositori .
1. Tambahkan operator Store ke proses dan hubungkan.
2. Tentukan parameter entri repositori dan pilih lokasi di Repositori Lokal Anda.