Modul Dscience Lanjut3
Modul Dscience Lanjut3
DATA SCIENCE
Erfan_Karyadiputra@2024
DATA SCIENCE
Erfan_Karyadiputra@2024
DATA SCIENCE
Erfan_Karyadiputra@2024
10. Kemudian kita juga perlu mensetting environment untuk streamlit, copy extensi conda.bat
atau bisa buka users
DATA SCIENCE
Erfan_Karyadiputra@2024
17. Coba ketik conda -V dan python -V untuk memastikan setting environment sudah berhasil
18. Selanjutnya buka anaconda navigator, lalu pilih sign up untuk memasukkan anaconda
asisstant
DATA SCIENCE
Erfan_Karyadiputra@2024
21. Pilih folder penyimpanan file misalnya folder documents, lalu pilih python 3
DATA SCIENCE
Erfan_Karyadiputra@2024
24. Selanjutnya menggunakan google colaboratory, buka drive google lalu pilih hubungkan aplikasi
lainnya
DATA SCIENCE
Erfan_Karyadiputra@2024
28. Pilih simbol AI, lalu ketikkan luas persegi panjang, lalu pastekan koding ke cell code
29. Selanjutnya download dan install text editor visual studio code, bisa download melalui
anaconda navigator atau dengan mengklik link Visual Studio Code - Code Editing. Redefined
DATA SCIENCE
Erfan_Karyadiputra@2024
32. Seperti yg sudah dijelaskan sebelumnya, anda jg bisa langsung menjalankan visual studio
codenya di anaconda navigator, lalu pilih launch
DATA SCIENCE
Erfan_Karyadiputra@2024
33. Selanjutnya pilih open folder untuk membuat penyimpanan file ipynb
35. Selanjutnya buat file baru pada folder tersebut dengan nama testing.ipynb, lalu buat
markdown untuk judul dan isi pada code perintah seperti dibawah ini, kemudian running
36. Selanjutnya kita akan mencoba mengimplementasikan python kedalam framework streamlit
untuk membuat aplikasi data science. Langkah pertama buka link streamlit Streamlit • A
faster way to build and share data apps
DATA SCIENCE
Erfan_Karyadiputra@2024
37. Selanjutnya buka cmd, lalu copy paste pip install streamlit, lalu tekan enter
38. Kemudian ketik streamlit hello untuk memastikan apakah streamlit berhasil dijalankan
40. Jika berhasil dijalankan maka akan tampil halaman dashboard streamlit
DATA SCIENCE
Erfan_Karyadiputra@2024
DATA SCIENCE
Erfan_Karyadiputra@2024
45. Buka visual code studio, pilih folder penyimpanan, lalu buat file baru dan beri nama
luaspersegi.py
47. Selanjutnya buka cmd, cari folder penyimpanan, lalu ketik streamlit run luaspersegi.py (sesuai
nama filenya)
DATA SCIENCE
Erfan_Karyadiputra@2024
50. Kemudia reload kembali, jika berhasil maka tampilannya seperti dibawah ini
51. Selanjutnya kita tambahkan option menu agar tampilan lebih menarik, buka pada browser dan
ketik streamlit option menu
54. Selanjutnya kita buat file baru dan beri nama perhitunganluas.py serta ketik koding berikut
DATA SCIENCE
Erfan_Karyadiputra@2024
56. Selanjutnya buka cmd lalu masukkan folder penyimpanan, lalu ketik streamlit run
perhitunganluas.py
58. Coba lakukan perubahan pada input data dari st.number_input menjadi st.slider serta rubah
tampilan option menu agar ditampilkan disamping/vertikal
DATA SCIENCE
Erfan_Karyadiputra@2024
1. Download dataset diabetes di Kaggle.com, silahkan klik link berikut Pima Indians Diabetes
Database
DATA SCIENCE
Erfan_Karyadiputra@2024
5. Selanjutnya buka cmd, lalu install library seperti numpy matplotlib seaborn dan scikit-learn
8. Pilih code, lalu import library numpy, pandas, matplotlib, seaborn dan scikit-learn, lalu running
DATA SCIENCE
Erfan_Karyadiputra@2024
9. Selanjutnya masukkan dataset, jika terjadi error maka otomatis anaconda assistant akan
membantu memberikan solusi utk mengatasi permasalahan, klik debug the active code cell
10. Melalui anaconda asisstant, maka kita perlu memindahkan dataset diabetes.csv yg telah
didownload kedalam direktori folder yg sama dgn file klasifikasi diabetes.ipynb
DATA SCIENCE
Erfan_Karyadiputra@2024
13. Selanjutnya ketik koding berikut utk melihat deskripsi data seperti jumlah data, nama kolom
dan utk mengetahui apakah ada data yg hilang atau tidak valid
15. Selanjutnya melakukan preprocessing data utk mengatasi jika ada data yg hilang atau tidak
valid berdasarkan hasil eksplorasi data
17. Kemudian melakukan permodelan, kita bagi dataset jadi data training dan data testing
DATA SCIENCE
Erfan_Karyadiputra@2024
24. Serta simpan juga scaler (optional). Selanjutnya buka visual code studio, lalu buat folder
klasifikasi dan file baru dengan nama Rfdiabetes.py
DATA SCIENCE
Erfan_Karyadiputra@2024
29. Selanjutnya coba anda rubah algoritma menggunakan model naïve bayes
DATA SCIENCE
Erfan_Karyadiputra@2024
1. Langkah pertama, kita install dulu openpyxl. Openpyxl adalah sebuah library Python yang
digunakan untuk membaca, menulis, dan memodifikasi file Excel dengan format .xlsx atau
.xlsm sehingga selain dapat membaca file CSV, sistem juga diharapkan dapat membaca file
Excel.
2. Selanjutnya buat file baru pada folder klasifikasi dengan nama Rfdiabetesvscode.py
5. Tekan button windows + titik utk membuka papan emoji bawaan windows
6. Atau kunjungi situs https://emojipedia.org/ utk mendapatkan emoji yang lebih lengkap
DATA SCIENCE
Erfan_Karyadiputra@2024
8. Selanjutnya ketik koding utk menjalankan fungsi unggah file, preprocessing dan normalisasi
DATA SCIENCE
Erfan_Karyadiputra@2024
13. Selanjutnya ketik koding untuk menu setting tema seperti mengganti warna dan style tulisan
14. Dalam Streamlit, pengaturan warna atau tema biasanya dilakukan melalui konfigurasi di file
config.toml. File ini digunakan untuk mengelola pengaturan global aplikasi Streamlit, termasuk
tema warna. Jika belum ada file config.toml maka kita perlu membuat file tersebut dalam
folder .streamlit
15. Anda bisa membuat file baru di visual code studio dengan nama config.toml atau membuat file
melalui notepad lalu copy koding berikut kemudian simpan di folder .streamlit
DATA SCIENCE
Erfan_Karyadiputra@2024
18. Berikut tampilan awal aplikasi jika berhasil dijalankan, cobalah unggah dataset diabetes
20. Selanjutnya buka menu evaluasi model untuk mengukur performance model
DATA SCIENCE
Erfan_Karyadiputra@2024
22. Menu setting tema digunakan untuk merubah warna, pilih warna sesuai kebutuhan lalu copy
coding
DATA SCIENCE