Modul Dscience Lanjut2
Modul Dscience Lanjut2
DATA SCIENCE
Erfan_Karyadiputra@2024
DATA SCIENCE
Erfan_Karyadiputra@2024
DATA SCIENCE
Erfan_Karyadiputra@2024
10. Kemudian kita juga perlu mensetting environment untuk streamlit, copy extensi conda.bat
atau bisa buka users
DATA SCIENCE
Erfan_Karyadiputra@2024
17. Coba ketik conda -V dan python -V untuk memastikan setting environment sudah berhasil
18. Selanjutnya buka anaconda navigator, lalu pilih sign up untuk memasukkan anaconda
asisstant
DATA SCIENCE
Erfan_Karyadiputra@2024
21. Pilih folder penyimpanan file misalnya folder documents, lalu pilih python 3
DATA SCIENCE
Erfan_Karyadiputra@2024
24. Selanjutnya menggunakan google colaboratory, buka drive google lalu pilih hubungkan aplikasi
lainnya
DATA SCIENCE
Erfan_Karyadiputra@2024
28. Pilih simbol AI, lalu ketikkan luas persegi panjang, lalu pastekan koding ke cell code
29. Selanjutnya download dan install text editor visual studio code, bisa download melalui
anaconda navigator atau dengan mengklik link Visual Studio Code - Code Editing. Redefined
DATA SCIENCE
Erfan_Karyadiputra@2024
32. Seperti yg sudah dijelaskan sebelumnya, anda jg bisa langsung menjalankan visual studio
codenya di anaconda navigator, lalu pilih launch
DATA SCIENCE
Erfan_Karyadiputra@2024
33. Selanjutnya pilih open folder untuk membuat penyimpanan file ipynb
35. Selanjutnya buat file baru pada folder tersebut dengan nama testing.ipynb, lalu buat
markdown untuk judul dan isi pada code perintah seperti dibawah ini, kemudian running
36. Selanjutnya kita akan mencoba mengimplementasikan python kedalam framework streamlit
untuk membuat aplikasi data science. Langkah pertama buka link streamlit Streamlit • A
faster way to build and share data apps
DATA SCIENCE
Erfan_Karyadiputra@2024
37. Selanjutnya buka cmd, lalu copy paste pip install streamlit, lalu tekan enter
38. Kemudian ketik streamlit hello untuk memastikan apakah streamlit berhasil dijalankan
40. Jika berhasil dijalankan maka akan tampil halaman dashboard streamlit
DATA SCIENCE
Erfan_Karyadiputra@2024
DATA SCIENCE
Erfan_Karyadiputra@2024
45. Buka visual code studio, pilih folder penyimpanan, lalu buat file baru dan beri nama
luaspersegi.py
47. Selanjutnya buka cmd, cari folder penyimpanan, lalu ketik streamlit run luaspersegi.py (sesuai
nama filenya)
DATA SCIENCE
Erfan_Karyadiputra@2024
50. Kemudia reload kembali, jika berhasil maka tampilannya seperti dibawah ini
51. Selanjutnya kita tambahkan option menu agar tampilan lebih menarik, buka pada browser dan
ketik streamlit option menu
54. Selanjutnya kita buat file baru dan beri nama perhitunganluas.py serta ketik koding berikut
DATA SCIENCE
Erfan_Karyadiputra@2024
56. Selanjutnya buka cmd lalu masukkan folder penyimpanan, lalu ketik streamlit run
perhitunganluas.py
58. Coba lakukan perubahan pada input data dari st.number_input menjadi st.slider serta rubah
tampilan option menu agar ditampilkan disamping/vertikal
DATA SCIENCE
Erfan_Karyadiputra@2024
1. Download dataset diabetes di Kaggle.com, silahkan klik link berikut Pima Indians Diabetes
Database
DATA SCIENCE
Erfan_Karyadiputra@2024
5. Selanjutnya buka cmd, lalu install library seperti numpy matplotlib seaborn dan scikit-learn
8. Pilih code, lalu import library numpy, pandas, matplotlib, seaborn dan scikit-learn, lalu running
DATA SCIENCE
Erfan_Karyadiputra@2024
9. Selanjutnya masukkan dataset, jika terjadi error maka otomatis anaconda assistant akan
membantu memberikan solusi utk mengatasi permasalahan, klik debug the active code cell
10. Melalui anaconda asisstant, maka kita perlu memindahkan dataset diabetes.csv yg telah
didownload kedalam direktori folder yg sama dgn file klasifikasi diabetes.ipynb
DATA SCIENCE
Erfan_Karyadiputra@2024
13. Selanjutnya ketik koding berikut utk melihat deskripsi data seperti jumlah data, nama kolom
dan utk mengetahui apakah ada data yg hilang atau tidak valid
15. Selanjutnya melakukan preprocessing data utk mengatasi jika ada data yg hilang atau tidak
valid berdasarkan hasil eksplorasi data
17. Kemudian melakukan permodelan, kita bagi dataset jadi data training dan data testing
DATA SCIENCE
Erfan_Karyadiputra@2024
24. Serta simpan juga scaler (optional). Selanjutnya buka visual code studio, lalu buat folder
klasifikasi dan file baru dengan nama Rfdiabetes.py
DATA SCIENCE
Erfan_Karyadiputra@2024
29. Selanjutnya coba anda rubah algoritma menggunakan model naïve bayes
DATA SCIENCE