0% menganggap dokumen ini bermanfaat (0 suara)
4 tayangan21 halaman

Modul Dscience Lanjut2

modul datascience 2

Diunggah oleh

Yusril Maulana
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
4 tayangan21 halaman

Modul Dscience Lanjut2

modul datascience 2

Diunggah oleh

Yusril Maulana
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 21

Erfan_Karyadiputra@2024

MODUL PRAKTIKUM 2 DATA SCIENCE


MENGGUNAKAN JUPYTER NOTEBOOKS, GOOGLE COLLABORATORY DAN
STREAMLIT
ERFAN KARYADIPUTRA

DATA SCIENCE
Erfan_Karyadiputra@2024

1. Langkah petama buka link https://www.anaconda.com/ untuk mendownload anaconda


navigator

2. Selanjutnya download sesuai tipe sistem operasi

3. Kemudian lakukan instalasi

4. Setelah berhasil diinstal, lakukan setting melalui anaconda prompt

DATA SCIENCE
Erfan_Karyadiputra@2024

5. Selanjutnya cari alamat extensi dari conda dan python

6. Lakukan setting environment pada edit the system environment variables

7. Pilih environment variables

8. Pada system variables, double click pada path

9. Selanjutnya copy alamat extensi dari conda.exe dan python.exe

DATA SCIENCE
Erfan_Karyadiputra@2024

10. Kemudian kita juga perlu mensetting environment untuk streamlit, copy extensi conda.bat
atau bisa buka users

11. Lalu pilih anaconda3

12. Pilih library

13. Selanjutnya pilih bin

DATA SCIENCE
Erfan_Karyadiputra@2024

14. Selanjutnya copy folder alamatnya

15. Kemudian pastekan ke path

16. Selanjutnya buka cmd

17. Coba ketik conda -V dan python -V untuk memastikan setting environment sudah berhasil

18. Selanjutnya buka anaconda navigator, lalu pilih sign up untuk memasukkan anaconda
asisstant

DATA SCIENCE
Erfan_Karyadiputra@2024

19. Selanjutnya pilih open

20. Lakukan installasi jupyter notebooks

21. Pilih folder penyimpanan file misalnya folder documents, lalu pilih python 3

DATA SCIENCE
Erfan_Karyadiputra@2024

22. Pada anaconda asisstant, ketik perhitungan luas persegi panjang

23. Copy dan pastekan pada code python, lalu running

24. Selanjutnya menggunakan google colaboratory, buka drive google lalu pilih hubungkan aplikasi
lainnya

25. Cari colaboratory

DATA SCIENCE
Erfan_Karyadiputra@2024

26. Lakukan installasi colaboratory

27. Kemudian pilih google colaboratory

28. Pilih simbol AI, lalu ketikkan luas persegi panjang, lalu pastekan koding ke cell code

29. Selanjutnya download dan install text editor visual studio code, bisa download melalui
anaconda navigator atau dengan mengklik link Visual Studio Code - Code Editing. Redefined

DATA SCIENCE
Erfan_Karyadiputra@2024

30. Lakukan installasi seperti biasa

31. Tambahkan extensions python , lalu install

32. Seperti yg sudah dijelaskan sebelumnya, anda jg bisa langsung menjalankan visual studio
codenya di anaconda navigator, lalu pilih launch

DATA SCIENCE
Erfan_Karyadiputra@2024

33. Selanjutnya pilih open folder untuk membuat penyimpanan file ipynb

34. Buat folder baru dengan nama praktikum ds

35. Selanjutnya buat file baru pada folder tersebut dengan nama testing.ipynb, lalu buat
markdown untuk judul dan isi pada code perintah seperti dibawah ini, kemudian running

36. Selanjutnya kita akan mencoba mengimplementasikan python kedalam framework streamlit
untuk membuat aplikasi data science. Langkah pertama buka link streamlit Streamlit • A
faster way to build and share data apps

DATA SCIENCE
Erfan_Karyadiputra@2024

37. Selanjutnya buka cmd, lalu copy paste pip install streamlit, lalu tekan enter

38. Kemudian ketik streamlit hello untuk memastikan apakah streamlit berhasil dijalankan

39. Selanjutnya masukkan email dan tekan enter

40. Jika berhasil dijalankan maka akan tampil halaman dashboard streamlit

DATA SCIENCE
Erfan_Karyadiputra@2024

41. Pilih menu animation demo utk menampilkan animation demo

42. Pilih menu plotting demo utk menampilkan plotting demo

43. Pilih menu mapping demo utk menampilkan mapping demo

44. Pilih menu dataframe demo utk menampilkan dataframe demo

DATA SCIENCE
Erfan_Karyadiputra@2024

45. Buka visual code studio, pilih folder penyimpanan, lalu buat file baru dan beri nama
luaspersegi.py

46. Selanjutnya ketikkan coding berikut

47. Selanjutnya buka cmd, cari folder penyimpanan, lalu ketik streamlit run luaspersegi.py (sesuai
nama filenya)

48. Jika berhasil dijalankan maka tampilanya seperti gambar berikut

49. Selanjutnya coba rubah st.number_input menjadi model st.slider

DATA SCIENCE
Erfan_Karyadiputra@2024

50. Kemudia reload kembali, jika berhasil maka tampilannya seperti dibawah ini

51. Selanjutnya kita tambahkan option menu agar tampilan lebih menarik, buka pada browser dan
ketik streamlit option menu

52. Copy pip install streamlit option menu

53. Buka cmd, lalu pastekan pip install streamlit option

54. Selanjutnya kita buat file baru dan beri nama perhitunganluas.py serta ketik koding berikut

DATA SCIENCE
Erfan_Karyadiputra@2024

55. Kemudian masukkan juga coding berikut

56. Selanjutnya buka cmd lalu masukkan folder penyimpanan, lalu ketik streamlit run
perhitunganluas.py

57. Jika berhasil maka tampilannya seperti berikut

58. Coba lakukan perubahan pada input data dari st.number_input menjadi st.slider serta rubah
tampilan option menu agar ditampilkan disamping/vertikal

DATA SCIENCE
Erfan_Karyadiputra@2024

1. Download dataset diabetes di Kaggle.com, silahkan klik link berikut Pima Indians Diabetes
Database

2. Selanjutnya buka jupyter notebook

3. Pilih folder penyimpanan, lalu klik python 3

4. Berikan nama file menjadi klasifikasi diabetes.ipynb

DATA SCIENCE
Erfan_Karyadiputra@2024

5. Selanjutnya buka cmd, lalu install library seperti numpy matplotlib seaborn dan scikit-learn

6. Buka kembali jupyter, lalu pilih markdown

7. Kemudian ketik pada markdown seperti dibawah ini, lalu running

8. Pilih code, lalu import library numpy, pandas, matplotlib, seaborn dan scikit-learn, lalu running

DATA SCIENCE
Erfan_Karyadiputra@2024

9. Selanjutnya masukkan dataset, jika terjadi error maka otomatis anaconda assistant akan
membantu memberikan solusi utk mengatasi permasalahan, klik debug the active code cell

10. Melalui anaconda asisstant, maka kita perlu memindahkan dataset diabetes.csv yg telah
didownload kedalam direktori folder yg sama dgn file klasifikasi diabetes.ipynb

11. Pindahkan sesuai direktori folder penyimpanan anda

DATA SCIENCE
Erfan_Karyadiputra@2024

12. Selanjutnya running kembali sehingga muncul sampel datasetnya

13. Selanjutnya ketik koding berikut utk melihat deskripsi data seperti jumlah data, nama kolom
dan utk mengetahui apakah ada data yg hilang atau tidak valid

14. Selanjutnya melakukan visualisasi utk melihat distribusi data

15. Selanjutnya melakukan preprocessing data utk mengatasi jika ada data yg hilang atau tidak
valid berdasarkan hasil eksplorasi data

16. Selanjutnya lakukan normalisasi

17. Kemudian melakukan permodelan, kita bagi dataset jadi data training dan data testing

18. Selanjutnya melatih model menggunakan algoritma RF

DATA SCIENCE
Erfan_Karyadiputra@2024

19. Langkah selanjutnya melakukan evaluasi model agar diketahui performancenya

20. Selanjutnya menampilkan visualisasi matrik

21. Selanjutnya melakukan tuning untuk meningkatkan performance model

22. Selanjutnya validasi data menggunakan teknik x-cross validations

23. Tahapan selanjutnya simpan model dalam format .sav

24. Serta simpan juga scaler (optional). Selanjutnya buka visual code studio, lalu buat folder
klasifikasi dan file baru dengan nama Rfdiabetes.py

25. Selanjutnya pindahkan file .sav ke dalam folder klasifikasi

DATA SCIENCE
Erfan_Karyadiputra@2024

26. Selanjutnya ketik koding berikut pada file Rfdiabetes.py

27. Selanjutnya jalankan streamlit

28. Terakhir, masukkan data baru lalu klik predict

29. Selanjutnya coba anda rubah algoritma menggunakan model naïve bayes

DATA SCIENCE

Anda mungkin juga menyukai