Data Scientists Training - Main Material
Data Scientists Training - Main Material
• Business Understanding
• Data Understanding
• Data Preparation
• Modeling
• Evaluation
• Deployment
https://www.stoodnt.com/blog/top-universities-for-ms-in-data-science-in-usa/
PAST PRESENT
IR 4.0
Information Information
Cybersecurity
Technology System
Software
Engineering
Computer Computer
Data Science
Engineering Science
A data scientist
KDD SEMMA
(Knowledge Data Discovery) (Sample, Explore, Modify, Model, and Assess)
CRISP-DM ASUM-DM
(Cross-industry Standard Process for Data Mining) (Analytics Solutions Unified Method for Data Mining)
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3), 37-37.
Chapman, P., et al (1999, March). The CRISP-DM user guide. In 4th CRISP-DM SIG Workshop in Brussels
Sharda, R., Delen, D., Turban, E. (2018). Big data Intelligence, Analytics, and Data Science: A Managerial Perspective. 04. Pearson Education. New Jersey.
IBM Analytics (2016). Analytics Solutions Unified Method: Implementations with Agile principles.
• Output:
• Contoh:
• Contoh:
• …..dll
• Contoh:
• Dll
• Output:
• Contoh:
• Sumber dana
• dll
• Contoh:
• Contoh:
• Resiko: data yang didapat sangat “kotor”, data di komputer hilang, dll
• Contoh:
• Contoh:
• Semakin banyak dana untuk pengambilan data -> data semakin banyak
-> prediksi lebih akurat
• Dll
• Contoh:
• Dll
Eksplorasi Regresi
Mengungkap insight dalam suatu data Memprediksi nilai kontinyu dari data
Asosiasi
Segmentasi
Mengungkap keterkaitan antar data,
Pemisahan data ke dalam grup-grup
grup, atau variabel
• Contoh:
• <subjective assessment>
• Dll
• Output:
• Contoh:
• Dll
Canggih Puspo Wibowo 38
2. Data Understanding
2. Data Understanding
• Contoh:
• Data pelanggan dapat diakses dari tabel pelanggan yang ada di database X
dengan akses ……..
• Dll
• Contoh:
• Contoh:
• Jika ada masalah terkait kualitas, berikan juga solusi yang mungkin
• Contoh:
• Dll
• Contoh:
• Dll
Hands-on with Python
• Contoh:
• Mengatasi typo
• Dll
• Contoh:
• dll
• Contoh:
• Dsb
• Output:
• MAE (Mean Absolute Error), MSE (Mean Square Error), RMSE (Root Mean
Square Error)
• Classification
• Clastering