Data Science Specialist
Data Science Specialist
Durasi: 4 hari
Deskripsi
Pelatihan ini bertujuan untuk memberikan pemahaman menyeluruh tentang Data
Science dan praktik-praktik utama dalam pengolahan Data. Peserta akan mendalami
konsep-konsep krusial dalam Data Science, termasuk pengenalan terhadap tipe data,
Exploratory Data Analysis (EDA), dasar-dasar Python dan R, Machine Learning, serta Text
Mining. Pelatihan ini memberikan landasan yang kuat bagi peserta untuk
mengembangkan keterampilan dan pemahaman dalam menerapkan teknik-teknik Data
Science dalam berbagai konteks analisis data.
Obyektif
Setelah mengikuti pelatihan ini peserta akan dapat:
• Mengidentifikasi berbagai jenis data, termasuk data struktured dan unstruktured
• Menerapkan teknik pembersihan data, termasuk penanganan pencilan dan reduksi
dimensi dalam konteks Explorative Data Analysis (EDA)
• Menggunakan library Pandas dan Numpy untuk manipulasi dan analisis data
• Mengimplementasikan visualisasi data dengan library Matplotlib dan Seaborn di
Python
• Menguasai dasar-dasar R termasuk variabel, vektor, dan struktur data dasar
• Menerapkan paket dan fungsi R untuk import dan persiapan data
• Menggunakan paket ggplot2 untuk visualisasi data dengan R
• Mengimplementasikan algoritma Supervised dan Unsupervised dalam Machine
Learning
• Mengaplikasikan konsep regresi, klasifikasi, dan clustering pada masalah dunia
nyata
• Menerapkan teknik optimisasi hyperparameter untuk meningkatkan model
Machine Learning
• Menjelaskan dasar-dasar Deep Learning dan mengimplementasikan model
sederhana
• Menerapkan konsep Natural Language Processing (NLP) dalam konteks Text
Mining untuk analisis teks yang lebih mendalam
www.inixindo.co.id
Data Science Specialist
Pengenalan Python
• Variabel, tipe data dasar, dan struktur data
• Operasi dasar dan ekspresi
• Library Pandas untuk analisis data
• Library Numpy untuk operasi numerik
• Library Matplotlib dan Seaborn untuk visualisasi data
Pengenalan R
• Variabel dan vektor
• Faktor dan dataframe
• Paket dan Fungsi R untuk import dan persiapan data
• Visualisasi data menggunakan paket ggplot2
Machine Learning
• Supervised dan Unsupervised Learning
• Model Regresi linear
www.inixindo.co.id
Data Science Specialist
• Model regresi logistik, decision Tree, Random Forest, SVM, Naive Bayes dalam
klasifikasi
• Model K-Means dan Hierarchical Clustering
• Pemahaman konsep Dataset Training, Testing, dan Validation
• Underfit dan Overfit
• Metrik untuk mengevaluasi model Machine Learning
• Teknik optimisasi hyperparameter
• Deep learning fundamental
Text Mining
• Penerapan NLP (Natural Language Processing) dalam konteks Text Mining
• Tokenization dan Segmentasi Kata
• Analisis Sentimen
• Stemming dan Lemmatization
• Word Embeddings dengan Word2Vec dan Gensim
• Konsep dasar visualisasi Word Cloud
www.inixindo.co.id