0% menganggap dokumen ini bermanfaat (0 suara)
7 tayangan27 halaman

Silabus + Roadmap

DQLab menawarkan program pembelajaran online untuk meningkatkan keterampilan di bidang Data Science, cocok untuk pemula dari latar belakang IT maupun non-IT. Program ini mencakup modul terstruktur yang mencakup statistik, pemrograman, dan aplikasi bisnis, serta memberikan sertifikat setelah menyelesaikan modul. Materi mencakup penggunaan R dan Python untuk analisis data, visualisasi, dan penerapan teknik machine learning dalam berbagai industri.

Diunggah oleh

chandra_agape
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
7 tayangan27 halaman

Silabus + Roadmap

DQLab menawarkan program pembelajaran online untuk meningkatkan keterampilan di bidang Data Science, cocok untuk pemula dari latar belakang IT maupun non-IT. Program ini mencakup modul terstruktur yang mencakup statistik, pemrograman, dan aplikasi bisnis, serta memberikan sertifikat setelah menyelesaikan modul. Materi mencakup penggunaan R dan Python untuk analisis data, visualisasi, dan penerapan teknik machine learning dalam berbagai industri.

Diunggah oleh

chandra_agape
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 27

DQLab

Online learning
Data Science

Build the Skills You Need


to be a Digital Data Talent
For IT and Non IT Background

Persiapkan diri meningkatkan skill untuk menjadi


talenta data unggulan di era transformasi digital
Sebagai seorang Data Scientist, Anda dituntut bisa
About DQLab
bekerja dengan berbagai format data, memiliki

pengetahuan tentang algoritma, memahami teknik

pengolahan, dan manajemen data yang

disesuaikan dengan kasus bisnis.

Program DQLab memberikan learning journey

practical menjawab kebutuhan Industri dengan

memanfaatkan rangkaian ilmu statistik,

pemrograman, dan bisnis yang dapat secara

langsung diterapkan secara aplikatif berbasis

project.

Cocok bagi pemula (programmer &

non-programmer) yang ingin menerapkan teknik

Data Science untuk menghasilkan insight bisnis

atau sedang mengejar karir dibidang ini.


Key Features
DQLab Online Data Science Program membantu
mempersiapkan para talenta data digital agar
dapat sukses berkarir di bidang data.

Modul terstruktur dan aplikatif, dapat dipelajari oleh


pemula (IT dan Non IT Background).

Metode belajar learning by doing tanpa perlu instal


software tambahan.

Sertifikat penyelesaian modul di setiap akhir modul yang


dikerjakan, nilai tambah untuk portfolio.

Materi yang tersedia menggambarkan riil studi kasus


industri di bidang marketing, retail, finance, dan media
industri.

Silabus Data Analytic Fundamental for Beginner disusun


dan dipersiapkan oleh para praktisi data di industri.
R Module
Data science adalah ilmu yang popularitas dan kebutuhannya
semakin tinggi. Ilmu ini merupakan gabungan dari ilmu statistik,
bisnis, dan computer science. R adalah software dan bahasa
pemrograman yang fokus ke pengolahan data terutama proses
analisa data. Yang membuat R populer adalah fiturnya yang sangat
kaya – dimana saat ini terdapat lebih dari 13 ribu package, dari
membaca file teks, database sampai penggunaan machine
learning untuk analisa otomatis.

Data Preparation in Data


R Fundamental for Data Science 1 2
Science using R

Statistics using R for Data Data Exploration in Data


3 4
Science Science using R

Data Visualization in Data Fundamental Data


5 6
Science using R Visualization using R

Advanced Data Visualization Data Science in Finance :


7 8
with ggplot2 using R Credit Risk Analysis

Data Science in Retail : Market Data Science in Marketing :


9 10
Basket Analysis Customer Segmentation

Data Science in Finance : Analisis Data COVID 19 di


11 12
Dimension Reduction Indonesia

A Walk Into Sensory Science 13


R Fundamental for Data Science
Course "R Fundamental for Data Science" ini adalah course yang diperuntukkan bagi Anda
memulai perjalanan mempelajari R. Dengan menyelesaikan course ini, Anda akan lebih
mudah melanjutkan ke topik penting selanjutnya. Setelah menyelesaikan course ini, peserta
akan mendapatkan pengetahuan dan keterampilan fundamental R sebagai berikut:

Mengerti cara menggunakan dan menampilkan angka, teks, dan perhitungan matematika
1
dasar.

Mampu menggunakan variable untuk menyimpan nilai dan penggunaan (comment)


2
untuk menghasilkan human readable code.

Mengerti sifat R yang case sensitive, penggunaan tipe data logika TRUE / FALSE serta
3
contoh error.

4 Mengerti bagaimana membaca file Excel.

Mampu menghasilkan grafik bar chart dan pie chart dengan data yang dibaca dari file
5
Excel.

Data Preparation in Data Science using R


Data preparation adalah proses membaca data dari berbagai sumber dan merubah isi dan
struktur sehingga dapat digunakan untuk analisa. Salah satu proses yang termasuk di
dalamnya adalah data cleansing. Data preparation adalah topik yang sangat besar, DQLab
coba merancang materi ini dengan pembagian ke beberapa course. Dengan menyelesaikan
course ini, akan menguasai pengetahuan dan keterampilan sebagai berikut:

1 Mempraktekkan missing Value.

2 Mempraktekkan struktur data kategori bernama Factor.

3 Membaca file-file teks dan Excel – yang paling banyak ditemui sehari-hari.

4 4. Melakukan perubahan struktur data sehingga cocok digunakan lebih lanjut.

Statistics using R for Data Science


Ilmu Statistik fungsinya yaitu untuk mengolah data. Data dapat berupa angka maupun bukan
angka. Statistika adalah ilmu yang mempelajari cara pengumpulan data, menganalisis data untuk
mendapatkan kesimpulan informasi sampai dapat dijadikan dasar pembuatan kebijakan.Dengan
menyelesaikan course ini, Anda akan mampu mengerti ilmu statistik dengan menggunakan R –
dengan detail pengetahuan dan keterampilan yang dikuasai sebagai berikut:
1 Memahami berbagai fungsi dan karakteristik data statistik.

2 Mengenal perbedaan Statistik Deskriptif dan Statistik Inferensia

3 Membaca dataset dalam format CSV.

Mengenal estimasi karakteristik (modus, median, mean) dan ukuran sebaran data (range,
4
varian, simpangan baku)

5 Mengenal hubungan antar variabel.

Data Exploration in Data Science using R


Fokus dari pembelajaran Data Exploration adalah pembacaan sistem database, data
cleansing, dan data enrichment. Dengan menyelesaikan course ini, Anda akan mampu
membaca sistem database, data cleansing, dan data enrichment menggunakan R – dengan
detail pengetahuan dan keterampilan yang dikuasai sebagai berikut:

1 Memahami cara membaca dataset dari database

Memahami profiling yaitu cara mengidentifikasi pola dataset untuk mengetahui


2
karakteristik data yang akan diproses.

3 Memahami cara membersihkan data (data cleansing) yang umumnya terdiri dari 3 fitur
yaitu:
Standardisasi: Merapikan format data dengan acuan yang telah ditentukan dengan
fungsi R.
Missing values: Memahami cara mengisi missing value.
Deduplication: Menemukan data ganda dan melakukan pengelompokan terhadap data
tersebut.

4 Memahami cara pengayaan data (data enrichment).

Data Visualization in Data Science using R


Untuk data scientist yang menggunakan R, terdapat package ggplot2 yang memiliki fitur yang
sangat kaya untuk menghasilkan grafik dengan komposisi berbagai elemen visual. Grafik
sendiri bukan sesuatu yang mudah dihasilkan dan dengan pendekatan konstruksi bernama
grammar of graphics, ggplot2 menggunakan pendekatan layering sehingga untuk
menghasilkan visualisasi yang menarik dan kompleks menjadi lebih mudah. Dengan
menyelesaikan course ini, Anda akan mampu menggunakan berbagai teknik dari package
ggplot2 untuk menghasilkan berbagai grafik dasar di R – dengan detail pengetahuan dan
keterampilan yang dikuasai sebagai berikut:
Memahami konsep rancangan ggplot2 yang memecah satu grafik menjadi komponen
1
visual.

Memahami komponen plot sebagai kanvas dasar dan memahami layer dan
2
komponennya yang terdiri dari geom, stat dan position.

Memahami dan mampu menggunakan data dan aesthetic mapping sebagai bagian plot
3
dan grafik.

Memahami dan mampu menggunakan layer dan transformasi data yang diperlukan
4
untuk menghasilkan scatter plot, histogram, line chart, bar chart, dan pie chart.

Mampu menggunakan teknik faceting untuk memecah grafik menjadi beberapa bagian
5
sehingga lebih mudah dianalisa.

Fundamental Data Visualization using R


Modul ini akan membahas beragam cara memvisualisasikan data, terutama cara memilih
grafik yang tepat serta memodifikasinya agar fokus pada pesan yang ingin disampaikan.
Modul ini juga akan menuntun kamu untuk memahami elemen-elemen pada grafik sehingga
kamu dapat mengubah elemen-elemen tersebut sesuai kebutuhan. Modul ini tidak akan
mengajarkan kamu menjadi seorang analis data dengan kemampuan desain grafis sekaligus.
Namun, setidaknya kamu dapat memahami bagaimana sebuah desain visual dapat
membantu audiens memahami data yang disajikan. Pembelajaran yang akan kamu dapat
ketika menyelesaikan modul ini adalah:

mempelajari kenapa visualisasi data dibutuhkan dan bagaimana cara memvisualisasikan


1
data.

mempelajari jenis-jenis grafik apa saja yang cocok digunakan dalam memvisualisasikan
2
data.

Menyelesaikan suatu kasus sederhana menggunakan bahasa R untuk menampilkan grafik


3
yang sesuai agar mudah dipahami.

Advanced Data Visualization with ggplot2 using R


Materi pada modul ini memberikan pemahaman tentang bagaimana menghasilkan suatu
eksplorasi teknik yang powerful untuk mendapatkan informasi yang mudah dipahami,
informatif dengan tampilan visualisasi yang indah. Setelah mempelajari modul ini, yang akan
diperoleh adalah:

1 Memahami konsep tentang “Grammar of graphic”

2 Mengenal lebih dalam prinsip tentang ggplot2


3 Estetika dan geometris dalam ggplot2

4 Grafik anotasi untuk penyampaian cerita dan konteks

5 Mengubah tampilan visualisasi untuk menyenangkan pembaca data

6 Menampilkan brand ke dalam grafik

Data Science in Finance: Credit Risk Analysis


Credit risk adalah risiko yang harus ditanggung oleh sebuah bank atau lembaga pembiayaan
lain ketika memberikan pinjaman ke seorang individu atau lembaga lain. Risiko ini berupa
tidak bisa dibayarkannya pokok dan bunga pinjaman, sehingga mengakibatkan kerugian.
Manfaat dari credit scoring ini adalah memperkecil risiko yang bisa terjadi pada lembaga
peminjam, dimana berdasarkan hasil penilaian ini akan menjadi penentu apakah aplikasi
pengajuan pinjaman diterima atau ditolak oleh lembaga finansial. Course ini akan
mempelajari penerapan metode machine learning di R dengan menggunakan algoritma
decision tree bernama C5.0. Setelah menyelesaikan modul ini akan memahami tentang:

Memahami permasalahan dan solusi credit scoring di lembaga pembiayaan, dan


1
bagaimana bisa dimodelkan dengan decision tree.

2 Mengerti apa itu decision tree dan algoritma C5.0.

3 Memahami dan mampu mempersiapkan data untuk class variable dan input variable.

4 Memahami dan mampu mempersiapkan data untuk training dan testing dataset.

5 Menghasilkan model credit risk menggunakan algoritma C5.0.

6 Mengevaluasi akurasi model yang dihasilkan.

Mampu mengoperasionalkan model tersebut sehari-hari untuk memprediksi credit risk


7
dari data pengajuan baru.

Data Science in Retail: Market Basket Analysis


Di bisnis ritel, salah satu inovasi teknologi adalah analisa otomatis terhadap ribuan sampai
jutaan data transaksi untuk mendapatkan kombinasi produk yang sering dibeli bersamaan.
Dari berbagai studi kasus, informasi kombinasi ini dapat digunakan untuk meningkatkan
penjualan 18% sampai dengan 60%. Selain efektif untuk meningkatkan penjualan, informasi ini
sekaligus bisa digunakan untuk memecahkan masalah stok. Proses analisa ini dikenal
sebagai-
- Market Basket Analysis (MBA). Dan di dunia data science, algoritma yang populer untuk
mendukung proses ini adalah Apriori. Setelah menyelesaikan modul ini, kamu akan
memahami tentang :

1 Memahami penggunaan Market Basket Analysis (MBA) di dunia ritel.

2 Memahami dan mampu mempersiapkan data yang diperlukan.

3 Memahami konsep fundamental item, itemset, frequent itemset dan association rules.

Memahami dan mampu menggunakan algoritma Apriori untuk menghasilkan model


4
association rules dengan R.

Mampu menghasilkan daftar kombinasi produk yang memiliki asosiasi kuat berdasarkan
5
nilai support, confidence dan lift.

Mampu mengoperasionalkan model sehari-hari untuk menghasilkan rekomendasi produk


6
kepada customer.

Data Science in Marketing: Customer Segmentation


Seluruh bisnis atau badan usaha – baik itu bisnis kecil, menengah maupun besar – pasti
memiliki customer atau pelanggan. Semakin kita mengenali karakteristik pelanggan kita,
maka akan semakin mudah kita melakukan inovasi produk dengan kebutuhan karakter
tersebut dan melakukan komunikasi pemasaran. Proses pembagian karakteristik pelanggan ini
disebut dengan segmentasi pelanggan atau customer segmentation. Setelah mempelajari
materi ini, ilmu yang bisa didapat adalah:

1 Memahami apa itu customer segmentation dalam penggunaannya di dunia bisnis.

2 Mampu membaca dan mempersiapkan data profil pelanggan.

Mampu menghasilkan model customer segmentation dengan algoritma k-means dan


3
k-modes.

4 Mengoperasionalkan model sehingga dapat digunakan sehari-hari oleh bisnis.

Data Science in Finance: Dimension Reduction


Pada modul Data Science in Finance: Dimension Reduction kita mempelajari penerapan
algoritma decision tree C5.0 untuk memprediksi credit scoring/rating seorang nasabah
berdasarkan variabel-variabel seperti pendapatan, tenor pinjaman dan banyaknya
tanggungan. Fokus pembelajaran pada modul ini adalah tentang teknik statistika Dimension
Reduction dapat berperan, yaitu sebagai teknik unsupervised machine learning untuk -
- mengurangi banyaknya variabel (dimension reduction) untuk digunakan sebagai input untuk
algoritma lain tanpa banyak mengurangi kualitas dari prediksi rating. Ilmu yang didapat
setelah menyelesaikan modul ini adalah :

1 Melakukan standarisasi data numerik untuk dianalisa dengan PCA.

2 Menghitung matrik korelasi antar variabel numerik.

3 Menghitung Principal Component dengan fungsi prcomp().

Menentukan banyaknya principal component dengan menggunakan screeplot dan


4
kriterion Kaiser.

5 Membuat visualisasi Principal Component dengan biplot.

6 Menghitung skor data setelah aplikasi PCA.

Analisis Data COVID 19 di Indonesia


Akibat masalah pandemi yang marak terjadi di tahun 2020, DQLab menghadirkan materi ini
sebagai pembelajaran mengenai persebaran kasus yang terjadi di Indonesia. Pemanfaatan
keterbukaan data publik dan teknik analisis data untuk memahami dinamika pandemi
COVID-19. Hal ini menunjukkan bahwa pemanfaatan data juga dapat digunakan di bidang
kesehatan. Setelah menyelesaikan modul ini, ilmu yang akan kamu pelajari adalah:

1 Peserta memahami prinsip dasar mengenai API.

2 Peserta dapat mengimpor data real-time menggunakan API.

3 Peserta mampu melakukan proses data cleaning dan transformasi sederhana.

4 Peserta mengenal fungsi-fungsi unik dari beberapa paket di tidyverse.

5 Peserta mampu membuat visualisasi data yang informatif, elegan, dan straightforward.

6 Peserta dapat mengambil kesimpulan atas hasil analisis data.

7 Peserta dapat mengadaptasi proses analisis data untuk studi kasus berbeda.
A Walk Into Sensory Science
Tidak banyak yang mengetahui bahwa di bidang food industri pun menggunakan data
science. Oleh karena ini, melalui modul ini DQLab mengajak kamu untuk mengenal lebih
dalam penerapan data science dalam menganalisa bidang food industri. Ilmu yang akan
didapatkan dengan mengerjakan modul ini adalah:

1 Sensory science untuk membuat dummy.

2 Mengetahui metode sensoris deskriptif.

3 Membedakan produk menggunakan dengan atribut tunggal.

4 Mengenal sensory space.

5 Melakukan prosedur analisis data multivariat.

6 Mengaitkan selera konsumen dengan fitur produk.

R Projects
Project Machine Learning for Retail with R:
Product Packaging
Di dalam project ini Anda akan diminta untuk menganalisa dataset transaksi yang diberikan
oleh DQlab Fashion. Tujuannya untuk menghasilkan rekomendasi paket produk yang dapat
memecahkan masalah stok dan meningkatan penjualan.

1 Melihat kombinasi produk dari case study yang diberikan.

Melakukan problem solving dengan case study yang diberikan menggunakan item
2
slow-moving.
Project Data Analysis for Finance:
Performa Cabang
Bersama project ini, kamu akan diajak untuk mengenal bagaimana peranan dari analisis data
dalam sektor keuangan, khususnya dalam bagian performa cabang. Kamu akan diberikan
case study yang dibuat berdasarkan real case industry dan bagaimana cara menganalisis
serta menarik kesimpulan untuk kedepannya.

1 Mengenal dan memahami library yang digunakan pada case study yang diberikan.

Melakukan beberapa analisis yang dibutuhkan, seperti analisis performa cabang


2
terendah dengan kategori yang diberikan.

Project Data Analysis for Finance:


Proses Investasi Investor
Bersama project ini, kamu akan diajak untuk mengenal bagaimana peranan dari analisis data
dalam sektor keuangan, khususnya dalam bagian proses investasi investor. Kamu akan
diberikan case study yang dibuat berdasarkan real case industry dan bagaimana cara
menganalisis serta menarik kesimpulan untuk kedepannya.

1 Mengenal dan memahami library yang digunakan pada case study yang diberikan.

Melakukan beberapa proses pengolahan data analisis yang dibutuhkan, seperti analisis
2
proses investasi.
Python Module
Python adalah bahasa pemrograman interpretatif yang bisa
dipasang pada berbagai platform, khususnya platform yang
berfokus pada keterbacaan kode. Data science, internet of things
(IoT), dan machine learning merupakan beberapa hal yang
berkaitan langsung dengan Python. Para programmer biasa
menggunakan Python untuk membuat prototype, scripting guna
mengelola infrastruktur, maupun pembuatan website dalam skala
besar.

Python Fundamental for Data


1 2 Data Wrangling Python
Science

Fundamental Data Visualization Statistic using Python for Data


3 4
with Python Science

Statistic using Python for Data Data Visualization using


5 6
Science part 2 Plotnine

Basic Feature Discovering using Data Science in Telco : Data


7 8
Machine Learning Cleansing

Customer Churn Prediction using Data Science Project: Analisis


9 10
Machine Learning Data Covid19 di Dunia dan Asean
Data Science in Analisis Data Data Science in Marketing:
Covid 19 di Indonesia: 11 12 Customer Segmentation with
Dimension Reduction Python
Data Science in Marketing :
Customer Segmentation with 13
Python part 2
Python Fundamental for Data Science
Tujuan course dasar ini agar peserta bisa mengenal dan mulai menggunakan Python di
kegiatan sehari-hari, sebagai berikut:

1 Mengetahui mengapa Python sangat popular dan implementasi penggunaannya.

2 Mengetahui penggunaan IF, ELSE, dan IF ELSE dalam Python.

3 Mengenal penggunaan Operator Matematika dan Pembanding Pada Python.

4 Mempelajari cara Menggunakan dan Memanggil Function dalam Python.

5 Mengetahui cara Melakukan Import Package dan Memanggil Modul dalam Python.

6 Melakukan Generate Grafik dengan Matplotlib.

Data Wrangling Python


Data wrangling merupakan langkah penting untuk memahami Data Science. Oleh karena itu,
pada modul ini akan diajarkan tentang bagaimana cara melakukan data wrangling dengan
menggunakan bahasa pemrograman Python. Pandas merupakan salah satu alternatif library
yang sering digunakan untuk proses data wrangling. Pandas merupakan toolkit yang
powerfull sebagai analisis data diawal dan pengenalan struktur dataset dalam Python.
Setelah menyelesaikan modul ini ilmu yang akan didapat adalah :

1 Cara membaca data menggunakan Pandas.

Mengakses data kolom dan akses data baris.

Mengenal numpy untuk menampilkan informasi statistik.

2 Cara menanggulangi data yang hilang hingga mempelajari data yang normal.

3 Melakukan praktek menggunakan scikit learn pada Python.

Fundamental Data Visualization with Python


Modul ini akan membahas beragam cara memvisualisasikan data, terutama cara memilih
grafik yang tepat serta memodifikasinya agar fokus pada pesan yang ingin disampaikan.
Modul ini juga akan menuntun kamu untuk memahami elemen-elemen pada grafik sehingga
kamu dapat mengubah elemen-elemen tersebut sesuai kebutuhan. Modul ini tidak akan -
mempelajari kenapa visualisasi data dibutuhkan dan bagaimana cara memvisualisasikan
1
data.

mempelajari jenis-jenis grafik apa saja yang cocok digunakan dalam memvisualisasikan
2
data.

Menyelesaikan suatu kasus sederhana menggunakan bahasa Python untuk menampilkan


3
grafik yang sesuai agar mudah dipahami.

Statistic using Python for Data Science


Penting mempelajari Statistika karena merupakan salah 1 fundamental dasar belajar data
science. Pada modul ini, kamu akan dibekali dengan banyak teori dasar mengenai statistika.
Dalam modul ini juga akan mempelajari jenis data di dalam statistika dan akan berkenalan
dengan library di dalam Python yang dapat kamu gunakan untuk mengolah statistika.
Dengan menyelesaikan modul ini kamu akan mendapatkan ilmu tentang :

1 Pengenalan Statistika dan Package Statistika di Python.

2 Pengenalan Numpy dan Pandas.

3 Memahami tentang Ukuran Pusat.

4 Mengenal Ukuran Sebaran.

5 Memahami tentang korelasi.

Statistic using Python for Data Science - Part 2


Module ini merupakan lanjutan dari module "Statistic using Python for Data Science". Module
ini akan memberikan pembelajaran lebih lanjut tentang metode statistik yang digunakan
dalam mengolah data dengan menggunakan bahasa pemrograman Python. Ilmu yang bisa
didapat setelah menyelesaikan modul ini adalah :

1 Visualisasi data untuk penyajian data dalam berbagai bentuk.

2 penjelasan transformasi data untuk model regresi linier.

3 Mengenal visualisasi statistik lebih dalam.

3 Regresi linier sederhana.


Data Visualization using Plotnine
Plotnine merupakan implementasi dari grammar of graphic yang berasal dari ggplot dan
digunakan menggunakan bahasa pemrograman Python. Plotnine lebih mudah digunakan
untuk menampilkan data visualisasi dalam Python. Dalam modul ini akan mempelajari
tentang bagaimana menggunakan library Plotnine, dan dengan menyelesaikan modul ini
ilmu yang didapat adalah :

1 Mengimport package dan membaca data.

2 Mulai membuat plot sederhana.

3 Mengenal berbagai geom.

4 Memberikan warna pada grafik yang dibuat.

5 Mengubah ukuran grafik.

Basic Feature Discovering for Machine Learning


Untuk menjaga tingkat akurasi dari model prediksi, seorang Data Scientist harus mampu
melakukan data pre-processing atau data cleansing sebelum melakukan data modeling.
Pada modul ini, materi yang diajarkan adalah mengenai bagaimana mempersiapkan data
sebelum dilakukan permodelan. Data yang ada kebanyakan adalah data kotor yang perlu
dilakukan cleansing sebelum dapat digunakan. Dengan mempelajari modul ini, kamu akan
memahami tentang :

1 manipulasi data menggunakan Pandas untuk mempersiapkan data mart yang baik.

2 Mengenal seaborn untuk membuat plot data agar mudah dipahami.

3 Mengatasi missing value dan mendeteksi adanya outlier.

4 Mendeteksi nilai yang tidak standard dan menstandarisasi variabel kategorik.

Data Science in Telco: Data Cleansing


Untuk menjaga tingkat akurasi dari model prediksi, seorang Data Scientist harus mampu
melakukan data pre-processing atau data cleansing sebelum melakukan data modeling.
Pada modul ini, materi yang diajarkan adalah mengenai bagaimana mempersiapkan data
sebelum dilakukan permodelan. Data yang ada kebanyakan adalah data kotor yang perlu
dilakukan cleansing sebelum dapat digunakan. Dengan mempelajari modul ini, kamu akan
memahami tentang :
1 manipulasi data menggunakan Pandas untuk mempersiapkan data mart yang baik.

2 Mengenal seaborn untuk membuat plot data agar mudah dipahami.

3 Mengatasi missing value dan mendeteksi adanya outlier.

4 Mendeteksi nilai yang tidak standard dan menstandarisasi variabel kategorik.

Customer Churn Prediction using Machine Learning


Pada modul ini diharapkan dapat memahami prediksi pelanggan Telco melakukan churn atau
tidak berdasarkan data yang disediakan. Diharapkan dengan mengerjakan modul ini dapat
menghasilkan suatu permodelan machine learning. Customer Churn Analysis merupakan sebuah
analisis yang dilakukan oleh Data Scientist untuk mendapatkan model dan memprediksi
kira-kira berapa banyak customer yang akan memutuskan untuk beralih dan berlanggan ke
kompetitor. Dengan mempelajari modul ini, ilmu yang bisa didapatkan adalah :

Member bisa melakukan manipulasi data dengan menggunakan Pandas,, sehingga bisa
1
mempersiapkan datamart yang baik sebelum dilakukan permodelan.

Member bisa membuat plot dengan menggunakan seaborn maupun matplotlib, sehingga
2
membantu untuk memahami pola dari data.

Member bisa melakukan Exploratory data analysis (EDA), Data Preprocessing (Removing
Unnecessary Columns, Encoding Data & Splitting Training Testing), melakukan pemodelan
3 dari berbagai macam algoritma Machine Learning (Logistic Regression, Random Forest &
Gradient Boosting) dan menyimpan model terbaik dalam bentuk file guna fase
deployment nantinya.

Member bisa membuat kesimpulan berdasarkan analisa dari langkah-langkah yang


4
dilakukan.

Data Science Project: Analisis Data COVID 19 di Dunia


& ASEAN
Dengan menyelesaikan modul ini, kamu akan mempraktekkan proses pengambilan data
melalui Python API Request. Di samping itu kamu akan belajar untuk menggunakan merge
dataset menggunakan PANDAS dan membuat visualisasi menggunakan Matplotlib. Dalam
modul ini juga kamu akan bisa melihat perbedaan angka kasus Covid19 di dunia dan di
Asean. Ilmu yang didapat adalah :

1 Membuat fungsi get API dan memanggil data API.

2 Melihat data data kasus Covid yang tertinggi di dunia.


3 Menghasilkan visualisasi dari data di Asean yang tertinggi.

Eksplorasi dan Analisis Data COVID-19 Indonesia


using Python
Akibat masalah pandemi yang marak terjadi di tahun 2020, DQLab menghadirkan materi ini
sebagai pembelajaran mengenai persebaran kasus yang terjadi di Indonesia. Pemanfaatan
keterbukaan data publik dan teknik analisis data untuk memahami dinamika pandemi
COVID-19. Hal ini menunjukkan bahwa pemanfaatan data juga dapat digunakan di bidang
kesehatan. Setelah menyelesaikan modul ini, ilmu yang akan kamu pelajari adalah :

1 Peserta memahami prinsip dasar mengenai API

2 Peserta dapat mengimpor data real-time menggunakan API

3 Peserta mampu melakukan proses data cleaning dan transformasi sederhana

4 Peserta mengenal fungsi-fungsi unik dari beberapa paket di tidyverse.

5 Peserta mampu membuat visualisasi data yang informatif, elegan, dan straightforward

6 Peserta dapat mengambil kesimpulan atas hasil analisis data

7 Peserta dapat mengadaptasi proses analisis data untuk studi kasus berbeda

Data Science in Marketing : Customer Segmentation


with Python
Segmentasi pasar adalah kegiatan membagi suatu pasar menjadi kelompok-kelompok pembeli
yang berbeda yang memiliki kebutuhan, karakteristik, atau perilaku yang berbeda yang
mungkin membutuhkan produk atau bauran pemasaran yang berbeda. Dengan mempelajari
materi ini, kamu akan dapat memahami dan mempraktekan bagaimana cara melakukan teknik
segmentasi pelanggan menggunakan Python. Di akhir modul, kamu akan bisa :

1 Memahami konsep segmentasi pelanggan dan manfaatnya

2 Melakukan segmentasi pelanggan di Python menggunakan algoritma K-Prototypes

3 Mencari jumlah segmen yang optimal


Data Science in Marketing : Customer Segmentation
with Python part 2
Modul ini merupakan lanjutan dari modul Customer Segmentation with Python part 1. Pada
modul ini, kamu akan mempelajari tentang :

Melakukan pemrosesan awal data dengan merubah kolom text menjadi numerik dan
1
melakukan standarisasi kolom numerik.

2 Membuat dan mengoptimalkan model menggunakan algoritma k-prototype.

3 Menggunakan model untuk memprediksi data-data baru.

Python Projects
Data Science Challenge with Python

Pada project ini kamu akan diuji kemampuan dalam melakukan probabilitas, statistik,
interpretasi mode, dan pemrograman.

Mengenal dan memahami dasar dari probobabilitas, statistik, interprestasi mode, dan
1
pemrograman.

2 mengerjakan beberapa case study yang berhubungan dengan pembelajaran dari project.

Data Engineer Challenge with Python

Pada project ini kamu akan diajak untuk mengenal dan mempersiapkan dirimu menjadi
serorang data engineer.

1 Mengenal dan memahami web scrapping.

2 Mengenal dan melakukan function dan reguler expression.


Project Machine Learning with Python:
Building Recommender System
Kamu akan diajak untuk membuat sebuah sistem rekomendasi dengan menggunakan bahasa
pemrograman Python. Di dalam project ini, kamu akan diajak untuk menggunakan case study
industry dari databse film milik IMDB, lengkap dengan metadata yang digunakan.

Mengenal dan melakukan tahapan pengolahan data dari awal sampai akhir
1
menggunakan case industry yang diberikan.

2 Membuat rekomendasi sistem dengan database yang ada.

Project Machine Learning with Python:


Building Recommender System with Similarity Function
Pada bagian sebelumnya kita telah melihat bagaimana recommender system dibuat hanya
dengan menggunakan average rating, dengan mengurutkan score yang terdapat komponen
average rating secara descending, kita dapat mengetahui (secara estimasi) film mana yang
menurut para audience paling menarik.

1 mengenal dan melakukan importing dari library yang akan digunakan.

Melakukan beberapa tahapan pengolahan data dari case study yang diberikan, seperti
2
grouping dan joining.
SQL Module
Structured Query Language atau SQL mungkin merupakan poin
penting dalam sebuah studi teknik komputer jaringan. Keberadaan
SQL sebagai sebuah bahasa pemrograman memiliki sejarah dan
perkembangan yang panjang. SQL dapat memungkinkan kamu
untuk mengakses maupun mengubah database. SQL juga bisa
digunakan untuk menghapus sebuah data pada database. Fungsi
lainnya SQL adalah untuk membuat sebuah prosedur baru dan ini
akan tersimpan dalam sebuah database.

Fundamental SQL using SELECT Fundamental SQL using INNER


1 2 JOIN and UNION
Statement

Fundamental SQL GROUP BY Fundamental SQL Using


3 4
and HAVING FUNCTION and GROUP BY
Fundamental SQL Using SELECT Statement
Memahami konsep penggunaan statement SELECT dalam SQL Query untuk menarik data dari
database, sebagai skill fundamental yang penting untuk kamu pahami agar siap berkarir di
bidang data science. Yang akan kamu pelajari dalam modul ini adalah:

1 Membahas apa itu SQL, pentingnya SQL, dan kapan SQL dapat digunakan.

Membahas sistem manajemen database relational menggunakan SQL sebagai


2
fondasinya

Membahas penggunaan statement dasar dari SQL untuk melakukan query suatu data
3
dari database, yaitu SELECT… FROM…

Memperkenalkan penggunaan SELECT terhadap penulisan identitas nama kolom dan


4
tabel dengan lebih spesifik dan lengkap menggunakan prefix dan alias.

Membahas teknik mengambil data dengan kondisi tertentu menggunakan filter, terutama
5
jika data sudah tersimpan dalam jumlah besar.

Mengerjakan studi kasus sederhana untuk mengukur pemahaman module 'Fundamental


6
SQL with SELECT Statement'.

Fundamental SQL Using INNER JOIN and UNION


Memahami konsep penggunaan fungsi skalar dan fungsi aggregate dalam operasi string dan
numerik di SQL database. Kamu juga dapat mengerti konsep penggunaan GROUP BY dalam
mengelompokkan data dan memahami konsep menggabungkan GROUP BY dengan fungsi
aggregate. Selain itu, Kamu juga dapat mengerti penggunaan CASE Statement untuk struktur
pengambilan keputusan. Yang akan kamu pelajari dalam modul ini adalah:

1 Memahami fungsi di SQL terutama fungsi matematika yang umum digunakan.

2 Memahami fungsi di SQL terutama fungsi text yang umum digunakan.

Memahami fungsi aggregate dan group by di SQL untuk mengagregasi data dan juga
3
mengelompokkan data berdasarkan kriteria tertentu.

Mengerjakan suatu studi kasus sederhana yang akan mengukur pemahaman kamu
4
dalam mempelajari rangkaian modul "Fundamental SQL Using FUNCTION and GROUP BY".
Fundamental SQL Group By and Having
Modul pembelajaran yang bertujuan menambah penggunaan fungsi pada sintaks SQL
queries. Fungsi SQL Group By dan Having biasanya digunakan untuk pengelompokkan data.
Contoh fungsi yang dipelajari dalam modul ini adalah fungsi SUM() yang akan menjumlahkan
seluruh nilai yang menjadi parameternya dan fungsi MAX() yang akan menghasilkan nilai
terbesar dari keseluruhan nilai yang menjadi parameternya. Pada modul ini akan mempelajari
tentang:

1 Penggunaan fungsi dasar group by

2 Penggunaan fungsi dasar having by

3 Penggunaan filtrasi group by dengan having by

Fundamental SQL Using FUNCTION and GROUP BY


Kamu akan memahami konsep penggunaan fungsi skalar dan fungsi agregat dalam operasi
string dan numerik di SQL database. Kamu juga dapat mengerti konsep penggunaan GROUP
BY dalam mengelompokkan data dan memahami konsep menggabungkan GROUP BY dengan
fungsi aggregate. Selain itu, Kamu juga dapat mengerti penggunaan CASE Statement untuk
struktur pengambilan keputusan.

1 Mengenal bermacam-macam fungsi skalar dan perbedaannya dengan fungsi agregasi.

2 Mengenal fungsi teks dalam SQL.

SQL Projects
Data Engineer Challenge with SQL

Pada project ini kamu akan diuji kemampuan dalam penguasaan bahasa pemrograman
mySQL.

Mengenal dan menguasai beragam fungsi dari SQL, seperti left join, right join, union, dan
1
inner join.

Melakukan beberapa case study yang diberikan, seperti mengurutkan nama pelanggan
2
dengan beberapa kriteria yang diberikan.
Project Data Analysis for Retail:
Sales Performance Report
Kamu akan diajak untuk melakukan analisis terhadap performa dari case study yang
diberikan, yaitu DQStore menggunakan MySQL.

Melakukan analisis secara keseluruhan dari perfoema DQStore berdasarkan data yang
1
telah dikumpulkan.

2 Melakukan analisis customer analytics.

Project Data Analysis for B2B Retail:


Customer Analytics Report
Kamu akan diajak untuk membuat sebuah analisis dari retail B2B, terkhususnya dalam bagian
customer analytics report.

Mengetahui pertumbuhan penjualan dengan melakukan perhitungan sederhana


1
berdasarkan case study yang diberikan.

2 Melakukan analisis customer analytics berdasarkan case study yang diberikan.

Data Analysis for E-Commerce Challenge

Pada project ini kamu akan diajak untuk mengenal dan melakukan analisis data di bidang
e-commerce.

Mengenal dan menguasai data yang dipergunakan dalam case study, seperti product,
1 order, transaksi bulanan, dan top buyer.

2 Membuat SQL berdasarkan kebutuhan dari data yang diberikan.

Project: Fundamental SQL Group By and Having

Pada project ini kamu akan diajak untuk mengenal dan memahami fundamental SQL, yaitu
group by dan having.

1 Menghitung jumlah nilai pinalti.

Melakukan beberapa case study yang diberikan, seperti mencari jumlah pelanggan yang
2
pindah layanan.
Data Analyst
Python Career Track
Python for Data Professional
1 Mengawali belajar data science berkenalan dengan bahasa Python yang
paling dasar.

SQL & Relational Database for Data Professional


2 Berkenalan dengan bahasa SQL karena merupakan bahasa pengolahan
data yang digunakan oleh vperusahaan untuk pengambilan keputusan.

Exploratory Data Analysis


3 Mulai mengenal konsep pengolahan data menggunakan Python dengan
kasus sederhana.

Data Manipulation with PANDAS


4 Mengenal Pandas, salah 1 library Python yang akan membantu proses
mengolah data menjadi lebih mudah.

Insightful Visualization with Python Matplotlib


5 Membuat hasil visualisasi dari data yang diolah dengan menggunakan
library Matplotlib yang ada di Python.

Machine Learning Modelling with Python


6 Membuat model Machine Learning sederhana dan mengetahui cara
aplikasinya dalam penyelesaian permasalahan di Industri.

Data Investigation & Anomaly Detection


7 Mengetahui anomali data dan melakukan investigasi.

Market Research Recommendation &


8 Visualization for Business Decision Making
Menguji kemampuan data analytic untuk mengambil keputusan pada kasus
bisnis research dari modul yang sudah dipelajari.
Let Us Guide You To Be A

MODERN
DATA
PRACTICIONER
register at dqlab.id
@dqlab
+62-811-1170-848
Learning Roadmap
TRACK Data Analyst Data Scientist Data Engineer
COURSE

Kelas Persiapan
Introduction to Data Science with R
R Fundamental for Data Science
Introduction to Data Science with Python
Python Fundamental for Data Science
Fundamental SQL with SELECT Statement
Fundamental SQL using INNER JOIN

Kelas Fundamental
Statistics using R for Data Science
Data Preparation in Data Science using R
Data Exploration in Data Science using R
Data Visualization in Data Science using R
Fundamental Data Visualization using R
Advanced Data Visualization with ggplot2 using R
Data Wrangling Python
Python for Data Professional Beginner - Part 1
Python for Data Professional Beginner - Part 2
Python for Data Professional Beginner - Part 3
Data Visualization with Python Matplotlib for Beginner - Part 1
Exploratory Data Analysis with Python for Beginner
Data Visualization with Python Matplotlib for Beginner - Part 2
Data Quality with Python for Beginner
Machine Learning With Python for Beginner
Fundamental Data Visualization with Python
Data Manipulation with Pandas - Part 1
Data Manipulation with Pandas - Part 2
Statistic using Python for Data Science
Statistic using Python for Data Science - Part 2
Data Visualization using Plotnine
Fundamental SQL Using SELECT Statement
Fundamental SQL Using FUNCTION and GROUP BY
Fundamental SQL Using INNER JOIN and UNION
Fundamental SQL Group By and Having

Kelas Penerapan di Industri


Data Science in Finance: Credit Risk Analysis
Data Science in Retail: Market Basket Analysis
Data Science in Marketing: Customer Segmentation
Data Science in Finance: Dimension Reduction
Analisis Data COVID19 di Indonesia
A Walk Into Sensory Science
Basic Feature Discovering for Machine Learning
Data Science in Telco: Data Cleansing
Customer Churn Prediction using Machine Learning
Data Science Project: Analisis Data COVID19 di Dunia & ASEAN
Data Analyst Project: Business Decision Research
Eksplorasi dan Analisis Data COVID-19 Indonesia using Python
Data Science in Marketing : Customer Segmentation with Python
Data Science in Marketing : Customer Segmentation with Python part 2

Projects
Project Machine Learning for Retail with R: Product Packaging
Project Data Analysis for Finance: Performa Cabang
Project Data Analysis for Finance: Proses Investasi Investor
Data Science Challenge with Python
Data Engineer Challenge with Python
Project Machine Learning with Python: Building Recommender System
Project Machine Learning with Python: Building Recommender System with Similarity Function
Data Engineer Challenge with SQL
Project Data Analysis for Retail: Sales Performance Report
Project Data Analysis for B2B Retail: Customer Analytics Report
Data Analysis for E-Commerce Challenge
Project: Fundamental SQL Group By and Having

Anda mungkin juga menyukai