Data Science Using Excel
Data Science Using Excel
Using Excel
Anastasia Sherin
26 September 2022
Data Science and
Machine Learning
In General
2
What is Data Science?
3
How Data Science Works?
Diolah
Data atau Informasi baru!
menggunakan
informasi dari Interesting
metode data
berbagai sumber insight or better
science
understanding
4
Data Science Methods
5
Cara Kerja Machine
Learning Menurut
Nam Do San di Drama
Korea Start Up
6
Tarzan Memberi Hadiah untuk Jane
7
Another Machine Learning Illustration
Provided
Rule Based Input Rule Output
Programming Returned
3 Input + 2 5
8
Data Science Lifecycle
9
Data Science Lifecycle
Model Building
Deployment Interpretation
Evaluation Model
10
Why Excel for
Data Science?
11
Can Excel Be Used for Data Science?
➔ Konsep workspace Excel berupa cell, baris, dan kolom yang ‘friendly’ untuk
pengolahan data
➔ Formula/fungsi yang disediakan Excel lengkap
◆ Menghitung suatu nilai, conditional, memisahkan string, dsb
➔ Excel mempunyai fitur Pivot Table, cek duplikat, cek nilai kosong, dsb yang
mendukung pengguna untuk melakukan proses data cleaning di Excel
➔ Excel mempunyai ragam bentuk grafik/plot untuk data visualisasi
➔ Excel mempunyai fitur add-ins, sehingga pengguna bisa memasukkan fungsi
tambahan di luar yang sudah disediakan Excel
◆ Contoh: menambahkan add ins terkait Statistika dan persamaan Matematika
12
Why Excel?
➔ Berdasarkan pengamatan, hampir semua orang pernah dan bisa menggunakan Excel
◆ Dimulai dari pelajaran TIK/komputer sejak SD, sudah dikenalkan ke Excel
◆ User interface yang sederhana
➔ Hampir semua mempunyai Excel di laptopnya
◆ Kalau pun ada yang tidak punya Excel, bisa menggunakan Google Sheet
◆ Fitur Excel dan Google Sheet sangat mirip
➔ Dalam pekerjaan (di perusahaan nasional maupun start up), Excel menjadi tools wajib
yang digunakan dan harus dikuasai
13
When You Shouldn’t Use Excel?
14
Why Do You Still Need to Learn Excel for
Data Science?
➔ Semua dapat dimulai dari yang paling familiar, mudah diakses, dan didapatkan
◆ Jika takut belajar Data Science karena takut coding, ini adalah awal yang tepat
◆ Kita bisa upgrade tools disaat kita merasa sudah butuh dan sudah siap
➔ Data Science bukan hanya tentang tools dan pemodelan yang ‘wah’
◆ Hasil pengolahan data yang bermanfaat, tidak selalu datang dari pengolahan yang rumit
◆ Pengolahan sederhana pun dapat membawa dampak
➔ Untuk mengambil informasi dari data, kita bisa lakukan dengan tools sederhana
15
Case Example
16
Bank Telemarketing
➔ Case description:
◆ Bank sering menawarkan produk melalui telepon (disebut bank telemarketing)
◆ Saat ini bank mempunyai produk deposito baru, yang ingin ditawarkan ke nasabah dengan cara
telemarketing
➔ Biggest pain point: success rate hanya 11%
◆ Saat ini bank melakukan filter manual untuk menentukan nasabah yang perlu di telepon
◆ Dalam kasus penawaran produk deposito ini, ada 30.488 nasabah yang ditelepon
◆ Namun nasabah yang mau membuka deposito hanya 3.859 orang
➔ KPI: Kenaikan success rate dan penurunan effort telepon (SDM, waktu, biaya telepon)
➔ Objective: Menentukan nasabah yang tepat (berpeluang tinggi) untuk mau membuka
deposito yang ditawarkan melalui telemarketing
17
Hasil Pengolahan dengan Machine Learning
18
Comparison: Tanpa Model Vs Dengan Model
Tanpa Machine Learning, bank harus menelepon seluruh nasabah (sebanyak 9559 orang) dan
hasilnya hanya 11% yang mau membuka deposito
Bila menggunakan prediksi Machine Learning, kita dapat mengabaikan yang diprediksi ‘Tidak Mau’,
dan hanya menelepon nasabah yang diprediksi ‘Mau’.
19
Hasil dan Interpretasi
➔ Dengan pengaturan nilai batas (threshold), kita dapat meningkatkan jumlah nasabah yang mau
membuka deposito menjadi 63.1% dengan peningkatan banyak telepon yang dilakukan
menjadi 18.2%
➔ Dengan mengorbankan success rate sebesar 10.1% dibanding saat threshold = 0.25
Telepon yang dilakukan 9559 (100%) 506 (5.3%) 1015 (10.6%) 1741 (18.2%)
Nasabah yang Deposit 1064 (100%) 316 (29.7%) 493 (53.5%) 671 (63.1%)
20