100% menganggap dokumen ini bermanfaat (1 suara)
176 tayangan

Data Science Using Excel

1. Data science dapat menggunakan Excel untuk mengolah data dan memperoleh wawasan baru dari data, seperti kasus bank telemarketing yang meningkatkan tingkat kesuksesan penawaran deposito dari semula 11% menjadi 62,5% 2. Walaupun Excel memiliki batasan ukuran data dan tipe model yang dapat diolah, Excel masih dapat digunakan untuk langkah awal belajar data science karena familiar dan mudah diakses oleh sebagian besar orang 3. K

Diunggah oleh

Saeful Aziz
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
100% menganggap dokumen ini bermanfaat (1 suara)
176 tayangan

Data Science Using Excel

1. Data science dapat menggunakan Excel untuk mengolah data dan memperoleh wawasan baru dari data, seperti kasus bank telemarketing yang meningkatkan tingkat kesuksesan penawaran deposito dari semula 11% menjadi 62,5% 2. Walaupun Excel memiliki batasan ukuran data dan tipe model yang dapat diolah, Excel masih dapat digunakan untuk langkah awal belajar data science karena familiar dan mudah diakses oleh sebagian besar orang 3. K

Diunggah oleh

Saeful Aziz
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 20

Data Science

Using Excel
Anastasia Sherin
26 September 2022
Data Science and
Machine Learning
In General

2
What is Data Science?

Extract meaning from data;


to help us understand the world and
discover new things

3
How Data Science Works?

Diolah
Data atau Informasi baru!
menggunakan
informasi dari Interesting
metode data
berbagai sumber insight or better
science
understanding

4
Data Science Methods

Machine Learning is one ways to


extract meaning from data and
identify patterns

5
Cara Kerja Machine
Learning Menurut
Nam Do San di Drama
Korea Start Up

6
Tarzan Memberi Hadiah untuk Jane

7
Another Machine Learning Illustration

Provided
Rule Based Input Rule Output
Programming Returned
3 Input + 2 5

Input Output Rule


Machine Learning
3 5 Input + 2

8
Data Science Lifecycle

9
Data Science Lifecycle

Understanding Data Data Exploratory


Problem Collection Cleaning Data Analysis

Model Building
Deployment Interpretation
Evaluation Model

10
Why Excel for
Data Science?

11
Can Excel Be Used for Data Science?

➔ Konsep workspace Excel berupa cell, baris, dan kolom yang ‘friendly’ untuk
pengolahan data
➔ Formula/fungsi yang disediakan Excel lengkap
◆ Menghitung suatu nilai, conditional, memisahkan string, dsb
➔ Excel mempunyai fitur Pivot Table, cek duplikat, cek nilai kosong, dsb yang
mendukung pengguna untuk melakukan proses data cleaning di Excel
➔ Excel mempunyai ragam bentuk grafik/plot untuk data visualisasi
➔ Excel mempunyai fitur add-ins, sehingga pengguna bisa memasukkan fungsi
tambahan di luar yang sudah disediakan Excel
◆ Contoh: menambahkan add ins terkait Statistika dan persamaan Matematika

12
Why Excel?

➔ Berdasarkan pengamatan, hampir semua orang pernah dan bisa menggunakan Excel
◆ Dimulai dari pelajaran TIK/komputer sejak SD, sudah dikenalkan ke Excel
◆ User interface yang sederhana
➔ Hampir semua mempunyai Excel di laptopnya
◆ Kalau pun ada yang tidak punya Excel, bisa menggunakan Google Sheet
◆ Fitur Excel dan Google Sheet sangat mirip
➔ Dalam pekerjaan (di perusahaan nasional maupun start up), Excel menjadi tools wajib
yang digunakan dan harus dikuasai

13
When You Shouldn’t Use Excel?

➔ Ketika row data yang diolah sudah melebihi 1 juta baris


➔ Jika rencana pengolahan data menggunakan Deep Learning atau model kompleks
lainnya
➔ Saat data yang dimiliki bukan berbentuk tabular
◆ Data berupa text dan arah pengolahannya ke Natural Language Processing (NLP)
◆ Data berupa gambar

14
Why Do You Still Need to Learn Excel for
Data Science?

➔ Semua dapat dimulai dari yang paling familiar, mudah diakses, dan didapatkan
◆ Jika takut belajar Data Science karena takut coding, ini adalah awal yang tepat
◆ Kita bisa upgrade tools disaat kita merasa sudah butuh dan sudah siap
➔ Data Science bukan hanya tentang tools dan pemodelan yang ‘wah’
◆ Hasil pengolahan data yang bermanfaat, tidak selalu datang dari pengolahan yang rumit
◆ Pengolahan sederhana pun dapat membawa dampak
➔ Untuk mengambil informasi dari data, kita bisa lakukan dengan tools sederhana

15
Case Example

16
Bank Telemarketing

➔ Case description:
◆ Bank sering menawarkan produk melalui telepon (disebut bank telemarketing)
◆ Saat ini bank mempunyai produk deposito baru, yang ingin ditawarkan ke nasabah dengan cara
telemarketing
➔ Biggest pain point: success rate hanya 11%
◆ Saat ini bank melakukan filter manual untuk menentukan nasabah yang perlu di telepon
◆ Dalam kasus penawaran produk deposito ini, ada 30.488 nasabah yang ditelepon
◆ Namun nasabah yang mau membuka deposito hanya 3.859 orang
➔ KPI: Kenaikan success rate dan penurunan effort telepon (SDM, waktu, biaya telepon)
➔ Objective: Menentukan nasabah yang tepat (berpeluang tinggi) untuk mau membuka
deposito yang ditawarkan melalui telemarketing

17
Hasil Pengolahan dengan Machine Learning

➔ Success rate meningkat menjadi


62.5%
Predicted ◆ Dari 506 nasabah yang
ditelepon, 316 nasabah mau
Tidak Mau Mau membuka deposito
◆ Jumlah nasabah yang ditelepon
Tidak Mau 8305 190 berkurang, namun success rate
Actual meningkat
Mau 748 316 ➔ Dari 1.064 nasabah yang aktualnya
mau membuka deposito, model dapat
menyaring 316 nasabah diantaranya
(29.7%)

18
Comparison: Tanpa Model Vs Dengan Model

Tanpa Machine Learning, bank harus menelepon seluruh nasabah (sebanyak 9559 orang) dan
hasilnya hanya 11% yang mau membuka deposito

Bila menggunakan prediksi Machine Learning, kita dapat mengabaikan yang diprediksi ‘Tidak Mau’,
dan hanya menelepon nasabah yang diprediksi ‘Mau’.

Tanpa Model Model

Banyak Telepon yang dilakukan 9559 (100%) 506 (5.3%)

Banyak Nasabah yang Deposit 1064 (100%) 316 (29.7%)

Success Rate 11.1% 62.5%

19
Hasil dan Interpretasi

➔ Dengan pengaturan nilai batas (threshold), kita dapat meningkatkan jumlah nasabah yang mau
membuka deposito menjadi 63.1% dengan peningkatan banyak telepon yang dilakukan
menjadi 18.2%
➔ Dengan mengorbankan success rate sebesar 10.1% dibanding saat threshold = 0.25

Tanpa Model Model Model Model


(threshold = 0.25) (threshold = 0.1)

Telepon yang dilakukan 9559 (100%) 506 (5.3%) 1015 (10.6%) 1741 (18.2%)

Nasabah yang Deposit 1064 (100%) 316 (29.7%) 493 (53.5%) 671 (63.1%)

Tingkat Kesuksesan 11.1% 62.5% 48.6% 38.5%

20

Anda mungkin juga menyukai