Python For Data Analytics (Buku Ajar)
Python For Data Analytics (Buku Ajar)
2023
BUKU AJAR
ISBN: 978-623-99962-4-6
Penulis:
Nur Alamsyah, S.T., M.Kom
Budiman, S.T., M.Kom
Tutik Ultsa Rahmatika
Dalam era digital ini, data telah menjadi harta yang paling berharga
bagi perusahaan, organisasi, dan individu. Data menyimpan potensi
besar untuk memberikan wawasan berharga, mendukung
pengambilan keputusan yang cerdas, dan mengungkap pola dan tren
yang mungkin tersembunyi di balik angka-angka. Untuk mengungkap
potensi ini, pemahaman yang mendalam tentang cara mengelola,
menganalisis, dan mengolah data menjadi sangat penting.
Buku ini sangat cocok untuk mahasiswa, profesional, atau siapa saja
yang ingin memperluas pengetahuan mereka tentang analisis data
menggunakan Python. Kami berharap buku ini akan memberi Anda
dasar yang kuat untuk memulai perjalanan Anda dalam memahami,
menjelajahi, dan menganalisis data dengan Python.
Penulis
iii
DAFTAR ISI
Kata Pengantar............................................................................. vi
BAB I .............................................................................................. 1
PYTHON DALAM ANALISIS DATA. ........................................... 1
1.1 Apa itu Analisis Data? ........................................................... 1
1.2 Peran Python dalam Analisis Data. ........................................ 1
1.3 Mengapa Analisis Data dengan Python? ................................ 2
1.4 Instalasi Python dan Lingkungan Pengembangan (IDE) ......... 3
1.5 Menggunakan Google Collab?............................................... 3
1.6 Dasar-Dasar Python: Variabel, Tipe Data, dan Operasi Dasar . 4
Operasi Dasar .............................................................................. 5
BAB II ............................................................................................ 9
PENGENALAN NumPy ................................................................. 9
2.1 NumPy Sebagai Library Dasar Untuk Komputasi Numerik... 9
NumPy ........................................................................................ 9
2.2 Mengapa NumPy Penting? ................................................... 9
2.3 Mengimpor NumPy ............................................................. 10
2.4 Membuat Array NumPy ....................................................... 10
2.6 Contoh Kasus: Analisis Data Sederhana dengan NumPy : .... 11
2.7 Pengindeksan dan Pemotongan (Slicing) dalam Array NumPy
.................................................................................................. 12
2.8 Machine Learning dengan NumPy. ...................................... 15
2.9 Komputasi Matriks dengan NumPy ..................................... 16
2.10 Implementasi Algoritma Machine Learning ....................... 17
BAB III ......................................................................................... 19
MENGOLAH DATA DENGAN PANDAS .................................... 19
3.1 Pandas untuk Manipulasi Data Tabular. ............................... 19
3.2 Penjelasan Data Tabular. ...................................................... 20
3.3 Pembuatan DataFrame dan Series ........................................ 21
3.4 Mengimpor Data dalam Pandas dari Google Drive .............. 21
BAB IV ......................................................................................... 25
EXPLORATORY DATA ANALYSIS (EDA) ................................. 25
4.1 Pengenalan Exploratory Data Analysis (EDA) ..................... 25
4.2 Eksplorasi Data. .................................................................. 27
4.3 Statistik Deskriptif ............................................................... 28
4.4 Visualisasi Data Dasar Menggunakan Matplotlib ................. 29
iv
BAB V .......................................................................................... 33
DATA CLEANING DAN PREPROCESSING ............................... 33
5.1 Membersihkan Data dari Nilai yang Hilang (Missing Values)
dan Data yang Tidak Valid......................................................... 34
5.2 Transformasi Data ............................................................... 34
5.3 Standarisasi ......................................................................... 35
BAB VI ......................................................................................... 39
VISUALISASI DATA ................................................................... 39
6.1 Matplotlib............................................................................ 39
6.2 Seaborn ............................................................................... 39
6.3 Plotly................................................................................... 40
6.4 Altair ................................................................................... 40
6.5 Contoh kasus Visualisasi Data : Visualisasi Data Outlier. ..... 41
BAB VII ........................................................................................ 43
PANDAS ADVANCED GROUPING DAN AGGREGATION....... 43
7.1 Grup Data Berdasarkan Kriteria Tertentu ............................. 44
7.2 Agregasi Data dan Penghitungan Statistik ............................ 45
7.3 Contoh Kasus Grouping & Aggregation............................... 45
7.4 Contoh Kasus: Analisis E-commerce ................................... 46
BAB VIII ...................................................................................... 49
ANALISIS DATA MULTIVARIABEL .......................................... 49
8.1 Eksplorasi Hubungan Antar Variabel dalam Data ................. 50
8.2 Menggunakan Heatmap ....................................................... 50
8.3 Contoh Kasus Analisis Data Multivariabel ........................... 51
8.4 Menggunakan Pair Plot........................................................ 53
8.5 Contoh Kasus Pairplot ......................................................... 54
8.6 Menggunakan Scatter Matrix ............................................... 55
8.7 Contoh Kasus Scatter Matrix ............................................... 56
BAB IX ......................................................................................... 61
STATISTIK UNTUK DATA ANALYSIS....................................... 61
9.1 Kegunaan Statistik dalam Analisis Data: .............................. 61
9.2 Library Python untuk Statistik: ............................................ 61
BAB X .......................................................................................... 67
REGRESI SEDERHANA.............................................................. 67
10.1 Model Regresi Sederhana: ................................................. 67
10.2 Tujuan Regresi Sederhana.................................................. 67
10.3 Contoh Penggunaan Regresi Sederhana ............................. 68
10.4 Evaluasi Regresi Sederhana ............................................... 68
10.5 Mean Squared Error (MSE) ............................................... 69
v
BAB XI ......................................................................................... 73
MODEL KLASIFIKASI DASAR.................................................. 73
11.1 Definisi Klasifikasi: ........................................................... 73
11.2 Tujuan Klasifikasi: ............................................................. 73
11.3 Langkah-langkah Klasifikasi.............................................. 74
11.4 Model Klasifikasi .............................................................. 74
BAB XII........................................................................................ 78
CLUSTERING DASAR ................................................................ 78
12.1 Penjelasan Clustering: ....................................................... 78
12.2 Tujuan Clustering .............................................................. 78
12.3 Metode Clustering yang Umum ......................................... 78
BAB XIII ...................................................................................... 81
EKSPLORASI DATA WAKTU (TIME SERIES DATA) ............... 81
13.1 Memahami Data Berdasarkan Waktu ................................. 81
13.2 Sumber Data Time Series................................................... 82
13.3 Menggunakan Pandas untuk Analisis Data Waktu .............. 83
BAB XIV ...................................................................................... 85
PANDAS UNTUK DATA TEXT DAN CATEGORICAL .............. 85
14.1 Mengolah dan Menganalisis Data Teks .............................. 85
14.2 Contoh Data Categorical .................................................... 85
14.3 Sumber Data Categorical ................................................... 86
14.4 Perbedaan Data Time Series Dengan Data Categorical ....... 87
14.5 Contoh Kasus: Analisis Kategori Produk ........................... 88
BAB XV ....................................................................................... 91
ANALISIS SENTIMEN DASAR .................................................. 91
15.1 Definisi Analisis Sentimen ................................................. 91
15.2 Tujuan Analisis Sentimen .................................................. 92
15.3 Langkah Langkah Analisis Sentimen ................................. 93
15.4 Library Pada Python .......................................................... 95
BAB XVI ...................................................................................... 99
DATA CRAWLING ....................................................................... 99
16.1 Penjelasan dan Konsep Dasar ............................................ 99
16.2 Penggunaan Crawling Data................................................ 99
16.3 Etika Dan Hukum .............................................................. 99
16.4 Teknik Crawling .............................................................. 100
vi