0% menganggap dokumen ini bermanfaat (0 suara)
4 tayangan13 halaman

Pengolahan Data Dengan Python Dan Pandas

Pengolahan Data dengan Python dan Pandas

Diunggah oleh

muhyahyau
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
4 tayangan13 halaman

Pengolahan Data Dengan Python Dan Pandas

Pengolahan Data dengan Python dan Pandas

Diunggah oleh

muhyahyau
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 13

M.

YAHYA UBAIDILLAH

PENGOLAHAN DATA DENGAN


PYTHON DAN PANDAS

Universitas Maarif Hasyim Latif


Tujuan Pembelajaran

Memahami konsep dasar


pengolahan data dengan Pandas.
Tujuan Melakukan eksplorasi dan

Pembelajaran manipulasi data menggunakan


Pandas.
Membersihkan dan menyiapkan
data untuk analisis lebih lanjut.
Pustaka yang digunakan
Pustaka Yang
import pandas as pd
Digunakan
import numpy as np
Membaca Dataset

df = pd.read_csv('nama_file.csv')
Fungsi read_csv() digunakan untuk membaca
Membaca

file CSV.
Dataset
Informasi Umum Data

Informasi Umum df.head() -> 5 baris pertama


df.tail() -> 5 baris terakhir
df.info() -> Info kolom & tipe data
df.describe() -> Statistik deskriptif kolom
numerik
Data
Seleksi dan Filter Data
Seleksi dan Filter # Seleksi kolom
df['NamaKolom']
# Seleksi baris dengan kondisi
df[df['Kolom'] > 100]
Data
Manipulasi Data

Manipulasi Data df['Total'] = df['Harga'] * df['Jumlah']


df.drop(columns=['Kolom'], inplace=True)
df['Status'] = df['Status'].replace({'lama': 'baru'}
Pembersihan Data
Pembersihan

df.isnull().sum() -> Cek NaN


df.dropna() -> Hapus NaN
df.fillna(0) -> Isi NaN dengan 0
Data
Grouping dan
Grouping dan Agregasi

df.groupby('Kota')['Total'].sum()
Agregasi
df.groupby('Genre')['Harga'].mean()
Visualisasi Data Visualisasi Data

df.groupby('Genre')['Total'].sum().plot(kind='bar')
plt.title("Total Penjualan per Genre")
plt.ylabel("Total (Rp)")
plt.show()
Seleksi dan Filter
Seleksi dan Filter Data

df['NamaKolom'] -> Seleksi kolom


df[df['Kolom'] > 100] -> Filter baris dengan
kondisi
Data
📘 Contoh Studi Kasus
Dataset: bookstore_sales.csv
Pertanyaan:
Kota mana yang memiliki total
penjualan tertinggi?
Genre apa yang paling sering muncul?
Berapa rata-rata dan standar deviasi
STUDI harga buku?

KASUS
Bagaimana Caranya?

# Tambah kolom total


df['TotalSale'] = df['Price'] * df['Quantity']
# Kota dengan total penjualan tertinggi
print(df.groupby('City')['TotalSale'].sum().sort_values(ascending=False))
# Genre paling populer
print(df['Genre'].value_counts())
# Statistik harga
print("Rata-rata harga:", np.mean(df['Price']))
print("Standar deviasi harga:", np.std(df['Price']))

Anda mungkin juga menyukai