0% menganggap dokumen ini bermanfaat (0 suara)
27 tayangan4 halaman

Tugas 1 Pak Haris

Pandas adalah library Python yang digunakan untuk analisis data, menyediakan struktur data seperti DataFrame untuk memproses dan mengelola data tabular. Fitur utama Pandas mencakup pengindeksan, manipulasi data, pembacaan dan penulisan dalam berbagai format, serta integrasi dengan perpustakaan visualisasi. Meskipun memiliki kelebihan seperti kemudahan penggunaan dan dukungan komunitas, Pandas juga memiliki kekurangan dalam hal kinerja pada dataset besar dan memori yang dibutuhkan.

Diunggah oleh

Lintang anisa
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
27 tayangan4 halaman

Tugas 1 Pak Haris

Pandas adalah library Python yang digunakan untuk analisis data, menyediakan struktur data seperti DataFrame untuk memproses dan mengelola data tabular. Fitur utama Pandas mencakup pengindeksan, manipulasi data, pembacaan dan penulisan dalam berbagai format, serta integrasi dengan perpustakaan visualisasi. Meskipun memiliki kelebihan seperti kemudahan penggunaan dan dukungan komunitas, Pandas juga memiliki kekurangan dalam hal kinerja pada dataset besar dan memori yang dibutuhkan.

Diunggah oleh

Lintang anisa
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
Anda di halaman 1/ 4

Nama : Lintang Anisa Gita Satria

NRP : 5017231063
Kelas : A

TUGAS!

1. Ekspresikan apa itu Pandas!


 Pengertian
Pandas merupakan library di Python yang dipakai untuk bekerja dengan DataFrame.
Pandas sering digunakan untuk memproses data yang meliputi pembersihan data,
memanipulasi data, analisis data, mengorganisir data, membersihkan data, hingga
membangun sebuah machine learning. Pandas menyediakan struktur data seperti
DataFrame yang memungkinkan penggunanya untuk lebih mudah menyortir,
menyaring, dan mengolah data tabular. Pandas mendukung pembacaan dan penulisan
data dalam berbagai format seperti CSV, Excel, SQL, dll. Pandas juga berintegrasi
dengan baik dengan berbagai perpustakaan lain seperti Numpy dan Matplotlib
sehingga menjadikannya alat yang sangat berguna dan kuat dalam ekosistem analisis
data dan visualisasi Python.

 Fitur
Ada 10 fitur utama dalam pandas, yaitu:
1. DataFrame
Struktur data dua dimensi yang mirip dengan tabel atau spreadsheet,
memudahkan pengolahan data tabular.
2. Series
Struktur data satu dimensi yang mirip ddigunakan untuk menyimpan data satu
kolom.
3. Pengindeksan dan Pemilihan Data
Pandas menyediakan berbagai cara untuk mengindeks dan memilih data,
termasuk pengindeksan berbasis label dan posisi.
4. Operasi Data
Memungkinkan operasi efisien seperti penyortiran, pengelompokan,
penyaringan, dan penggabungan data.
5. Manipulasi dan Pemrosesan Data
Menyediakan fungsi untuk membersihkan data, menangani nilai yang hilang,
dan melakukan transformasi data.
6. Pembacaan dan Penulisan Data
Dapat membaca dan menulis data dari/to berbagai format, termasuk CSV,
Excel, SQL, dan lebih banyak lagi.
7. Visualisasi Data
Nama : Lintang Anisa Gita Satria
NRP : 5017231063
Kelas : A
Pandas berintegrasi dengan baik dengan perpustakaan visualisasi seperti
Matplotlib, memungkinkan pengguna untuk dengan mudah membuat grafik
dan visualisasi data.
8. Fungsi Statistik
Menyediakan berbagai fungsi untuk perhitungan statistik, seperti mean,
median, deviasi standar, dan korelasi.
9. Dukungan untuk Data yang Hilang
Pandas menyediakan alat untuk mengelola data yang hilang, termasuk deteksi
dan pengisian nilai yang hilang.
10. Penggabungan dan Penggantian Data
Memudahkan penggabungan data dari berbagai sumber dan penggantian nilai
berdasarkan kriteria tertentu.

 Kelebihan
1. Pandas menyediakan struktur data yang fleksibel
2. Sintaksis Pandas relatif mudah di pelajari dan intuitif
3. Pandas dapat menangani operasi pengolahan data dengan sangat efisien
4. Integrasi Pandas dengan perpustakaan visualisasi mempermudah pembuatan
grafik dan visualisasi data
5. Pandas mendukung berbagai format file untuk memudahkan penggunaan data
dari berbagai sumber
6. Pandas memiliki komunitas yang aktif dan dukungan yang sangat luas, dengan
dokumentasi yang baik dan sumber daya online yang melimpah.
 Kekurangan
1. Kinerja Pandas dapat menurun pada dataset yang sangat besar karena
diimplementasikandi Python
2. Pandas membutuhkan memori yang signifikan dan dapat menjadi tidak efisien
untuk dataset yag sangat besar yag tidak muat dalam RAM
3. Pandas tidak dirancang khusus untuk operasi terdistribusi di lingkungan cluster,
sehingga mungkin tidak ideal untuk beberapa skenario data besar.
4. Adanya keterbatasan dalam statistik tingkat lanjut yang memerlukan
perpustakaan tambahan.
Nama : Lintang Anisa Gita Satria
NRP : 5017231063
Kelas : A
2. Apa yang bisa dilakukan dengan Pandas!
1. Membaca data
Pandas dapat digunakan untuk membaca data dari berbagai sumber seperti file CSV,
Excel, SQL databases, dan lainnya.
2. Eksplorasi data
Menampilkan informasi umum tentang dataset, seperti tipe data, statistik deskriptif, dan
sejumlah baris pertama atau terakhir.
3. Seleksi dan pengindeksan data
Memilih subset dari data berdasarkan kriteria tertentu, baik berdasarkan label maupun
posisi.
4. Penanganan dan pembersihan data
Menangani nilai yang hilang, mengganti nilai, dan membersihkan data yang tidak valid.
5. Transformasi data
Melakukan transformasi seperti penggabungan data, pengelompokan, dan penghitungan
agregasi.
6. Visualisasi data
Pandas berintegrasi dengan baik dengan perpustakaan visualisasi seperti Matplotlib dan
Seaborn untuk membuat grafik dan visualisasi data.
7. Operasi Time Series
Pandas mendukung operasi terkait time series, seperti resampling, shift, dan pemrosesan
data dengan indeks waktu.
8. Membuat dan mengelola DataFrame
Membuat DataFrame dari awal atau mengubah struktur DataFrame yang ada.
9. Membaca dan menulis data ke berbagai format
Menyimpan DataFrame ke format file yang berbeda, seperti CSV, Excel, atau database
SQL.
10. Penggabungan data
Menggabungkan dua atau lebih DataFrame berdasarkan kolom atau indeks tertentu.
11. Analisis statistik dan Time Series
Menghitung statistik deskriptif, korelasi, serta melakukan analisis time series.
12. Manajemen kategori dan label
Membuat dan mengelola kategori, mengganti label, dan merubah tipe data kolom.
Nama : Lintang Anisa Gita Satria
NRP : 5017231063
Kelas : A
3. Apa yang sudah kalian lakukan dengan Pandas!
Pandas adalah perpustakaan python yang kuat untuk analisis data termasuk pada operasi
matematika pada data frame. Dengan menggunakan Pandas, saya sudah melakukan berbagai
operasi matematika seperti penjumlahan, pengurangan, perkalian, dan pembagian pada data
frame dengan mudah. Saya juga bisa mengoperasikan dan mengolah data yang sudah ada
menggunakan Pandas. Selain itu, saya juga bisa menambahkan kolom, mengalikan kolom,
menghitung statistik, mengoprasikan seluruh data frame, serta mentranformasikan data dengan
fungsi lambda. Contoh:

import pandas as pd  Contoh penambahan dan


pengurangan kolom
# Membuat data frame contoh

data = {'A': [7, 8, 9], 'B': [2, 3, 4]} import pandas as pd


# Membuat data frame contoh
df = pd.DataFrame(data) data = {'A': [1, 2, 3], 'B': [4, 5,
6]}
# Operasi penjumlahan pada kolom A dan B
df = pd.DataFrame(data)
df['C'] = df['A'] + df['B'] # Menambahkan kolom baru
dengan penjumlahan dua
# Operasi perkalian pada kolom A dan B kolom lainnya
df['C'] = df['A'] + df['B']
df['D'] = df['A'] * df['B']
# Menambahkan kolom baru
# Menampilkan hasil dengan perkalian dua kolom
lainnya
print(df) df['D'] = df['A'] * df['B']

 Contoh menghitung statistik mengoperasikan seluruh data frame

# Menghitung rata-rata kolom


# Menjumlahkan seluruh data frame total_seluruh =
rata_rata = df['A'].mean()
df.sum().sum()
# Menghitung total kolom
total = df['B'].sum() # Menemukan nilai maksimum dalam setiap kolom
maksimum_kolom = df.max()

Anda mungkin juga menyukai