Tugas Mahasiswa Data Mining 1
Tugas Mahasiswa Data Mining 1
Judul Tugas:
"Eksplorasi dan Preprocessing Data dari Kaggle atau Sumber Lain"
Deskripsi Tugas
Dalam dunia Data Mining, preprocessing data adalah langkah kritis sebelum analisis lebih
lanjut dilakukan. Tugas ini mengharuskan mahasiswa untuk:
1. Mencari dataset dari sumber terpercaya seperti Kaggle, UCI Machine Learning
Repository, Data.gov, atau website lain.
2. Melakukan eksplorasi awal terhadap data untuk memahami struktur dan karakteristik
dataset.
3. Menyelesaikan masalah kualitas data seperti duplikasi data, missing values (data
hilang), dan noise.
4. Menggunakan salah satu program yang dipilih (Python, R, SPSS, atau MATLAB)
untuk preprocessing data.
5. Membuat laporan hasil analisis dan kode program yang digunakan.
Langkah-Langkah Pengerjaan
1️. Mencari Dataset dari Sumber Resmi
Tugas: Temukan 1 dataset dari salah satu sumber berikut:
o Kaggle
o UCI Machine Learning Repository
o Data.gov
o Google Dataset Search
o Atau sumber data terpercaya lainnya.
# Membaca dataset
df = pd.read_csv("nama_file.csv")
# Statistik deskriptif
print(df.describe())
Bagian 1: Pendahuluan
• Penanganan duplikasi.
• Penanganan missing values.
• Penanganan noise.
• Normalisasi atau transformasi data.
Kesimpulan
• Mahasiswa akan memahami bagaimana mencari, mengeksplorasi, dan membersihkan
data sebelum analisis lebih lanjut.
• Proyek ini juga akan memberikan pengalaman praktis dalam menggunakan alat
seperti Python, R, SPSS, atau MATLAB untuk Data Mining.