Tugas Data Preprocessing
Tugas Data Preprocessing
1201174123
TUGAS WEEK 3 DATA ANALITIK
• Data preprocessing yang perlu dilakukan adalah cleaning data. Hal pertama
ialah melakukan formatting data dengan syntax sebagai berikut:
df['Usia'][3] = 35
df['Lama Kerja(tahun)'][7] = 9.167
• Terakhir, menghilangkan drop missing value yang ada dengan syntax sebagai
berikut:
df.dropna()
Screenshot Hasil Running Cleaning Data Menggunakan Google Colab
3. Membuat atribut baru dengan nama golongan_pendapatan (<3 kategori rendah, 3-5
kategori sedang, dan >5 juta kategori tinggi)
Syntax
bins =[0,3,5,7]
group_names=["Rendah","Sedang","Tinggi"]
df['golongan_pendapatan']=pd.cut(df["Gaji (juta)"], bins,
labels = group_names)
df
df.dropna()
***