Day-5 Ai Code

The document provides a Python program that cleans a dataset by removing duplicate entries and filling missing values with the mean of their respective columns. It includes a sample dataset with duplicates and missing values, demonstrating the cleaning process using the pandas library. The output shows the original and cleaned datasets side by side.

Uploaded by

suhani

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views1 page

Day-5 Ai Code

Uploaded by

suhani

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

3/5/25, 6:11 PM Untitled2.

ipynb - Colab

format_size format_bold format_italic code link image format_quote format_list_numbered format_list_bulleted horizontal_rule ψ mood
.Write a Python program to clean a dataset by removing duplicate ent .Write a Python program to clean a dataset by removing duplicate
filling missing
entries and filling missing values with the mean of the respective
values with the mean of the respective column.
column.

# Import required libraries

import pandas as pd
import numpy as np

# Sample dataset with duplicates and missing values

data = {
'ID': [1, 2, 3, 4, 5, 2, 6], # Duplicate ID = 2
'Age': [25, 30, 35, np.nan, 45, 30, np.nan], # Missing values in Age
'Salary': [50000, 60000, np.nan, 80000, 90000, 60000, 70000] # Missing Salary
}

# Create a DataFrame
df = pd.DataFrame(data)

print("Original Dataset:")
print(df)

# Remove duplicate entries based on all columns

df = df.drop_duplicates()

# Fill missing values with column mean

df.fillna(df.mean(numeric_only=True), inplace=True)

print("\nCleaned Dataset:")
print(df)

Original Dataset:
ID Age Salary
0 1 25.0 50000.0
1 2 30.0 60000.0
2 3 35.0 NaN
3 4 NaN 80000.0
4 5 45.0 90000.0
5 2 30.0 60000.0
6 6 NaN 70000.0

Cleaned Dataset:
ID Age Salary
0 1 25.00 50000.0
1 2 30.00 60000.0
2 3 35.00 70000.0
3 4 33.75 80000.0
4 5 45.00 90000.0
6 6 33.75 70000.0

Start coding or generate with AI.

https://colab.research.google.com/drive/1oavejkqUovkIr12hdg44TYQOszJqwIyR#scrollTo=WvmINz-oUrFa&printMode=true 1/1

Data Analytics Lab Manual
No ratings yet
Data Analytics Lab Manual
47 pages
Part A Assignment 6
No ratings yet
Part A Assignment 6
28 pages
Data Cleaning With Python and Pandas
No ratings yet
Data Cleaning With Python and Pandas
49 pages
6.data Cleaning
No ratings yet
6.data Cleaning
20 pages
Practice 1
No ratings yet
Practice 1
45 pages
Data Analytics Lab Manuals 2025-2026-1
No ratings yet
Data Analytics Lab Manuals 2025-2026-1
39 pages
Lab File
No ratings yet
Lab File
96 pages
Unit 5 Python
No ratings yet
Unit 5 Python
30 pages
PDS Exp 7 To 9
No ratings yet
PDS Exp 7 To 9
10 pages
Pandas
No ratings yet
Pandas
4 pages
Hands On Data Cleaning With Pandas and NumPy
No ratings yet
Hands On Data Cleaning With Pandas and NumPy
20 pages
ML Practical 03
No ratings yet
ML Practical 03
20 pages
DAP Writeups - Merged
No ratings yet
DAP Writeups - Merged
33 pages
Data Cleaning
No ratings yet
Data Cleaning
20 pages
Dealing With Missing Values
No ratings yet
Dealing With Missing Values
19 pages
Pandas
No ratings yet
Pandas
30 pages
Ass 3 - Best
No ratings yet
Ass 3 - Best
10 pages
ch4 Slides PDF
No ratings yet
ch4 Slides PDF
44 pages
Create A Pandas Series From A Dictionary of Values and An Ndarray
No ratings yet
Create A Pandas Series From A Dictionary of Values and An Ndarray
15 pages
Unit3 - Cleaning - Preparing - Data - Jupyter Notebook
No ratings yet
Unit3 - Cleaning - Preparing - Data - Jupyter Notebook
10 pages
Data Cleaning
No ratings yet
Data Cleaning
13 pages
Document (4) - 1
No ratings yet
Document (4) - 1
15 pages
Data Cleaning & Preparation
100% (2)
Data Cleaning & Preparation
2 pages
Learn Data Analysis With Python
No ratings yet
Learn Data Analysis With Python
6 pages
Data Cleaning in Python
No ratings yet
Data Cleaning in Python
14 pages
2-Introduction To Data Cleaning P02
No ratings yet
2-Introduction To Data Cleaning P02
7 pages
Python (Unit - 2)
No ratings yet
Python (Unit - 2)
22 pages
Reading 5 - Data Preparation
No ratings yet
Reading 5 - Data Preparation
23 pages
Data Cleaning With Python Cheat Sheet Anello
No ratings yet
Data Cleaning With Python Cheat Sheet Anello
4 pages
Exp-12 Iaiml
No ratings yet
Exp-12 Iaiml
13 pages
DS Lec 6
No ratings yet
DS Lec 6
27 pages
Data Cleaningin ML
No ratings yet
Data Cleaningin ML
15 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
Handling Missing Values in Python
No ratings yet
Handling Missing Values in Python
9 pages
Lesson 3. Data Preparation and Structuring 1 Data Cleaning
No ratings yet
Lesson 3. Data Preparation and Structuring 1 Data Cleaning
36 pages
Haha 1
No ratings yet
Haha 1
2 pages
221a1129 DS Exp1
No ratings yet
221a1129 DS Exp1
4 pages
Day 10 Pandasdatacleaning
No ratings yet
Day 10 Pandasdatacleaning
6 pages
DMML Lab Report 03
No ratings yet
DMML Lab Report 03
9 pages
DA Lab Manual r22
No ratings yet
DA Lab Manual r22
31 pages
Overview of Data Cleaning
No ratings yet
Overview of Data Cleaning
17 pages
Exp 2 Data Preprocessing - Cleaning The Dataset Obtained From The UCI ML Repository
No ratings yet
Exp 2 Data Preprocessing - Cleaning The Dataset Obtained From The UCI ML Repository
9 pages
Data Preprocessing 1
No ratings yet
Data Preprocessing 1
6 pages
Data Cleaning in Python
No ratings yet
Data Cleaning in Python
6 pages
Code Explanation For Date Types
No ratings yet
Code Explanation For Date Types
8 pages
Data Cleaning in Machine Learning With Numerical Example
No ratings yet
Data Cleaning in Machine Learning With Numerical Example
3 pages
Pandas 1
No ratings yet
Pandas 1
13 pages
5-Demonstrate Missing Value Analysis Using Sample Data.-06!01!2025
No ratings yet
5-Demonstrate Missing Value Analysis Using Sample Data.-06!01!2025
2 pages
DPPR 3
No ratings yet
DPPR 3
2 pages
7 Cleaning Data w3s.............................................
No ratings yet
7 Cleaning Data w3s.............................................
2 pages
DA Cheat Codes
No ratings yet
DA Cheat Codes
2 pages
DataCleaning Techniques
No ratings yet
DataCleaning Techniques
20 pages
PW2 DataCleaning
No ratings yet
PW2 DataCleaning
6 pages
Step-by-Step Explanation of Python Data Preprocessing Script
No ratings yet
Step-by-Step Explanation of Python Data Preprocessing Script
9 pages
Pandas Merged
No ratings yet
Pandas Merged
2 pages
ESE Ques Pattern
No ratings yet
ESE Ques Pattern
3 pages
Essential n8n Playbook
From Everand
Essential n8n Playbook
Leandro Calado
No ratings yet
Python for Data Science: Data Science Mastery by Nikhil Khan, #1
From Everand
Python for Data Science: Data Science Mastery by Nikhil Khan, #1
Nikhil Khan
No ratings yet
Learning Pandas 2.0: A Comprehensive Guide to Data Manipulation and Analysis for Data Scientists and Machine Learning Professionals
From Everand
Learning Pandas 2.0: A Comprehensive Guide to Data Manipulation and Analysis for Data Scientists and Machine Learning Professionals
Matthew Rosch
No ratings yet
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet

Day-5 Ai Code

Uploaded by

Day-5 Ai Code

Uploaded by

3/5/25, 6:11 PM Untitled2.

# Import required libraries

# Sample dataset with duplicates and missing values

# Remove duplicate entries based on all columns

# Fill missing values with column mean

Start coding or generate with AI.

You might also like