0% found this document useful (0 votes)

39 views6 pages

Session 11 Lecture 1

The document discusses cleaning and analyzing a student exam data set using Pandas. Various data cleaning steps are applied including converting date columns, filling missing values, dropping duplicates, and plotting the data.

Uploaded by

detomal301

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

39 views6 pages

Session 11 Lecture 1

Uploaded by

detomal301

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

In [6]: 1 data =pd.read_csv('/content/SAMPLE_FOR_CLEANING.

csv')
2 print(data.to_string())

ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

0 0901IT181001 AADITYA KHANTAL 25-05-2021 15.0 75.0
1 0901IT181002 ADITYA JOSHI 05-25-2021 NaN NaN
2 0901IT181003 AJAY GARG 25-May-21 16.0 80.0
3 0901IT181004 AKASH KACHHAWAY 25-05-2021 17.0 85.0
4 0901IT181005 AKSHAT KOTHAVADE 25-05-2021 12.0 60.0
5 0901IT181006 ALAKH NIRANJAN THAKURIYA 05-25-2021 11.0 55.0
6 0901IT181007 ALOK KUMAR 05-25-2021 13.0 65.0
7 0901IT181008 AMAN DIXIT 25-05-2021 NaN NaN
8 0901IT181009 AMIT BAMNIYA 25-05-2021 12.0 60.0
9 0901IT181010 ANKIT KUMAR 25-05-2021 12.5 62.5
10 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0
11 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

In [5]: 1 data['DATE OF EXAM']=pd.to_datetime(data['DATE OF EXAM'])

2 print(data.to_string())

ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

0 0901IT181001 AADITYA KHANTAL 2021-05-25 15.0 75.0
1 0901IT181002 ADITYA JOSHI 2021-05-25 NaN NaN
2 0901IT181003 AJAY GARG 2021-05-25 16.0 80.0
3 0901IT181004 AKASH KACHHAWAY 2021-05-25 17.0 85.0
4 0901IT181005 AKSHAT KOTHAVADE 2021-05-25 12.0 60.0
5 0901IT181006 ALAKH NIRANJAN THAKURIYA 2021-05-25 11.0 55.0
6 0901IT181007 ALOK KUMAR 2021-05-25 13.0 65.0
7 0901IT181008 AMAN DIXIT 2021-05-25 NaN NaN
8 0901IT181009 AMIT BAMNIYA 2021-05-25 12.0 60.0
9 0901IT181010 ANKIT KUMAR 2021-05-25 12.5 62.5
10 0901IT181011 ANKIT RAJ TIRKEY 2021-05-25 13.0 65.0
11 0901IT181011 ANKIT RAJ TIRKEY 2021-05-25 13.0 65.0

In [ ]: 1 data['DATE OF EXAM'].apply(lambda x:pd.to_datetime(x).strftime('%m-%d-%y'))

In [12]: 1 data = pd.read_csv('/content/SAMPLE_FOR_CLEANING.csv')
2 data['MARKS'].fillna(21, inplace=True)
3 data

Out[12]: ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

0 0901IT181001 AADITYA KHANTAL 25-05-2021 15.0 75.0

1 0901IT181002 ADITYA JOSHI 05-25-2021 21.0 NaN

2 0901IT181003 AJAY GARG 25-May-21 16.0 80.0

3 0901IT181004 AKASH KACHHAWAY 25-05-2021 17.0 85.0

4 0901IT181005 AKSHAT KOTHAVADE 25-05-2021 12.0 60.0

5 0901IT181006 ALAKH NIRANJAN THAKURIYA 05-25-2021 11.0 55.0

6 0901IT181007 ALOK KUMAR 05-25-2021 13.0 65.0

7 0901IT181008 AMAN DIXIT 25-05-2021 21.0 NaN

8 0901IT181009 AMIT BAMNIYA 25-05-2021 12.0 60.0

9 0901IT181010 ANKIT KUMAR 25-05-2021 12.5 62.5

10 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

11 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

In [15]: 1 for x in data.index:
2 if data.loc[x,'MARKS']>20:
3 data.loc[x, 'MARKS'] = 12
4 print(data.to_string())
5

ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

0 0901IT181001 AADITYA KHANTAL 25-05-2021 15.0 75.0
1 0901IT181002 ADITYA JOSHI 05-25-2021 12.0 NaN
2 0901IT181003 AJAY GARG 25-May-21 16.0 80.0
3 0901IT181004 AKASH KACHHAWAY 25-05-2021 17.0 85.0
4 0901IT181005 AKSHAT KOTHAVADE 25-05-2021 12.0 60.0
5 0901IT181006 ALAKH NIRANJAN THAKURIYA 05-25-2021 11.0 55.0
6 0901IT181007 ALOK KUMAR 05-25-2021 13.0 65.0
7 0901IT181008 AMAN DIXIT 25-05-2021 12.0 NaN
8 0901IT181009 AMIT BAMNIYA 25-05-2021 12.0 60.0
9 0901IT181010 ANKIT KUMAR 25-05-2021 12.5 62.5
10 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0
11 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

In [ ]: 1 print(data.duplicated())

In [ ]: 1 data.drop_duplicates()

In [ ]: 1 data.corr()

In [19]: 1 import matplotlib.pyplot as plt

In [20]: 1 data =pd.read_csv('/content/SAMPLE_FOR_CLEANING.csv')
2 print(data.to_string())

ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

In [21]: 1 data.plot()
2 plt.show()
In [22]: 1 data = pd.read_csv('/content/SAMPLE_FOR_CLEANING.csv')
2 data['MARKS'].fillna(12, inplace=True)
3 data['PERCENTAGE'].fillna(60, inplace=True)
4 data

Out[22]: ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

0 0901IT181001 AADITYA KHANTAL 25-05-2021 15.0 75.0

1 0901IT181002 ADITYA JOSHI 05-25-2021 12.0 60.0

2 0901IT181003 AJAY GARG 25-May-21 16.0 80.0

3 0901IT181004 AKASH KACHHAWAY 25-05-2021 17.0 85.0

4 0901IT181005 AKSHAT KOTHAVADE 25-05-2021 12.0 60.0

5 0901IT181006 ALAKH NIRANJAN THAKURIYA 05-25-2021 11.0 55.0

6 0901IT181007 ALOK KUMAR 05-25-2021 13.0 65.0

7 0901IT181008 AMAN DIXIT 25-05-2021 12.0 60.0

8 0901IT181009 AMIT BAMNIYA 25-05-2021 12.0 60.0

9 0901IT181010 ANKIT KUMAR 25-05-2021 12.5 62.5

10 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

11 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

In [ ]: 1 data.plot()
2 plt.show()
In [24]: 1 data.plot(kind='bar')
2 plt.show()

Schematic Diagram MCB-V6-En Ver.18.06 Rev.1 (GEEC)
100% (1)
Schematic Diagram MCB-V6-En Ver.18.06 Rev.1 (GEEC)
44 pages
GP RM E FEM PreStressedPlateBridge EC
No ratings yet
GP RM E FEM PreStressedPlateBridge EC
85 pages
DA Lab Manual r22
No ratings yet
DA Lab Manual r22
31 pages
Practical No-2
No ratings yet
Practical No-2
4 pages
Unit3 - Cleaning - Preparing - Data - Jupyter Notebook
No ratings yet
Unit3 - Cleaning - Preparing - Data - Jupyter Notebook
10 pages
Etl1 6
No ratings yet
Etl1 6
6 pages
PythonFinal (8,9,10,11) Removed
No ratings yet
PythonFinal (8,9,10,11) Removed
8 pages
Project Prog
No ratings yet
Project Prog
6 pages
Ds Pract 2 Vedanti
No ratings yet
Ds Pract 2 Vedanti
7 pages
12 IP File Programs 6 To 17
No ratings yet
12 IP File Programs 6 To 17
9 pages
Practical File ANKIT RAJ CLASS 12-F
No ratings yet
Practical File ANKIT RAJ CLASS 12-F
48 pages
I037 - Manas Patel Experiment09
No ratings yet
I037 - Manas Patel Experiment09
9 pages
Assignment
No ratings yet
Assignment
2 pages
Create A Pandas Series From A Dictionary of Values and An Ndarray
No ratings yet
Create A Pandas Series From A Dictionary of Values and An Ndarray
15 pages
Lab2.2 Kritika
No ratings yet
Lab2.2 Kritika
10 pages
Data Preprocessing
No ratings yet
Data Preprocessing
5 pages
Fifth Class Hands On - Jupyter Notebook
No ratings yet
Fifth Class Hands On - Jupyter Notebook
11 pages
First 4
No ratings yet
First 4
11 pages
Solution
No ratings yet
Solution
8 pages
Info Practical
No ratings yet
Info Practical
56 pages
Data Frames Python
No ratings yet
Data Frames Python
16 pages
Dataframe in Pandas
No ratings yet
Dataframe in Pandas
23 pages
Lab Programs
No ratings yet
Lab Programs
53 pages
Practical Questions
No ratings yet
Practical Questions
7 pages
Assessment Test
No ratings yet
Assessment Test
22 pages
Ip 12
No ratings yet
Ip 12
5 pages
Samarth Raghav
No ratings yet
Samarth Raghav
15 pages
Document (4) - 1
No ratings yet
Document (4) - 1
15 pages
Data Science Practical 01
No ratings yet
Data Science Practical 01
12 pages
AI Practical 2025
No ratings yet
AI Practical 2025
14 pages
Practicals
No ratings yet
Practicals
11 pages
Data Wrangling 2
No ratings yet
Data Wrangling 2
4 pages
Ip Practical
No ratings yet
Ip Practical
23 pages
Group 10A - GA2
No ratings yet
Group 10A - GA2
10 pages
Ip-12-2023-24 Practical File
No ratings yet
Ip-12-2023-24 Practical File
19 pages
List of Practical Ip065 Xii Session 2025 CKC Academy
No ratings yet
List of Practical Ip065 Xii Session 2025 CKC Academy
19 pages
Panda Merged
No ratings yet
Panda Merged
19 pages
List of Practical Ip065 Xii Session 2025 CKC Academy
No ratings yet
List of Practical Ip065 Xii Session 2025 CKC Academy
19 pages
Xii Ip Practical File 24-25
No ratings yet
Xii Ip Practical File 24-25
111 pages
Week 3 GGG
No ratings yet
Week 3 GGG
17 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
4 June 2024
No ratings yet
4 June 2024
5 pages
Load
No ratings yet
Load
4 pages
Data Sci
No ratings yet
Data Sci
29 pages
Pandasmatplotlib Practical File
No ratings yet
Pandasmatplotlib Practical File
15 pages
Sgpa Cgpa
No ratings yet
Sgpa Cgpa
1 page
Himadri
No ratings yet
Himadri
6 pages
2 Data Wranglin 2 Acadamic P
No ratings yet
2 Data Wranglin 2 Acadamic P
12 pages
Dsbda Lab - 2.1 - 1736750718198
No ratings yet
Dsbda Lab - 2.1 - 1736750718198
9 pages
IBA Practical Set A 14th Dec
No ratings yet
IBA Practical Set A 14th Dec
3 pages
Answer Sheet Fiza
No ratings yet
Answer Sheet Fiza
6 pages
Practical Solutions
No ratings yet
Practical Solutions
6 pages
Vantika Kamra's Practical File 12 Diamond (26600872)
No ratings yet
Vantika Kamra's Practical File 12 Diamond (26600872)
46 pages
PDF&Rendition 1
No ratings yet
PDF&Rendition 1
47 pages
DAV Previous Year
No ratings yet
DAV Previous Year
7 pages
Payal - 2 - Practical (1) - Edited
No ratings yet
Payal - 2 - Practical (1) - Edited
9 pages
ML Lab Manual Final
No ratings yet
ML Lab Manual Final
36 pages
Assignment 2 - Jupyter Notebook
No ratings yet
Assignment 2 - Jupyter Notebook
8 pages
12 IP Unit 1 Python Pandas I (Part 3 Dataframes) Assignment
No ratings yet
12 IP Unit 1 Python Pandas I (Part 3 Dataframes) Assignment
2 pages
Iot Da1
No ratings yet
Iot Da1
16 pages
CS 3
No ratings yet
CS 3
28 pages
Zizi and The Germs
From Everand
Zizi and The Germs
Leanne Tarvin
No ratings yet
Final Nikhil Cover - Page - Certi.
No ratings yet
Final Nikhil Cover - Page - Certi.
10 pages
SAP Afaria System Requirements
No ratings yet
SAP Afaria System Requirements
38 pages
Whitepaper EngineeringDesignSimulationShapeOptimization OnshapeSimScaleESTECO
No ratings yet
Whitepaper EngineeringDesignSimulationShapeOptimization OnshapeSimScaleESTECO
17 pages
Lab 6 Introduction To Basic Interface
No ratings yet
Lab 6 Introduction To Basic Interface
7 pages
Ice Stone1
No ratings yet
Ice Stone1
38 pages
Auction of Dead Stock - Auction Notice of CT
No ratings yet
Auction of Dead Stock - Auction Notice of CT
1 page
Build A Simple Webservice With Delphi 2006 and Microsoft Server 2003 IIS 6.0
No ratings yet
Build A Simple Webservice With Delphi 2006 and Microsoft Server 2003 IIS 6.0
7 pages
Com - Upgadata.up7723 Logcat
No ratings yet
Com - Upgadata.up7723 Logcat
47 pages
RHB R6.2 Point Release PDF
No ratings yet
RHB R6.2 Point Release PDF
14 pages
Handover - Check List
No ratings yet
Handover - Check List
5 pages
Lecture 2 - Problem Solving Process
No ratings yet
Lecture 2 - Problem Solving Process
32 pages
Information Technology: Assignment 2
No ratings yet
Information Technology: Assignment 2
18 pages
G Suite Interview Questions
No ratings yet
G Suite Interview Questions
7 pages
There Are Four Basic Types of Satellites
100% (1)
There Are Four Basic Types of Satellites
18 pages
The Business of Intellectual Property A Literature Review of IP Management Research
No ratings yet
The Business of Intellectual Property A Literature Review of IP Management Research
20 pages
TADANO 80ton GR-800EX - Specification & Load Chart PDF
0% (1)
TADANO 80ton GR-800EX - Specification & Load Chart PDF
13 pages
BES - R Lab 7
No ratings yet
BES - R Lab 7
5 pages
Science Technology and Society Final Examination
100% (2)
Science Technology and Society Final Examination
9 pages
Cloud Computing Chapter3 2
0% (1)
Cloud Computing Chapter3 2
36 pages
DBMS File
No ratings yet
DBMS File
96 pages
Expt 6 - P-I-N and Avalanche Photodiode BER Performance Comparison
No ratings yet
Expt 6 - P-I-N and Avalanche Photodiode BER Performance Comparison
4 pages
Regulation of Streams in The Skopje Region With Measures For Regulation and Rehabilitation of The River Beds
No ratings yet
Regulation of Streams in The Skopje Region With Measures For Regulation and Rehabilitation of The River Beds
29 pages
LJ CG Unit 2
No ratings yet
LJ CG Unit 2
2 pages
Draft DGS Order As An Addendum To Order 28 of 2020 v3
No ratings yet
Draft DGS Order As An Addendum To Order 28 of 2020 v3
19 pages
TRAINEE's PROGRESS SHEET-TDNC2-JB - RAMOS
No ratings yet
TRAINEE's PROGRESS SHEET-TDNC2-JB - RAMOS
3 pages
Adaptive DFE Modeling Using IBIS v4. 2
No ratings yet
Adaptive DFE Modeling Using IBIS v4. 2
36 pages
Ks2 Mathematics 2001 Marking Scheme
No ratings yet
Ks2 Mathematics 2001 Marking Scheme
30 pages
VGS House Model - Estimate
No ratings yet
VGS House Model - Estimate
1 page

Session 11 Lecture 1

Uploaded by

Session 11 Lecture 1

Uploaded by

In [6]: 1 data =pd.read_csv('/content/SAMPLE_FOR_CLEANING.

ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

In [5]: 1 data['DATE OF EXAM']=pd.to_datetime(data['DATE OF EXAM'])

ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

In [ ]: 1 data['DATE OF EXAM'].apply(lambda x:pd.to_datetime(x).strftime('%m-%d-%y'))

Out[12]: ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

0 0901IT181001 AADITYA KHANTAL 25-05-2021 15.0 75.0

1 0901IT181002 ADITYA JOSHI 05-25-2021 21.0 NaN

2 0901IT181003 AJAY GARG 25-May-21 16.0 80.0

3 0901IT181004 AKASH KACHHAWAY 25-05-2021 17.0 85.0

4 0901IT181005 AKSHAT KOTHAVADE 25-05-2021 12.0 60.0

5 0901IT181006 ALAKH NIRANJAN THAKURIYA 05-25-2021 11.0 55.0

6 0901IT181007 ALOK KUMAR 05-25-2021 13.0 65.0

7 0901IT181008 AMAN DIXIT 25-05-2021 21.0 NaN

8 0901IT181009 AMIT BAMNIYA 25-05-2021 12.0 60.0

9 0901IT181010 ANKIT KUMAR 25-05-2021 12.5 62.5

10 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

11 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

In [19]: 1 import matplotlib.pyplot as plt

ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

Out[22]: ROLL. NO. STUDENT_NAME DATE OF EXAM MARKS PERCENTAGE

0 0901IT181001 AADITYA KHANTAL 25-05-2021 15.0 75.0

1 0901IT181002 ADITYA JOSHI 05-25-2021 12.0 60.0

2 0901IT181003 AJAY GARG 25-May-21 16.0 80.0

3 0901IT181004 AKASH KACHHAWAY 25-05-2021 17.0 85.0

4 0901IT181005 AKSHAT KOTHAVADE 25-05-2021 12.0 60.0

5 0901IT181006 ALAKH NIRANJAN THAKURIYA 05-25-2021 11.0 55.0

6 0901IT181007 ALOK KUMAR 05-25-2021 13.0 65.0

7 0901IT181008 AMAN DIXIT 25-05-2021 12.0 60.0

8 0901IT181009 AMIT BAMNIYA 25-05-2021 12.0 60.0

9 0901IT181010 ANKIT KUMAR 25-05-2021 12.5 62.5

10 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

11 0901IT181011 ANKIT RAJ TIRKEY 25-May-21 13.0 65.0

You might also like