0% found this document useful (0 votes)

12 views11 pages

Getting Start With Pandas

The document provides an introduction to Pandas, a data manipulation library in Python, detailing its primary data structures: Series and DataFrame. It covers creating Series and DataFrames, data manipulation techniques such as filtering, sorting, and grouping, as well as handling missing data, merging DataFrames, and performing descriptive statistics. Additionally, it includes examples of reading from and writing to various file formats and string manipulation methods.

Uploaded by

abhinav.mishra

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views11 pages

Getting Start With Pandas

Uploaded by

abhinav.mishra

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 11

UNIVERSITY OF STEEL TECHNOLOGY

AND MANAGEMENT

Introduction to Data Science and

Data Analytics
Presented by:

Dr. Ravindra Singh Saluja

OP Jindal University, Raigarh

UNIVERSITY OF STEEL TECHNOLOGYAND MANAGEMENT
Introduction to Pandas

• Pandas is primarily used for working

with structured data. It provides two
main data structures:
• Series: One-dimensional labeled array
capable of holding any data type.
• DataFrame: Two-dimensional labeled
data structure with columns of
potentially different types.

2
Creating a series
• From a List:
import pandas as pd
data = [10, 20, 30, 40, 50]
series = pd.Series(data)
print(series)
• From a Dictionary:
import pandas as pd
data = {"a": 1, "b": 2, "c": 3}
series = pd.Series(data)
print(series)
• With Custom Index:
import pandas as pd
data = [10, 20, 30, 40, 50]
series = pd.Series(data, index=["a", "b", "c", "d", "e"])
print(series)
3
Creating a DataFrame

import pandas as pd

# Creating a DataFrame from a dictionary

data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)

4
Data Manipulation
Pandas provides a wide range of methods to manipulate data, such as filtering, sorting,
and grouping.
•Filtering: Select rows based on conditions.
# Filtering rows where Age is greater than 28
filtered_df = df[df['Age'] > 28]
print(filtered_df)

• Sorting: Sort the DataFrame by a specific column.

# Sorting by Age in descending order
sorted_df = df.sort_values(by='Age', ascending=False)
print(sorted_df)
• Grouping: Group data and perform aggregate functions.
# Grouping by City and calculating the mean age
grouped_df = df.groupby('City')['Age'].mean()
print(grouped_df)
Handling Missing Data

Pandas makes it easy to handle missing data with methods like fillna() and dropna().
# Filling missing values with a default value
df.fillna(0, inplace=True)

# Dropping rows with any missing values

df.dropna(inplace=True)
Merging and Joining
DataFrames

# Merging two DataFrames on a common column

df1 = pd.DataFrame({'ID': [1, 2, 3], 'Name': ['Alice', 'Bob', 'Charlie']})
df2 = pd.DataFrame({'ID': [1, 2, 4], 'Age': [25, 30, 40]})

merged_df = pd.merge(df1, df2, on='ID', how='inner')

print(merged_df)
Reading and Writing Data

You can read from and write to various file formats like CSV, Excel, and SQL databases.
# Reading from a CSV file
df = pd.read_csv('data.csv')

# Writing to a CSV file

df.to_csv('output.csv', index=False)
String Manipulation

df['Name'] = df['Name'].str.upper() # Convert names to uppercase

df['Name_Length'] = df['Name'].str.len() # Find length of names
df['Name'] = df['Name'].str.replace('A', '@') # Replace 'A' with '@'

9
Descriptive Statistics

• Basic Statistical Measures:

# Creating a sample DataFrame
data = {'A': [1, 2, 3, 4, 5], 'B': [5, 10, 15, 20,
25]}
df = pd.DataFrame(data)
# Descriptive statistics
print(df.describe())

10
• Calculating Specific Statistics:
# Mean
mean = df['A'].mean()
print('Mean:', mean)

# Standard Deviation
std = df['A'].std()
print('Standard Deviation:', std)

# Correlation
correlation = df.corr()
print('Correlation:\n', correlation)

Pandas Course Slides
No ratings yet
Pandas Course Slides
90 pages
EDA Unit2
No ratings yet
EDA Unit2
99 pages
Python Notes by Prof T
No ratings yet
Python Notes by Prof T
10 pages
Practical Guide To Pandas For Data Science
100% (1)
Practical Guide To Pandas For Data Science
26 pages
Accenture Offer Letter Validation
No ratings yet
Accenture Offer Letter Validation
18 pages
Pandas Basics For Data Science
No ratings yet
Pandas Basics For Data Science
2 pages
Uk
100% (1)
Uk
12 pages
DaVinci Resolve 19 488 610
No ratings yet
DaVinci Resolve 19 488 610
123 pages
Pandas
No ratings yet
Pandas
20 pages
FDS Notes Unit-4
No ratings yet
FDS Notes Unit-4
30 pages
Python Learn 05 Dictionaries
No ratings yet
Python Learn 05 Dictionaries
9 pages
Numerical Similarity Measures Versus Jaccard For Collaborative Filtering
No ratings yet
Numerical Similarity Measures Versus Jaccard For Collaborative Filtering
14 pages
Introduction To Data Science and Data Analytics: OP Jindal University, Raigarh
No ratings yet
Introduction To Data Science and Data Analytics: OP Jindal University, Raigarh
6 pages
Food Delivery Truck Inspection Form2016
100% (1)
Food Delivery Truck Inspection Form2016
2 pages
Lifeboat Seat Belt Requirements
No ratings yet
Lifeboat Seat Belt Requirements
9 pages
Petitioners Respondents
No ratings yet
Petitioners Respondents
9 pages
Session2-DM Using Pandas
No ratings yet
Session2-DM Using Pandas
51 pages
Python Unit 4&5 Que
No ratings yet
Python Unit 4&5 Que
33 pages
SL 1015
No ratings yet
SL 1015
1 page
Pandas
No ratings yet
Pandas
63 pages
3) Sieve Analysis Test
100% (1)
3) Sieve Analysis Test
2 pages
Python Learn 06 Tuples
No ratings yet
Python Learn 06 Tuples
9 pages
Mobile1 PDF
No ratings yet
Mobile1 PDF
2 pages
FINAL Wireline Operators
No ratings yet
FINAL Wireline Operators
2 pages
How To Get Started As An Online English Teacher
No ratings yet
How To Get Started As An Online English Teacher
2 pages
RESUME - Payam Rahrow
No ratings yet
RESUME - Payam Rahrow
2 pages
Python 2.1.2
No ratings yet
Python 2.1.2
7 pages
Lab 1 ML Lab
No ratings yet
Lab 1 ML Lab
15 pages
U1A 1B Linear Relations
No ratings yet
U1A 1B Linear Relations
48 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
7 pages
Pandas Presentation
No ratings yet
Pandas Presentation
10 pages
Python Programming For Data Science
No ratings yet
Python Programming For Data Science
36 pages
Data Handling Using Pandas-1
No ratings yet
Data Handling Using Pandas-1
60 pages
Financial Statement Analysis: Abid Hussain
No ratings yet
Financial Statement Analysis: Abid Hussain
14 pages
Python & MySQL For Data Analysis
No ratings yet
Python & MySQL For Data Analysis
45 pages
Environmental Laws Chapter 3 1
No ratings yet
Environmental Laws Chapter 3 1
4 pages
Unit 4 Pandas
No ratings yet
Unit 4 Pandas
8 pages
Dilip PP
No ratings yet
Dilip PP
9 pages
Samsung Gt-m5650 Lindy Service Manual
No ratings yet
Samsung Gt-m5650 Lindy Service Manual
79 pages
Python Data Science 101
100% (1)
Python Data Science 101
41 pages
JOINS
No ratings yet
JOINS
10 pages
04-Data Manipulation With Pandas
No ratings yet
04-Data Manipulation With Pandas
28 pages
Unit 4
No ratings yet
Unit 4
27 pages
Binder 1
No ratings yet
Binder 1
12 pages
L32, 33 Pandas
No ratings yet
L32, 33 Pandas
7 pages
HPC Lectures 1 5
No ratings yet
HPC Lectures 1 5
18 pages
UNIT II Notes
No ratings yet
UNIT II Notes
23 pages
Pandas
No ratings yet
Pandas
13 pages
Pandas
No ratings yet
Pandas
7 pages
Lab 9
No ratings yet
Lab 9
9 pages
Pandas - Digitalocean
No ratings yet
Pandas - Digitalocean
15 pages
Pandas Introduction: What Is Python Pandas Used For?
No ratings yet
Pandas Introduction: What Is Python Pandas Used For?
28 pages
Pandas
No ratings yet
Pandas
94 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
NumPy and Pandas Tutorial
No ratings yet
NumPy and Pandas Tutorial
8 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
9 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Pandas
No ratings yet
Pandas
12 pages
RA No 11232 Revised Corporation Code of The Philippines Sec 115 To Sec 132
No ratings yet
RA No 11232 Revised Corporation Code of The Philippines Sec 115 To Sec 132
4 pages
347 862932 Introduction
No ratings yet
347 862932 Introduction
35 pages
IP 12th Chapter 3
No ratings yet
IP 12th Chapter 3
9 pages
347 862840 PureSubstanceAP
No ratings yet
347 862840 PureSubstanceAP
31 pages
Data Handling Module
No ratings yet
Data Handling Module
10 pages
Loki Temp PPT Pandas 2
No ratings yet
Loki Temp PPT Pandas 2
31 pages
Heather Jennings Resume
No ratings yet
Heather Jennings Resume
1 page
Pandas
No ratings yet
Pandas
26 pages
Exp3 Python
No ratings yet
Exp3 Python
15 pages
Assignment 1 - Unitii
No ratings yet
Assignment 1 - Unitii
2 pages
The Pandas Library
No ratings yet
The Pandas Library
39 pages
Unit 3
No ratings yet
Unit 3
10 pages
Sample DLP 2024
No ratings yet
Sample DLP 2024
3 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
Unit 4
No ratings yet
Unit 4
36 pages
Pandas For Data Science
No ratings yet
Pandas For Data Science
42 pages
Introduction To Pandas in Data Analytics
No ratings yet
Introduction To Pandas in Data Analytics
12 pages
Datasheet Freecom Dual Drive Network Center en
No ratings yet
Datasheet Freecom Dual Drive Network Center en
2 pages
Pandas
No ratings yet
Pandas
13 pages
Financial Admission Requirements For Undergraduate International Students at Auburn University Academic Year 2016
No ratings yet
Financial Admission Requirements For Undergraduate International Students at Auburn University Academic Year 2016
2 pages
MEP Myanmar
No ratings yet
MEP Myanmar
27 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
12 pages
Pak ST Final Paper
No ratings yet
Pak ST Final Paper
7 pages
Lab-3 Pandas Library
No ratings yet
Lab-3 Pandas Library
14 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Pandas
No ratings yet
Pandas
4 pages
Pandas
No ratings yet
Pandas
27 pages
Introduction To Pandas For Data Analysis
No ratings yet
Introduction To Pandas For Data Analysis
6 pages
Data Wrangling With Python and Pandas
No ratings yet
Data Wrangling With Python and Pandas
7 pages
What Is Pandas
No ratings yet
What Is Pandas
9 pages
Aesv
No ratings yet
Aesv
32 pages
Pandas Handbook
No ratings yet
Pandas Handbook
33 pages
PThread API Reference
No ratings yet
PThread API Reference
348 pages
Pandas Merged
No ratings yet
Pandas Merged
2 pages
Case Study: How Neuroscience Transformed Business: The TCS Story
No ratings yet
Case Study: How Neuroscience Transformed Business: The TCS Story
6 pages
Pandas
No ratings yet
Pandas
5 pages
Stivuitor Electric 4 Tone - Diagrama 4 Tone
No ratings yet
Stivuitor Electric 4 Tone - Diagrama 4 Tone
2 pages
How To Solve The Rubik's Cube
No ratings yet
How To Solve The Rubik's Cube
23 pages

Getting Start With Pandas

Uploaded by

Getting Start With Pandas

Uploaded by

UNIVERSITY OF STEEL TECHNOLOGY

Introduction to Data Science and

Dr. Ravindra Singh Saluja

OP Jindal University, Raigarh

• Pandas is primarily used for working

# Creating a DataFrame from a dictionary

• Sorting: Sort the DataFrame by a specific column.

# Dropping rows with any missing values

# Merging two DataFrames on a common column

merged_df = pd.merge(df1, df2, on='ID', how='inner')

# Writing to a CSV file

df['Name'] = df['Name'].str.upper() # Convert names to uppercase

• Basic Statistical Measures:

You might also like