0% found this document useful (0 votes)

28 views4 pages

Pandas Dataframe All Operations 1735471870

Sql and python

Uploaded by

Rupadevi Baskar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

28 views4 pages

Pandas Dataframe All Operations 1735471870

Sql and python

Uploaded by

Rupadevi Baskar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Detailed Document on Pandas DataFrame Operations

Introduction to Pandas DataFrame #

Pandas is a powerful Python library for data analysis and manipulation. A DataFrame is a two-dimensional,
size-mutable, and heterogeneous data structure, similar to a table in a relational database or an Excel
spreadsheet.

Creating a DataFrame #
import pandas as pd

# Creating a DataFrame from a dictionary

data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'Salary': [50000, 60000, 70000]
}

df = pd.DataFrame(data)
print(df)

Basic Operations #

1. Viewing Data #

head(n): View the first n rows (default: 5).

tail(n): View the last n rows (default: 5).
info(): Summary of the DataFrame.
describe(): Statistical summary of numerical columns.
print(df.head(2))
print(df.tail(2))
print(df.info())
print(df.describe())

2. Accessing Data #

Column selection: df['column_name'] or df.column_name

Row selection: df.loc[index] (label-based) or df.iloc[index] (integer-based)
# Accessing a column
print(df['Name'])

# Accessing a row by label

print(df.loc[1])

# Accessing a row by index

print(df.iloc[1])

Data Manipulation #

1. Adding Columns #

df['Department'] = ['HR', 'Finance', 'IT']

print(df)
codeInSpark.com
2. Dropping Columns or Rows #

drop(): Remove specific rows or columns.

# Dropping a column
df = df.drop('Department', axis=1)

# Dropping a row
df = df.drop(1, axis=0)

3. Renaming Columns #

df.rename(columns={'Name': 'Employee Name'}, inplace=True)

print(df)

4. Filtering Data #

# Filter rows where Age > 28

filtered_df = df[df['Age'] > 28]
print(filtered_df)

5. Sorting Data #

# Sort by Age
sorted_df = df.sort_values(by='Age', ascending=True)
print(sorted_df)

Aggregation and Grouping #

1. Aggregation Functions #

sum(), mean(), min(), max(), etc.

print(df['Salary'].sum())
print(df['Age'].mean())

2. Grouping Data #

grouped = df.groupby('Department').mean()
print(grouped)

Handling Missing Data #

1. Detecting Missing Values #

isnull(): Check for missing values.

notnull(): Check for non-missing values.

print(df.isnull())

2. Filling Missing Values #

# Fill missing values with a specific value

df['Age'] = df['Age'].fillna(30)

3. Dropping Missing Values #

codeInSpark.com
# Drop rows with missing values
df = df.dropna()

Merging, Joining, and Concatenation #

1. Merging #

data2 = {
'Name': ['Alice', 'Bob'],
'City': ['New York', 'Los Angeles']
}
df2 = pd.DataFrame(data2)
merged_df = pd.merge(df, df2, on='Name')
print(merged_df)

2. Concatenation #

concat_df = pd.concat([df, df2], axis=0)

print(concat_df)

3. Joining #

joined_df = df.set_index('Name').join(df2.set_index('Name'))
print(joined_df)

Advanced Operations #

1. Applying Functions #

# Apply a lambda function to a column

df['Double Salary'] = df['Salary'].apply(lambda x: x * 2)
print(df)

2. Pivot Tables #

pivot = df.pivot_table(values='Salary', index='Department', aggfunc='mean')

print(pivot)

3. Working with Dates #

df['Hire Date'] = pd.to_datetime(['2020-01-01', '2019-05-20', '2021-07-15'])

print(df)
print(df['Hire Date'].dt.year)

Saving and Loading Data #

1. Saving to a File #

# Save to CSV
df.to_csv('data.csv', index=False)

# Save to Excel
df.to_excel('data.xlsx', index=False)

2. Loading from a File #

codeInSpark.com
# Load from CSV
new_df = pd.read_csv('data.csv')

# Load from Excel

new_df = pd.read_excel('data.xlsx')

Conclusion #
Pandas DataFrame provides a versatile and efficient way to handle and analyze structured data. Mastering
these operations will significantly enhance your data analysis workflow.

codeInSpark.com

EDA Cheat Sheet
No ratings yet
EDA Cheat Sheet
7 pages
Municipality of Guiguinto Comprehensive Develeopment Plan CDP 2022 2027
100% (1)
Municipality of Guiguinto Comprehensive Develeopment Plan CDP 2022 2027
95 pages
Python Interviews
No ratings yet
Python Interviews
154 pages
Pyspark Cheatsheet
No ratings yet
Pyspark Cheatsheet
21 pages
Xii Record (Dataframe & CSV)
No ratings yet
Xii Record (Dataframe & CSV)
11 pages
Python Pandas-Data Frames
No ratings yet
Python Pandas-Data Frames
41 pages
Intro Pandas
No ratings yet
Intro Pandas
18 pages
Pandas Fuction Notes
No ratings yet
Pandas Fuction Notes
3 pages
Set 1
No ratings yet
Set 1
16 pages
12 Pandas
100% (1)
12 Pandas
21 pages
Dataframe in Pandas - Cheatsheet
No ratings yet
Dataframe in Pandas - Cheatsheet
8 pages
Pandas Introduction: What Is Python Pandas Used For?
No ratings yet
Pandas Introduction: What Is Python Pandas Used For?
28 pages
Data Analysis With Python
No ratings yet
Data Analysis With Python
60 pages
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
No ratings yet
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
7 pages
Unit 4 Pandas
No ratings yet
Unit 4 Pandas
8 pages
Dataframing in CSV
No ratings yet
Dataframing in CSV
14 pages
Pandas Handbook
No ratings yet
Pandas Handbook
33 pages
Pandas Moderate
No ratings yet
Pandas Moderate
15 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
9 pages
Exp3 Python
No ratings yet
Exp3 Python
15 pages
Data Handling Using Pandas-1
No ratings yet
Data Handling Using Pandas-1
60 pages
IP 12th Chapter 3
No ratings yet
IP 12th Chapter 3
9 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Pandas
No ratings yet
Pandas
26 pages
3Y3Z2Xzqn7 U Y%K : 2. How To Create A Data Frame Using A Dictionary of Pre-Existing Columns or Numpy 2D Arrays?
No ratings yet
3Y3Z2Xzqn7 U Y%K : 2. How To Create A Data Frame Using A Dictionary of Pre-Existing Columns or Numpy 2D Arrays?
8 pages
Pandas Notes
No ratings yet
Pandas Notes
4 pages
Pandas Commands
No ratings yet
Pandas Commands
3 pages
Pandas - Digitalocean
No ratings yet
Pandas - Digitalocean
15 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
Lab 9
No ratings yet
Lab 9
9 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
5 pages
Chapter Notes - Data Handling Using Pandas DataFrame
No ratings yet
Chapter Notes - Data Handling Using Pandas DataFrame
16 pages
Introduction To Pandas Programming 2
No ratings yet
Introduction To Pandas Programming 2
3 pages
Pandas
No ratings yet
Pandas
13 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
17 pages
Pandas
No ratings yet
Pandas
94 pages
Panda Cheatsheet
No ratings yet
Panda Cheatsheet
17 pages
Python Data Science 101
100% (1)
Python Data Science 101
41 pages
Introduction To Pandas in Data Analytics
No ratings yet
Introduction To Pandas in Data Analytics
12 pages
Introduction To Pandas
No ratings yet
Introduction To Pandas
27 pages
Python-for-Data-Analysis (Pandas
No ratings yet
Python-for-Data-Analysis (Pandas
31 pages
DataFrame Ac Win Final
No ratings yet
DataFrame Ac Win Final
30 pages
Ainotes Dataframe
No ratings yet
Ainotes Dataframe
5 pages
DevOps Session 3 Pandas
No ratings yet
DevOps Session 3 Pandas
33 pages
S8 - End-of-Unit 1 Test
100% (1)
S8 - End-of-Unit 1 Test
2 pages
What Is Pandas
No ratings yet
What Is Pandas
9 pages
Data Handling Module
No ratings yet
Data Handling Module
10 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Pandas Basics Guide
No ratings yet
Pandas Basics Guide
4 pages
Pandas Merged
No ratings yet
Pandas Merged
2 pages
Pandas CheatSheet
No ratings yet
Pandas CheatSheet
18 pages
Ainotes
No ratings yet
Ainotes
5 pages
Content Pandas Cheat Sheet
No ratings yet
Content Pandas Cheat Sheet
9 pages
Pandas
No ratings yet
Pandas
13 pages
Data Analysis CheatSheet
No ratings yet
Data Analysis CheatSheet
2 pages
EDA With Pandas
No ratings yet
EDA With Pandas
8 pages
Important Pandas Operations 1697910759
No ratings yet
Important Pandas Operations 1697910759
6 pages
Pandas
No ratings yet
Pandas
4 pages
Pandas
No ratings yet
Pandas
5 pages
Dependent Personality Inventory-Revised (DPI-R) - Incorporating A
No ratings yet
Dependent Personality Inventory-Revised (DPI-R) - Incorporating A
85 pages
Chapter 1 Introduction To Well Planning
No ratings yet
Chapter 1 Introduction To Well Planning
6 pages
Chemicals Zetag DATA Beads Magnafloc 156 - 0410
No ratings yet
Chemicals Zetag DATA Beads Magnafloc 156 - 0410
2 pages
Chapter 6 - : The Stability of Linear Feedback Systems
No ratings yet
Chapter 6 - : The Stability of Linear Feedback Systems
19 pages
05 - Magnetism and Matter
No ratings yet
05 - Magnetism and Matter
5 pages
AUBO I5 USER MANUAL V4.3.1 USA PDF
No ratings yet
AUBO I5 USER MANUAL V4.3.1 USA PDF
171 pages
Reproductive System
No ratings yet
Reproductive System
8 pages
Subsea Field Architecture Types - Evaluation & Comparison Made Easy in SFACE - SFACE
No ratings yet
Subsea Field Architecture Types - Evaluation & Comparison Made Easy in SFACE - SFACE
7 pages
Piping Engineering - Knowledge Base: I. Dyke Wall Height Calculation
No ratings yet
Piping Engineering - Knowledge Base: I. Dyke Wall Height Calculation
3 pages
Modeling With Data Grade 4 Lesson Plan Pop Cycle 2
No ratings yet
Modeling With Data Grade 4 Lesson Plan Pop Cycle 2
4 pages
Course Syllabus and Schedule Rubric
No ratings yet
Course Syllabus and Schedule Rubric
2 pages
22PAM0062 - INTERMEDIATE ACADEMIC ENGLISH - Part8
No ratings yet
22PAM0062 - INTERMEDIATE ACADEMIC ENGLISH - Part8
20 pages
Sample Research
No ratings yet
Sample Research
41 pages
Publications Frosch
No ratings yet
Publications Frosch
7 pages
Improving Speaking Skill by Using Game
No ratings yet
Improving Speaking Skill by Using Game
129 pages
International Journal of Food Science - 2023 - Amaiach - Microbiological Profile and Hygienic Quality of Foodstuffs
No ratings yet
International Journal of Food Science - 2023 - Amaiach - Microbiological Profile and Hygienic Quality of Foodstuffs
13 pages
Formal Lab Report Format and Checklist
No ratings yet
Formal Lab Report Format and Checklist
1 page
Contoh Time Schedule Starting Project MBLE - KBU
No ratings yet
Contoh Time Schedule Starting Project MBLE - KBU
1 page
Grade 10 Physics Mid Exam
No ratings yet
Grade 10 Physics Mid Exam
5 pages
What Is Internet Banking
No ratings yet
What Is Internet Banking
13 pages
Interview Questions
No ratings yet
Interview Questions
76 pages
G12 DR Geography
No ratings yet
G12 DR Geography
216 pages
Types of Brakes: Adhesive Brake
No ratings yet
Types of Brakes: Adhesive Brake
10 pages
Musical Notation
No ratings yet
Musical Notation
4 pages
The Analysis of A Framed Building With Shear Walls Subjected To Horizontal and Vertical Load Is Essentially A Three
No ratings yet
The Analysis of A Framed Building With Shear Walls Subjected To Horizontal and Vertical Load Is Essentially A Three
5 pages
Project Ligtas Mag Aaral
No ratings yet
Project Ligtas Mag Aaral
4 pages
MMW Requirement Basic Statistics-.
No ratings yet
MMW Requirement Basic Statistics-.
16 pages
Wind Energy Development in The Caribbean
No ratings yet
Wind Energy Development in The Caribbean
6 pages
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet

Pandas Dataframe All Operations 1735471870

Uploaded by

Pandas Dataframe All Operations 1735471870

Uploaded by

Detailed Document on Pandas DataFrame Operations

Introduction to Pandas DataFrame #

# Creating a DataFrame from a dictionary

head(n): View the first n rows (default: 5).

Column selection: df['column_name'] or df.column_name

# Accessing a row by label

# Accessing a row by index

df['Department'] = ['HR', 'Finance', 'IT']

drop(): Remove specific rows or columns.

df.rename(columns={'Name': 'Employee Name'}, inplace=True)

# Filter rows where Age > 28

Aggregation and Grouping #

sum(), mean(), min(), max(), etc.

Handling Missing Data #

1. Detecting Missing Values #

isnull(): Check for missing values.

2. Filling Missing Values #

# Fill missing values with a specific value

3. Dropping Missing Values #

Merging, Joining, and Concatenation #

concat_df = pd.concat([df, df2], axis=0)

# Apply a lambda function to a column

pivot = df.pivot_table(values='Salary', index='Department', aggfunc='mean')

3. Working with Dates #

df['Hire Date'] = pd.to_datetime(['2020-01-01', '2019-05-20', '2021-07-15'])

Saving and Loading Data #

2. Loading from a File #

# Load from Excel

You might also like