100% found this document useful (2 votes)

2K views63 pages

On Data Handling Using Pandas-I

This document provides an overview of Pandas, a popular Python library for data analysis and manipulation. It discusses Pandas Series and DataFrames, the two primary data structures in Pandas. Series are one-dimensional arrays that can hold any data type, while DataFrames are two-dimensional structures consisting of rows and columns that can store heterogeneous data types. The document describes how to create, access, and manipulate Series and DataFrames, including indexing, slicing, selection, iteration, joining, and importing/exporting data to and from CSV files. Key Pandas functions covered include read_csv(), to_csv(), head(), tail(), loc, iloc, and merge.

Uploaded by

anagha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

100% found this document useful (2 votes)

2K views63 pages

On Data Handling Using Pandas-I

Uploaded by

anagha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 63

INFORMATICS PRACTICES

Code No-065
CLASS-XII
2020-2021

ARYA K S PGT(IP)
Blue Print:
Unit Unit Name Marks
No

1 Data Handling using Pandas and Data 30

Visualization

2 Database Query using SQL 25

3 Introduction to Computer Networks 7

4 Societal Impacts 8

Practical 30

Total 100
Unit 1
Data Handling using Pandas and Data
Visualization

(Data Handling using Pandas –I)

Module: Module is a file which contains python functions. It is
.py file which has python executable code or statements.
Package: Package is namespace which contains multiple
packages or modules. It is a directory which contains a special
file __init__.py.
__init__.py file denotes Python the file that contains __init__.py
as package.
Library: It is collection of various packages. There is no
difference between package and python library conceptually.

Framework: It is a collection of various libraries which architects

the code flow.
Pandas:
Pandas is the most popular open source python library used for
data analysis.
We can analyze the data in pandas in two ways-
● Series
● Dataframes
Installation of pandas:

pip install pandas

Series:
Series is 1-Dimensional array defined in python pandas to store
any data type.

Syntax:

<Series Name>=<pd>.Series(<list name>, ...)

Example:
5 15 16 4 34

Properties of Series:
• Series will contain homogeneous data type.
• Size of the series immutable
• Values in the series are mutable.
Creation of Series:
We can create a pandas series in following ways-

● From arrays
● From Lists
● From Dictionaries
● From scalar value
From Lists :

Output:
From arrays :

Output:
From Dictionary:

Output:
From Scalar Value:

Output:
Mathematical Operations on Series:
Mathematical Operations on Series (cont…):

Output:
Head and Tail functions on Series:
head and tail functions returns first and last n rows respectively.
Syntax:
<Series name>.head(n)
<Series name>.tail(n)
n-number of rows
Default value of n is 5
Selection, Indexing and Slicing on Series:
Selection: We can select a value from the series by using its
corresponding index.
Syntax:
<Series name>[<index number>]

Output:
Indexing:
Series.index attribute is used to get or set the index labels for the
given series.

Syntax:
<Series name>.index
Indexing (cont...):

Output:
Slicing:
Slicing operation on the series split the series based on the given
parameters.
Syntax:
<Series name>[<start>:<stop>:<step>]
Note: start,stop,step are optional
Default values: start=0, stop=n-1, step=1
Note: slicing will take default index
Data Frames
Data Frames:
Data Frames is a two-dimensional(2-D) data structure defined in
pandas which consist of rows and columns.
Data Frames stores an ordered collection of columns that can
store data of different types.

Example:
S.No. Name Age Marks

1 Ravi 25 99

2 Kunal 26 98
Characteristics of Data Frames:
➢ It has two indices (two axes)
○ Row index (axis=0) ->known as index
○ Column index (axis=1) ->known as column-name
➢ Value in the Data Frame will be identifiable by the
combination of row index and column index.
➢ Indices can be of any type
➢ Column can have data of different types.
➢ Value is mutable
➢ Size is mutable
Creation of Data Frames:
Syntax:
<Data Frame Name>=
pandas.DataFrame(
<2D data structure>,
<columns=<column sequence>,
<index=<index sequence>,............)
We can create Data Frame in many ways, such as-
(i) Two dimensional dictionaries
(ii) Two dimensional ndarrays(NumPy arrays)
(iii) Series type object
(iv) Another Dataframe object
(v) Text/CSV files
Creating Data frame from List:

Output:
Creating Data frame from array:

Output:
Creating Data frame from Series:

Output:
Creating Data frame from another Data frame:

Output:
(i) Two dimensional dictionaries
We can create Dataframe from Two dimensional dictionaries-

➢ Creating Dataframe from list of dictionaries

➢ Creating Dataframe from dictionary of Series

Creating Dataframe from list of dictionaries:

Output:
Creating Data frame from dictionary of Series:

Output:
(v) Text/CSV files:
We can Create Dataframe from Text/CSV Files by using
read_csv() function.
Syntax:
<data frame name>
=pandas.read_csv(filepath_or_buffer, sep=',',
delimiter=None, header='infer', names=None,
index_col=None, usecols=None, …)
(v) Text/CSV files (cont..):

Output:
Accessing values in dataframe:
Accessing a particular value:
<Data frame name>[<column name>][<index>]

Accessing a group of values:

<Data frame name>.loc[<index>],[<column name>]
Accessing values in dataframe (cont…):

Output:
NaN variable in Python:
NaN , standing for not a number, is a numeric data type used to
represent any value that is undefined or unpresentable. For
example, 0/0 is undefined as a real number and is, therefore,
represented by NaN.
Iteration on Dataframes:

In Pandas Dataframe we can iterate an element in two ways:

● Iterating over rows

● Iterating over columns
Iterating over rows :

To iterate over the rows of the DataFrame, we can use the

following functions −
● iterrows() − iterate over the rows as (index,series) pairs
● iteritems() − to iterate over the (key,value) pairs
● itertuples() − iterate over the rows as namedtuples
iterrows():

Output:
iteritems():

Output:
itertuples():

Output:
Iterating over Columns :In order to iterate over columns, we
need to create a list of dataframe columns and then iterating
through that list to pull out the data frame columns.
Operations on rows and columns:

● Add

● Select

● Delete

● Rename
Column selection:

Output:
Column addition:

Output:
Column Deletion:

Output:
Column Rename:

Output:
Row selection:

Output:
Row Addition:

Output:
Row Deletion:

Output:
Row Rename:

Output:
Head and Tail functions in Data Frames:

head(n):
Returns the first n rows.
tail(n):
Returns last n rows.
Default value for n is 5
Indexing using Labels in Data Frames: We can make one of
the columns as row index label for the data frame by using the
function set_index().

Output:
Boolean indexing in Data Frames: Boolean indexing helps us
to select the data from the Data Frames using a boolean vector.
Joining, Merging and Concatenation on Data Frames:
Merge:
pandas.merge() method is used for merging two data frames.
It will have three arguments.
● Data frame names
● how - how will take any of the three values i.e., left,right or
inner
● on - on the common column name
Merge (cont..):
Join:The join method uses the index of the dataframes.
Use <dataframe 1>.join(<dataframe 2>) to join
Concatenation:Concatenate uses pandas.concat(<List of data
frames>).
Importing/Exporting Data between CSV files and Data
Frames:
Import data from CSV file to Data Frame:We can import data
from CSV File to Data Frame by using read_csv() function.

Output:
Export data from Data Frame to CSV File:We can export data
from Data Frame to CSV File by using to_csv() function.
Syntax:
<data frame name>.to_csv(<File Path>,.....)
Thank you

Data Visualization and Data Handling Using Pandas CLASS 12 - Aashi Nagiya
No ratings yet
Data Visualization and Data Handling Using Pandas CLASS 12 - Aashi Nagiya
19 pages
AI Practical File Part 1
100% (1)
AI Practical File Part 1
9 pages
KVS PB I CS 202425 QPS
No ratings yet
KVS PB I CS 202425 QPS
53 pages
SQL Practical File
100% (1)
SQL Practical File
9 pages
Class 11 Asseration Reason Informatics Practices CHP 7 (2024-25)
No ratings yet
Class 11 Asseration Reason Informatics Practices CHP 7 (2024-25)
26 pages
Hitech HMI Communication With PLC (HmiVietNam - Com)
No ratings yet
Hitech HMI Communication With PLC (HmiVietNam - Com)
109 pages
843 Class 12 Question Bank Artificial Intelligence Chap-1 (2024-25)
No ratings yet
843 Class 12 Question Bank Artificial Intelligence Chap-1 (2024-25)
27 pages
Informatics Practices CBSE Project File Class 12
0% (1)
Informatics Practices CBSE Project File Class 12
40 pages
Worksheet 12 - Only Qs - (Aggregate Functions) Group BY
100% (1)
Worksheet 12 - Only Qs - (Aggregate Functions) Group BY
5 pages
X-AI Practical File-2 (2024)
No ratings yet
X-AI Practical File-2 (2024)
17 pages
Ip Practical File
No ratings yet
Ip Practical File
20 pages
Series Worksheet1 3
No ratings yet
Series Worksheet1 3
10 pages
Python Program To Implement Stack Operations
100% (2)
Python Program To Implement Stack Operations
4 pages
Apractical File Informatics Practices Class 12 For 2022-23 No WM
No ratings yet
Apractical File Informatics Practices Class 12 For 2022-23 No WM
27 pages
Xii-Ip PPT 2020-21
0% (1)
Xii-Ip PPT 2020-21
7 pages
IP - Pandas 1 & 2 (Worksheet) Class 12
No ratings yet
IP - Pandas 1 & 2 (Worksheet) Class 12
16 pages
Xiiip Practical 2023-24 - Final
0% (1)
Xiiip Practical 2023-24 - Final
38 pages
Worksheet Dataframes Solved-23
No ratings yet
Worksheet Dataframes Solved-23
6 pages
XII IP Practical File - 2023-24upto June
No ratings yet
XII IP Practical File - 2023-24upto June
6 pages
Stack Class XII
100% (1)
Stack Class XII
16 pages
Important Questions On Stack
100% (1)
Important Questions On Stack
4 pages
Dataframe Practical
No ratings yet
Dataframe Practical
14 pages
Final Practical File 2022-23
No ratings yet
Final Practical File 2022-23
87 pages
Ip Practice Questions Class 12
No ratings yet
Ip Practice Questions Class 12
5 pages
Lesson Plan Ip Xii (October-2023)
No ratings yet
Lesson Plan Ip Xii (October-2023)
3 pages
Series Programs
No ratings yet
Series Programs
4 pages
Computer Science Class 12 - SQL
No ratings yet
Computer Science Class 12 - SQL
31 pages
Pandas Questions Ip File
No ratings yet
Pandas Questions Ip File
13 pages
Grade 12 - Data Handling Using Pandas 1-Worksheet 3
No ratings yet
Grade 12 - Data Handling Using Pandas 1-Worksheet 3
2 pages
Practical File Artificial Intelligence Class 10 For 2023-24
No ratings yet
Practical File Artificial Intelligence Class 10 For 2023-24
27 pages
Worksheet On Data Visualization Using Pyplot
No ratings yet
Worksheet On Data Visualization Using Pyplot
2 pages
CS-12-Strings in Python
No ratings yet
CS-12-Strings in Python
18 pages
Worksheet-1 (Python)
No ratings yet
Worksheet-1 (Python)
9 pages
Write 20 Simple Basic Python Programs With Output - Search
No ratings yet
Write 20 Simple Basic Python Programs With Output - Search
4 pages
Informatics Practices-Xii-Model Test Paper-1
No ratings yet
Informatics Practices-Xii-Model Test Paper-1
6 pages
Informatics Practices Practical List22-2323
No ratings yet
Informatics Practices Practical List22-2323
6 pages
HF Sample Paper-X Half Yearly Class - Xi Informatics Practices
No ratings yet
HF Sample Paper-X Half Yearly Class - Xi Informatics Practices
3 pages
QP XII Computer Science
No ratings yet
QP XII Computer Science
11 pages
Op Ques
No ratings yet
Op Ques
7 pages
Class Xii - Informatics Practices (065) Max Marks: 70 Time: 3 Hrs General Instructions
0% (1)
Class Xii - Informatics Practices (065) Max Marks: 70 Time: 3 Hrs General Instructions
11 pages
Files Extension Detail
No ratings yet
Files Extension Detail
38 pages
Chapter 1 Python Pandas - I Type C Long Answer
No ratings yet
Chapter 1 Python Pandas - I Type C Long Answer
5 pages
Oracle PLSQL MCQ Questions
No ratings yet
Oracle PLSQL MCQ Questions
10 pages
1 Data Handling Using Pandas 1
No ratings yet
1 Data Handling Using Pandas 1
63 pages
Class Xii Information Practices PPT On Data Handling Using Pandas-I
No ratings yet
Class Xii Information Practices PPT On Data Handling Using Pandas-I
64 pages
Class 11 IP PT 2 (QP-2)
No ratings yet
Class 11 IP PT 2 (QP-2)
5 pages
Ip Practical File
No ratings yet
Ip Practical File
31 pages
User Properties
0% (1)
User Properties
2 pages
Python Programs - Oswal
No ratings yet
Python Programs - Oswal
29 pages
SQP 2 Class 11 IP Annual Exam (QP)
No ratings yet
SQP 2 Class 11 IP Annual Exam (QP)
6 pages
14.8.1 Packet Tracer - TCP and UDP Communications
No ratings yet
14.8.1 Packet Tracer - TCP and UDP Communications
6 pages
Lesson Plan Ip Xii March April 2023
75% (4)
Lesson Plan Ip Xii March April 2023
1 page
CBSE Class 11 Informatics Practices Sample Paper-02 (Solved)
100% (1)
CBSE Class 11 Informatics Practices Sample Paper-02 (Solved)
12 pages
Binary File
No ratings yet
Binary File
8 pages
CH-1 Assignment
No ratings yet
CH-1 Assignment
4 pages
I2C Bus Manual
100% (6)
I2C Bus Manual
51 pages
XI IP PT-1 Sample Paper-III
No ratings yet
XI IP PT-1 Sample Paper-III
2 pages
Class XI - IP Notes and Python Programs
100% (2)
Class XI - IP Notes and Python Programs
42 pages
Typecasting in Python
No ratings yet
Typecasting in Python
6 pages
Ip Class Xii Sample Question Paper 1
100% (3)
Ip Class Xii Sample Question Paper 1
11 pages
Assignment-1 (Python Pandas-Series Object and Data Frame: 1. Answer The Following
100% (1)
Assignment-1 (Python Pandas-Series Object and Data Frame: 1. Answer The Following
8 pages
Class Xii Minimum Level Learning
No ratings yet
Class Xii Minimum Level Learning
10 pages
3+years Oracle DBA Interview Questions
No ratings yet
3+years Oracle DBA Interview Questions
3 pages
Content Manager - Error Codes
No ratings yet
Content Manager - Error Codes
349 pages
Cs (File Handling) Important
No ratings yet
Cs (File Handling) Important
12 pages
McAfee SIEM Course Content
No ratings yet
McAfee SIEM Course Content
2 pages
11computer Science-Python Fundamentals-Assignment
100% (1)
11computer Science-Python Fundamentals-Assignment
2 pages
Data Handling Using Pandas-1: Long Answer Questions
100% (1)
Data Handling Using Pandas-1: Long Answer Questions
1 page
CBSE Class 11 Information Practices Worksheet
No ratings yet
CBSE Class 11 Information Practices Worksheet
3 pages
Experiment 3.2 How To Create A Datacenter With One Host and Run Two Cloudlets On It
No ratings yet
Experiment 3.2 How To Create A Datacenter With One Host and Run Two Cloudlets On It
7 pages
CSE316
No ratings yet
CSE316
2 pages
Website: Vce To PDF Converter: Facebook: Twitter:: C2090-600.Vceplus - Premium.Exam.60Q
No ratings yet
Website: Vce To PDF Converter: Facebook: Twitter:: C2090-600.Vceplus - Premium.Exam.60Q
19 pages
CCNA Training Hot Standby Router Protocol HSRP Tutorial
No ratings yet
CCNA Training Hot Standby Router Protocol HSRP Tutorial
4 pages
07 Pal Pla Rom
No ratings yet
07 Pal Pla Rom
26 pages
Course 6419B:: Configuring, Managing and Maintaining Windows Server 2008-Based Servers
No ratings yet
Course 6419B:: Configuring, Managing and Maintaining Windows Server 2008-Based Servers
10 pages
Debug 1214
No ratings yet
Debug 1214
23 pages
Oracle Error Codes
100% (2)
Oracle Error Codes
16 pages
Net Topology sfb52 e PDF
No ratings yet
Net Topology sfb52 e PDF
13 pages
Define Product Hierarchies (SAP Library - Material Master)
No ratings yet
Define Product Hierarchies (SAP Library - Material Master)
4 pages
SQL CheatSheet 1680011434
No ratings yet
SQL CheatSheet 1680011434
10 pages
IF3140 Query Optimization
No ratings yet
IF3140 Query Optimization
77 pages
Data Types Sophia.K
No ratings yet
Data Types Sophia.K
1 page
Distributed DBMS - Quick Guide - Tutorialspoint
No ratings yet
Distributed DBMS - Quick Guide - Tutorialspoint
51 pages
Interviw Questions 1
No ratings yet
Interviw Questions 1
5 pages
Assignment Check List
No ratings yet
Assignment Check List
3 pages
Implementasi Program Keluarga Harapan Dalam Upaya Mengentaskan Kemiskinan Di Kota Batu Cahyo Sasmito Ertien Rining Nawangsari
No ratings yet
Implementasi Program Keluarga Harapan Dalam Upaya Mengentaskan Kemiskinan Di Kota Batu Cahyo Sasmito Ertien Rining Nawangsari
8 pages
Advanced Database Lab
No ratings yet
Advanced Database Lab
36 pages
SQL 2
No ratings yet
SQL 2
20 pages
C Interview Questions
No ratings yet
C Interview Questions
32 pages
Partitioning in Informatica Cloud (IICS) - ThinkETL
No ratings yet
Partitioning in Informatica Cloud (IICS) - ThinkETL
14 pages

On Data Handling Using Pandas-I

Uploaded by

On Data Handling Using Pandas-I

Uploaded by

INFORMATICS PRACTICES

1 Data Handling using Pandas and Data 30

2 Database Query using SQL 25

3 Introduction to Computer Networks 7

(Data Handling using Pandas –I)

Framework: It is a collection of various libraries which architects

pip install pandas

<Series Name>=<pd>.Series(<list name>, ...)

➢ Creating Dataframe from list of dictionaries

➢ Creating Dataframe from dictionary of Series

Accessing a group of values:

In Pandas Dataframe we can iterate an element in two ways:

● Iterating over rows

To iterate over the rows of the DataFrame, we can use the

You might also like