0% found this document useful (0 votes)

23 views10 pages

Data Frame Creation

A DataFrame is a 2D collection of rows and columns used in Pandas for data manipulation. The document outlines how to create a DataFrame, perform operations such as adding columns, handling null values, and merging columns. It also covers scaling categorical values and generating random data for DataFrames.

Uploaded by

qubefexe

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

23 views10 pages

Data Frame Creation

Uploaded by

qubefexe

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 10

DATA FRAME

CREATION
WHAT IS A
DATA FRAME ?

•A Data frame is a
collection of rows and
columns , it loads into
2D row and column
format

•Pandas reads any file

that we upload into
Data frame format.
CREATING A DATA FRAME

Creating Data frame

df = pd.DataFrame([[0, 2, 3], [0, 4, 1], [10, 20, 30]],

index=[4, 5, 6], columns=['A', 'B', 'C'])
df

d= {'col1': [0, 1, 2, 3], 'col2': pd.Series ([2, 3],

index=[2, 3])}
df=pd.DataFrame(data=d, index-[0, 1, 2, 3])
OPERATIONS ON FROM DATA FRAME
Use an existing columns to create a new one

df['new_column'] = df['column_1'] + df['column_2’]

ADDING A COLUMN IN DATAFRAME

df.append({'column_1': 1, 'column_2': 2},ignore_index=True)

df.insert(loc=1, column="Stars", value=[2,2,3,4])

df
NULL VALUES HANDLING
find all the null values present in the
columns

df.isnull( ).sum( )

drop rows with missing values

df.dropna(inplace=true)
df.drop(index=0,axis=0)
FILLING MISSING VALUES IN A DATAFRAME

To fill the missing values from mean

df.fillna(df.mean())

df.rename(columns={'old_name':'new_name’})

drop the particular column from particular data frame

df.drop(['column3'], axis=1,inplace=True)
HANDLING DATA SET
• Merging two columns into a single column
df['new_column'] = df['column_1'] + df['column_2’]

set the index to adefault integer index starting from 0

df.reset_index()
Renaming the column
df.rename(columns={'old_name': 'new_name'})
HANDLING CATEGORICAL VALUES

• Standard scaler removes the mean and scales each feature/variable to

unit variance
• 'rem" with no value and scaling the column1. eg: if I have a vlues in
column such as REMOO1
• df['column1’] = df['column1'].str.replace('rem’, ‘ ‘ )

ss= StandardScaler()

df['column'] = ss.fit_transform(df['column'].values.reshape(-1, 1))

Generating multiple values
import random
import pandas as pd
[w1,w2,w3,w4,w5,w6,w7] = [0.367,-0.0327,0.509,0.491,-0.226,1.142,-0.169]
vals = []
for i in range(1000000):
x1 = random.randint(1, 10)
x2 = random.randint(1, 5)
x3 = random.randint(0, 100)
x4 = random.randint(0, 70)
x5 = random.randint(1, 2)
x6 = random.randint(1, 10)
x7 = random.randint(1, 2)
eq = w1*x1+w2*x2+w3*x3+w4*x4+w5*x5+w6*x6+w7*x7
vals.append([x1,x2,x3,x4,x5,x6,x7,eq])
df =
pd.DataFrame(vals,columns=['Column1','Column2','Column3','Column4','Column5','Column6'
,'Column7','Column8'])
df.to_csv(‘File Name.csv',index=False)

CH-6 Data Loading, Storage, and File Formats
No ratings yet
CH-6 Data Loading, Storage, and File Formats
163 pages
Data Handling Part Ii
No ratings yet
Data Handling Part Ii
41 pages
Pandas 1
No ratings yet
Pandas 1
50 pages
Unit 5 Python
No ratings yet
Unit 5 Python
30 pages
Chapter 2 Python Pandas - II
No ratings yet
Chapter 2 Python Pandas - II
19 pages
Lab File
No ratings yet
Lab File
96 pages
Dsbda Ass2
No ratings yet
Dsbda Ass2
49 pages
Panas Short Notes
No ratings yet
Panas Short Notes
4 pages
Python Pandas Presentation
No ratings yet
Python Pandas Presentation
32 pages
12 Pandas
100% (1)
12 Pandas
21 pages
2-Introduction To Data Cleaning P02
No ratings yet
2-Introduction To Data Cleaning P02
7 pages
Session2-DM Using Pandas
No ratings yet
Session2-DM Using Pandas
51 pages
Pandas
No ratings yet
Pandas
63 pages
Pandas
No ratings yet
Pandas
44 pages
Pandas Cheat Sheet
100% (1)
Pandas Cheat Sheet
2 pages
Pandas Cheat Sheet PDF
67% (3)
Pandas Cheat Sheet PDF
1 page
Data Frame Demo
No ratings yet
Data Frame Demo
73 pages
Download
No ratings yet
Download
3 pages
Day 10 Pandasdatacleaning
No ratings yet
Day 10 Pandasdatacleaning
6 pages
Asfasdas
No ratings yet
Asfasdas
36 pages
Data Analysis: Data Preparation
No ratings yet
Data Analysis: Data Preparation
9 pages
Pandas Cheat Sheet
100% (2)
Pandas Cheat Sheet
6 pages
Python Cheat Sheet Code Academy
100% (1)
Python Cheat Sheet Code Academy
1 page
Aide Memoire Preparation Des Données
No ratings yet
Aide Memoire Preparation Des Données
2 pages
Dev Lab Record
No ratings yet
Dev Lab Record
21 pages
DA Cheat Codes
No ratings yet
DA Cheat Codes
2 pages
Mechanisms in Modern Engineering Design PDF
100% (3)
Mechanisms in Modern Engineering Design PDF
618 pages
Data Cleaning in Python
No ratings yet
Data Cleaning in Python
14 pages
Codigos 5700
No ratings yet
Codigos 5700
153 pages
SCIEX QTRAP 5500 System Specification
No ratings yet
SCIEX QTRAP 5500 System Specification
13 pages
Term 1 IP AK
No ratings yet
Term 1 IP AK
6 pages
Ap Python
No ratings yet
Ap Python
12 pages
Wonderware - InTouch Access Anywhere Secure Gateway 2013
No ratings yet
Wonderware - InTouch Access Anywhere Secure Gateway 2013
43 pages
Documents From The US Antitrust Investigation Into Apple
No ratings yet
Documents From The US Antitrust Investigation Into Apple
113 pages
12 IP Pandas DataFrame - Question Bank
No ratings yet
12 IP Pandas DataFrame - Question Bank
10 pages
Lab 9
No ratings yet
Lab 9
9 pages
How To Write An Email in English
No ratings yet
How To Write An Email in English
58 pages
Jade M Kit
No ratings yet
Jade M Kit
1 page
Acknowledgement
No ratings yet
Acknowledgement
25 pages
Practical File IP
No ratings yet
Practical File IP
27 pages
10) Merging Dataframes: # Detecting Duplicates
No ratings yet
10) Merging Dataframes: # Detecting Duplicates
7 pages
Pandas
No ratings yet
Pandas
30 pages
Unit3 - 3) Pandas - Ipynb - Colab
No ratings yet
Unit3 - 3) Pandas - Ipynb - Colab
11 pages
Pandas
No ratings yet
Pandas
94 pages
Dataframe
No ratings yet
Dataframe
19 pages
Pandas Commands
No ratings yet
Pandas Commands
3 pages
Pandas: Import
100% (1)
Pandas: Import
13 pages
Free Ebook MCQ Series Based On e PG Pathshala P02-M1,2,3
No ratings yet
Free Ebook MCQ Series Based On e PG Pathshala P02-M1,2,3
81 pages
Rapids Cheatsheet
100% (1)
Rapids Cheatsheet
2 pages
Code Explanation For Date Types
No ratings yet
Code Explanation For Date Types
8 pages
04-Data Manipulation With Pandas
No ratings yet
04-Data Manipulation With Pandas
28 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
9 pages
Data Analysis With Python
No ratings yet
Data Analysis With Python
60 pages
Exp3 Python
No ratings yet
Exp3 Python
15 pages
Evaluation Metrics
No ratings yet
Evaluation Metrics
20 pages
Evaluation Metrics
No ratings yet
Evaluation Metrics
20 pages
Algorithms 1
No ratings yet
Algorithms 1
23 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
5 pages
Machine Learning
No ratings yet
Machine Learning
16 pages
Pandas Merged
No ratings yet
Pandas Merged
2 pages
Data Science Cheat Sheet: KEY Imports
100% (1)
Data Science Cheat Sheet: KEY Imports
1 page
Content Pandas Cheat Sheet
No ratings yet
Content Pandas Cheat Sheet
9 pages
12 Pandas
No ratings yet
12 Pandas
9 pages
Career Transition Handbook
No ratings yet
Career Transition Handbook
8 pages
Syllabus Computer Class-3
No ratings yet
Syllabus Computer Class-3
9 pages
Axial Piston Variable Pump A4VG Series 32: Europe
No ratings yet
Axial Piston Variable Pump A4VG Series 32: Europe
94 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Pandas DataFrame Notes
No ratings yet
Pandas DataFrame Notes
13 pages
Algebraic Geometry For Geometric Modeling: Ragni Piene
No ratings yet
Algebraic Geometry For Geometric Modeling: Ragni Piene
46 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
Prepare, Sterilize and Dispense Culture Media
No ratings yet
Prepare, Sterilize and Dispense Culture Media
24 pages
Arrays Strings Vectors Wrapper Class
No ratings yet
Arrays Strings Vectors Wrapper Class
9 pages
Statement of Account
No ratings yet
Statement of Account
109 pages
Canon I350 Waste Tank Full - Fixyourownprinter
No ratings yet
Canon I350 Waste Tank Full - Fixyourownprinter
22 pages
Important Pandas Operations 1697910759
No ratings yet
Important Pandas Operations 1697910759
6 pages
CPE 445-Internet of Things - Chapter 7
No ratings yet
CPE 445-Internet of Things - Chapter 7
39 pages
Cree XLamp LM-80 - Results
No ratings yet
Cree XLamp LM-80 - Results
173 pages
Installing PINE A64 7" LCD Touch Screen Panel: Description
No ratings yet
Installing PINE A64 7" LCD Touch Screen Panel: Description
9 pages
Information and Communication Technologies in Healthcare in 2020 - State of Play and Trends en
No ratings yet
Information and Communication Technologies in Healthcare in 2020 - State of Play and Trends en
203 pages
Some Introductory Concepts On Fiberr Optic System
No ratings yet
Some Introductory Concepts On Fiberr Optic System
36 pages
Onboarding Form Filling Guide
No ratings yet
Onboarding Form Filling Guide
2 pages
Pandas
No ratings yet
Pandas
5 pages
Assignment - 01 Install and Uninstall Software
No ratings yet
Assignment - 01 Install and Uninstall Software
4 pages
IRC Codes
No ratings yet
IRC Codes
36 pages
Planos ZX130-5
No ratings yet
Planos ZX130-5
18 pages
Learning Episode 11 Updated
No ratings yet
Learning Episode 11 Updated
7 pages
Computer Vision in Banking
No ratings yet
Computer Vision in Banking
7 pages
Summer Internship Format May 2023 New
No ratings yet
Summer Internship Format May 2023 New
67 pages
Kashi Vishwanath Entry Ticket (5 Persons)
No ratings yet
Kashi Vishwanath Entry Ticket (5 Persons)
1 page
MTCP NJ Client
No ratings yet
MTCP NJ Client
4 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
DBMS Lab Manual
From Everand
DBMS Lab Manual
Jitendra Patel
1.5/5 (3)
Administering Microsoft Azure SQL Solutions DP 300
From Everand
Administering Microsoft Azure SQL Solutions DP 300
Manish Soni
No ratings yet
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet

Data Frame Creation

Uploaded by

Data Frame Creation

Uploaded by

DATA FRAME

•Pandas reads any file

Creating Data frame

df = pd.DataFrame([[0, 2, 3], [0, 4, 1], [10, 20, 30]],

d= {'col1': [0, 1, 2, 3], 'col2': pd.Series ([2, 3],

df['new_column'] = df['column_1'] + df['column_2’]

df.append({'column_1': 1, 'column_2': 2},ignore_index=True)

df.insert(loc=1, column="Stars", value=[2,2,3,4])

drop rows with missing values

To fill the missing values from mean

drop the particular column from particular data frame

set the index to adefault integer index starting from 0

• Standard scaler removes the mean and scales each feature/variable to

df['column'] = ss.fit_transform(df['column'].values.reshape(-1, 1))

You might also like