Pandas PDF

Uploaded by

ROHIT NANDI

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF or read online on Scribd

0% found this document useful (0 votes)

36 views6 pages

Pandas PDF

Uploaded by

ROHIT NANDI

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF or read online on Scribd

You are on page 1/ 6

In In In In In In In In In In In In In In import pandas as pd dataset = pd.read_csv(r"D: \datasets\Demographicbata. csv") dataset : # Explore data in python #1, Full dataframe #2. How many rows & columns. you have to chk the row becuase the no. of raw sh len(dataset) #195 rows imported (this is for tracking later part ) : #3. see columns dataset.columns : #4. Number of columns Jen (dataset. columns) 1 #5. top rows dataset.head() # it will print top 5 rows dataset..head(2) : #6. Bottom rows dataset.tail() #last 5 rows dataset. tail(3) : #7. information of the column dataset.info() #strings are called as object : #8. get stats on the columns dataset.describe() #it will work Like a statistic fun dataset.describe().transpose() #transpose convert column into rows : # Renaming columns of a dataframeIn In In In In In In In In In In In In In In dataset..head() dataset.columns dataset.columns dataset .head() Cab, dataset.columns = [‘CountryName’, ‘CountryCode’, ‘BirthRate’, ‘InternetUsers’, dataset-head() : # subsetting a dataframes in pandas #1. Rows #2. Columns #3. combine the tno # Rows: dataset[21:26] #how python know that only this is rows based on index dataset[:] dataset[:10] dataset .head(10) # How to reverse the dataframe dataset : : -1) dataset[::-1] dataset[ : -1] dataset : ff get only every 20th row dataset[: : 20]In In In In In In In In In In In In In In In In In 2 # COLUMNS: dataset.columns dataset .head() dataset [ 'CountryName' ] .head(1@) ['countryName’ "BirthRate' ] dataset[[ ‘CountryNane' , ‘BirthRate']}.head() dataset-head() dataset[ 'BirthRate'] : # combine the two dataset[4:8][[CountryNane', ‘BirthRate']] dataset [['CountryName', ‘BirthRate']][4:8] df1 = dataset [['CountryName’, ‘BirthRate’ ]] df df2 = dataset [4:8] af2 dataset[4:8] af : # Basic operatioin of dataframe dataset .head() dataset[[ ‘CountryCode' , "BirthRate', "InternetUsers']][:1@] #subet dataframeIn In In In In In In In In In In In In In In In In dataset. head() wathmetical operation = dataset .BirthRate * dataset. InternetUsers # Add @ column dataset['myCalc'] = dataset.BirthRate * dataset. InternetUsers dataset. head() Remove a column dataset.drop("BinthRate", axis=1) dataset .drop('myCalc',axis = 1) dataset.head() dataset .columns(2] dataset .InternetUsers dataset .InternetUsers dataset. InternetUsers<3 #we are checking given condition if its correct true ¢ Filter = dataset.InternetUsers < 2 dataset.InternetUsers < 2 pd.set_option('display.max_rows', 500) Filter datasetIn In In In In In In In In In In In In In In dataset[3:7] stats[30:40] stats[Filter] # IT WILL take that row which are false stats.BirthRate>4e Filter2 = stats.BirthRate>4o Filter2 stats[Filter2] : #Filter and Filter2 Filter & Filter2 stats[Filter & Filter2] stats[(stats.BirthRate > 40) & (stats.InternetUsers < 2)] stats.head() stats stats[stats.IncomeGroup == ‘Low income'] 1 # How to get the unique categories stats. IncomeGroup .unique() : # Introduction to seaborn # seaborn is very powerfull visualizatio(STATISTIC V import matplotlib.pyplot as plt # visulaiztion import seaborn as sns # distribution visualtion Xnatplotlib inline plt.rcParams[ figure. figsize’] = 8,4 import warnings warnings. filterwarnings( ‘ignore’ )In({] Int] In (J In[(] In [ J: In]: In]: In[}: In[] In]: Inf]: Inf] import warnings warnings. filterwarnings(' ignore’) stats-head() # Distributions: visi = sns.distplot(stats["BirthRate"}) vis1 = sns.distplot(stats["InternetUsers"], bin: ‘#80 PLOTS: vis2 = sns.boxplot(data = stats, x="IncomeGroup", y="BirthRate" ) # refer to seaborn gallary # visualizing with seaborn vis3 = sns.Inplot(data = stats,x = ‘InternetUsers’, y = ‘BirthRate’, fit_reg = vis4 = sns.Inplot(data = stats,x = ‘InternetUsers', y = 'BirthRate’) vis5 = sns.Inplot(data = stats,x = ‘InternetUsers', y = 'BirthRate’, fit_reg = False,hue = ‘IncomeGroup') #hue - parameter for cc vis5 = sns.Inplot(data = stats,x = ‘InternetUsers', y = ‘'BirthRate’, fit_reg = False,hue = ‘IncomeGroup', size = 10) In this section we learned 1> importing data into python 2> Dataframe via panda 3> exploring datasets: head{)taill)info()describe() 4> Renaming columns 5> subsetting dataframes 6> Basic operations with dataframe 8> filtering data frames 9> seaborn introduction

EDA Python Code Cheatsheets
No ratings yet
EDA Python Code Cheatsheets
52 pages
Intro To Pandas World Happiness
No ratings yet
Intro To Pandas World Happiness
20 pages
Pandas Notes
No ratings yet
Pandas Notes
4 pages
Aiml Lab Manaual R23
100% (1)
Aiml Lab Manaual R23
10 pages
EDA+Cheatsheet+ +Class+Note
No ratings yet
EDA+Cheatsheet+ +Class+Note
29 pages
Pandas Filtering
No ratings yet
Pandas Filtering
19 pages
Python Cheatsy
No ratings yet
Python Cheatsy
1 page
Unit - 4 - Part 2
No ratings yet
Unit - 4 - Part 2
36 pages
Kunal Assignment 3
No ratings yet
Kunal Assignment 3
19 pages
Python SQL
No ratings yet
Python SQL
5 pages
Python Pandas-DataFrames Complete - Jupyter Notebook
No ratings yet
Python Pandas-DataFrames Complete - Jupyter Notebook
34 pages
Data Preprocess Steps
No ratings yet
Data Preprocess Steps
2 pages
Numpy
No ratings yet
Numpy
9 pages
Data Cheat Sheet
No ratings yet
Data Cheat Sheet
2 pages
Justenoughpython Pandas 220915 175329
No ratings yet
Justenoughpython Pandas 220915 175329
64 pages
EDA Cheatsheet - Class Note
No ratings yet
EDA Cheatsheet - Class Note
29 pages
Using Python For Data Analysis - July 2018 - Slides
No ratings yet
Using Python For Data Analysis - July 2018 - Slides
43 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
20 pages
Cheat Sheet Pandas
No ratings yet
Cheat Sheet Pandas
4 pages
Lab 1 ML Lab
No ratings yet
Lab 1 ML Lab
15 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
Family Main
No ratings yet
Family Main
5 pages
Data Visualization - Plotly
100% (1)
Data Visualization - Plotly
106 pages
Chemalite
No ratings yet
Chemalite
10 pages
ML Expt 1 Description
No ratings yet
ML Expt 1 Description
15 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
Numpy
No ratings yet
Numpy
9 pages
Data Visualization EDA-print
No ratings yet
Data Visualization EDA-print
18 pages
Eda - 1@3pm 8th Nov
No ratings yet
Eda - 1@3pm 8th Nov
2 pages
Comparison Operators: Hugo Bowne-Anderson
No ratings yet
Comparison Operators: Hugo Bowne-Anderson
34 pages
Chapter3 PDF
No ratings yet
Chapter3 PDF
34 pages
Pandas Python For Data Science
100% (1)
Pandas Python For Data Science
1 page
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
No ratings yet
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
7 pages
Murali Internship
No ratings yet
Murali Internship
34 pages
Intermediate Python ch3 Slides PDF
No ratings yet
Intermediate Python ch3 Slides PDF
33 pages
12 Pandas
100% (1)
12 Pandas
21 pages
Machine Learning Project 3
No ratings yet
Machine Learning Project 3
74 pages
Cheat Python
No ratings yet
Cheat Python
8 pages
Python Cheat Sheet For Excel Users
100% (2)
Python Cheat Sheet For Excel Users
5 pages
Set B
No ratings yet
Set B
8 pages
DV0101EN-2-2-1-Area-Plots-Histograms-and-Bar-Charts-py-v2.0: 1 Exploring Datasets With Pandas and Matplotlib
No ratings yet
DV0101EN-2-2-1-Area-Plots-Histograms-and-Bar-Charts-py-v2.0: 1 Exploring Datasets With Pandas and Matplotlib
29 pages
Pandas Cheat Sheet Final
No ratings yet
Pandas Cheat Sheet Final
1 page
Introduction To Pandas
No ratings yet
Introduction To Pandas
27 pages
Python Data Science 101
100% (1)
Python Data Science 101
41 pages
2
No ratings yet
2
18 pages
Pandas Complete + Visualisation Summary of IBM Visualization
No ratings yet
Pandas Complete + Visualisation Summary of IBM Visualization
21 pages
Pandaspythonfordatascience
No ratings yet
Pandaspythonfordatascience
1 page
Summary: Introduction To Data Visualization Tools
No ratings yet
Summary: Introduction To Data Visualization Tools
13 pages
Python-for-Data-Analysis (Pandas
No ratings yet
Python-for-Data-Analysis (Pandas
31 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
17 pages
ML Lab1 Python Panda
No ratings yet
ML Lab1 Python Panda
9 pages
WEBINTEL GUIDED LAB ACTIVITY Introduction To Pandas
No ratings yet
WEBINTEL GUIDED LAB ACTIVITY Introduction To Pandas
1 page
Data Manipulation With Pandas - Yulei's Sandbox
No ratings yet
Data Manipulation With Pandas - Yulei's Sandbox
18 pages
Python Lab
No ratings yet
Python Lab
8 pages
Pandas Python For Data Science
No ratings yet
Pandas Python For Data Science
1 page

Pandas PDF

Uploaded by

Pandas PDF

Uploaded by

You might also like