0% found this document useful (0 votes)

41 views2 pages

Short Notes On Coding

1. The document discusses various pandas functions and methods for data analysis including converting data to a dataframe, reading in csv files, handling missing values, data visualization using matplotlib and seaborn, descriptive statistics using numpy, random number generation, and performing groupby operations. 2. Key pandas functions covered include pd.DataFrame(), pd.read_csv(), .isnull(), .fillna(), .value_counts(), and .info(). Plotting methods like plt.plot, plt.scatter, plt.bar and plt.hist are also discussed. 3. The document also reviews numpy functions such as np.mean(), np.median(), np.var(), np.std(), and random number generation with np.random.uniform

Uploaded by

Pragati jain

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

41 views2 pages

Short Notes On Coding

Uploaded by

Pragati jain

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

Pandas:

1. to convert into a dataframe -> pd.DataFrame()

2. pd.read_csv
3. train-> a dataframe
train["column_name"].isnull().sum
to change null value -> train["column_name"]= train["column_name"].
fillna(train["column_name"].mean())

train.isnull().sum()

train.select_dtypes(include=[np.object,np.float64,np.int64])
)

train["column_name"].value_counts() -> give count of distint value in column

train["column_name"].replace(["","",""]),["","",""],inplace=True)

train.info()

---------------------------------------
import matplotlib.pyplot as plt
plt.subplots(1,2,1)
plt.xlabel('name on x-axis')
plt.ylabel('name on y-axis')
sns.countplot("columnname",data=train,pallete='ocean','spring','summer')
df.plt(kind= 'scatter or hist',x= 'column as x', y= 'column name x')

plt.bar(x,y)
plt.hist(x)
plt.scatter(x,y)

y=np.array([12,34,56,90])
plt.pie(y)
plt.plot

----------------------------------------------------
import numpy as np
from scipy import stats

np.mean(list)
np.meadian(list)
stats.mode(list)

np.var(list) -> (sum over all i(xi- (mean of xi)))/no. of points= variance
np.std(list) -> sqrt(variance)

np.percentile(list, 75)

75 percentile meaning 75 percentile= 43 that means 75% of the population has values
lower than 43
max_no= m
min_no= n
25 percentile = 0.25* (max_no-min_no)
---------------------------------------------------

Distributions:

np.random.uniform(start,end,size)
np.random.normal(start,end,size)

------------------------------------------------------

how to use map

map we use when we want to perform an operation over all the elments of list

list(map(myfunc,iterable))

-----------------------------------------------------------------

some more dataframe

performing groupby operation on dataframe using pandas

find out the name of district with max mean model_price

df= dataframe

di= dict(df.groupby(['district']).['model_price'].mean())

I want district which is a key in dict

keymax= max(di, key=di.get)

print(keymax)

data[data['state']== 'Telanagana']['commodity'].value_counts

to get the count of unique commodity each state has

data.groupby('state')['commodity'].nunique()

data.sort_values(by=['column_name'],inplace=True)

Delhivery Mani
No ratings yet
Delhivery Mani
79 pages
Data Wrangling and Preprocessing
100% (1)
Data Wrangling and Preprocessing
41 pages
EDA Plots Code
No ratings yet
EDA Plots Code
13 pages
Feature Engineering 1708311524
No ratings yet
Feature Engineering 1708311524
48 pages
Data Wrangling Python.
No ratings yet
Data Wrangling Python.
8 pages
AD3301 - Data - Transformation - Ipynb - Colaboratory
No ratings yet
AD3301 - Data - Transformation - Ipynb - Colaboratory
27 pages
22 Dim Reduction Part-1
No ratings yet
22 Dim Reduction Part-1
9 pages
K-Means Clustering Algorithm
No ratings yet
K-Means Clustering Algorithm
17 pages
Abhiml ML File
No ratings yet
Abhiml ML File
74 pages
Data Cleaning and Pre Processing 2
No ratings yet
Data Cleaning and Pre Processing 2
27 pages
Fds Slips
No ratings yet
Fds Slips
6 pages
DAV Practicals
No ratings yet
DAV Practicals
26 pages
Dsbda Ass2
No ratings yet
Dsbda Ass2
49 pages
Lab File
No ratings yet
Lab File
96 pages
ASSi2 DSBDA
No ratings yet
ASSi2 DSBDA
4 pages
2777959-Day 8 - Data Wrangling
No ratings yet
2777959-Day 8 - Data Wrangling
2 pages
PW2 DataCleaning
No ratings yet
PW2 DataCleaning
6 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
Dsbda Assignment 1
No ratings yet
Dsbda Assignment 1
5 pages
Data Pre Processing
No ratings yet
Data Pre Processing
2 pages
Python Cheat Sheet For Data Analysis
No ratings yet
Python Cheat Sheet For Data Analysis
2 pages
Group A Assignment No2 Writeup
No ratings yet
Group A Assignment No2 Writeup
9 pages
Jamboree
No ratings yet
Jamboree
56 pages
Assignmnet 5
No ratings yet
Assignmnet 5
11 pages
Week1 Numpy, Pandas (178) .Ipynb Colab
No ratings yet
Week1 Numpy, Pandas (178) .Ipynb Colab
6 pages
Etl1 6
No ratings yet
Etl1 6
6 pages
MACHINE LEARNING Manual
No ratings yet
MACHINE LEARNING Manual
36 pages
Cheat Sheet Modeldeploy
No ratings yet
Cheat Sheet Modeldeploy
2 pages
DS Problem Statements and Codes
No ratings yet
DS Problem Statements and Codes
21 pages
Python Pandas
No ratings yet
Python Pandas
13 pages
Lecture 4 New Data Pre Processing
No ratings yet
Lecture 4 New Data Pre Processing
41 pages
Data Analyzer
No ratings yet
Data Analyzer
10 pages
Data Mining Lab 03
No ratings yet
Data Mining Lab 03
10 pages
Untitled1.ipynb - Colab
No ratings yet
Untitled1.ipynb - Colab
10 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
Micro
No ratings yet
Micro
4 pages
Project Prog
No ratings yet
Project Prog
6 pages
Fda Exp2 E0323040
No ratings yet
Fda Exp2 E0323040
3 pages
Data Frame Creation
No ratings yet
Data Frame Creation
10 pages
DV Mid Internal 1
No ratings yet
DV Mid Internal 1
8 pages
Fds Assign 3
No ratings yet
Fds Assign 3
4 pages
Experiment 1 Solution
No ratings yet
Experiment 1 Solution
5 pages
Edp 3
No ratings yet
Edp 3
16 pages
Machine Learning Project Roadmap
No ratings yet
Machine Learning Project Roadmap
4 pages
10) Merging Dataframes: # Detecting Duplicates
No ratings yet
10) Merging Dataframes: # Detecting Duplicates
7 pages
Download
No ratings yet
Download
3 pages
Model2.ipynb - Colab
No ratings yet
Model2.ipynb - Colab
11 pages
Data Cleaning
No ratings yet
Data Cleaning
22 pages
Enda Practical 3 Explanation One
No ratings yet
Enda Practical 3 Explanation One
7 pages
Program
No ratings yet
Program
10 pages
Machine Learning Record VR19
No ratings yet
Machine Learning Record VR19
46 pages
Aide Memoire Preparation Des Données
No ratings yet
Aide Memoire Preparation Des Données
2 pages
Dealing With Missing Values
No ratings yet
Dealing With Missing Values
19 pages
Machine Learning Lab Assignment 2
No ratings yet
Machine Learning Lab Assignment 2
23 pages
DA Cheat Codes
No ratings yet
DA Cheat Codes
2 pages
Data Preprocessing 1
No ratings yet
Data Preprocessing 1
6 pages
ML LAB Manual-1
No ratings yet
ML LAB Manual-1
33 pages
DA Lab Manual r22
No ratings yet
DA Lab Manual r22
31 pages
Ass 1 ML
No ratings yet
Ass 1 ML
21 pages
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet

Short Notes On Coding

Uploaded by

Short Notes On Coding

Uploaded by

Pandas:

1. to convert into a dataframe -> pd.DataFrame()

train["column_name"].value_counts() -> give count of distint value in column

how to use map

some more dataframe

performing groupby operation on dataframe using pandas

find out the name of district with max mean model_price

I want district which is a key in dict

keymax= max(di, key=di.get)

to get the count of unique commodity each state has

You might also like