0% found this document useful (0 votes)

1 views2 pages

Python Cheatsheet For Data Scientists

This document is a Python cheatsheet for data scientists, covering core Python syntax, NumPy, Pandas, Matplotlib, Seaborn, and Scikit-learn basics. It includes examples of data manipulation, visualization techniques, and machine learning model training. Additionally, it lists essential libraries for data handling, visualization, machine learning, and deep learning.

Uploaded by

sundarksp

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

1 views2 pages

Python Cheatsheet For Data Scientists

Uploaded by

sundarksp

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Python Cheatsheet for Data Scientists

Core Python for Data Science

x = 10 # int
y = 3.14 # float
name = "AI" # str
flag = True # bool

lst = [1, 2, 3]
tpl = (1, 2, 3)
dct = {"a": 1, "b": 2}
st = {1, 2, 3}

squares = [x**2 for x in range(10)]

def square(x): return x**2

f = lambda x: x**2

NumPy

import numpy as np

a = np.array([1, 2, 3])
b = np.zeros((2, 3))
c = np.ones(5)
d = np.eye(3)
e = np.linspace(0, 1, 5)

a.mean(), a.std(), a.sum()

a.reshape(3, 1)
np.dot(a, a)

Pandas

import pandas as pd

df = pd.read_csv("data.csv")
df.head(), df.info(), df.describe()
df["col"], df[["col1", "col2"]]
df[df["col"] > 5]
df.groupby("group_col").mean()
df.isnull().sum()
df.fillna(0), df.dropna()

Matplotlib & Seaborn

Python Cheatsheet for Data Scientists

import matplotlib.pyplot as plt

import seaborn as sns

plt.plot([1,2,3], [4,5,6])
plt.hist([1,2,2,3])
plt.show()

sns.boxplot(x="col", data=df)
sns.heatmap(df.corr(), annot=True)

Scikit-learn (ML Basics)

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

X = df[["feature1", "feature2"]]
y = df["target"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

model = LinearRegression()
model.fit(X_train, y_train)

preds = model.predict(X_test)
mse = mean_squared_error(y_test, preds)

Common Data Science Tasks

pd.get_dummies(df["category"])

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

from sklearn.ensemble import RandomForestClassifier

rf = RandomForestClassifier().fit(X, y)
importances = rf.feature_importances_

Bonus: Libraries to Know

- numpy, pandas: Data handling

- matplotlib, seaborn, plotly: Visualization
- scikit-learn: Machine learning
- xgboost, lightgbm: Gradient boosting
- statsmodels: Statistical modeling
- tensorflow, pytorch: Deep learning

Pandas Cheat Sheet CN
No ratings yet
Pandas Cheat Sheet CN
4 pages
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
No ratings yet
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
12 pages
Python For DS Cheat Sheet
100% (2)
Python For DS Cheat Sheet
6 pages
Ilovepdf Merged (2) Merged
No ratings yet
Ilovepdf Merged (2) Merged
65 pages
Cheat Sheet: Python For Data Science
No ratings yet
Cheat Sheet: Python For Data Science
4 pages
Python Cheatsheet
No ratings yet
Python Cheatsheet
3 pages
Tool and Lib in Data Science
No ratings yet
Tool and Lib in Data Science
32 pages
DSC Lab Programs
No ratings yet
DSC Lab Programs
24 pages
PR Final File
No ratings yet
PR Final File
70 pages
Data Science Cheat Sheet
No ratings yet
Data Science Cheat Sheet
2 pages
Ai Programs
No ratings yet
Ai Programs
22 pages
Cheat Sheet: Python For Data Science
No ratings yet
Cheat Sheet: Python For Data Science
4 pages
Data Science Programs
No ratings yet
Data Science Programs
11 pages
Pandas Cheat Sheet
85% (13)
Pandas Cheat Sheet
2 pages
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
100% (3)
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
9 pages
Python Numpy Pandas CheatSheet
No ratings yet
Python Numpy Pandas CheatSheet
4 pages
Class Xii PDF For Practical
No ratings yet
Class Xii PDF For Practical
24 pages
EDA+Cheatsheet+ +Class+Note
No ratings yet
EDA+Cheatsheet+ +Class+Note
29 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
More On Pandas
No ratings yet
More On Pandas
51 pages
Rimjhim
No ratings yet
Rimjhim
21 pages
EDA Cheatsheet - Class Note
No ratings yet
EDA Cheatsheet - Class Note
29 pages
Data Analysis W Pandas
No ratings yet
Data Analysis W Pandas
4 pages
ML Final Prac
No ratings yet
ML Final Prac
47 pages
End Semester Answer Key Format-Fods
No ratings yet
End Semester Answer Key Format-Fods
8 pages
EDA+Cheatsheet+ +Class+Note
No ratings yet
EDA+Cheatsheet+ +Class+Note
29 pages
Set-D CT2 Answerkey
No ratings yet
Set-D CT2 Answerkey
11 pages
ML Lab Manual 1-10
No ratings yet
ML Lab Manual 1-10
58 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
ML Practice Assignment
No ratings yet
ML Practice Assignment
7 pages
EDA Cheatsheet - Class Note
No ratings yet
EDA Cheatsheet - Class Note
29 pages
Usage of NumPy For Numerical Data in Detail
No ratings yet
Usage of NumPy For Numerical Data in Detail
52 pages
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
No ratings yet
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
7 pages
CS3362 Data Science Laboratory Manual 2022-23
No ratings yet
CS3362 Data Science Laboratory Manual 2022-23
54 pages
Python For Statistics
No ratings yet
Python For Statistics
40 pages
Code Shabab Error 7
No ratings yet
Code Shabab Error 7
5 pages
Eda Code Snippets
No ratings yet
Eda Code Snippets
17 pages
ML Manual
No ratings yet
ML Manual
21 pages
Data Science Python Cheat Sheet
No ratings yet
Data Science Python Cheat Sheet
25 pages
External
No ratings yet
External
11 pages
Data Science
No ratings yet
Data Science
42 pages
NumPy and Pandas Tutorial
No ratings yet
NumPy and Pandas Tutorial
8 pages
Data Clearning
No ratings yet
Data Clearning
7 pages
Wa0005.
No ratings yet
Wa0005.
29 pages
Part A Assignment - No - 1
No ratings yet
Part A Assignment - No - 1
7 pages
EDS - Python Cheat Sheet
0% (1)
EDS - Python Cheat Sheet
3 pages
Pandas Cheat Sheet
100% (4)
Pandas Cheat Sheet
2 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
12 pages
Ai Tools and Applications-Lab
No ratings yet
Ai Tools and Applications-Lab
33 pages
Report
No ratings yet
Report
18 pages
EXP1-siddhant Gupta (23 - SE - 148)
No ratings yet
EXP1-siddhant Gupta (23 - SE - 148)
17 pages
Know Your Dataset: Season Holiday Weekday Workingday CNT 726 727 728 729 730
No ratings yet
Know Your Dataset: Season Holiday Weekday Workingday CNT 726 727 728 729 730
1 page
EDA Cheatsheet - Class Note
No ratings yet
EDA Cheatsheet - Class Note
29 pages
Data Analysis
No ratings yet
Data Analysis
8 pages
Data Analysis Lab - Final - 23-24
No ratings yet
Data Analysis Lab - Final - 23-24
11 pages
CO-367 Machine Learning Lab File: Submitted To: Submitted by
No ratings yet
CO-367 Machine Learning Lab File: Submitted To: Submitted by
12 pages
Cheat Sheet: The Pandas Dataframe Object I: Preliminaries Get Your Data Into A Dataframe
No ratings yet
Cheat Sheet: The Pandas Dataframe Object I: Preliminaries Get Your Data Into A Dataframe
12 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet

Python Cheatsheet For Data Scientists

Uploaded by

Python Cheatsheet For Data Scientists

Uploaded by

Python Cheatsheet for Data Scientists

Core Python for Data Science

squares = [x**2 for x in range(10)]

def square(x): return x**2

a.mean(), a.std(), a.sum()

Matplotlib & Seaborn

import matplotlib.pyplot as plt

Scikit-learn (ML Basics)

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

Common Data Science Tasks

from sklearn.preprocessing import StandardScaler

from sklearn.ensemble import RandomForestClassifier

Bonus: Libraries to Know

- numpy, pandas: Data handling

You might also like