0% found this document useful (0 votes)

46 views11 pages

EDA Python Guide

Uploaded by

Muhammad Faizan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

46 views11 pages

EDA Python Guide

Uploaded by

Muhammad Faizan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Exploratory Data Analysis in Python

1. Loading Libraries

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

from scipy import stats

from sklearn.preprocessing import MinMaxScaler, StandardScaler

Exploratory Data Analysis in Python

2. Loading the Dataset

# Example: Loading a CSV file

df = pd.read_csv('your_dataset.csv')
Exploratory Data Analysis in Python

3. Data Overview

# Display the first few rows of the dataset

print(df.head())

# Display summary statistics

print(df.describe())

# Display information about the dataset

print(df.info())
Exploratory Data Analysis in Python

4. Cleaning Data

# Handling missing values

print(df.isnull().sum())

df.fillna(df.mean(), inplace=True)

# Handling duplicates

print(df.duplicated().sum())

df.drop_duplicates(inplace=True)
Exploratory Data Analysis in Python

5. Preprocessing Data

# Encoding categorical variables

df = pd.get_dummies(df, columns=['categorical_column'])

# Feature Engineering

df['new_feature'] = df['existing_feature1'] * df['existing_feature2']

Exploratory Data Analysis in Python

6. Outlier Detection and Treatment

# Using Z-score to identify outliers

z_scores = stats.zscore(df['column_name'])

abs_z_scores = np.abs(z_scores)

filtered_entries = (abs_z_scores < 3)

df = df[filtered_entries]
Exploratory Data Analysis in Python

7. Scaling and Normalization

# Min-Max Scaling

scaler = MinMaxScaler()

df[['column1', 'column2']] = scaler.fit_transform(df[['column1', 'column2']])

# Alternatively, for Standardization

# scaler = StandardScaler()

# df[['column1', 'column2']] = scaler.fit_transform(df[['column1', 'column2']])

Exploratory Data Analysis in Python

8. Data Visualization (Examples)

# Histogram

plt.figure(figsize=(10, 6))

sns.histplot(df['column_name'], kde=True)

plt.title('Histogram of column_name')

plt.show()

# Boxplot

plt.figure(figsize=(10, 6))

sns.boxplot(x=df['column_name'])

plt.title('Boxplot of column_name')

plt.show()

# Scatter plot

plt.figure(figsize=(10, 6))

sns.scatterplot(x='column1', y='column2', data=df)

plt.title('Scatter plot between column1 and column2')

plt.show()

# Heatmap for correlation

plt.figure(figsize=(12, 8))

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

plt.title('Correlation Heatmap')

plt.show()
Exploratory Data Analysis in Python
Exploratory Data Analysis in Python

9. Summarizing Findings

print("Key Findings:")

print("1. Description of key patterns or anomalies.")

print("2. Potential relationships between features.")

print("3. Insights on missing values and outliers.")

Python EDA Guide for Data Analysts
No ratings yet
Python EDA Guide for Data Analysts
13 pages
EDA with Python: Techniques & Tools
No ratings yet
EDA with Python: Techniques & Tools
47 pages
Data Analysis
No ratings yet
Data Analysis
42 pages
IOT-Domain Analyst
No ratings yet
IOT-Domain Analyst
11 pages
Data Prep & EDA for Python Users
No ratings yet
Data Prep & EDA for Python Users
12 pages
Universal Data Analytics Algorithm
No ratings yet
Universal Data Analytics Algorithm
51 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
4 pages
IMPDAV
No ratings yet
IMPDAV
105 pages
Understanding Exploratory Data Analysis
No ratings yet
Understanding Exploratory Data Analysis
17 pages
EDA Techniques in SAS for Data Science
No ratings yet
EDA Techniques in SAS for Data Science
25 pages
What Is Exploratory Data Analysis?: Intuition
No ratings yet
What Is Exploratory Data Analysis?: Intuition
8 pages
Dsi237 Group 2
No ratings yet
Dsi237 Group 2
27 pages
Perform Exploratory Data Analysis
No ratings yet
Perform Exploratory Data Analysis
5 pages
Data Analysis With Python
100% (2)
Data Analysis With Python
29 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
PDF Experiments-1 DADV
No ratings yet
PDF Experiments-1 DADV
41 pages
Presentation - University
No ratings yet
Presentation - University
52 pages
Data Analysis & Visualization Guide
No ratings yet
Data Analysis & Visualization Guide
9 pages
Python Data Exploration Guide
100% (1)
Python Data Exploration Guide
12 pages
Week 6 - Data Cleaning
No ratings yet
Week 6 - Data Cleaning
8 pages
Exploratory Data Analysis: by Neha Mathur
No ratings yet
Exploratory Data Analysis: by Neha Mathur
14 pages
ML Unit 2
No ratings yet
ML Unit 2
52 pages
Exploratory Data Analysis-1
No ratings yet
Exploratory Data Analysis-1
10 pages
AUTOMATED EDA Libraries
No ratings yet
AUTOMATED EDA Libraries
12 pages
Exploratory Analysis: Here Should Start Making Some Notes About Potential Fixes (More in Data Cleaning)
No ratings yet
Exploratory Analysis: Here Should Start Making Some Notes About Potential Fixes (More in Data Cleaning)
2 pages
Explorato Ry: Data Analysis
No ratings yet
Explorato Ry: Data Analysis
6 pages
BasicAnalysis Using PYTHON
No ratings yet
BasicAnalysis Using PYTHON
6 pages
FOUND. DATA SCIENCE Practical
No ratings yet
FOUND. DATA SCIENCE Practical
15 pages
Exploratory Data
No ratings yet
Exploratory Data
47 pages
Machine Learning Project Roadmap
No ratings yet
Machine Learning Project Roadmap
4 pages
Mastering Exploratory Data Analysis With Python - A Comprehensive Guide To Unveiling Hidden Insights
No ratings yet
Mastering Exploratory Data Analysis With Python - A Comprehensive Guide To Unveiling Hidden Insights
73 pages
Data Analysis For Beginners Book - 2
100% (1)
Data Analysis For Beginners Book - 2
27 pages
DataPreparation - Outlier - Treatment ASSIGEMENT ANSWER
No ratings yet
DataPreparation - Outlier - Treatment ASSIGEMENT ANSWER
4 pages
Dsbda Ass2
No ratings yet
Dsbda Ass2
49 pages
04 DS 2023
No ratings yet
04 DS 2023
63 pages
Python Data Cleaning Guide
No ratings yet
Python Data Cleaning Guide
9 pages
Chapter 2. Data Analysis and Processing - Full
No ratings yet
Chapter 2. Data Analysis and Processing - Full
49 pages
Advance Python
No ratings yet
Advance Python
5 pages
DSBDA Lab Assignment No 2
No ratings yet
DSBDA Lab Assignment No 2
7 pages
Module 3
No ratings yet
Module 3
108 pages
DAV Assign6
No ratings yet
DAV Assign6
8 pages
Statistics IMP Questions and Answers
No ratings yet
Statistics IMP Questions and Answers
23 pages
Mastering Exploratory Data Analysis (EDA) - Everything You Need To Know - by Sze Zhong LIM - Data and Beyond - Medium
No ratings yet
Mastering Exploratory Data Analysis (EDA) - Everything You Need To Know - by Sze Zhong LIM - Data and Beyond - Medium
63 pages
Résumé-Analyse Des Données Resumee Resumee
No ratings yet
Résumé-Analyse Des Données Resumee Resumee
4 pages
Lesson 2 - Data Preprocessing
100% (1)
Lesson 2 - Data Preprocessing
72 pages
Data Cleaning
No ratings yet
Data Cleaning
40 pages
Python Data Analysis Guide
No ratings yet
Python Data Analysis Guide
1 page
Lecture 22
No ratings yet
Lecture 22
20 pages
EDA With Pandas CheatSheet
No ratings yet
EDA With Pandas CheatSheet
3 pages
CSE445 NSU Week - 3
No ratings yet
CSE445 NSU Week - 3
48 pages
DAP Writeups - Merged
No ratings yet
DAP Writeups - Merged
33 pages
EDA Techniques and Visualizations
No ratings yet
EDA Techniques and Visualizations
15 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
15 pages
Python For Data Analysis
100% (2)
Python For Data Analysis
84 pages
PGP in DS & AI
No ratings yet
PGP in DS & AI
24 pages
Sales Data Analysis
No ratings yet
Sales Data Analysis
37 pages
Manjeet K Resume
No ratings yet
Manjeet K Resume
2 pages
Sample Paper Annual
No ratings yet
Sample Paper Annual
3 pages
Report Machine Learning
No ratings yet
Report Machine Learning
23 pages
Class XII Informatics Exam
No ratings yet
Class XII Informatics Exam
8 pages
2024SDSC500AD Assignment
No ratings yet
2024SDSC500AD Assignment
24 pages
Data Science Foundations Question Bank
No ratings yet
Data Science Foundations Question Bank
16 pages
Updated Python Model Papers
No ratings yet
Updated Python Model Papers
8 pages
python-notes-BCC-302 (Unit - 05)
No ratings yet
python-notes-BCC-302 (Unit - 05)
25 pages
AIC3 - Python For Data Analysis - Scheda
No ratings yet
AIC3 - Python For Data Analysis - Scheda
4 pages
Data Science - Unit-3-Part-2
No ratings yet
Data Science - Unit-3-Part-2
32 pages
Assignment 1: Software Tools and Techniques For CSE
No ratings yet
Assignment 1: Software Tools and Techniques For CSE
29 pages
House Price Prediction Using ML
No ratings yet
House Price Prediction Using ML
17 pages
Sireesha ML
No ratings yet
Sireesha ML
113 pages
Telecommunications Engineer Resume
No ratings yet
Telecommunications Engineer Resume
3 pages
Introdution To GIS Programming - ToC
0% (1)
Introdution To GIS Programming - ToC
9 pages
Jas Report
No ratings yet
Jas Report
28 pages
12-Hour Hackathon - AI Database Capacity & Performa
No ratings yet
12-Hour Hackathon - AI Database Capacity & Performa
4 pages
Certified Data Analyst
No ratings yet
Certified Data Analyst
22 pages
Case Study 1
No ratings yet
Case Study 1
4 pages
Brochure Professional Certificate in Data Engineering
100% (1)
Brochure Professional Certificate in Data Engineering
14 pages
Data Science Lab
No ratings yet
Data Science Lab
61 pages
UNIT 4 Data Science Notes
100% (1)
UNIT 4 Data Science Notes
4 pages
Life Is Short I Use Python For Supply Chain Analytics PDF 1762433843
No ratings yet
Life Is Short I Use Python For Supply Chain Analytics PDF 1762433843
2 pages
ML Manual
No ratings yet
ML Manual
42 pages
Ai Final Project File by Yogesh Xii - B.docx Reedited
100% (1)
Ai Final Project File by Yogesh Xii - B.docx Reedited
28 pages
Stats Functionfile
No ratings yet
Stats Functionfile
4 pages
KOL QP XII-IP-PB-1-21.11 (1)
No ratings yet
KOL QP XII-IP-PB-1-21.11 (1)
12 pages
Assignment No 01
No ratings yet
Assignment No 01
2 pages

EDA Python Guide

Uploaded by

EDA Python Guide

Uploaded by

Exploratory Data Analysis in Python

Exploratory Data Analysis in Python

import matplotlib.pyplot as plt

import seaborn as sns

from scipy import stats

from sklearn.preprocessing import MinMaxScaler, StandardScaler

2. Loading the Dataset

# Example: Loading a CSV file

# Display the first few rows of the dataset

# Display summary statistics

# Display information about the dataset

# Handling missing values

# Encoding categorical variables

df['new_feature'] = df['existing_feature1'] * df['existing_feature2']

6. Outlier Detection and Treatment

# Using Z-score to identify outliers

filtered_entries = (abs_z_scores < 3)

7. Scaling and Normalization

df[['column1', 'column2']] = scaler.fit_transform(df[['column1', 'column2']])

# Alternatively, for Standardization

# df[['column1', 'column2']] = scaler.fit_transform(df[['column1', 'column2']])

8. Data Visualization (Examples)

sns.scatterplot(x='column1', y='column2', data=df)

plt.title('Scatter plot between column1 and column2')

# Heatmap for correlation

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

print("1. Description of key patterns or anomalies.")

print("2. Potential relationships between features.")

print("3. Insights on missing values and outliers.")

You might also like