0% found this document useful (0 votes)

7 views2 pages

Data Analytics With Python Examples

The document provides a comprehensive guide on data analytics using Python, covering data gathering, cleaning, descriptive analytics, inferential statistics, and clustering. It includes code examples for loading datasets, handling missing values, performing statistical tests, and visualizing results. Key techniques demonstrated include t-tests for survival analysis and K-Means clustering for data segmentation.

Uploaded by

bibija.john

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views2 pages

Data Analytics With Python Examples

Uploaded by

bibija.john

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Data Analytics with Python - Code and Visualization Examples

1. Data Gathering

import seaborn as sns

import pandas as pd

# Load sample dataset

df = sns.load_dataset("titanic")
print(df.head())

2. Data Scrubbing (Cleaning)

# Check for missing values

print(df.isnull().sum())

# Fill missing 'age' with median

df['age'].fillna(df['age'].median(), inplace=True)

# Drop 'deck' column (too many missing values)

df.drop(columns=['deck'], inplace=True)

# Drop rows with any remaining nulls

df.dropna(inplace=True)

3. Descriptive Analytics

# Descriptive statistics
print(df.describe())

# Plot: Age distribution

import matplotlib.pyplot as plt
import seaborn as sns

sns.histplot(df['age'], bins=30, kde=True)

plt.title('Age Distribution')
plt.xlabel('Age')
plt.ylabel('Frequency')
plt.show()

4. Measures of Central Tendency and Spread

mean_age = df['age'].mean()
median_age = df['age'].median()
std_dev = df['age'].std()

print(f"Mean Age: {mean_age:.2f}")

print(f"Median Age: {median_age}")
print(f"Standard Deviation: {std_dev:.2f}")
Data Analytics with Python - Code and Visualization Examples

5. Inferential Statistics: T-Test

from scipy.stats import ttest_ind

# Create two groups

survived = df[df['survived'] == 1]['age']
not_survived = df[df['survived'] == 0]['age']

# Perform independent t-test

t_stat, p_val = ttest_ind(survived, not_survived)

print(f"T-statistic: {t_stat:.2f}")
print(f"P-value: {p_val:.4f}")

6. Data Analysis: Survival Rate by Sex

sns.barplot(x='sex', y='survived', data=df)

plt.title('Survival Rate by Sex')
plt.ylabel('Survival Rate')
plt.show()

7. Clustering with K-Means

from sklearn.cluster import KMeans

# Select numeric features

X = df[['age', 'fare']]

# Apply K-Means Clustering

kmeans = KMeans(n_clusters=3)
df['cluster'] = kmeans.fit_predict(X)

# Plot clusters
plt.figure(figsize=(8,5))
sns.scatterplot(x='age', y='fare', hue='cluster', data=df, palette='Set2')
plt.title('K-Means Clustering on Age and Fare')
plt.show()

Data Visualization Python Tutorial
100% (1)
Data Visualization Python Tutorial
9 pages
Universal Data Analytics Algorithm
No ratings yet
Universal Data Analytics Algorithm
51 pages
Data Exploration and Visualization Laboratory - AD3301 - Lab Manual
No ratings yet
Data Exploration and Visualization Laboratory - AD3301 - Lab Manual
55 pages
Python Notes by Prof T
No ratings yet
Python Notes by Prof T
10 pages
Data Visualization
No ratings yet
Data Visualization
31 pages
Data Analysis
No ratings yet
Data Analysis
42 pages
Edap Lab
No ratings yet
Edap Lab
47 pages
Final Dev Record
No ratings yet
Final Dev Record
49 pages
Data Analytics
No ratings yet
Data Analytics
34 pages
Data Science
No ratings yet
Data Science
42 pages
Wa0005.
No ratings yet
Wa0005.
29 pages
DAV EXP 1 t12 31
No ratings yet
DAV EXP 1 t12 31
39 pages
Chapter 2. Data Analysis and Processing - Full
No ratings yet
Chapter 2. Data Analysis and Processing - Full
49 pages
Datascience
No ratings yet
Datascience
26 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
CG DADL - 2024 June - Lecture 02
No ratings yet
CG DADL - 2024 June - Lecture 02
64 pages
It Journal
No ratings yet
It Journal
30 pages
CSE445 NSU Week - 3
No ratings yet
CSE445 NSU Week - 3
48 pages
Python & MySQL For Data Analysis
No ratings yet
Python & MySQL For Data Analysis
45 pages
IP Project I
No ratings yet
IP Project I
56 pages
Financial Analytics With Python
100% (1)
Financial Analytics With Python
40 pages
IP Project I
No ratings yet
IP Project I
51 pages
Training Report On Data Analysis With Python
No ratings yet
Training Report On Data Analysis With Python
12 pages
Server Hosting Management System (Ip Class 12) (2024-25)
No ratings yet
Server Hosting Management System (Ip Class 12) (2024-25)
21 pages
DVA Practical
No ratings yet
DVA Practical
19 pages
Lab Record Dev
No ratings yet
Lab Record Dev
20 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
12 pages
Fraud 2
No ratings yet
Fraud 2
20 pages
Data Aggregation Using Python
No ratings yet
Data Aggregation Using Python
33 pages
BDA File
No ratings yet
BDA File
26 pages
Pandas Complete + Visualisation Summary of IBM Visualization
No ratings yet
Pandas Complete + Visualisation Summary of IBM Visualization
21 pages
Data Analysis With Python
No ratings yet
Data Analysis With Python
29 pages
Week13 2 Data Analysis 2
No ratings yet
Week13 2 Data Analysis 2
44 pages
An Extensive Step by Step Guide To Exploratory Data Analysis
No ratings yet
An Extensive Step by Step Guide To Exploratory Data Analysis
26 pages
Course - Introduction To Data Science (SD211105)
No ratings yet
Course - Introduction To Data Science (SD211105)
10 pages
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
No ratings yet
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
28 pages
Summary: Introduction To Data Visualization Tools
No ratings yet
Summary: Introduction To Data Visualization Tools
13 pages
Data Unit4
No ratings yet
Data Unit4
8 pages
Types of Data Analysis With Code
No ratings yet
Types of Data Analysis With Code
8 pages
MODULE2 Material
No ratings yet
MODULE2 Material
14 pages
01 - Lesson - Visualization - Jupyter Notebook
No ratings yet
01 - Lesson - Visualization - Jupyter Notebook
18 pages
Practical No.-01
No ratings yet
Practical No.-01
25 pages
Data Visualisation
No ratings yet
Data Visualisation
5 pages
DAVP Lab Manual
No ratings yet
DAVP Lab Manual
12 pages
Pandas
No ratings yet
Pandas
7 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
BasicAnalysis Using PYTHON
No ratings yet
BasicAnalysis Using PYTHON
6 pages
DAC Phase2
No ratings yet
DAC Phase2
8 pages
Learneverythingai
No ratings yet
Learneverythingai
9 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
4 pages
DSBDL Write Ups 8 To 10
No ratings yet
DSBDL Write Ups 8 To 10
7 pages
Code Shabab Error 7
No ratings yet
Code Shabab Error 7
5 pages
Data Exploration Preparation
No ratings yet
Data Exploration Preparation
12 pages
Data Analysis
No ratings yet
Data Analysis
4 pages
Viva Answers
No ratings yet
Viva Answers
3 pages
Advanced Visualization For Data Scientists With Matplotlib
No ratings yet
Advanced Visualization For Data Scientists With Matplotlib
38 pages
Python Ds
No ratings yet
Python Ds
22 pages
Exploratory Data Analysis-1
No ratings yet
Exploratory Data Analysis-1
10 pages
Experiment No: 1 Introduction To Data Analytics and Python Fundamentals Page-1/11
No ratings yet
Experiment No: 1 Introduction To Data Analytics and Python Fundamentals Page-1/11
8 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet

Data Analytics With Python Examples

Uploaded by

Data Analytics With Python Examples

Uploaded by

Data Analytics with Python - Code and Visualization Examples

import seaborn as sns

# Load sample dataset

2. Data Scrubbing (Cleaning)

# Check for missing values

# Fill missing 'age' with median

# Drop 'deck' column (too many missing values)

# Drop rows with any remaining nulls

# Plot: Age distribution

sns.histplot(df['age'], bins=30, kde=True)

4. Measures of Central Tendency and Spread

print(f"Mean Age: {mean_age:.2f}")

5. Inferential Statistics: T-Test

from scipy.stats import ttest_ind

# Create two groups

# Perform independent t-test

6. Data Analysis: Survival Rate by Sex

sns.barplot(x='sex', y='survived', data=df)

7. Clustering with K-Means

from sklearn.cluster import KMeans

# Select numeric features

# Apply K-Means Clustering

You might also like