0% found this document useful (0 votes)

13 views25 pages

Unit 5

This document covers data visualization techniques using Matplotlib and Seaborn, including various plot types such as line plots, scatter plots, histograms, and error visualizations. It discusses the advantages and disadvantages of data visualization, as well as methods for creating multiple subplots and three-dimensional plots. Additionally, it highlights the importance of visualizing data distributions and relationships to identify trends and patterns.

Uploaded by

Smt.G.Vanitha Assistant Professor

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views25 pages

Unit 5

Uploaded by

Smt.G.Vanitha Assistant Professor

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 25

UNIT-5

Visualization with Matplotlib : Simple Line plots, Scatter

plots, Visualizing errors, Density and Contour plots,
Histograms, Binnings, Multiple subplots, Three-
dimensional plotting with Matplotlib
,
Geographic data with Basemap, Visualization with
Seaborn
Data visualization
Data visualization is the graphical representation of information and
data. By using visual elements like charts, graphs, and maps, data
visualization tools provide an accessible way to see and understand
trends, outliers, and patterns in data.

Some other advantages of data visualization include:

Easily sharing information.
Interactively explore opportunities.
Visualize patterns and relationships.
• Some other disadvantages include:

• Biased or inaccurate information.

• Correlation doesn’t always mean causation.
• Core messages can get lost in translation.
• Importing Matplotlib

Setting Styles
We will use the plt.style directive to choose appropriate aesthetic styles
for our figures.
Simple Line Plots
• Perhaps the simplest of all plots is the visualization of a single
function $y = f(x)$.

• Here we will take a first look at creating a simple plot of this type. As
with all the following sections, we'll start by setting up the notebook
for plotting.
simple line plots
• A line plot shows how something changes over time or in relation to
another variable. It connects data points with straight lines, making it
easy to spot trends.
2. Bar Plot
• Shows quantities for different categories using bars.
• Comparing values across categories.
• Example: Sales by product type.

plt.bar(['Apples', 'Bananas', 'Oranges'], [50, 75, 30])

3. Histogram
• Shows the distribution of numerical data by grouping into bins.
• You want to understand the frequency of data ranges.
• Example: Distribution of students’ scores in a test.

plt.hist([55, 61, 70, 70, 72, 85, 90, 95, 95, 95], bins=5)
4. Scatter Plot
• Plots individual points to show the relationship between two variables.
• You're analyzing correlation or patterns.
• Example: Hours studied vs. test score.

plt.scatter([1, 2, 3, 4], [50, 60, 70, 80])

5. Box Plot (Box-and-Whisker Plot)

Summarizes data with median, quartiles, and outliers.
You want to visualize the spread and skew of your data.
Compare salary distributions for different departments.

psns.boxplot(data=[ [30000, 35000, 40000], [50000, 52000, 58000] ])

Different Plots
Line Plot :
• Shows trends over time by connecting points with lines.
• You want to see how something changes over time.

Example: Temperature across 7 days.

plt.plot([1, 2, 3], [10, 15, 13])
• 6. Pie Chart
• A circular chart showing proportions as slices.
• You want to show percentage breakdowns.
• Market share by brand.
• plt.pie([40, 30, 20, 10], labels=['Brand A', 'B', 'C', 'D'], autopct='%1.1f
%%')

7. Heatmap
• A color-coded matrix that shows correlations or frequencies.
• You're visualizing a grid of values (e.g., correlations).
• Correlation between different features in a dataset.
import seaborn as sns
import numpy as np
data = np.random.rand(5,5)
sns.heatmap(data, annot=True)

8. Pair Plot
• Multiple scatter plots in a grid to show relationships in multi-variable data.
• You’re exploring relationships between several features.
• Iris dataset (petal length, width, species, etc.)

sns.pairplot(sns.load_dataset('iris'), hue='species')
Simple Scatter Plots
• A scatter plot is a graph with points (dots) plotted on a horizontal (x-
axis) and vertical (y-axis) to show how much one variable is affected
by another.

Purpose of a Scatter Plot

• To observe relationships/correlations between two variables (e.g.,

height vs weight, hours studied vs exam score)
• To identify trends, such as positive, negative, or no correlation
• To spot outliers (data points that don't fit the pattern)
• To visualize clusters or groupings of data
Choose two variables you want to compare.

• Example: Study hours (X-axis) vs Test score (Y-axis)

Plot the data as points on the graph, each point representing one
observation.
(x₁, y₁), (x₂, y₂), etc.
Look for patterns:
Upward trend → Positive correlation
Downward trend → Negative correlation
Random spread → No correlation
Visualizing Errors
When you plot data, you often want to answer:

• How reliable are these points?

• Is the variation random noise or a real pattern?

• How confident are we in the measurements?

• Error bars help answer that by showing how much the data might vary.
They usually represent uncertainty in measurements or predictions. This could
be:

• Standard deviation (how spread out the data is)

• Standard error (uncertainty of the mean)
• Confidence intervals
• Measurement precision

plt.errorbar(x, y, yerr=dy, fmt='.k');

"Here are the observed data points (y), but each has a possible error of ±0.8."
The vertical lines (error bars) show that range.
• Points = the measured or predicted values.
• Vertical lines = the possible range above and below each point, due to
noise or uncertainty.
• If error bars don’t overlap between groups/points → strong evidence
of difference.
• If they do overlap → differences might be due to noise.
Types of error bars
• Symmetric Vertical Error Bars : All points have the same uncertainty
range above and below.

• Asymmetric Vertical Error Bars : Each point has a different upper and
lower error.

• Horizontal Error Bars : Error is shown in the x-direction instead of y.

Density and Contour Plots
Sometimes it is useful to display three-dimensional data in two
dimensions using contours or color-coded regions. There are three
Matplotlib functions that can be helpful for this task: plt.contour for
contour plots, plt.contourf for filled contour plots, and plt.imshow for
showing images
• Density Plot (2D Histogram or KDE)
• Shows how data points are concentrated in different areas of a 2D space.
• Think of it like a heatmap of how many points are in different regions.
• Often created with kernel density estimation (KDE) or 2D histograms.

• 🔸 Contour Plot
• A topographic map-style plot.
• Shows lines of constant density — each contour line encloses an area with
equal density.
• It's like slicing a 3D density surface into 2D layers.
Histograms, Binnings, Multiple subplots
• A histogram is a graphical representation of the distribution of numerical data. It's an estimate
of the probability distribution of a continuous variable and was first introduced by Karl Pearson.

Key characteristics:
• Consists of adjacent rectangles (bins)
• The area of each rectangle represents the frequency of data points in that bin
• X-axis represents the range of data values divided into intervals
• Y-axis represents the frequency or count of observations in each interval

Purpose:
• Visualize data distribution
• Identify patterns (normal, skewed, bimodal distributions)
• Spot outliers
• Understand data spread and central tendency
Binning
Binning (or bucketing) is the process of dividing the range of values in a dataset into a series
of intervals (bins) for histogram creation or data discretization.
Key aspects:Bin Width/Size: The range of values each bin covers
• Number of Bins: How many intervals to create
• Bin Edges: The boundaries between bins
Common binning strategies:
• Fixed-width binning: Equal-sized intervals (e.g., 0-10, 10-20, 20-30)
• Variable-width binning: Unequal intervals based on data density
• Square-root choice: Number of bins = √n (n = number of data points)Impact of binning:
• Too few bins may oversimplify the distribution
• Too many bins may show too much noise
• Optimal binning reveals the true underlying distribution
Multiple subplots
Multiple subplots (or small multiples) are arrangements of several plots in a
single figure to enable comparison across different variables or categories.

Common types of subplot arrangements:

• Grid layout (rows × columns)
• Shared axis subplots (aligned scales for comparison)
• Faceted plots (by category variables)

Benefits:
• Compare distributions across categories
• Visualize relationships between multiple variables
• Save space while showing comprehensive information
Three-dimensional plotting with
Matplotlib

Module 4 Personal Hygiene Course Notes
No ratings yet
Module 4 Personal Hygiene Course Notes
7 pages
Buncombe County EMS System Report
No ratings yet
Buncombe County EMS System Report
22 pages
Datascience
No ratings yet
Datascience
50 pages
Matplotlib
No ratings yet
Matplotlib
22 pages
Matplotlib Basics
No ratings yet
Matplotlib Basics
27 pages
Data Visualization
No ratings yet
Data Visualization
48 pages
3-Data Description
No ratings yet
3-Data Description
91 pages
Lecture Week3
No ratings yet
Lecture Week3
51 pages
19 Matplotlib
No ratings yet
19 Matplotlib
26 pages
3 Data Description
No ratings yet
3 Data Description
87 pages
Datascienece
No ratings yet
Datascienece
18 pages
Data Science Unit 2-11-08 2023
No ratings yet
Data Science Unit 2-11-08 2023
78 pages
Python Plots
No ratings yet
Python Plots
47 pages
BarPlot and Histogram
No ratings yet
BarPlot and Histogram
28 pages
Description of Data Visualization Tools
No ratings yet
Description of Data Visualization Tools
15 pages
Unit 5
No ratings yet
Unit 5
10 pages
Data Visualization With Matplotlib
No ratings yet
Data Visualization With Matplotlib
20 pages
Mat Plot Lib
No ratings yet
Mat Plot Lib
22 pages
Seaborn
No ratings yet
Seaborn
7 pages
Matplotlib
No ratings yet
Matplotlib
13 pages
Unit I 1 1
No ratings yet
Unit I 1 1
56 pages
Data Visualization Using Matplotlib and Seaborn
No ratings yet
Data Visualization Using Matplotlib and Seaborn
28 pages
L5 6 DataViz
No ratings yet
L5 6 DataViz
79 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
22 pages
Data Visualization - 1 by Matplot Lib
No ratings yet
Data Visualization - 1 by Matplot Lib
19 pages
PYDS 3150713 Unit-4
No ratings yet
PYDS 3150713 Unit-4
59 pages
Pandas Cheat Sheet 2
No ratings yet
Pandas Cheat Sheet 2
12 pages
Data Visualization
No ratings yet
Data Visualization
35 pages
Unit 2 DS
No ratings yet
Unit 2 DS
36 pages
Data Visualization Using Pyplot: Submitted by
No ratings yet
Data Visualization Using Pyplot: Submitted by
27 pages
Unit V Data Visualization
No ratings yet
Unit V Data Visualization
49 pages
Data Analysis Graphs
No ratings yet
Data Analysis Graphs
9 pages
Data Visualisation
No ratings yet
Data Visualisation
5 pages
Unit 4 - Data Visualization
No ratings yet
Unit 4 - Data Visualization
32 pages
Data Visulation
No ratings yet
Data Visulation
8 pages
Unit 4 (2) Python
No ratings yet
Unit 4 (2) Python
27 pages
UNIT3
No ratings yet
UNIT3
60 pages
Data Visualization Part 2
No ratings yet
Data Visualization Part 2
18 pages
Data Visualization
No ratings yet
Data Visualization
26 pages
Content From Jose Portilla's Udemy Course Learning Python For Data Analysis and Visualization Notes by Michael Brothers, Available On
No ratings yet
Content From Jose Portilla's Udemy Course Learning Python For Data Analysis and Visualization Notes by Michael Brothers, Available On
13 pages
Lecture 4
No ratings yet
Lecture 4
60 pages
Visualization
No ratings yet
Visualization
28 pages
Unit 05
No ratings yet
Unit 05
26 pages
Python Unit 4.notes
No ratings yet
Python Unit 4.notes
50 pages
Notes9 - Class - 10 - Data Visualization Using MatPlotlib Notes
No ratings yet
Notes9 - Class - 10 - Data Visualization Using MatPlotlib Notes
5 pages
Dataviz Cheatsheet
No ratings yet
Dataviz Cheatsheet
9 pages
Matplotlib
No ratings yet
Matplotlib
9 pages
Matplotlib Functions
No ratings yet
Matplotlib Functions
32 pages
Data Visualization
No ratings yet
Data Visualization
28 pages
Data Visualization Notes
No ratings yet
Data Visualization Notes
7 pages
Seaborn 2
No ratings yet
Seaborn 2
49 pages
Matplotlib Notes
No ratings yet
Matplotlib Notes
5 pages
Matplotlib Plots
No ratings yet
Matplotlib Plots
13 pages
ML Week 7
No ratings yet
ML Week 7
12 pages
DS - UNIT - IV - QB & Ans
No ratings yet
DS - UNIT - IV - QB & Ans
27 pages
CHAPTER-2 Data Visualization
No ratings yet
CHAPTER-2 Data Visualization
4 pages
1714514135
No ratings yet
1714514135
12 pages
Chapter11 DataVisualization2
No ratings yet
Chapter11 DataVisualization2
43 pages
Unit2 Modified
No ratings yet
Unit2 Modified
42 pages
Advanced Python Chap 3 Part 1
No ratings yet
Advanced Python Chap 3 Part 1
49 pages
Image Histogram: Unveiling Visual Insights, Exploring the Depths of Image Histograms in Computer Vision
From Everand
Image Histogram: Unveiling Visual Insights, Exploring the Depths of Image Histograms in Computer Vision
Fouad Sabry
No ratings yet
Illuminating Data: A hands on guide to data visualization in R
From Everand
Illuminating Data: A hands on guide to data visualization in R
Eman Ahmad
No ratings yet
Embroidrerd Patches For Jacket
No ratings yet
Embroidrerd Patches For Jacket
4 pages
BFR 96 Ts
No ratings yet
BFR 96 Ts
9 pages
(I) (Ii) (Iii) (Iv) : A) B) C) D)
No ratings yet
(I) (Ii) (Iii) (Iv) : A) B) C) D)
16 pages
DESIGN AND DEVELOPMENT OF MINI SUGAR CANE LIFTER Ijariie8602
No ratings yet
DESIGN AND DEVELOPMENT OF MINI SUGAR CANE LIFTER Ijariie8602
3 pages
Sunn SPL 2212,2216,2224 Service Manual
No ratings yet
Sunn SPL 2212,2216,2224 Service Manual
16 pages
Guide To Using SQL: Synonyms and The Rename Statement: A Feature of Oracle RDB
No ratings yet
Guide To Using SQL: Synonyms and The Rename Statement: A Feature of Oracle RDB
15 pages
The Feeling Korea Guide Book - 2025 Summer
No ratings yet
The Feeling Korea Guide Book - 2025 Summer
8 pages
MA BRKSEC-3006 284402 156-1 v1
No ratings yet
MA BRKSEC-3006 284402 156-1 v1
110 pages
Q 25-2015 PDF
No ratings yet
Q 25-2015 PDF
16 pages
বিজ্ঞান ও প্রযু‌ক্তি
No ratings yet
বিজ্ঞান ও প্রযু‌ক্তি
21 pages
OneTrust ESG Program Checklist
No ratings yet
OneTrust ESG Program Checklist
2 pages
2Q2324 C1 Hydraulics Drills
No ratings yet
2Q2324 C1 Hydraulics Drills
6 pages
Global Foresight Through Multiple Perspective
No ratings yet
Global Foresight Through Multiple Perspective
36 pages
Half-Life - Counter Strike Cheat Codes For PC
No ratings yet
Half-Life - Counter Strike Cheat Codes For PC
7 pages
Thesis On Tata Motors
100% (2)
Thesis On Tata Motors
7 pages
UML Class Diagram
No ratings yet
UML Class Diagram
44 pages
CVP Analysis Learning Exercises
No ratings yet
CVP Analysis Learning Exercises
3 pages
IMT Asia Pasifik
No ratings yet
IMT Asia Pasifik
7 pages
DSA-Class-Assignment 3
No ratings yet
DSA-Class-Assignment 3
2 pages
Scott Steering Damper
No ratings yet
Scott Steering Damper
20 pages
Gulshan Polyol
No ratings yet
Gulshan Polyol
4 pages
Medical Surgical Nursing Questions
No ratings yet
Medical Surgical Nursing Questions
7 pages
Eic SE-EXTC Sem 3 May-19 QP
No ratings yet
Eic SE-EXTC Sem 3 May-19 QP
2 pages
Conceptual Questions: Problem Set 1: Electric Forces and Fields
No ratings yet
Conceptual Questions: Problem Set 1: Electric Forces and Fields
5 pages
Shah Jehan Assignment
No ratings yet
Shah Jehan Assignment
4 pages
SL. NO Particulars L.F DEBIT (RS) Credit (RS)
No ratings yet
SL. NO Particulars L.F DEBIT (RS) Credit (RS)
23 pages
Discovery Inc.-The Acquisition of Scripps Network Interactive by Discovery Communications
No ratings yet
Discovery Inc.-The Acquisition of Scripps Network Interactive by Discovery Communications
5 pages
Zorem 9-15 July
No ratings yet
Zorem 9-15 July
4 pages

Unit 5

Uploaded by

Unit 5

Uploaded by

UNIT-5

Visualization with Matplotlib : Simple Line plots, Scatter

Some other advantages of data visualization include:

• Biased or inaccurate information.

plt.bar(['Apples', 'Bananas', 'Oranges'], [50, 75, 30])

plt.scatter([1, 2, 3, 4], [50, 60, 70, 80])

5. Box Plot (Box-and-Whisker Plot)

psns.boxplot(data=[ [30000, 35000, 40000], [50000, 52000, 58000] ])

Example: Temperature across 7 days.

Purpose of a Scatter Plot

• To observe relationships/correlations between two variables (e.g.,

• Example: Study hours (X-axis) vs Test score (Y-axis)

• How reliable are these points?

• Is the variation random noise or a real pattern?

• How confident are we in the measurements?

• Standard deviation (how spread out the data is)

plt.errorbar(x, y, yerr=dy, fmt='.k');

• Horizontal Error Bars : Error is shown in the x-direction instead of y.

Common types of subplot arrangements:

You might also like