0% found this document useful (0 votes)

14 views8 pages

Data Visualization Lab: Experiment 1

s,ncasnccncscd,v,vmdvc,m dcv.dfd

Uploaded by

mohammadafrin03

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views8 pages

Data Visualization Lab: Experiment 1

s,ncasnccncscd,v,vmdvc,m dcv.dfd

Uploaded by

mohammadafrin03

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

Date: 03-01-25

DATA VISUALIZATION LAB

Mohammad Afrin

24PDD0021

SCOPE

Experiment 1:
Create a dataset of 20 rows and 10 columns of data associated with any of your

interested domains. The dataset shall include data of types: Qualitative and

Quantitative (ordinal, nominal, interval and ratio – continuous / discrete).

For the created dataset, perform the following visualization of:

a. Precise Comparison of Two or more categorical data

b. Numerical data across more than one categorical data

Code:
import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

# Set random seed for reproducibility

np.random.seed(42)

# Create a dataset with 20 rows and 10 columns

data = {

'Employee ID': [f'EMP{1000+i}' for i in range(1, 21)],

'Department': np.random.choice(['Sales', 'HR', 'IT', 'Finance'], 20),

'Job Level': np.random.randint(1, 6, size=20),

'Gender': np.random.choice(['Male', 'Female'], 20),

'Age': np.random.randint(22, 60, size=20),

'Salary': np.random.randint(40000, 120000, size=20),

'Years of Experience': np.random.randint(1, 35, size=20),

'Performance Score': np.random.randint(50, 101, size=20),

'Work Hours per Week': np.random.randint(30, 60, size=20),

'Promoted': np.random.choice(['Yes', 'No'], 20)

# Create DataFrame

df = pd.DataFrame(data)

# a. Precise Comparison of Two or More Categorical Data (e.g., Gender vs Department)

plt.figure(figsize=(10, 6))

sns.countplot(data=df, x='Department', hue='Gender', palette='Set1')

plt.title('Comparison of Gender across Departments')

plt.xlabel('Department')

plt.ylabel('Count')

plt.show()

# b. Numerical Data across more than one categorical data (e.g., Salary vs Department with
Job Level as Hue)

plt.figure(figsize=(10, 6))

sns.boxplot(data=df, x='Department', y='Salary', hue='Job Level', palette='Set2')

plt.title('Salary Distribution across Departments and Job Levels')

plt.xlabel('Department')

plt.ylabel('Salary (USD)')
plt.show()

# Bonus Visualization: Performance Score by Age Group

df['Age Group'] = pd.cut(df['Age'], bins=[20, 30, 40, 50, 60], labels=['20-30', '30-40', '40-50',
'50-60'])

plt.figure(figsize=(10, 6))

sns.boxplot(data=df, x='Age Group', y='Performance Score', palette='coolwarm')

plt.title('Performance Score by Age Group')

plt.xlabel('Age Group')

plt.ylabel('Performance Score')

plt.show()

Output:
Experiment 5:

Create a dataset of 20 rows and 10 columns of data associated with any of your

interested domains. The dataset shall include data of types: Qualitative and

Quantitative (ordinal, nominal, interval and ratio – continuous / discrete).

For the created dataset, perform the following visualization of:

a. Two or more Continuous Data over a period of time

b. Relative Proportion of one or more categorical data

Code:
import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

# Set random seed for reproducibility

np.random.seed(42)

# Generate the dataset

data = {

'Transaction ID': [f'TR{1000+i}' for i in range(1, 21)],

'Product Category': np.random.choice(['Electronics', 'Clothing', 'Books', 'Home

Appliances'], 20),

'Customer Region': np.random.choice(['North', 'South', 'East', 'West'], 20),

'Customer Age': np.random.randint(18, 60, size=20),

'Transaction Amount': np.random.randint(50, 500, size=20),

'Discount Applied': np.random.uniform(5, 30, size=20),

'Payment Method': np.random.choice(['Credit Card', 'PayPal', 'Bank Transfer'], 20),

'Transaction Date': pd.date_range(start='2023-01-01', periods=20, freq='D'),

'Quantity Purchased': np.random.randint(1, 5, size=20),

'Customer Satisfaction': np.random.randint(1, 6, size=20)

# Create DataFrame

df = pd.DataFrame(data)

# a. Two or more Continuous Data over a period of time

# We'll plot Transaction Amount and Discount Applied over the Transaction Date.

plt.figure(figsize=(10, 6))

plt.plot(df['Transaction Date'], df['Transaction Amount'], label='Transaction Amount (USD)',

marker='o', color='blue')

plt.plot(df['Transaction Date'], df['Discount Applied'], label='Discount Applied (%)',

marker='o', color='green')

plt.title('Transaction Amount and Discount Applied Over Time')

plt.xlabel('Date')

plt.ylabel('Value')

plt.legend()

plt.xticks(rotation=45)

plt.tight_layout()

plt.show()

# b. Relative Proportion of one or more categorical data

# We'll plot the proportion of each product category sold.

plt.figure(figsize=(10, 6))

sns.countplot(data=df, x='Product Category', palette='Set2')

plt.title('Relative Proportion of Product Categories Sold')

plt.xlabel('Product Category')

plt.ylabel('Count')

plt.show()

# Bonus Visualization: Average Satisfaction by Payment Method

# We will visualize the average customer satisfaction score by Payment Method.

plt.figure(figsize=(10, 6))

sns.boxplot(data=df, x='Payment Method', y='Customer Satisfaction', palette='coolwarm')

plt.title('Customer Satisfaction by Payment Method')

plt.xlabel('Payment Method')

plt.ylabel('Customer Satisfaction')

plt.show()

Output:

Assignment2 DataViz
No ratings yet
Assignment2 DataViz
11 pages
The Aeneid Book VI Lines 295-332, 384-425, 450-476, 847-899
No ratings yet
The Aeneid Book VI Lines 295-332, 384-425, 450-476, 847-899
4 pages
Lab Manual: 18CS3262S Data Modelling and Visualization Techniques
33% (3)
Lab Manual: 18CS3262S Data Modelling and Visualization Techniques
17 pages
Ai&Ml Bail606 ML Lab Manual
No ratings yet
Ai&Ml Bail606 ML Lab Manual
50 pages
DSBDL Write Ups 8 To 10
No ratings yet
DSBDL Write Ups 8 To 10
7 pages
Advanced Plot Types With Seaborn
No ratings yet
Advanced Plot Types With Seaborn
8 pages
Data Visualization With Python
No ratings yet
Data Visualization With Python
34 pages
Khadeeja - DS - PRACTICAL 4
No ratings yet
Khadeeja - DS - PRACTICAL 4
24 pages
DAV Guidelines
No ratings yet
DAV Guidelines
4 pages
DSBDAL - Assignment No 9
No ratings yet
DSBDAL - Assignment No 9
12 pages
West Rox
No ratings yet
West Rox
29 pages
Exp 12 and 15
No ratings yet
Exp 12 and 15
4 pages
Data Science
No ratings yet
Data Science
18 pages
DAVP Lab Manual
No ratings yet
DAVP Lab Manual
12 pages
Data Visualization
No ratings yet
Data Visualization
31 pages
Experiment No 9
No ratings yet
Experiment No 9
13 pages
DSA Lab Manual Pgms - fINAL
No ratings yet
DSA Lab Manual Pgms - fINAL
34 pages
Eda Code Snippets
No ratings yet
Eda Code Snippets
17 pages
Matplotlib Pandas Guide
No ratings yet
Matplotlib Pandas Guide
7 pages
DVT Lab
No ratings yet
DVT Lab
15 pages
Seaborn
No ratings yet
Seaborn
7 pages
Main - Py Text File
No ratings yet
Main - Py Text File
5 pages
Data Sci
No ratings yet
Data Sci
10 pages
23bet10114 Naman Gupta Assignment-1
No ratings yet
23bet10114 Naman Gupta Assignment-1
17 pages
Index
No ratings yet
Index
4 pages
Exp 5
No ratings yet
Exp 5
5 pages
Maxbox Starter139 Top5 Data Diagram Types
No ratings yet
Maxbox Starter139 Top5 Data Diagram Types
4 pages
Set B
No ratings yet
Set B
8 pages
BIDA Practical Print
No ratings yet
BIDA Practical Print
56 pages
Vanshika Goyal Gec Practicals
No ratings yet
Vanshika Goyal Gec Practicals
31 pages
Data Visualization
No ratings yet
Data Visualization
13 pages
Lab Manual For Students
No ratings yet
Lab Manual For Students
38 pages
Oddstudents
No ratings yet
Oddstudents
35 pages
Time Series Analysis Group 9
No ratings yet
Time Series Analysis Group 9
16 pages
Pandas Complete + Visualisation Summary of IBM Visualization
No ratings yet
Pandas Complete + Visualisation Summary of IBM Visualization
21 pages
Summary: Introduction To Data Visualization Tools
No ratings yet
Summary: Introduction To Data Visualization Tools
13 pages
Gec Practicals
No ratings yet
Gec Practicals
31 pages
Data Analysis CheatSheet
No ratings yet
Data Analysis CheatSheet
2 pages
Data Viz Cheat Sheet Final
No ratings yet
Data Viz Cheat Sheet Final
2 pages
DAV EXP 1 t12 31
No ratings yet
DAV EXP 1 t12 31
39 pages
1.1 Univariate Analysis: 1.1.1 Categorical Data
No ratings yet
1.1 Univariate Analysis: 1.1.1 Categorical Data
10 pages
Prac 2
No ratings yet
Prac 2
11 pages
Pandas 3-2
No ratings yet
Pandas 3-2
27 pages
Dev Record Final
No ratings yet
Dev Record Final
34 pages
B Fariha Data Visualization w6
No ratings yet
B Fariha Data Visualization w6
6 pages
Certificate
No ratings yet
Certificate
25 pages
Ccs346 Eda Unit 1
No ratings yet
Ccs346 Eda Unit 1
139 pages
Aphical Representation
No ratings yet
Aphical Representation
8 pages
Technologyname Phase2
No ratings yet
Technologyname Phase2
20 pages
Employee Info
No ratings yet
Employee Info
2 pages
Python Comands
No ratings yet
Python Comands
3 pages
Prac - 6
No ratings yet
Prac - 6
7 pages
Chirayu (1) Merged Merged
No ratings yet
Chirayu (1) Merged Merged
76 pages
Informatics Practices Record Class 12
No ratings yet
Informatics Practices Record Class 12
60 pages
GE Practical Sem 2
No ratings yet
GE Practical Sem 2
28 pages
ML Expt 1 Description
No ratings yet
ML Expt 1 Description
15 pages
Even Students
No ratings yet
Even Students
36 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
Prac 2
No ratings yet
Prac 2
11 pages
Illuminating Data: A hands on guide to data visualization in R
From Everand
Illuminating Data: A hands on guide to data visualization in R
Eman Ahmad
No ratings yet
Visualization and Interpretation: Humanistic Approaches to Display
From Everand
Visualization and Interpretation: Humanistic Approaches to Display
Johanna Drucker
No ratings yet
F'ed Up
No ratings yet
F'ed Up
5 pages
1
No ratings yet
1
1 page
DAC Minutes Format - B
No ratings yet
DAC Minutes Format - B
3 pages
Titlehi Hello Namaste
No ratings yet
Titlehi Hello Namaste
12 pages
UG Science Honours 2nd Merit List
No ratings yet
UG Science Honours 2nd Merit List
21 pages
Chap 4 Job Costing
No ratings yet
Chap 4 Job Costing
9 pages
3 Laptop 26 Oktober 2020
No ratings yet
3 Laptop 26 Oktober 2020
1 page
Special Ed Thesis Topics
100% (3)
Special Ed Thesis Topics
5 pages
Complete
No ratings yet
Complete
14 pages
Look To You
No ratings yet
Look To You
8 pages
1
No ratings yet
1
1 page
4 January 2020 r137 Bitcoin Crypto Update Rev0
No ratings yet
4 January 2020 r137 Bitcoin Crypto Update Rev0
9 pages
Review Data
No ratings yet
Review Data
745 pages
Please Provide Answers To The Following Questions:: Activity 5 - Determine Appropriate Business Structure
No ratings yet
Please Provide Answers To The Following Questions:: Activity 5 - Determine Appropriate Business Structure
4 pages
Lumbang Integrated National High School
No ratings yet
Lumbang Integrated National High School
3 pages
FSM 1989 Tracker 00 General Information
No ratings yet
FSM 1989 Tracker 00 General Information
24 pages
A. Recount Text
No ratings yet
A. Recount Text
9 pages
OSI Security Architecture
No ratings yet
OSI Security Architecture
5 pages
8DG24624AGAATQZZA - V1 - 1850 Transport Service Switch 5C (TSS-5C) Release 6.1 User Provisioning Guide PDF
No ratings yet
8DG24624AGAATQZZA - V1 - 1850 Transport Service Switch 5C (TSS-5C) Release 6.1 User Provisioning Guide PDF
464 pages
ETR PHD Chemistry 2019
No ratings yet
ETR PHD Chemistry 2019
5 pages
Maps Dhamnod Dhar
100% (1)
Maps Dhamnod Dhar
13 pages
Treasurers Certificate
No ratings yet
Treasurers Certificate
2 pages
Website Blogs
No ratings yet
Website Blogs
7 pages
Affirmative Action in Malaysia: Education and Employment Outcomes Since The 1990s
No ratings yet
Affirmative Action in Malaysia: Education and Employment Outcomes Since The 1990s
37 pages
Science Powerpoint Presentation
No ratings yet
Science Powerpoint Presentation
80 pages
Moving Coil Galvanometer Porject Class 12
No ratings yet
Moving Coil Galvanometer Porject Class 12
25 pages
Assignment
No ratings yet
Assignment
7 pages
Claes 20 Gauge Vitrectomy System
No ratings yet
Claes 20 Gauge Vitrectomy System
8 pages
Business Model - 2021 - SCE
No ratings yet
Business Model - 2021 - SCE
23 pages
18106A1051 - Ishwar Jathar - Social Relevance Project
No ratings yet
18106A1051 - Ishwar Jathar - Social Relevance Project
49 pages
Hydrological Modeling and Climate Change Impact Assessment Using HBV
No ratings yet
Hydrological Modeling and Climate Change Impact Assessment Using HBV
13 pages
Digital Design
No ratings yet
Digital Design
173 pages
4.1 Revised Penal Code Book 1
No ratings yet
4.1 Revised Penal Code Book 1
75 pages

Data Visualization Lab: Experiment 1

Uploaded by

Data Visualization Lab: Experiment 1

Uploaded by

Date: 03-01-25

DATA VISUALIZATION LAB

Quantitative (ordinal, nominal, interval and ratio – continuous / discrete).

For the created dataset, perform the following visualization of:

a. Precise Comparison of Two or more categorical data

import matplotlib.pyplot as plt

import seaborn as sns

# Set random seed for reproducibility

# Create a dataset with 20 rows and 10 columns

'Employee ID': [f'EMP{1000+i}' for i in range(1, 21)],

'Department': np.random.choice(['Sales', 'HR', 'IT', 'Finance'], 20),

'Gender': np.random.choice(['Male', 'Female'], 20),

'Age': np.random.randint(22, 60, size=20),

'Salary': np.random.randint(40000, 120000, size=20),

'Years of Experience': np.random.randint(1, 35, size=20),

'Performance Score': np.random.randint(50, 101, size=20),

'Work Hours per Week': np.random.randint(30, 60, size=20),

'Promoted': np.random.choice(['Yes', 'No'], 20)

# a. Precise Comparison of Two or More Categorical Data (e.g., Gender vs Department)

sns.countplot(data=df, x='Department', hue='Gender', palette='Set1')

plt.title('Comparison of Gender across Departments')

sns.boxplot(data=df, x='Department', y='Salary', hue='Job Level', palette='Set2')

plt.title('Salary Distribution across Departments and Job Levels')

# Bonus Visualization: Performance Score by Age Group

sns.boxplot(data=df, x='Age Group', y='Performance Score', palette='coolwarm')

plt.title('Performance Score by Age Group')

Quantitative (ordinal, nominal, interval and ratio – continuous / discrete).

For the created dataset, perform the following visualization of:

a. Two or more Continuous Data over a period of time

import matplotlib.pyplot as plt

import seaborn as sns

# Set random seed for reproducibility

# Generate the dataset

'Transaction ID': [f'TR{1000+i}' for i in range(1, 21)],

'Product Category': np.random.choice(['Electronics', 'Clothing', 'Books', 'Home

'Customer Region': np.random.choice(['North', 'South', 'East', 'West'], 20),

'Customer Age': np.random.randint(18, 60, size=20),

'Transaction Amount': np.random.randint(50, 500, size=20),

'Discount Applied': np.random.uniform(5, 30, size=20),

'Transaction Date': pd.date_range(start='2023-01-01', periods=20, freq='D'),

'Quantity Purchased': np.random.randint(1, 5, size=20),

'Customer Satisfaction': np.random.randint(1, 6, size=20)

# a. Two or more Continuous Data over a period of time

plt.plot(df['Transaction Date'], df['Transaction Amount'], label='Transaction Amount (USD)',

plt.plot(df['Transaction Date'], df['Discount Applied'], label='Discount Applied (%)',

plt.title('Transaction Amount and Discount Applied Over Time')

# b. Relative Proportion of one or more categorical data

# We'll plot the proportion of each product category sold.

sns.countplot(data=df, x='Product Category', palette='Set2')

plt.title('Relative Proportion of Product Categories Sold')

# Bonus Visualization: Average Satisfaction by Payment Method

# We will visualize the average customer satisfaction score by Payment Method.

sns.boxplot(data=df, x='Payment Method', y='Customer Satisfaction', palette='coolwarm')

plt.title('Customer Satisfaction by Payment Method')

You might also like