0% found this document useful (0 votes)

20 views16 pages

Iot Da1

internet of things digital assignment

Uploaded by

keerthiu2003

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views16 pages

Iot Da1

internet of things digital assignment

Uploaded by

keerthiu2003

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 16

Name: Keerthi Uppalapati

Reg No: 20BEC0174

ECE3502
IoT Domain Analyst Lab
TASK-1

FACULTY: Biswajit Dwivedy

SLOT: L5+L6
Aim of the Experiment:
The aim of this experiment is exploratory Data Analysis/ Pre-processing
using Python.

Name of the simulation platform:

Python using numpy, pandas and seaborn modules.

Theory:
EDA is a phenomenon under data analysis used for gaining a better
understanding of data aspects like:
1. main features of data
2. variables and relationships that hold between them
3. identifying which variables are important for our problem

We shall look at various exploratory data analysis methods like:

1. Descriptive Statistics, which is a way of giving a brief overview of the
dataset we are dealing with, including some measures and features of
the sample
2. Grouping data [Basic grouping with group by]
3. ANOVA, Analysis of Variance, which is a computational method to divide
variations in an observations set into different components.
4. Correlation and correlation methods
Algorithm/Flowchart:

(a)Perform the following operations on the data-set: Exploratory

Data Analysis/ Pre-processing using Python
https://www.kaggle.com/spscientist/students-performance-
in- exams?select=StudentsPerformance.csv
(i) First and Last five rows
Program:

#20BEC0174 - Keerthi Uppalapati

import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
print(df.head())
print(df.tail())
Output:

(ii) Size of the Data set

Program:

#20BEC0174 - Keerthi Uppalapati

import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
print(f"size of csv file:{df.shape}")
Output:

(iii) Describe the dataset

Program:

#20BEC0174 - Keerthi Uppalapati

import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
print(f"{df.info()}\n")
print(df.describe())
Output:

(iv) Function of “nunique”

Program:

#20BEC0174 - Keerthi Uppalapati

import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
print(df.nunique())
Output:

(v) Correcting the dataset: Removing columns, Outlier detection, null

value detection etc.

Program:

#20BEC0174 - Keerthi Uppalapati

import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
print(f"The number of null values in the entire dataset is \n {df.isnull().sum()}")
print(f"\nthe column gender has been removed from the dataset \n
{df.drop('gender',axis=1)}")
maths=df["math score"]
math2=np.array(df["math score"])
outliers=[]
mean=np.mean(math2)
std=np.std(math2)
for i in math2:
zscore=(i-mean)/std
if np.abs(zscore)>3:
outliers.append(i)
print(f"\n the number of outliers is {len(outliers)}")
print(outliers)

Output:

(vi) Data Normalization on any two columns

Program:

#20BEC0174 - Keerthi Uppalapati

import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
df_max_scaled = df.copy()
column = 'math score'
df_max_scaled[column] = df_max_scaled[column]
/df_max_scaled[column].abs().max()
column1='reading score'
df_max_scaled[column1] =
df_max_scaled[column1]/df_max_scaled[column1].abs().max()
print(df_max_scaled[['math score','reading score']])
Output:

(vii) Corelation between different variables

Program:

#20BEC0174 - Keerthi Uppalapati

import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
correlation = df.corr()
print(correlation)
Output:

(viii) Heatmap to represent Corelation

Program:
#20BEC0174 - Keerthi Uppalapati
import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
correlation = df.corr()
print(correlation)
sns.heatmap(correlation, xticklabels=correlation.columns,
yticklabels=correlation.columns,annot=True)
Output:

(ix) Use of relplot, pairplot, distplot.

Program:
#20BEC0174 - Keerthi Uppalapati
import pandas as pd
import numpy as np
import seaborn as sns
df = pd.read_csv('C:/Users\keert\Downloads\StudentsPerformance.csv')
sns.pairplot(df)
sns.relplot(x = 'math score', y = 'reading score', hue= 'lunch', data= df)
sns.distplot(df['writing score'])
Output:
(b) Binarization (Dataset: pima-indians-diabetes.csv)

Output:
(c) Standardization (Dataset: pima-indians-diabetes.csv)

Program:
#20BEC0174 - Keerthi Uppalapati
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn import preprocessing
df = pd.read_csv('C:/Users\keert\Downloads\pima-indians-diabetes.csv')
df2=df.copy()
m=df['Glucose'].mean()
s=df['Glucose'].std()
#using df[‘column’] =( df[‘column’] – df[‘column’].mean() ) /
df[‘column’].std()
df2['Glucose']=(df['Glucose']-m)/s
print(df['Glucose'])
print(df2['Glucose'])

Output:

(d) Data- Labelling

Program:
#20BEC0174 - Keerthi Uppalapati
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn import preprocessing
df = pd.read_csv('C:/Users\keert\Downloads\pima-indians-diabetes.csv')
df["label"] = "default_label"
df.loc[df["Glucose"] > 100, "label"] = "diabetic"
df.loc[df["Glucose"] <= 100, "label"] = "Not diabetic"
print(df)

Output:

Conclusion:
This is how we’ll do Exploratory Data Analysis. Exploratory Data
Analysis (EDA) helps us to look beyond the data. The more we explore the
data, the more the insights we draw from it. As a data analyst, almost 80% of
our time will be spent understanding data and solving various business
problems through EDA.

Signature of student

DP Failure Mode Effects Analysis Assurance Framework Risk Based Guidance
100% (2)
DP Failure Mode Effects Analysis Assurance Framework Risk Based Guidance
93 pages
Bookdown Demo
No ratings yet
Bookdown Demo
448 pages
A Proposed Design of Advanced Coconut Cutting Machine Powered by Hydraulic System
No ratings yet
A Proposed Design of Advanced Coconut Cutting Machine Powered by Hydraulic System
52 pages
Even Students
No ratings yet
Even Students
36 pages
CSC - 310 Advanced Python Programming Continuous Assessment-2 Assignment:Ca2
No ratings yet
CSC - 310 Advanced Python Programming Continuous Assessment-2 Assignment:Ca2
33 pages
DA Lab Manual r22
No ratings yet
DA Lab Manual r22
31 pages
Data Science Practicals
No ratings yet
Data Science Practicals
47 pages
Oddstudents
No ratings yet
Oddstudents
35 pages
Grade 12 - IP Practicals (1 To 9)
No ratings yet
Grade 12 - IP Practicals (1 To 9)
12 pages
PRACTICALS
No ratings yet
PRACTICALS
52 pages
DS Journal - Final
No ratings yet
DS Journal - Final
37 pages
Vanshika Goyal Gec Practicals
No ratings yet
Vanshika Goyal Gec Practicals
31 pages
Gec Practicals
No ratings yet
Gec Practicals
31 pages
ML Lab Record
No ratings yet
ML Lab Record
38 pages
DataAnalytics Lab Manual
No ratings yet
DataAnalytics Lab Manual
35 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
Fdsa Record Ai&Ds
No ratings yet
Fdsa Record Ai&Ds
26 pages
Practical List Ip
100% (1)
Practical List Ip
10 pages
Practical File
No ratings yet
Practical File
20 pages
QP - 12-CS - PB-I 23-24 Set 1
No ratings yet
QP - 12-CS - PB-I 23-24 Set 1
10 pages
DS Journal-1
No ratings yet
DS Journal-1
25 pages
Farm Land Leads PDF
No ratings yet
Farm Land Leads PDF
28 pages
Codes
No ratings yet
Codes
44 pages
DAV Practicle File
No ratings yet
DAV Practicle File
28 pages
Creation of Series Using List, Dictionary & Ndarray
No ratings yet
Creation of Series Using List, Dictionary & Ndarray
65 pages
Aadarsh
No ratings yet
Aadarsh
26 pages
23HCS4142 PDF
No ratings yet
23HCS4142 PDF
24 pages
Sowmi DS
No ratings yet
Sowmi DS
27 pages
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
No ratings yet
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
28 pages
List of Practical Ip065 Xii Session 2025 CKC Academy
No ratings yet
List of Practical Ip065 Xii Session 2025 CKC Academy
19 pages
Fda Batch2program
No ratings yet
Fda Batch2program
18 pages
Mayank Chaudhary DEV Practicals
No ratings yet
Mayank Chaudhary DEV Practicals
14 pages
DA Lab
No ratings yet
DA Lab
27 pages
QP DAV 3rd Sem Dec 2023
No ratings yet
QP DAV 3rd Sem Dec 2023
12 pages
DXE 24gksmknvj
No ratings yet
DXE 24gksmknvj
16 pages
ML Lab Manual Final
No ratings yet
ML Lab Manual Final
36 pages
Class X Practical-2025 - Jupyter Notebook
No ratings yet
Class X Practical-2025 - Jupyter Notebook
6 pages
Fds SLOT 2
No ratings yet
Fds SLOT 2
12 pages
DAV Practicals
No ratings yet
DAV Practicals
26 pages
Adobe Scan 25 Nov 2023
No ratings yet
Adobe Scan 25 Nov 2023
17 pages
List of Practical Ip065 Xii Session 2025 CKC Academy
No ratings yet
List of Practical Ip065 Xii Session 2025 CKC Academy
19 pages
Numpy Dataframe
No ratings yet
Numpy Dataframe
12 pages
Python BATCH 11 Voice
No ratings yet
Python BATCH 11 Voice
13 pages
AIDS - DM Using Python - Lab Programs
No ratings yet
AIDS - DM Using Python - Lab Programs
19 pages
DAV Practical
No ratings yet
DAV Practical
12 pages
Complex Problem AI
No ratings yet
Complex Problem AI
13 pages
Dav 2024 Pyq
No ratings yet
Dav 2024 Pyq
7 pages
Exercise - 6: DS203-2024-S1 Problem1:: Statistics
No ratings yet
Exercise - 6: DS203-2024-S1 Problem1:: Statistics
10 pages
Cs Sem III Dav Upc 2343012002 Sl. No. Qp. 1673 Dec '23
No ratings yet
Cs Sem III Dav Upc 2343012002 Sl. No. Qp. 1673 Dec '23
12 pages
Limooezekii Report 7
No ratings yet
Limooezekii Report 7
17 pages
Ai Tools and Applications-Lab
No ratings yet
Ai Tools and Applications-Lab
33 pages
Automatically Build ML Models On Amazon SageMaker Autopilot - Tapan Hoskeri
No ratings yet
Automatically Build ML Models On Amazon SageMaker Autopilot - Tapan Hoskeri
26 pages
GE - Computer Scien EaQvs42
No ratings yet
GE - Computer Scien EaQvs42
6 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
Data Science in Society Cat
No ratings yet
Data Science in Society Cat
5 pages
I037 - Manas Patel Experiment09
No ratings yet
I037 - Manas Patel Experiment09
9 pages
HY Exam Revision (11/9/2024)
No ratings yet
HY Exam Revision (11/9/2024)
15 pages
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
No ratings yet
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
16 pages
Lab 13
No ratings yet
Lab 13
5 pages
2020-21 XIIInfo - Pract.S.E.155
No ratings yet
2020-21 XIIInfo - Pract.S.E.155
11 pages
12 Ip Practical List With Solution Complete
No ratings yet
12 Ip Practical List With Solution Complete
5 pages
XII IP Practical List 2023-24
No ratings yet
XII IP Practical List 2023-24
4 pages
Short Notes Regional Geography
No ratings yet
Short Notes Regional Geography
6 pages
QP - Ip PB19-01QP
No ratings yet
QP - Ip PB19-01QP
7 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
DAV Guidelines
No ratings yet
DAV Guidelines
4 pages
Ip 2019
No ratings yet
Ip 2019
12 pages
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
From Everand
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
Manish Soni
No ratings yet
SLG Module 10.2.1 Smplifying and Evaluating Rational Expressions (Casas, Albiso)
No ratings yet
SLG Module 10.2.1 Smplifying and Evaluating Rational Expressions (Casas, Albiso)
5 pages
SolarRiver - 3400TL D 6000TL D Product - Manual V1 2 - EN
No ratings yet
SolarRiver - 3400TL D 6000TL D Product - Manual V1 2 - EN
50 pages
Beethoven Overture Fidelio Timpani
No ratings yet
Beethoven Overture Fidelio Timpani
3 pages
February
No ratings yet
February
2 pages
SR958 Control Doc 1
No ratings yet
SR958 Control Doc 1
66 pages
Abiyot Kahle Thesis (Recovered) 33
No ratings yet
Abiyot Kahle Thesis (Recovered) 33
75 pages
3.255 Million Cookies - Cookie Clicker
No ratings yet
3.255 Million Cookies - Cookie Clicker
1 page
Ebooks File Interviewing Children and Adolescents Second Edition 2nd All Chapters
100% (1)
Ebooks File Interviewing Children and Adolescents Second Edition 2nd All Chapters
25 pages
BAIS Exam
No ratings yet
BAIS Exam
4 pages
Harvard Architecture
No ratings yet
Harvard Architecture
4 pages
Safuu X Calculator
No ratings yet
Safuu X Calculator
97 pages
A General, Fast and Robust B-Spline Fitting Scheme For Micro-Line Tool Path Under Chord Error Constraint
No ratings yet
A General, Fast and Robust B-Spline Fitting Scheme For Micro-Line Tool Path Under Chord Error Constraint
12 pages
QA6
No ratings yet
QA6
8 pages
Guide For Candidates Calibrand v2
No ratings yet
Guide For Candidates Calibrand v2
4 pages
TFT LCD Display Incubator Controller EGGHATCHER 02 V01 0516
No ratings yet
TFT LCD Display Incubator Controller EGGHATCHER 02 V01 0516
36 pages
Momen
No ratings yet
Momen
2 pages
7XV5662-0AB0 Catalog SIP2004 en
No ratings yet
7XV5662-0AB0 Catalog SIP2004 en
3 pages
MSBTE Solution App-2
No ratings yet
MSBTE Solution App-2
4 pages
Entegra
No ratings yet
Entegra
4 pages
A Detection System For Stolen Vehicles Using Vehicle Attributes With Deep Learning
No ratings yet
A Detection System For Stolen Vehicles Using Vehicle Attributes With Deep Learning
4 pages
Zoom Online Event Consulting Services PDF
No ratings yet
Zoom Online Event Consulting Services PDF
1 page
AC Adaptor For Blood Pressure Monitor / Nebulizer: - US Version
No ratings yet
AC Adaptor For Blood Pressure Monitor / Nebulizer: - US Version
1 page

Iot Da1

Uploaded by

Iot Da1

Uploaded by

Name: Keerthi Uppalapati

Reg No: 20BEC0174

FACULTY: Biswajit Dwivedy

Name of the simulation platform:

We shall look at various exploratory data analysis methods like:

(a)Perform the following operations on the data-set: Exploratory

#20BEC0174 - Keerthi Uppalapati

(ii) Size of the Data set

#20BEC0174 - Keerthi Uppalapati

(iii) Describe the dataset

#20BEC0174 - Keerthi Uppalapati

(iv) Function of “nunique”

#20BEC0174 - Keerthi Uppalapati

(v) Correcting the dataset: Removing columns, Outlier detection, null

#20BEC0174 - Keerthi Uppalapati

(vi) Data Normalization on any two columns

#20BEC0174 - Keerthi Uppalapati

(vii) Corelation between different variables

#20BEC0174 - Keerthi Uppalapati

(viii) Heatmap to represent Corelation

(ix) Use of relplot, pairplot, distplot.

(d) Data- Labelling

You might also like