0% found this document useful (0 votes)

491 views14 pages

Data Analytics Lab

The document outlines an index for a lab file on data analytics submitted by a student named Amit Singh to their professors at NOIDA INSTITUE OF ENGINEERING & TECHNOLOGY, listing topics like performing numerical operations, data import/export, matrix operations, statistical analysis, and simple linear and logistic regression using Python/R. The aims demonstrate how to handle data preprocessing tasks, fit regression models, and evaluate their performance on test data.

Uploaded by

Amit Singh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

491 views14 pages

Data Analytics Lab

Uploaded by

Amit Singh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 14

NOIDA INSTITUE OF ENGINEERING & TECHNOLOGY,

GREATER NOIDA

Department of Information Technology

LAB FILE
ON
DATA ANALYTICS LAB
KIT-651
(6th Semester)
(2020 – 2021)

Submitted To: Submitted by:

Ms. Tanya Name: Amit Singh

Dr. Vivek Kumar Roll: 1813313019

Affiliated to Dr. A.P.J Abdul Kalam Technical University, Uttar Pradesh, Lucknow.
Data ANALYTICS LAB
KIT-651
INDEX
S.NO TOPIC DATE GRADE SIGNATURE

To get the input from user and perform numerical

1 operations (MAX, MIN, AVG, SUM, SQRT, ROUND)
using in R/Python.
To perform data import/export (.CSV, .XLS, TXT)
2
operations using data frames in R/Python.
To get the input matrix from user and perform Matrix
addition, subtraction, multiplication, inverse transpose
3
and division operations using vector concept in
R/Python.
To perform statistical operations (Mean, Median, Mode
4
and Standard deviation) using R/Python.
To perform data pre-processing operations i) Handling
5
Missing data ii) Min-Max normalization.
6 To perform Simple Linear Regression with R/Python.

7 To perform Simple Logistic Regression with R/Python.

16
Aim -1. To get the input from user and perform numerical operations (MAX,
MIN, AVG, SUM, SQRT, ROUND) using in R/Python.

import math
list1 = []

n = int(input("Enter number of elements : "))

for i in range(0, n):
  ele = int(input())
  list1.append(ele)

print("Sum = ",sum(list1))
print("Maximum element = ",max(list1))
print("Minimum element = ",min(list1))
print("Square root =" ,math.sqrt(list1[1]))
print("Round =",round(5.56))
print("Average = ", sum(list1)/len(list1))

OUTPUT: -
Enter number of elements : 5
1
6
2
8
7
Sum = 24
Maximum element = 8
Minimum element = 1
Square root = 2.449489742783178
Round = 6
Average = 4.8
Aim - 2. To perform data import/export (.CSV, .XLS, TXT) operations using
data frames in R/Python.

from google.colab import drive

drive.mount("/content/drive")

import pandas as pd
df = pd.read_csv('/content/drive/MyDrive/Da-Lab/ITUR_rain1.csv')

print(df.Frequency)

OUTPUT: -

0 1.0
1 1.5
2 2.0
3 2.5
4 3.0
...
99 96.0
100 97.0
101 98.0
102 99.0
103 100.0
Name: Frequency, Length: 104, dtype: float64
Aim - 3. To get the input matrix from user and perform Matrix addition,
subtraction, multiplication, inverse transpose and division operations using
vector concept in R/Python.

import numpy
r = int(input("Enter  no of row of matrix1 "))
c = int(input("Enter no of cloumns of matrix1 "))
m = []
print("Enter elements")
for i in range(r):
    a =[]
    for j in range(c):
         a.append(int(input()))
    m.append(a)
r1 = int(input("Enter the number of rows of matrix 2 "))
c1 = int(input("Enter the number of columns of matrix 2 "))
m1 = []
print("Enter elements")
for i in range(r1):
    a1 =[]
    for j in range(c1):
         a1.append(int(input()))
    m1.append(a1)
m2=[]
for i in range(r):
  a3=[]
  for j in range(c):
    a3.append(m[i][j]+m1[i][j])
  m2.append(a3)
print("Sum pf matrix is:")
for i in range (r):
  for j in range(c):
    print(m2[i][j],end=" ")
  print()
pm=[]
for i in range (r):
  sm=[]
  for j in range (c):
    s=0

    for k in range (c):
      s=s+m[i][k]*m1[k][j]
    sm.append(s)
  pm.append(sm)
print("Product of matrix:")
for i in range( r):
  for j in range (c):
    print(pm[i][j],end =" ")
  print()
print("Transpose of multiplication matrix is :")
print(numpy.transpose(pm))

OUTPUT: -

Enter no of row of matrix1 2

Enter no of cloumns of matrix1 2
Enter elements
1
2
3
4
Enter the number of rows of matrix 2 2
Enter the number of columns of matrix 2 2
Enter elements
4
5
6
7
Sum pf matrix is:
57
9 11
Product of matrix:
16 19
36 43
Transpose of multiplication matrix is :
[[16 36]
[19 43]]
Aim -4. To perform statistical operations (Mean, Median, Mode and Standard
deviation) using R/Python.

import statistics as st
lst = []

n = int(input("Enter number of elements : "))

for i in range(0, n):
    ele = int(input())

    lst.append(ele)

print("Mean value is:",st.mean(lst))
print("Meadian is:",st.median(lst))
print("Mode value is :",st.mode(lst))
print("Standard deviation is :",statistics.stdev(lst))

OUTPUT :-

Enter number of elements : 5

1
2
3
4
5
Mean value is: 3
Meadian is: 3
Mode is: 0
Standard deviation is: 1.414
Aim - 5. To perform data pre-processing operations i) Handling Missing data
ii) Min-Max normalization.

import pandas as pd
import numpy as np
df = pd.read_csv("/content/drive/MyDrive/Da-Lab/titanic.csv")
df.head()

df.drop(['PassengerId','Name','SibSp','Parch','Ticket','Cabin','Embarked'],axis='columns',inplace=
True)
df.head()
target = df.Survived
inputs = df.drop('Survived',axis='columns')

#One-hot encoding
dummies = pd.get_dummies(inputs.Sex)
dummies.head(3)

inputs = pd.concat([inputs,dummies],axis='columns')
inputs.head(3)

inputs.drop(['Sex','male'],axis='columns',inplace=True)
inputs.head(3)
inputs.columns[inputs.isna().any()]

OUTPUT: -

Index(['Age'], dtype='object')

inputs.Age = inputs.Age.fillna(inputs.Age.mean())
inputs.head()

inputs.Age[:10]

OUTPUT: -

0 22.000000
1 38.000000
2 26.000000
3 35.000000
4 35.000000
5 29.699118
6 54.000000
7 2.000000
8 27.000000
9 14.000000
Name: Age, dtype: float64
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(inputs,target,test_size=0.3)

from sklearn.naive_bayes import GaussianNB
model = GaussianNB()

model.fit(X_train,y_train)

OUTPUT: -
GaussianNB(priors=None, var_smoothing=1e-09)

model.score(X_test,y_test)

OUTPUT: -

0.7574626865671642

model.predict(X_test[0:10])

OUTPUT: -

array([0, 1, 1, 1, 0, 1, 1, 0, 0, 1])
Aim - 6. To perform Simple Linear Regression with R/Python.

import numpy as np

import pandas as pd
import matplotlib.pyplot as plt

from google.colab import files
uploaded = files.upload()

data = pd.read_csv("area.csv")
X = data.Area.values.astype(float)

y = data.Price.values.astype(float)

plt.scatter(X,y)
plt.xlabel("Area")
plt.ylabel("Price")
plt.show()
from sklearn import linear_model
from sklearn.linear_model import LinearRegression
reg = linear_model.LinearRegression()
reg.fit(data[['Area']],data.Price)

OUTPUT: -

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

reg.predict([[100]])

OUTPUT: -

array([9229.8328887])

reg.coef_

OUTPUT: -

array([40.46056658])

reg.intercept_

OUTPUT: -

5183.7762302371

100.6691978*100+1118.140232700558

OUTPUT: -

11185.060012700558
Aim - 7. To perform Simple Logistic Regression with R/Python.

Alberto - Leon-Garcia 2009 Student Solutions Manual
86% (7)
Alberto - Leon-Garcia 2009 Student Solutions Manual
204 pages
ST2195 Programming For Data Science
No ratings yet
ST2195 Programming For Data Science
11 pages
Answer Mathematics Paper 2 2012
No ratings yet
Answer Mathematics Paper 2 2012
24 pages
Data Science Project Report
100% (1)
Data Science Project Report
3 pages
Assignment 2 - Part 2 - Cryptography
No ratings yet
Assignment 2 - Part 2 - Cryptography
11 pages
Business Intelligence
No ratings yet
Business Intelligence
41 pages
Data Science Solutions Sample
100% (6)
Data Science Solutions Sample
53 pages
6 Different Ways To Compensate For Missing Values in A Dataset
No ratings yet
6 Different Ways To Compensate For Missing Values in A Dataset
6 pages
Tutorial On "R" Programming Language
No ratings yet
Tutorial On "R" Programming Language
25 pages
Assignment Data Analysis Example
100% (1)
Assignment Data Analysis Example
10 pages
Exploratory Data Analysis Using Python
No ratings yet
Exploratory Data Analysis Using Python
10 pages
Data Analysis With Python
100% (3)
Data Analysis With Python
49 pages
Nosql Database Systems: M.Tech. (Iind, Sem Ce/Cn)
100% (1)
Nosql Database Systems: M.Tech. (Iind, Sem Ce/Cn)
135 pages
Matrix-Vector Multiplication Using MapReduce in Big Data.
No ratings yet
Matrix-Vector Multiplication Using MapReduce in Big Data.
4 pages
Lecture+Notes (Upgrad)
No ratings yet
Lecture+Notes (Upgrad)
5 pages
Big Data Research Paper
No ratings yet
Big Data Research Paper
10 pages
Introduction To Data Mining
75% (4)
Introduction To Data Mining
45 pages
How To Document Your Data Science Project
No ratings yet
How To Document Your Data Science Project
9 pages
R Package
0% (1)
R Package
123 pages
Data Visualisation Using Python
100% (1)
Data Visualisation Using Python
77 pages
Association Rule Mining Lesson PDF
No ratings yet
Association Rule Mining Lesson PDF
9 pages
Introduction To Data Mining
No ratings yet
Introduction To Data Mining
19 pages
Data Science With Python Explained PDF
No ratings yet
Data Science With Python Explained PDF
1 page
Simple Linear Regression - Assign3
No ratings yet
Simple Linear Regression - Assign3
8 pages
Data Science With R Text Mining by Graham Williams
No ratings yet
Data Science With R Text Mining by Graham Williams
21 pages
Business Intelligence & Business Analytics
No ratings yet
Business Intelligence & Business Analytics
8 pages
SAS Presentation
No ratings yet
SAS Presentation
49 pages
Clouds and Big Data Computing
No ratings yet
Clouds and Big Data Computing
13 pages
Big Data in E-Commerce
100% (2)
Big Data in E-Commerce
21 pages
Intro To BI
No ratings yet
Intro To BI
28 pages
R Programming Interview
No ratings yet
R Programming Interview
24 pages
Data Science Project Ideas
No ratings yet
Data Science Project Ideas
6 pages
DexLab Analytics Business Analytics - Data Science - Study Material
No ratings yet
DexLab Analytics Business Analytics - Data Science - Study Material
169 pages
Data Mining New Notes Unit 3 PDF
No ratings yet
Data Mining New Notes Unit 3 PDF
12 pages
Data Science in Business
No ratings yet
Data Science in Business
9 pages
Data Mining
No ratings yet
Data Mining
27 pages
AnalytixLabs - Advanced Big Data Science Using Python-R-Hadoop-Spark
No ratings yet
AnalytixLabs - Advanced Big Data Science Using Python-R-Hadoop-Spark
13 pages
Implementing Data Science Projects PDF
No ratings yet
Implementing Data Science Projects PDF
2 pages
Data Analytics Project
No ratings yet
Data Analytics Project
9 pages
Microsoft Business Intelligence (Msbi)
No ratings yet
Microsoft Business Intelligence (Msbi)
8 pages
2nd Unit - 2.2 - Data Analytics
No ratings yet
2nd Unit - 2.2 - Data Analytics
22 pages
2017 Fuzzy Information Retrieval
No ratings yet
2017 Fuzzy Information Retrieval
83 pages
Data Mining
100% (1)
Data Mining
53 pages
Practical Python Course-Overview
No ratings yet
Practical Python Course-Overview
5 pages
Advanced Certification in Data Science and Artificial Intelligence
No ratings yet
Advanced Certification in Data Science and Artificial Intelligence
18 pages
Statistics Machine Learning Python Draft
No ratings yet
Statistics Machine Learning Python Draft
173 pages
Infromation System1
No ratings yet
Infromation System1
47 pages
Data Science Use Cases
100% (1)
Data Science Use Cases
10 pages
Shiny Introduction
100% (1)
Shiny Introduction
70 pages
Machine Learning
No ratings yet
Machine Learning
29 pages
TeradataStudioUserGuide 2041
No ratings yet
TeradataStudioUserGuide 2041
350 pages
Implications of Predictive Analytics
No ratings yet
Implications of Predictive Analytics
9 pages
Decision Tree Algorithm: Comp328 Tutorial 1 Kai Zhang
No ratings yet
Decision Tree Algorithm: Comp328 Tutorial 1 Kai Zhang
25 pages
Hadoop For Dummies
From Everand
Hadoop For Dummies
Dirk deRoos
3/5 (2)
Python Natural Language Processing Cookbook: Over 60 recipes for building powerful NLP solutions using Python and LLM libraries
From Everand
Python Natural Language Processing Cookbook: Over 60 recipes for building powerful NLP solutions using Python and LLM libraries
Zhenya Antić
No ratings yet
Optimizing Hadoop for MapReduce
From Everand
Optimizing Hadoop for MapReduce
Khaled Tannir
No ratings yet
Social Media Data Mining and Analytics
From Everand
Social Media Data Mining and Analytics
Gabor Szabo
No ratings yet
Learn R By Coding
From Everand
Learn R By Coding
Thomas Kurnicki
No ratings yet
Hadoop BIG DATA Interview Questions You'll Most Likely Be Asked
From Everand
Hadoop BIG DATA Interview Questions You'll Most Likely Be Asked
Vibrant Publishers
No ratings yet
Data Governance for Tax Administrations: A Practical Guide
From Everand
Data Governance for Tax Administrations: A Practical Guide
Inter-American Center of Tax Administrations – CIAT
No ratings yet
Building Machine Learning Systems Using Python: Practice to Train Predictive Models and Analyze Machine Learning Results with Real Use-Cases (English Edition)
From Everand
Building Machine Learning Systems Using Python: Practice to Train Predictive Models and Analyze Machine Learning Results with Real Use-Cases (English Edition)
Deepti Chopra
No ratings yet
Data Science Fusion: Integrating Maths, Python, and Machine Learning
From Everand
Data Science Fusion: Integrating Maths, Python, and Machine Learning
NIBEDITA Sahu
No ratings yet
Herd_Behavior-student_copy
No ratings yet
Herd_Behavior-student_copy
4 pages
Contents
No ratings yet
Contents
95 pages
Hirac (Manhole Installation)
No ratings yet
Hirac (Manhole Installation)
7 pages
Assignment MEG-01, July 2023-Jan 2024
No ratings yet
Assignment MEG-01, July 2023-Jan 2024
5 pages
Anchor Bolts & Fixings
No ratings yet
Anchor Bolts & Fixings
25 pages
English 3: TOEIC Bridge Preparation Session
No ratings yet
English 3: TOEIC Bridge Preparation Session
18 pages
Placement Project BMIH6006.8 - Autumn Term 2023 Handbook FINAL KF EE PDF
No ratings yet
Placement Project BMIH6006.8 - Autumn Term 2023 Handbook FINAL KF EE PDF
20 pages
Preparing A PHD Concept Paper: 1. What Is The Essential Component of A PHD?
No ratings yet
Preparing A PHD Concept Paper: 1. What Is The Essential Component of A PHD?
2 pages
Physics Work Power Energy Questions class 11
No ratings yet
Physics Work Power Energy Questions class 11
3 pages
Ev Charging - Full Document
No ratings yet
Ev Charging - Full Document
73 pages
Mahmoud Ben Romdhane & Sam Moyo (Eds) - Peasant Organisations and The Democratisation Process in Africa
No ratings yet
Mahmoud Ben Romdhane & Sam Moyo (Eds) - Peasant Organisations and The Democratisation Process in Africa
3 pages
Modelling of Flat Plate and V-Corrugated Solar Air Heaters For Single and Counter Flow Operating Modes
No ratings yet
Modelling of Flat Plate and V-Corrugated Solar Air Heaters For Single and Counter Flow Operating Modes
15 pages
The Graduate School of Korean Studies, The Academy of Korean Studies
No ratings yet
The Graduate School of Korean Studies, The Academy of Korean Studies
9 pages
CHE 46: Biochemical Engineering
No ratings yet
CHE 46: Biochemical Engineering
30 pages
Gujarat Technological University
100% (1)
Gujarat Technological University
2 pages
Manual Broches
No ratings yet
Manual Broches
52 pages
11TH Summer Assignment Science
No ratings yet
11TH Summer Assignment Science
2 pages
Wodwo Analysis
100% (1)
Wodwo Analysis
3 pages
Lesson Plan For Hu, An Body (Grade 1)
No ratings yet
Lesson Plan For Hu, An Body (Grade 1)
8 pages
Analysis of Brain Waves According To Their Frequency
No ratings yet
Analysis of Brain Waves According To Their Frequency
7 pages
Sim Ge3
No ratings yet
Sim Ge3
144 pages
Effectiveness of Forest and Wildlife Laws
No ratings yet
Effectiveness of Forest and Wildlife Laws
5 pages
Sampling Methods in Clinical Research An Educational Review
No ratings yet
Sampling Methods in Clinical Research An Educational Review
3 pages
The Passage Below Is Accompanied by A Set of Six Questions. Choose The Best Answer To Each Question
100% (1)
The Passage Below Is Accompanied by A Set of Six Questions. Choose The Best Answer To Each Question
123 pages
Math Class-12 Volume-2 - Merge File - Final
No ratings yet
Math Class-12 Volume-2 - Merge File - Final
208 pages
Fluid Dynamics: Impinging Jet Experiment Report
No ratings yet
Fluid Dynamics: Impinging Jet Experiment Report
16 pages
Wa0002
No ratings yet
Wa0002
3 pages
Foundation t1 Guim-Miriam
No ratings yet
Foundation t1 Guim-Miriam
9 pages