Assignment 2

Uploaded by

Amit Yadav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

32 views2 pages

Assignment 2

Uploaded by

Amit Yadav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

GOVERNMENT ENGINEERING COLLEGE DAHOD

COMPUTER ENGINEERING
SUBJECT: DATA MINING (3160714)
SEMESTER – VI

Assignment 2(CO-1)

1) Suppose that the data for analysis includes the attribute age. The age values for the data
tuples are (in increasing order) 13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30,
33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70.
a. What is the mean of the data?What is the median?
b. What is the mode of the data? Comment on the data’s modality (i.e., bimodal,
trimodal, etc.).
c. What is the midrange of the data?
d. Can you find (roughly) the first quartile (Q1) and the third quartile (Q3) of the data?
e. Give the five-number summary of the data.
f. Show a boxplot of the data.
g. How is a quantile–quantile plot different from a quantile plot?

2) Explain the following data normalization techniques:

a. min-max normalization and
b. decimal scaling
3) Given two objects represented by the tuples (22, 1, 42, 10) and (20, 0, 36, 8):
a. Compute the Euclidean distance between the two objects.
b. Compute the Manhattan distance between the two objects.
c. Compute the Minkowski distance between the two objects, using q D 3.
d. Compute the supremum distance between the two objects

4) In real-world data, tuples with missing values for some attributes are a common occurrence.
Describe various methods for handling this problem.
5) Discuss issues to consider during data integration.
6) Use these methods to normalize the following group of data: 200, 300, 400, 600,1000
a. min-max normalization by setting min = 0 and max = 1
b. z-score normalization
c. z-score normalization using the mean absolute deviation instead of standard deviation
d. normalization by decimal scaling
7) Explain the need for data smoothing during pre-processing and discuss data smoothing by
Binning.
8) What is meant by “clustering”? Explain why clustering is called unsupervised learning. Mention
any two applications of clustering.
9) Explain why we need to perform data pre-processing, with proper example.
10) List out and explain major pre-processing tasks of data mining.

IP Question Paper 2020-2021
No ratings yet
IP Question Paper 2020-2021
9 pages
Data Mining Assignment 2
No ratings yet
Data Mining Assignment 2
2 pages
Data Preprocessing Questions
No ratings yet
Data Preprocessing Questions
2 pages
Data Mining Homework 1
100% (1)
Data Mining Homework 1
2 pages
Data Mining Paer 2 Oct 12, 2024 - 241012 - 224522
No ratings yet
Data Mining Paer 2 Oct 12, 2024 - 241012 - 224522
13 pages
Chapter-2 Questionnaire
No ratings yet
Chapter-2 Questionnaire
5 pages
Data Preprocessing Solution-24-37
No ratings yet
Data Preprocessing Solution-24-37
14 pages
File To Submitt Till 20
No ratings yet
File To Submitt Till 20
2 pages
Data Mining-1
No ratings yet
Data Mining-1
15 pages
Assignment
No ratings yet
Assignment
2 pages
Assignment 2
No ratings yet
Assignment 2
4 pages
Show Your Work in Detail: 1. Given The Following Data
No ratings yet
Show Your Work in Detail: 1. Given The Following Data
6 pages
CS402 Data Mining and Warehousing Question Bank
No ratings yet
CS402 Data Mining and Warehousing Question Bank
6 pages
DBDM, FDS, Ds Model QP
No ratings yet
DBDM, FDS, Ds Model QP
5 pages
Assignment 2 Slot8 TTS3208 Summer
No ratings yet
Assignment 2 Slot8 TTS3208 Summer
11 pages
Answer Midterm Exam Data Mining1 2021 - 2022
100% (2)
Answer Midterm Exam Data Mining1 2021 - 2022
4 pages
Advanced Databases Jan 2024
No ratings yet
Advanced Databases Jan 2024
2 pages
DM QB
No ratings yet
DM QB
3 pages
Assignment M-Tech CSE I Sem
No ratings yet
Assignment M-Tech CSE I Sem
1 page
Assignment I
No ratings yet
Assignment I
4 pages
ML Assignment-1
No ratings yet
ML Assignment-1
7 pages
Assignment 3 (Warehouse)
No ratings yet
Assignment 3 (Warehouse)
2 pages
HW3
0% (1)
HW3
3 pages
DMDW Midsem Question
No ratings yet
DMDW Midsem Question
1 page
CS 515 Data Warehousing and Data Mining
No ratings yet
CS 515 Data Warehousing and Data Mining
5 pages
21CS63 - Unit1 Practice Questions
No ratings yet
21CS63 - Unit1 Practice Questions
3 pages
Cis 417.Ccs 415. CCT 416 Cat
No ratings yet
Cis 417.Ccs 415. CCT 416 Cat
4 pages
1 Assignment
No ratings yet
1 Assignment
2 pages
QB FDS
No ratings yet
QB FDS
5 pages
Dcs 7302
No ratings yet
Dcs 7302
17 pages
CEUC502 - DMBI - Question - Bank
No ratings yet
CEUC502 - DMBI - Question - Bank
12 pages
DM UNIT-1 Question and Answer
No ratings yet
DM UNIT-1 Question and Answer
25 pages
Data Warehousing&Data Mining AMTCSE0114
No ratings yet
Data Warehousing&Data Mining AMTCSE0114
3 pages
ML Question Bank
No ratings yet
ML Question Bank
1 page
QB 2
No ratings yet
QB 2
3 pages
Data Mining Worksheet One
No ratings yet
Data Mining Worksheet One
2 pages
Data Engineering Lab: List of Programs
No ratings yet
Data Engineering Lab: List of Programs
2 pages
Assignment 02
No ratings yet
Assignment 02
9 pages
Data Mining Cse It
No ratings yet
Data Mining Cse It
2 pages
IS421 Exam
No ratings yet
IS421 Exam
8 pages
Question Bank Bca - Ids
No ratings yet
Question Bank Bca - Ids
3 pages
Task 1
No ratings yet
Task 1
3 pages
Important Questions Related To Module-1 & Module-2
No ratings yet
Important Questions Related To Module-1 & Module-2
2 pages
Assignment Questions - Data Analysis and Visualization Using Power BI and Tableau
No ratings yet
Assignment Questions - Data Analysis and Visualization Using Power BI and Tableau
2 pages
FDS Important Q
No ratings yet
FDS Important Q
5 pages
1569928600-7cs It3a dmwh-3555
No ratings yet
1569928600-7cs It3a dmwh-3555
2 pages
DWDM Assignment 1
No ratings yet
DWDM Assignment 1
4 pages
Answers PDF
No ratings yet
Answers PDF
9 pages
126VW122019
No ratings yet
126VW122019
2 pages
Assignment#2 RT WQ2021
No ratings yet
Assignment#2 RT WQ2021
2 pages
Data Warehousing and DatabySRS
No ratings yet
Data Warehousing and DatabySRS
8 pages
III Yr B.Tech. - Computer Science & Engineering/Information Technology Data Mining
No ratings yet
III Yr B.Tech. - Computer Science & Engineering/Information Technology Data Mining
2 pages
Data Engineering Lab: List of Programs
No ratings yet
Data Engineering Lab: List of Programs
2 pages
Sample Question DMW
No ratings yet
Sample Question DMW
4 pages
E-Tivity 2.2 Tharcisse 217010849
No ratings yet
E-Tivity 2.2 Tharcisse 217010849
7 pages
2CSOE03-O IR December 2023
No ratings yet
2CSOE03-O IR December 2023
4 pages
Tut 6
No ratings yet
Tut 6
1 page
Unit 01
No ratings yet
Unit 01
32 pages
UNIT02
No ratings yet
UNIT02
41 pages
UNIT03
No ratings yet
UNIT03
52 pages
Pps Amit
No ratings yet
Pps Amit
35 pages
UNIT04
No ratings yet
UNIT04
35 pages
Gujarat Technological University (Established Under Gujarat Act No. 20 of 2007)
No ratings yet
Gujarat Technological University (Established Under Gujarat Act No. 20 of 2007)
30 pages
Deeptech Circular 727004
No ratings yet
Deeptech Circular 727004
6 pages
Assignment 1
No ratings yet
Assignment 1
1 page
Delhi Hit and Run Case
No ratings yet
Delhi Hit and Run Case
1 page
De 4
No ratings yet
De 4
2 pages
CS25S22008075 AdmitCard
No ratings yet
CS25S22008075 AdmitCard
1 page
Teen Crime Spree Melbourne
No ratings yet
Teen Crime Spree Melbourne
1 page
The Family Gang Crackdown
No ratings yet
The Family Gang Crackdown
1 page
Police Non Crime Hate Incidents
No ratings yet
Police Non Crime Hate Incidents
1 page

Assignment 2

Uploaded by

Assignment 2

Uploaded by

GOVERNMENT ENGINEERING COLLEGE DAHOD

2) Explain the following data normalization techniques:

You might also like