Revision (Ques - Only)

The document outlines sample exam questions for an Introduction to Data Mining course taught by Sang Nguyen. It covers various topics including data representation, statistical measures, similarity calculations, classification methods, frequent itemset mining, and clustering algorithms. The questions are designed to assess understanding of key concepts and techniques in data mining.

Uploaded by

dohoangtruonghuy

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views2 pages

Revision (Ques - Only)

Uploaded by

dohoangtruonghuy

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Introduction to Data Mining Course Lecturer: Sang Nguyen

Revision
Sample exam questions

1. Name five kinds of graphics/plots that can be used to represent data dispersion characteristics
effectively.

2. For the following group of data: 53, 55, 70, 58, 64, 57, 53, 69, 57, 68, 53

(a) What is the mean of the data? What is the median?

(b) What is the mode of the data?
(c) What is the midrange of the data?
(d) Can you find (roughly) the first quartile (Q1) and the third quartile (Q3) of the data?
(e) Give the five-number summary of the data.
(f) Show a boxplot of the data.
(g) What is the variance? What is the standard deviation?

3. For the following vectors x and y, calculate the indicated similarity or distance measures.

(a) x=(1,1,1,1), y=(2,2,2,2). Euclidean, Manhattan, Minkowski (h=3)

(b) x=(0,1,0,1), y=(1,0,1,0). Cosine, Euclidean, Jaccard

4. Both decision-tree induction and associative classification may generate rules for classification.
What are their major differences? Why is it that in many cases an associative induction may lead to
better accuracy in prediction?

5. Consider the data set shown in the following:

(a) Estimate the conditional probabilities for P(A|+), P(B|+), P(C|+), P(A|−), P(B|−), and P(C|−).

1
Introduction to Data Mining Course Lecturer: Sang Nguyen

(b) Use the estimate of conditional probabilities given in the previous question to predict the class
label for a test sample (A=0,B=1,C=0) using the Na¨ıve Bayes approach.

6. Describe two frequent itemset mining method, i.e., Apriori and FPGrowth, and remark their
advantages and disadvantages.

7. Consider the data set shown below.

(a) Compute the support for itemsets {e}, {b, d}, and {b, d, e} by treating each transaction ID as a
market basket.

(b) Use the results in part (a) to compute the confidence for the association rules: {b, d}→{e} and
{e}→{b, d}. Is conﬁdence a symmetric measure?

(c) Repeat part (a) by treating each customer ID as a market basket. Each item should be treated as a
binary variable (1 if an item appears in at least one transaction bought by the customer, and 0
otherwise.)

(d) Use the results in part (c) to compute the confidence for the association rules: {b, d}→{e} and
{e}→{b, d}.

8. Consider the following set of frequent 3-itemsets:

{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}.

Assume that there are only five items in the data set.

(a) List all candidate 4-itemsets obtained by the candidate generation procedure in Apriori.

(b) List all candidate 4-itemsets that survive the candidate pruning step of the Apriori algorithm.

9. Present some clustering algorithms, e.g., DBSCAN

10. Review advanced classification algorithms.

Soderstrom T., Stoica P. System Identification (PH 1989) (ISBN S
100% (6)
Soderstrom T., Stoica P. System Identification (PH 1989) (ISBN S
637 pages
MCQ
100% (7)
MCQ
37 pages
Data Warehousing and Mining April 2019
No ratings yet
Data Warehousing and Mining April 2019
4 pages
Exam dm1 121017 Ans
No ratings yet
Exam dm1 121017 Ans
8 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
13 pages
DWM 5
No ratings yet
DWM 5
9 pages
Major 2020
No ratings yet
Major 2020
2 pages
Assignment Data Mining
No ratings yet
Assignment Data Mining
27 pages
Sample Question DMW
No ratings yet
Sample Question DMW
4 pages
DWDM Unit Wise Question Bank
No ratings yet
DWDM Unit Wise Question Bank
8 pages
DMKD Guide
No ratings yet
DMKD Guide
3 pages
Data Mining - Classification Using Frequent Pattern
No ratings yet
Data Mining - Classification Using Frequent Pattern
8 pages
Data Mining Practice Final Sol
No ratings yet
Data Mining Practice Final Sol
5 pages
Seperated
No ratings yet
Seperated
11 pages
Gtu Computer 3160714 Summer 2023
No ratings yet
Gtu Computer 3160714 Summer 2023
3 pages
Midterm F07 Solutions
No ratings yet
Midterm F07 Solutions
4 pages
DM Guidelines 14jan2022
No ratings yet
DM Guidelines 14jan2022
5 pages
Data Mining Long Answers
No ratings yet
Data Mining Long Answers
4 pages
Exam Advanced Data Mining Date: 5-11-2009 Time: 14.00-17.00: General Remarks
100% (1)
Exam Advanced Data Mining Date: 5-11-2009 Time: 14.00-17.00: General Remarks
5 pages
DW & DM Questions & Answers
No ratings yet
DW & DM Questions & Answers
12 pages
Data Mining IMP Objective Questions - Sep 2023
No ratings yet
Data Mining IMP Objective Questions - Sep 2023
4 pages
Data Mining List of Important Question
No ratings yet
Data Mining List of Important Question
4 pages
Final Exam Review
No ratings yet
Final Exam Review
6 pages
Mobile Computing
No ratings yet
Mobile Computing
3 pages
Chapter4 Clustering
No ratings yet
Chapter4 Clustering
77 pages
Exam DUT 070816 Ans
No ratings yet
Exam DUT 070816 Ans
5 pages
DWDM MID - 2 Question Paper and Online Bits
No ratings yet
DWDM MID - 2 Question Paper and Online Bits
3 pages
Data Mining and Analysis: Fundamental Concepts and Algorithms
No ratings yet
Data Mining and Analysis: Fundamental Concepts and Algorithms
9 pages
Assignment DMW
No ratings yet
Assignment DMW
2 pages
DM UNIT-1 Question and Answer
No ratings yet
DM UNIT-1 Question and Answer
25 pages
DataMining Workbook Answers
No ratings yet
DataMining Workbook Answers
18 pages
Data Mining
No ratings yet
Data Mining
7 pages
Question Bank 2
No ratings yet
Question Bank 2
4 pages
DMBI Questions
No ratings yet
DMBI Questions
8 pages
Data Mining Mid 1 - Students-1
No ratings yet
Data Mining Mid 1 - Students-1
4 pages
HW1
No ratings yet
HW1
4 pages
W05.data Mining Functionalities
No ratings yet
W05.data Mining Functionalities
31 pages
DMDW Lab Oral Question Bank
No ratings yet
DMDW Lab Oral Question Bank
4 pages
Introduction To Data Mining Assignment 2
No ratings yet
Introduction To Data Mining Assignment 2
1 page
SemSuggestions DM
No ratings yet
SemSuggestions DM
6 pages
DWDM Ii Mid Paper
No ratings yet
DWDM Ii Mid Paper
2 pages
DMBI All Pyqs
No ratings yet
DMBI All Pyqs
4 pages
Mid Term
No ratings yet
Mid Term
12 pages
QB Students DM
No ratings yet
QB Students DM
12 pages
DM
No ratings yet
DM
7 pages
ML Exercises 4 5 6 en
No ratings yet
ML Exercises 4 5 6 en
4 pages
DM QB
No ratings yet
DM QB
7 pages
Question Bank FDS
No ratings yet
Question Bank FDS
4 pages
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
No ratings yet
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
3 pages
Guidelines Datamining I
No ratings yet
Guidelines Datamining I
3 pages
1 Assignment
No ratings yet
1 Assignment
2 pages
Data Mining University Answer
No ratings yet
Data Mining University Answer
10 pages
Question Bank Semester: IV Sem Subject: Data Science Sub Code: 17MCA441 SL - No. Questions Marks
No ratings yet
Question Bank Semester: IV Sem Subject: Data Science Sub Code: 17MCA441 SL - No. Questions Marks
4 pages
Introduction To Data Mining-Sources
No ratings yet
Introduction To Data Mining-Sources
5 pages
Data Mining Notes
No ratings yet
Data Mining Notes
25 pages
Data Mining Suggestions
No ratings yet
Data Mining Suggestions
5 pages
21CS63 - Unit1 Practice Questions
No ratings yet
21CS63 - Unit1 Practice Questions
3 pages
Ia1 ML Scheme Common To Is, Ai, Cs
No ratings yet
Ia1 ML Scheme Common To Is, Ai, Cs
10 pages
IS328 Final Exam
No ratings yet
IS328 Final Exam
12 pages
IGNOU BCA Computer Oriented Numerical Technique Previous Year Unsolved Papers BCS 054
From Everand
IGNOU BCA Computer Oriented Numerical Technique Previous Year Unsolved Papers BCS 054
Manish Soni
No ratings yet
IGNOU BCA Introduction to Algorithm Design Previous Year Unsolved Papers BCS 042
From Everand
IGNOU BCA Introduction to Algorithm Design Previous Year Unsolved Papers BCS 042
Manish Soni
No ratings yet
Laboratory Session 1: Shell Commands On Linux Man
No ratings yet
Laboratory Session 1: Shell Commands On Linux Man
1 page
Ch01 Introduction 4e 2
No ratings yet
Ch01 Introduction 4e 2
47 pages
Ch06 Control Flow 4e
No ratings yet
Ch06 Control Flow 4e
25 pages
Ch03 Names Scopes and Bindings 4e
No ratings yet
Ch03 Names Scopes and Bindings 4e
45 pages
Ch02 Programming Language Syntax 4e 2
No ratings yet
Ch02 Programming Language Syntax 4e 2
64 pages
Data Structure 1 Fyit
No ratings yet
Data Structure 1 Fyit
39 pages
MPRA Paper 94323
No ratings yet
MPRA Paper 94323
4 pages
Finite Element Method
50% (2)
Finite Element Method
24 pages
Asumbi Maths Paper 2 QS Teacher - Co - .Ke
No ratings yet
Asumbi Maths Paper 2 QS Teacher - Co - .Ke
15 pages
2020 Dse-4
No ratings yet
2020 Dse-4
12 pages
20 Analysis of Selection Sort
No ratings yet
20 Analysis of Selection Sort
4 pages
(Nonlinear (6-31) : Structures GTU-Sem. 3-Comp/T) Binary Tree
No ratings yet
(Nonlinear (6-31) : Structures GTU-Sem. 3-Comp/T) Binary Tree
25 pages
MCS 224 2
No ratings yet
MCS 224 2
5 pages
Polynomial-Basic Concepts
No ratings yet
Polynomial-Basic Concepts
15 pages
Johnson's Rule
100% (1)
Johnson's Rule
12 pages
MIT6 0001F16 Pset4
No ratings yet
MIT6 0001F16 Pset4
10 pages
CSE/MATH 6643: Numerical Linear Algebra: Haesun Park
No ratings yet
CSE/MATH 6643: Numerical Linear Algebra: Haesun Park
13 pages
Edge Detection
No ratings yet
Edge Detection
33 pages
Physical Chemistry: An Indian Journal: Explanation of The Gibbs Paradox in Statistical Mechanics
No ratings yet
Physical Chemistry: An Indian Journal: Explanation of The Gibbs Paradox in Statistical Mechanics
6 pages
Power Point Presentation On-: Array Based Applications in C Language
No ratings yet
Power Point Presentation On-: Array Based Applications in C Language
20 pages
23 Domain Adaptation Challenges Methods Datasets and Applications
No ratings yet
23 Domain Adaptation Challenges Methods Datasets and Applications
48 pages
Tutorial 1
No ratings yet
Tutorial 1
3 pages
V. IS 1893 2016 Static Seismic
No ratings yet
V. IS 1893 2016 Static Seismic
5 pages
Digital Image Processing: Lecture # 7 Spatial Filtering
No ratings yet
Digital Image Processing: Lecture # 7 Spatial Filtering
32 pages
Unit I: Introduction To Neural Networks Biological Neural Networks Characteristics of Neural Networks Models of Neurons
No ratings yet
Unit I: Introduction To Neural Networks Biological Neural Networks Characteristics of Neural Networks Models of Neurons
35 pages
Ir Practical 9
No ratings yet
Ir Practical 9
4 pages
Machine Learning and Deep Learning For State of Art
No ratings yet
Machine Learning and Deep Learning For State of Art
21 pages
LCS Q
No ratings yet
LCS Q
6 pages
String Pair PDF
No ratings yet
String Pair PDF
3 pages
(ERRATA) An Introduction To Numerical Computation (Wen Shen)
No ratings yet
(ERRATA) An Introduction To Numerical Computation (Wen Shen)
2 pages
Final Synopsis
No ratings yet
Final Synopsis
12 pages
Recommender Systems
No ratings yet
Recommender Systems
8 pages
2nd Sem - PR2 2.5 Handouts
No ratings yet
2nd Sem - PR2 2.5 Handouts
3 pages
Cse
No ratings yet
Cse
4 pages