DWDM Unitwise Questions

This document is a unit-wise question bank for a Data Warehousing and Data Mining course at V.V.P. Engineering College. It covers various topics including data warehousing concepts, data mining processes, data preprocessing techniques, mining frequent patterns, classification and prediction methods, clustering, and advanced topics like web mining and text mining. Each unit contains specific questions designed to assess understanding and application of the subject matter.

Uploaded by

22it089.ajaysingh.jhala

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

50 views3 pages

DWDM Unitwise Questions

Uploaded by

22it089.ajaysingh.jhala

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 3

Semester 6th – I.T. Department – V.V.P. Engg.

College
DATAWAREHOUSING AND DATA MINING
Subject Code: 3161610
Unit-Wise Question Bank

Unit-1 Data Warehousing

1) What is Data Warehousing? Explain its features.
2) Difference between a) Data warehouse and Data Mart b) OLTP and OLAP systems
c) Fact table vs. Dimension table.
3) With the help of a neat diagram explain the 3-tier architecture of a data warehouse.
4) Explain Star, Snowflake, and Fact Constellation Schema for Multidimensional
Database with diagram.
5) What is Cube? Explain various OLAP Operations on Data Cube with example.

Unit-2 Introduction to data mining (DM)

6) Define the term “Data Mining”. With the help of a suitable diagram explain the
process of knowledge discovery from databases. Why is it called data mining rather
knowledge mining?
7) List the types of data on which data mining can be performed. Explain different data
mining functionalities.
8) Write a note on Classification of data mining.
9) Discuss possible ways for integration of a Data Mining system with a Database or
Data Warehouse system.
10) List and describe major issues in data mining.

Unit-3 Data Preprocessing

11) Explain the pre-processing required to handle missing data and noisy data during
the process of data mining. Or List and describe the methods for handling the
missing and noisy values in data cleaning.
12) Explain with example how continuous numerical data values can be discretized.
13) Describe methods for data transformation.
14) What is Measures? List and explain types of measures Or Short Note :Distributive
and Holistic measures
15) Suppose that the data for analysis includes the attribute age. The age values for the
data tuples are (in increasing order): 13, 15, 16, 16, 19, 20, 23, 29, 35, 41, 44, 53, 62,
69, 72
a. Use min-max normalization to transform the value 45 for age onto the range
[0:0, 1:0]
b. Use z-score normalization to transform the value 45 for age, where the
standard deviation of age is 20.64 years.
Compiled By: Darshana H. Patel
V.V.P. Engineering College, Rajkot
16) Enlist various data reduction strategies and explain any two.
17) What is noise? Explain data smoothing methods as noise removal technique to divide
given data into bins of size 3 by bin partition (equal frequency), by bin means, by bin
medians and by bin boundaries. Consider the data: 10, 2, 19, 18, 20, 18, 25, 28, 22
18) Explain following Terms: Concept Hierarchy and its types, Histogram, Sampling, Co-
relation analysis, Chi-square test.
19) Clarify Mean, Median, Mode, Variance, Standard Deviation & five number summary
with suitable database example.
20) Explain Feature selection, Feature extraction and CUR decomposition in brief.

Unit-4 Mining Frequent Patterns, Associations and Correlations

21) Write and discuss the algorithm which is used to generate frequent itemsets using
an iterative level-wise approach based on candidate generation. State the Apriori
Property. Also, list the technique to improve efficiency of Apriori algorithm
Generate large itemsets and association rules using Apriori algorithm on the
following data set with minimum support value and minimum confidence value
set as 50% and 75% respectively

22) What is Market Basket Analysis and explain with its use? Explain Association Rules
with Confidence & Support giving an example.
23) Why strong association rule is not always interesting? Explain with example. How
multilevel association rules can be mined efficiently using concept hierarchy?
24) Write a note on sequential pattern mining or advanced association rule mining
techniques.
25) Briefly explain mining frequent patterns without candidate generation giving an
example.

Unit-5 Classification and Prediction

26) Explain the Classification by Decision Tree Induction Algorithm illustrating an
example alongwith algorithm
27) What is classification and prediction? List out Issues regarding Classification and
prediction.
28) Discuss Tree Pruning in detail. Or why tree pruning useful in decision tree induction?
29) What is an attribute selection measure? Explain different attribute selection measures
with example. OR Explain the following as attribute selection measure: (i)
Information Gain (ii) Gain Ratio
Compiled By: Darshana H. Patel
V.V.P. Engineering College, Rajkot
30) Explain “Linear Regression” using suitable example. Or Explain Linear & Non-
Linear Regression methods of Predictions. Or Explain linear regression? What are the
reasons for not using the linear regression model to estimate the output data?
31) Why naïve Bayesian classification is called “naïve”? Briefly outline the major ideas of
naïve Bayesian classification giving an example. Or Explain Baye’s Theorm and
Statistical based algorithm used for classification.
32) Explain how the accuracy of a classifier/predictor can be measured (evaluating the
accuracy of a classifier/predictor) & also describe by which methods accuracy can be
increased (Ensemble methods/Combining methods).
33) Write a note on accuracy and error measures for classification and prediction
34) Explain rule based classification and case based reasoning in details.
35) What are neural networks? Describe the various factors which make them useful for
classification and prediction in data mining. Explain how the topology of neural
network is designed. List strengths and weakness of neural network as classifier. What
are the terminating conditions to stop training process of neural network classifier?

Unit-6 Clustering
36) What is meant by “clustering”? Explain why clustering is called unsupervised
learning. Mention any two applications of clustering.
37) Explain k-Means and K-Mediods clustering algorithm in detail. How K-Mean
clustering method differs from K-Medoid clustering method?
38) What is outlier analysis? Why outlier mining is important? Briefly describe the
different approaches for outlier detection.
39) Discuss Agglomerative Methods and divisive methods along with strength and
weakness of hierarchical clustering.
40) Write a note on clustering high dimensional data.

Unit-7 Advance Topics

41) What is web log? Explain web structure mining and web usage mining in detail.
42) Briefly explain basic concepts of text mining and Spatial mining using example.
43) Write a note on Temporal Mining and Multimedia Mining.

Compiled By: Darshana H. Patel

V.V.P. Engineering College, Rajkot

Pilgrim Bank - Case Study
97% (39)
Pilgrim Bank - Case Study
14 pages
Introduction To Statistical Modelling PDF
100% (1)
Introduction To Statistical Modelling PDF
133 pages
STA301 Final Term Solved MCQs by JUNAID-1
No ratings yet
STA301 Final Term Solved MCQs by JUNAID-1
54 pages
Quiz 3 - Business Analytics For Marketing - MBA - Sem II - Batch 2021-2023
No ratings yet
Quiz 3 - Business Analytics For Marketing - MBA - Sem II - Batch 2021-2023
7 pages
DWDM Mid-1
No ratings yet
DWDM Mid-1
3 pages
Gandhinagar Institute of Technology: Computer Engineer Ing Department Question Bank
No ratings yet
Gandhinagar Institute of Technology: Computer Engineer Ing Department Question Bank
3 pages
CEUC502 - DMBI - Question - Bank
No ratings yet
CEUC502 - DMBI - Question - Bank
12 pages
Sample Question DMW
No ratings yet
Sample Question DMW
4 pages
16CS531-Data Warehousing and Data Mining
No ratings yet
16CS531-Data Warehousing and Data Mining
6 pages
Data Warehousing and Data Mining Important Question
No ratings yet
Data Warehousing and Data Mining Important Question
7 pages
QB Data Mining
No ratings yet
QB Data Mining
5 pages
DWM 10 Marks
No ratings yet
DWM 10 Marks
3 pages
DWDM Unit Wise Question Bank
No ratings yet
DWDM Unit Wise Question Bank
8 pages
Vi Sem Bca Qbank - Wcms - Fds
50% (2)
Vi Sem Bca Qbank - Wcms - Fds
11 pages
PG - M.sc. - Computer Science - 34141 Data Mining and Ware Housing
No ratings yet
PG - M.sc. - Computer Science - 34141 Data Mining and Ware Housing
192 pages
CS-DM Module - 1
No ratings yet
CS-DM Module - 1
27 pages
16 Marks DWDM
No ratings yet
16 Marks DWDM
6 pages
DM Question Bank
No ratings yet
DM Question Bank
5 pages
Iv Semester: Data Mining Question Bank: Unit 2 2 Mark Questions)
No ratings yet
Iv Semester: Data Mining Question Bank: Unit 2 2 Mark Questions)
5 pages
Data Mining - DM 1-5 Question Bank
No ratings yet
Data Mining - DM 1-5 Question Bank
10 pages
DWDM Unitwise Qns
No ratings yet
DWDM Unitwise Qns
3 pages
DMDW Lab Oral Question Bank
No ratings yet
DMDW Lab Oral Question Bank
4 pages
Data Science Question Bank
No ratings yet
Data Science Question Bank
6 pages
DMBI Questions
No ratings yet
DMBI Questions
8 pages
Data Mining List of Important Question
No ratings yet
Data Mining List of Important Question
4 pages
Question Bank Bca - Ids
No ratings yet
Question Bank Bca - Ids
3 pages
DMBI-Viva Sample Questions
No ratings yet
DMBI-Viva Sample Questions
2 pages
DM Important Questions
100% (1)
DM Important Questions
2 pages
SemSuggestions DM
No ratings yet
SemSuggestions DM
6 pages
Question Bank 2
No ratings yet
Question Bank 2
4 pages
126VW122019
No ratings yet
126VW122019
2 pages
Data Mining Syllabus and Question
No ratings yet
Data Mining Syllabus and Question
6 pages
Important Questions From All Units
No ratings yet
Important Questions From All Units
3 pages
CS1004 DWM 2marks 2013
No ratings yet
CS1004 DWM 2marks 2013
22 pages
Important-Questions of DWDM (BCS058)
No ratings yet
Important-Questions of DWDM (BCS058)
2 pages
Gujarat Technological University: Page 1 of 2
No ratings yet
Gujarat Technological University: Page 1 of 2
2 pages
DMBI QB AssignmentQ
No ratings yet
DMBI QB AssignmentQ
8 pages
Data Warehousing and Mining April 2019
No ratings yet
Data Warehousing and Mining April 2019
4 pages
DWDM
No ratings yet
DWDM
2 pages
DMBI All Pyqs
No ratings yet
DMBI All Pyqs
4 pages
Wa0001
No ratings yet
Wa0001
6 pages
Unit 1 Data Mining
No ratings yet
Unit 1 Data Mining
3 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
13 pages
DWDM QB
No ratings yet
DWDM QB
6 pages
1569928600-7cs It3a dmwh-3555
No ratings yet
1569928600-7cs It3a dmwh-3555
2 pages
DM Question Bank
No ratings yet
DM Question Bank
2 pages
Question Bank DWM 2022-23 Vii Semester B.E. Cse
No ratings yet
Question Bank DWM 2022-23 Vii Semester B.E. Cse
3 pages
Data Mining Question Bank Chapter-1 (Introduction To Data Warehouse and Data Mining) Expected Questions 1 Mark Questions
No ratings yet
Data Mining Question Bank Chapter-1 (Introduction To Data Warehouse and Data Mining) Expected Questions 1 Mark Questions
6 pages
DWM Question Bank
No ratings yet
DWM Question Bank
3 pages
Jntuqp DWDM
No ratings yet
Jntuqp DWDM
8 pages
CS2032 DWM QB PDF
No ratings yet
CS2032 DWM QB PDF
5 pages
DMBI Sample Questions
No ratings yet
DMBI Sample Questions
7 pages
Btech Sem6 Cs1141 Data Mining
No ratings yet
Btech Sem6 Cs1141 Data Mining
5 pages
Gujarat Technological University: Page 1 of 2
No ratings yet
Gujarat Technological University: Page 1 of 2
2 pages
DWM NOTES
No ratings yet
DWM NOTES
118 pages
Data Mining
No ratings yet
Data Mining
3 pages
Data Mining Questions
No ratings yet
Data Mining Questions
5 pages
DWDM Questions Bank (BCS058)
No ratings yet
DWDM Questions Bank (BCS058)
9 pages
Seperated
No ratings yet
Seperated
11 pages
Consolidated Cse Question Bank1
No ratings yet
Consolidated Cse Question Bank1
170 pages
How To Pass Sem 5 - Comps
No ratings yet
How To Pass Sem 5 - Comps
11 pages
DWM Question Bank
No ratings yet
DWM Question Bank
3 pages
IGNOU MCA Data Warehousing and Data Mining Previous Years Unsolved Papers MCS 221
From Everand
IGNOU MCA Data Warehousing and Data Mining Previous Years Unsolved Papers MCS 221
Manish Soni
No ratings yet
IGNOU MCA Data Science and Big Data Previous Years Unsolved Papers MCS 226
From Everand
IGNOU MCA Data Science and Big Data Previous Years Unsolved Papers MCS 226
Manish Soni
No ratings yet
Quiz Calculation Sheet
No ratings yet
Quiz Calculation Sheet
17 pages
Stat 331 Applied Linear Models - Assignment 1: I 0 1 I I I I N I 1 2 I
No ratings yet
Stat 331 Applied Linear Models - Assignment 1: I 0 1 I I I I N I 1 2 I
2 pages
Business Analytics 2nd Edition Evans Test Bankdownload
100% (8)
Business Analytics 2nd Edition Evans Test Bankdownload
45 pages
Mps 3 - Desain Studi Kohort - Dr. Budi Utomo, DR., M.kes.
No ratings yet
Mps 3 - Desain Studi Kohort - Dr. Budi Utomo, DR., M.kes.
43 pages
ML Practical 04
No ratings yet
ML Practical 04
19 pages
Unit7 Autocorrelation
No ratings yet
Unit7 Autocorrelation
11 pages
Particle Filtering: Emin Orhan Eorhan@bcs - Rochester.edu
No ratings yet
Particle Filtering: Emin Orhan Eorhan@bcs - Rochester.edu
6 pages
Tutorial Confidence Interval
No ratings yet
Tutorial Confidence Interval
21 pages
(Daniel & Williams, 2019) Self-Questioning Strategy For Struggling Readers
No ratings yet
(Daniel & Williams, 2019) Self-Questioning Strategy For Struggling Readers
15 pages
Torturing Excel Into Doing Statistics: Preparing Your Spreadsheet
No ratings yet
Torturing Excel Into Doing Statistics: Preparing Your Spreadsheet
10 pages
PG Dast 2019
No ratings yet
PG Dast 2019
29 pages
Program To Find The Variance and Standard Deviation of Set of Elements
No ratings yet
Program To Find The Variance and Standard Deviation of Set of Elements
3 pages
Oak or Sfo?: Eunkwang Joo, Ryan Jung, Julia Kosheleva-Coats, Divya Menghani
No ratings yet
Oak or Sfo?: Eunkwang Joo, Ryan Jung, Julia Kosheleva-Coats, Divya Menghani
8 pages
Random Effects Models: Yanez, Spring 2004 1 Lecture Notes XI
No ratings yet
Random Effects Models: Yanez, Spring 2004 1 Lecture Notes XI
14 pages
Redeveloped Division Initiated Self-Learning Module: Department of Education - Division of Palawan
No ratings yet
Redeveloped Division Initiated Self-Learning Module: Department of Education - Division of Palawan
20 pages
1 Research III Chapter 4 Student
No ratings yet
1 Research III Chapter 4 Student
78 pages
m4 PDF
No ratings yet
m4 PDF
23 pages
OPR201 Midterm Exam
No ratings yet
OPR201 Midterm Exam
3 pages
Dixon Q Test
No ratings yet
Dixon Q Test
2 pages
R Tutorial For STAT 350 For Computer Assignment 9a: Example
No ratings yet
R Tutorial For STAT 350 For Computer Assignment 9a: Example
4 pages
465 898 1 SM
No ratings yet
465 898 1 SM
9 pages
D Linear Regression With R
No ratings yet
D Linear Regression With R
9 pages
Basic Statistics (BST) Session1-2
No ratings yet
Basic Statistics (BST) Session1-2
93 pages
Peta Math
No ratings yet
Peta Math
5 pages
Ameen, Muhydeen Garba (09/30GB116) : An Empirical Assesment of Causes of Building Failures in Lagos State
No ratings yet
Ameen, Muhydeen Garba (09/30GB116) : An Empirical Assesment of Causes of Building Failures in Lagos State
58 pages
Chapter 12 Heteroskedasticity PDF
No ratings yet
Chapter 12 Heteroskedasticity PDF
20 pages

DWDM Unitwise Questions

Uploaded by

DWDM Unitwise Questions

Uploaded by

Semester 6th – I.T. Department – V.V.P. Engg.

Unit-1 Data Warehousing

Unit-2 Introduction to data mining (DM)

Unit-3 Data Preprocessing

Unit-4 Mining Frequent Patterns, Associations and Correlations

Unit-5 Classification and Prediction

Unit-7 Advance Topics

Compiled By: Darshana H. Patel

You might also like