0% found this document useful (0 votes)

17 views3 pages

Most Detailed 4 Data Mining Answers

The document discusses data transformation and reduction techniques essential for data mining, including normalization, aggregation, and dimensionality reduction. It also explains OLAP operations such as roll-up and drill-down, and provides a detailed example of calculating correlation using lift. Additionally, it covers hierarchical clustering methods, outlining agglomerative and divisive approaches along with their applications.

Uploaded by

rojasebastian2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views3 pages

Most Detailed 4 Data Mining Answers

Uploaded by

rojasebastian2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Most Detailed Data Mining Answers with Diagrams

22. Explain data transformation and data reduction in detail.

**Data Transformation:**
Data transformation is the process of converting data into a suitable format for mining. It includes:
- **Normalization:** Adjusting values to a common scale (e.g., Min-Max Scaling: (X - Min) / (Max -
Min)).
- **Aggregation:** Summarizing data at a higher level (e.g., Monthly sales Quarterly sales).
- **Smoothing:** Removing noise using moving averages or binning.
- **Discretization:** Converting continuous values into discrete categories (e.g., Age Young,
Middle-aged, Senior).

**Data Reduction:**
Data reduction minimizes the dataset size while retaining important features. Techniques include:
- **Dimensionality Reduction:** Uses Principal Component Analysis (PCA) to reduce attributes.
- **Data Compression:** Encodes data efficiently (e.g., Huffman coding).
- **Sampling:** Uses subsets of data instead of full data for analysis.
- **Feature Selection:** Removes redundant attributes using correlation analysis.

23. Explain with diagrams, various OLAP operations.

**OLAP (Online Analytical Processing) Operations:**
OLAP is used in data warehousing to analyze multidimensional data effectively. Key operations
include:

- **Roll-up:** Aggregates data to a higher level (e.g., from monthly sales to yearly sales).
- **Drill-down:** Moves from summarized to detailed data (e.g., from yearly sales to monthly sales).
- **Slice:** Extracts data for a single dimension (e.g., filtering sales for 2023 only).
- **Dice:** Extracts a subset of data based on multiple dimensions (e.g., sales for 2023 and product
category A).
- **Pivot:** Rotates data for different perspectives (e.g., switching rows and columns in a report).

24. Explain with an example, how to perform correlation using lift.

**Lift Calculation Formula:**
- Lift = (Confidence of Rule) / (Expected Confidence)
**Example:**
- Assume a supermarket dataset where:
- 20% of transactions include bread.
- 30% of transactions include milk.
- 10% of transactions include both bread and milk.

Step 1: Calculate Confidence:

- Confidence(Bread Milk) = P(Bread and Milk) / P(Bread)
- Confidence = 10% / 20% = 0.5 (50%)

Step 2: Calculate Expected Confidence:

- Expected Confidence = P(Milk) = 30% (0.3)

Step 3: Calculate Lift:

- Lift = 0.5 / 0.3 = 1.67

**Interpretation:**
- Lift > 1 indicates a strong positive correlation (customers buying bread are likely to buy milk).

25. Explain hierarchical method of clustering.

**Definition:**
Hierarchical clustering builds a tree-like structure (dendrogram) of nested clusters.

**Types:**
1. **Agglomerative Hierarchical Clustering:**
- Starts with individual points and merges the closest clusters iteratively.
- Linkage methods:
- **Single Linkage:** Merges clusters based on shortest distance.
- **Complete Linkage:** Merges clusters based on farthest distance.
- **Average Linkage:** Uses the average distance between clusters.

2. Divisive Hierarchical Clustering:

- Starts with a single large cluster and recursively splits it into smaller clusters.
**Example Applications:**
- Used in bioinformatics for gene classification.
- Helps in customer segmentation for targeted marketing.

Azure Data Engineer
No ratings yet
Azure Data Engineer
8 pages
KIUT CIT Research Proposal Project Format Guidelines
No ratings yet
KIUT CIT Research Proposal Project Format Guidelines
9 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
10 pages
Maths
No ratings yet
Maths
51 pages
Computer
No ratings yet
Computer
49 pages
EXCEL
No ratings yet
EXCEL
19 pages
Cognos 10.1.1 Technical Architecture Super Session 2012
No ratings yet
Cognos 10.1.1 Technical Architecture Super Session 2012
99 pages
Dmaclat4 Merged
No ratings yet
Dmaclat4 Merged
46 pages
UG BSF Clustering
No ratings yet
UG BSF Clustering
119 pages
Ifferent Methods of Clustering
No ratings yet
Ifferent Methods of Clustering
8 pages
Data Mining
No ratings yet
Data Mining
48 pages
DDF Builder Users Guide
No ratings yet
DDF Builder Users Guide
148 pages
Rushikesh Patil Casestudy
No ratings yet
Rushikesh Patil Casestudy
75 pages
331 MT2 Study
No ratings yet
331 MT2 Study
30 pages
10-2 Data Analysis and Pre-Processing Part 4 PDF
No ratings yet
10-2 Data Analysis and Pre-Processing Part 4 PDF
23 pages
Data Mining
No ratings yet
Data Mining
44 pages
Final CS
No ratings yet
Final CS
34 pages
Question
No ratings yet
Question
27 pages
Unit 2
No ratings yet
Unit 2
82 pages
Data Mining Assignment 2
No ratings yet
Data Mining Assignment 2
25 pages
FML
No ratings yet
FML
18 pages
DM Data Transformation Techniques
No ratings yet
DM Data Transformation Techniques
25 pages
Sem 2 Synopsis
No ratings yet
Sem 2 Synopsis
27 pages
Current Log
No ratings yet
Current Log
27 pages
Big Data Analytics
No ratings yet
Big Data Analytics
25 pages
Unit-4 Notes
No ratings yet
Unit-4 Notes
16 pages
BDA LabReport-9
No ratings yet
BDA LabReport-9
17 pages
EDA Question Bank Answers
No ratings yet
EDA Question Bank Answers
24 pages
1M and 10 M
No ratings yet
1M and 10 M
23 pages
Solve These
No ratings yet
Solve These
7 pages
DMBI Sem 6 Important Topics (IT)
No ratings yet
DMBI Sem 6 Important Topics (IT)
20 pages
DWDM Unit 3
No ratings yet
DWDM Unit 3
21 pages
DWM Unit-5 Sem Ans
No ratings yet
DWM Unit-5 Sem Ans
8 pages
Affairs
No ratings yet
Affairs
9 pages
206 Data Mining
No ratings yet
206 Data Mining
28 pages
Data Mining Overview
No ratings yet
Data Mining Overview
4 pages
DWDM 2marks
No ratings yet
DWDM 2marks
15 pages
Chapter 7
No ratings yet
Chapter 7
3 pages
Document
No ratings yet
Document
44 pages
IP.21 Learning Path
No ratings yet
IP.21 Learning Path
1 page
Unit No 3
No ratings yet
Unit No 3
10 pages
AZ-304-Version 4.0
No ratings yet
AZ-304-Version 4.0
164 pages
DWM Ia-2 QB
No ratings yet
DWM Ia-2 QB
10 pages
Model Question Paper 2
No ratings yet
Model Question Paper 2
7 pages
Data Mining Questions Modules
No ratings yet
Data Mining Questions Modules
3 pages
Data Mining Long Answers
No ratings yet
Data Mining Long Answers
4 pages
DWDM
No ratings yet
DWDM
18 pages
DM - MP
No ratings yet
DM - MP
6 pages
Module III Data Mining
No ratings yet
Module III Data Mining
7 pages
DW Question Paper 3
No ratings yet
DW Question Paper 3
4 pages
Assignment 2nd DMDW
No ratings yet
Assignment 2nd DMDW
11 pages
DWM Important Answer
No ratings yet
DWM Important Answer
8 pages
Sap Abap Dictionary
No ratings yet
Sap Abap Dictionary
24 pages
Unit3 Datamining
No ratings yet
Unit3 Datamining
5 pages
P 3.1.3 Hierarchical
No ratings yet
P 3.1.3 Hierarchical
30 pages
Data Mining
No ratings yet
Data Mining
4 pages
It-3031 (DMDW) - CS End Nov 2023
No ratings yet
It-3031 (DMDW) - CS End Nov 2023
23 pages
Data Mining Key Concepts
No ratings yet
Data Mining Key Concepts
3 pages
CS 2 Marks PDF Ia2
No ratings yet
CS 2 Marks PDF Ia2
4 pages
Viva Preparation Notes
No ratings yet
Viva Preparation Notes
6 pages
S12 B4H ADSOs+-+Part+1
No ratings yet
S12 B4H ADSOs+-+Part+1
12 pages
Final Most Detailed 4 Data Mining Answers With Diagrams
No ratings yet
Final Most Detailed 4 Data Mining Answers With Diagrams
4 pages
SE AI and ML DBMSL Practical SYLLABUS
No ratings yet
SE AI and ML DBMSL Practical SYLLABUS
3 pages
NZ DDL Grant Group
No ratings yet
NZ DDL Grant Group
12 pages
Highly Detailed 4 Data Mining Answers
No ratings yet
Highly Detailed 4 Data Mining Answers
3 pages
Oss Report
No ratings yet
Oss Report
5 pages
JB183 EAP7.0 en 2 20180124 IG 1 PDF
No ratings yet
JB183 EAP7.0 en 2 20180124 IG 1 PDF
78 pages
BPEL PM 11g Performance Tuning - 5
No ratings yet
BPEL PM 11g Performance Tuning - 5
104 pages
Detailed Clustering in Machine Learning Notes
No ratings yet
Detailed Clustering in Machine Learning Notes
4 pages
Unit 2 - Data Preprocessing
No ratings yet
Unit 2 - Data Preprocessing
42 pages
Transaction Processing Concepts and Theory
No ratings yet
Transaction Processing Concepts and Theory
56 pages
Nandkumar Balkrishna Mohite
No ratings yet
Nandkumar Balkrishna Mohite
3 pages
PROFICIENCY Data Mining
No ratings yet
PROFICIENCY Data Mining
6 pages
Clustering
No ratings yet
Clustering
3 pages
DMDW
No ratings yet
DMDW
4 pages
HTCB Unit 5
No ratings yet
HTCB Unit 5
3 pages
DM UNIT-1 Question and Answer
No ratings yet
DM UNIT-1 Question and Answer
25 pages
SQL Injection PDF
No ratings yet
SQL Injection PDF
6 pages
Data Mining: Concepts and Techniques
No ratings yet
Data Mining: Concepts and Techniques
50 pages
Data Mining Answer Key
No ratings yet
Data Mining Answer Key
10 pages
3.data Pre-Processing Concepts
No ratings yet
3.data Pre-Processing Concepts
8 pages
Oracle: Question & Answers
No ratings yet
Oracle: Question & Answers
5 pages
CMP1042 Information Systems
No ratings yet
CMP1042 Information Systems
4 pages
Welcome
No ratings yet
Welcome
23 pages
Rdbmsexp 6
No ratings yet
Rdbmsexp 6
6 pages
Overview of Unsupervised Learning
No ratings yet
Overview of Unsupervised Learning
2 pages
Ignore The Tuple
No ratings yet
Ignore The Tuple
2 pages
Oracle Data Guard 11g Release 2: High Availability To Protect Your Business
No ratings yet
Oracle Data Guard 11g Release 2: High Availability To Protect Your Business
58 pages
Editable Tables in JavaFX - DZone Java
No ratings yet
Editable Tables in JavaFX - DZone Java
15 pages
Rakhi's Resume
No ratings yet
Rakhi's Resume
1 page
Data Warehousing and Mining: Ii Unit: Data Preprocessing, Language Architecture Concept Description
No ratings yet
Data Warehousing and Mining: Ii Unit: Data Preprocessing, Language Architecture Concept Description
7 pages
IV-cse DM Viva Questions
No ratings yet
IV-cse DM Viva Questions
10 pages
Active Directory Partition
No ratings yet
Active Directory Partition
3 pages
Hydraulic Hoists & Lifts World Summary: Market Values & Financials by Country
From Everand
Hydraulic Hoists & Lifts World Summary: Market Values & Financials by Country
Editorial DataGroup
No ratings yet

Most Detailed 4 Data Mining Answers

Uploaded by

Most Detailed 4 Data Mining Answers

Uploaded by

Most Detailed Data Mining Answers with Diagrams

22. Explain data transformation and data reduction in detail.

23. Explain with diagrams, various OLAP operations.

24. Explain with an example, how to perform correlation using lift.

**Step 1: Calculate Confidence:**

**Step 2: Calculate Expected Confidence:**

**Step 3: Calculate Lift:**

25. Explain hierarchical method of clustering.

2. **Divisive Hierarchical Clustering:**

You might also like

Step 1: Calculate Confidence:

Step 2: Calculate Expected Confidence:

Step 3: Calculate Lift:

2. Divisive Hierarchical Clustering: