0% found this document useful (0 votes)

11 views6 pages

Data Mining Questions 1st Unit

The KDD (Knowledge Discovery in Databases) process involves extracting valuable information from large datasets through iterative steps including data cleaning, integration, selection, transformation, mining, and pattern evaluation. Each step is crucial for ensuring the accuracy and relevance of the knowledge extracted. Additionally, the document outlines database task primitives that guide users in constructing data mining queries and describes the typical architecture of a database management system.

Uploaded by

Aryan Sukhdewe

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views6 pages

Data Mining Questions 1st Unit

Uploaded by

Aryan Sukhdewe

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

KDD Process (Knowledge discovery in database)

KDD (Knowledge Discovery in Databases) is a process that involves the extraction of useful, previously
unknown, and potentially valuable information from large datasets. The KDD process is an iterative
process and it requires multiple iterations of the above steps to extract accurate knowledge from the
data. The following steps are included in KDD process:

Data Cleaning

Data cleaning is defined as removal of noisy and irrelevant data from collection.

1. Cleaning in case of Missing values.

2. Cleaning noisy data, where noise is a random or variance error.

3. Cleaning with Data discrepancy detection and Data transformation tools.

Data Integration

Data integration is defined as heterogeneous data from multiple sources combined in a common source
(Data Warehouse). Data integration using Data Migration tools, Data Synchronization tools and
ETL(Extract-Load-Transformation) process.

Data Selection

Data selection is defined as the process where data relevant to the analysis is decided and retrieved from
the data collection. For this we can use Neural network, Decision Trees, Naive bayes, Clustering,
and Regression methods.

Data Transformation

Data Transformation is defined as the process of transforming data into appropriate form required by
mining procedure. Data Transformation is a two step process:

1. Data Mapping: Assigning elements from source base to destination to capture transformations.

2. Code generation: Creation of the actual transformation program.

Data Mining

Data mining is defined as techniques that are applied to extract patterns potentially useful. It transforms
task relevant data into patterns, and decides purpose of model using classification or characterization.

Pattern Evaluation

Pattern Evaluation is defined as identifying strictly increasing patterns representing knowledge based on
given measures. It find interestingness score of each pattern, and
uses summarization and Visualization to make data understandable by user.
Database Task Primitive
1. How to construct a data mining query

The primitives allow the user to interactively communicate with the data mining system during
discovery to direct the mining process, or examine the finding

2. The primitives specify:

(1) The set of task-relevant data – which portion of the database to be used
– Database or data warehouse name
– Database tables or data warehouse cubes
– Condition for data selection
– Relevant attributes or dimensions
– Data grouping criteria
(2) The kind of knowledge to be mined – what DB functions to be performed
– Characterization
– Discrimination
– Association
– Classification/prediction
– Clustering
– Outlier analysis
– Other data mining task
(3) The background knowledge to be used – what domain knowledge, concept hierarchies,
etc.

(4) Interestingness measures and thresholds – support, confidence, etc.

(5) Visualization methods – what form to display the result, e.g. rules, tables, charts, graphs,

Typical Database management system architecture

➢ Database, data warehouse, WWW or other information repository (store data)
➢ Database or data warehouse server (fetch and combine data)
➢ Knowledge base (turn data into meaningful groups according to domain knowledge)
➢ Data mining engine (perform mining tasks)
➢ Pattern evaluation module (find interesting patterns)
➢ User interface (interact with the user)

Unit 1 Datamining For Business Intelligence
No ratings yet
Unit 1 Datamining For Business Intelligence
101 pages
Introduction to Robotics
From Everand
Introduction to Robotics
Swarnalata Verma
No ratings yet
Aws Certified Data Engineer Slides
100% (1)
Aws Certified Data Engineer Slides
696 pages
DW and DM Notes
No ratings yet
DW and DM Notes
89 pages
Mastering Data Mining Techniques
From Everand
Mastering Data Mining Techniques
Dhaanyalakshmi Ahuja
No ratings yet
Unit III DWDM
No ratings yet
Unit III DWDM
113 pages
DWDM Notes - Unit 1
No ratings yet
DWDM Notes - Unit 1
26 pages
T24 Archiving and Data Lifecycle Management - User Guide: Release R15.000
No ratings yet
T24 Archiving and Data Lifecycle Management - User Guide: Release R15.000
20 pages
8 Data Mining and Warehousing
No ratings yet
8 Data Mining and Warehousing
171 pages
FDS Unit 1
No ratings yet
FDS Unit 1
20 pages
Data Mining Unit-1
No ratings yet
Data Mining Unit-1
59 pages
Chapter-1 - Introduction To Data Mining
No ratings yet
Chapter-1 - Introduction To Data Mining
10 pages
Data Mining - Reference - 1
No ratings yet
Data Mining - Reference - 1
91 pages
Unit-I (Dmwh6em)
No ratings yet
Unit-I (Dmwh6em)
45 pages
Chapter 1 - Data Mining and Data Warehouse
No ratings yet
Chapter 1 - Data Mining and Data Warehouse
44 pages
Data Mining Notes UNIT I
No ratings yet
Data Mining Notes UNIT I
21 pages
Unit I DM
No ratings yet
Unit I DM
27 pages
Unit-2 Introduction To Data Mining
100% (1)
Unit-2 Introduction To Data Mining
11 pages
Great Compiled Notes Data Mining V1
No ratings yet
Great Compiled Notes Data Mining V1
92 pages
Data Mining
No ratings yet
Data Mining
11 pages
Steps For Data Processing
No ratings yet
Steps For Data Processing
10 pages
UNIT-1 Introduction To Data Mining
No ratings yet
UNIT-1 Introduction To Data Mining
29 pages
Data Mining Unit-I
No ratings yet
Data Mining Unit-I
11 pages
Databricks Certified Data Engineer Associate PDF
0% (1)
Databricks Certified Data Engineer Associate PDF
5 pages
02 - Introduction To Data Lakehouse Open-Source Technologies
No ratings yet
02 - Introduction To Data Lakehouse Open-Source Technologies
42 pages
Data Mining
No ratings yet
Data Mining
43 pages
SQL DBA Interview Questions
100% (1)
SQL DBA Interview Questions
7 pages
Topic 3 - Data Mining
No ratings yet
Topic 3 - Data Mining
37 pages
Chapter 7 Introduction To Knowledge Discovery in Databases
No ratings yet
Chapter 7 Introduction To Knowledge Discovery in Databases
15 pages
Data Mining
No ratings yet
Data Mining
25 pages
Unit 1 DMDW
No ratings yet
Unit 1 DMDW
57 pages
Data Mining PPT
No ratings yet
Data Mining PPT
17 pages
Unit 1
No ratings yet
Unit 1
43 pages
21SE204-B DATA MINING - S2 M.Tech: Prepared By, Prince V Jose Ap, Cse Saintgits College of Engg
No ratings yet
21SE204-B DATA MINING - S2 M.Tech: Prepared By, Prince V Jose Ap, Cse Saintgits College of Engg
31 pages
Chapater 1 Data Mining 2025
No ratings yet
Chapater 1 Data Mining 2025
7 pages
A) Data Cleaning
No ratings yet
A) Data Cleaning
7 pages
DMWH M1
No ratings yet
DMWH M1
25 pages
SQL Project ScienceQtech Employee Performance Mapping...
No ratings yet
SQL Project ScienceQtech Employee Performance Mapping...
14 pages
Data Mining New
No ratings yet
Data Mining New
21 pages
Data Minng
No ratings yet
Data Minng
20 pages
Data Mining and Warehousing-1
No ratings yet
Data Mining and Warehousing-1
43 pages
Screenshot 2023-10-19 at 11.36.57
No ratings yet
Screenshot 2023-10-19 at 11.36.57
27 pages
Data Mining Lecture One - Docx1
No ratings yet
Data Mining Lecture One - Docx1
12 pages
Functional Dependency-II
No ratings yet
Functional Dependency-II
6 pages
Data Mining and Data Analysis UNIT-1 Notes For Print
No ratings yet
Data Mining and Data Analysis UNIT-1 Notes For Print
22 pages
Module-1 DM
No ratings yet
Module-1 DM
15 pages
DM Module 1
No ratings yet
DM Module 1
11 pages
DM Chapter 1
No ratings yet
DM Chapter 1
10 pages
DWM 4
No ratings yet
DWM 4
23 pages
Unit-2 Finalized
No ratings yet
Unit-2 Finalized
12 pages
Wao
No ratings yet
Wao
9 pages
DWDM R13 Unit 1 PDF
No ratings yet
DWDM R13 Unit 1 PDF
10 pages
DWH Unit 3
No ratings yet
DWH Unit 3
7 pages
Data Mining Notes
No ratings yet
Data Mining Notes
9 pages
D-Unit-1 R16
No ratings yet
D-Unit-1 R16
17 pages
Dmdw-Unit-1 R16
No ratings yet
Dmdw-Unit-1 R16
17 pages
Data Mining Basics
No ratings yet
Data Mining Basics
20 pages
Schemas For Multidimensional Databases
No ratings yet
Schemas For Multidimensional Databases
5 pages
DM Unit1 Intro
No ratings yet
DM Unit1 Intro
12 pages
Power Query Transforming Data in Power BI Like A Pro
No ratings yet
Power Query Transforming Data in Power BI Like A Pro
31 pages
Unit 3 Data Mining PDF
No ratings yet
Unit 3 Data Mining PDF
19 pages
Databases: System Concepts, Designs, Management, and Implementation
From Everand
Databases: System Concepts, Designs, Management, and Implementation
Jonathan Rigdon
No ratings yet
Data Mining 14
No ratings yet
Data Mining 14
3 pages
Unit 1
No ratings yet
Unit 1
11 pages
2 Pandas
No ratings yet
2 Pandas
22 pages
Unit V-Apache Pig
No ratings yet
Unit V-Apache Pig
10 pages
A Conceptual Overview of Data Mining: B.N. Lakshmi., G.H. Raghunandhan
No ratings yet
A Conceptual Overview of Data Mining: B.N. Lakshmi., G.H. Raghunandhan
6 pages
Dms Lab Manual Updated
No ratings yet
Dms Lab Manual Updated
87 pages
Backend Development Test 1
No ratings yet
Backend Development Test 1
49 pages
Data Mine
No ratings yet
Data Mine
14 pages
SIT 200 Database Management System
No ratings yet
SIT 200 Database Management System
4 pages
Computer Science Engineering
No ratings yet
Computer Science Engineering
33 pages
Advance Database With Lab: Professor & Head (Department of Software Engineering)
No ratings yet
Advance Database With Lab: Professor & Head (Department of Software Engineering)
5 pages
Advanced Database Systems Handout
No ratings yet
Advanced Database Systems Handout
42 pages
DATA MINING-Knowledge Discovery in Databases
No ratings yet
DATA MINING-Knowledge Discovery in Databases
6 pages
Complete Sylabus Advanced Excel, Power BI, SQL
No ratings yet
Complete Sylabus Advanced Excel, Power BI, SQL
7 pages
84311737514719120-Class8WorksheetLs4andLs5 MSACCESS2010AnswerKey PDF
No ratings yet
84311737514719120-Class8WorksheetLs4andLs5 MSACCESS2010AnswerKey PDF
5 pages
Data Structures: Notes For Lecture 12 Introduction To Data Mining by Samaher Hussein Ali
No ratings yet
Data Structures: Notes For Lecture 12 Introduction To Data Mining by Samaher Hussein Ali
4 pages
Adf Interview Q&a
No ratings yet
Adf Interview Q&a
27 pages
Document WPS Office
No ratings yet
Document WPS Office
4 pages
Chap8-Cluster Analysis
No ratings yet
Chap8-Cluster Analysis
78 pages
3.1 Relational Algebra
No ratings yet
3.1 Relational Algebra
63 pages
2015KS Mediratta-Big Data Terms, Definitions and Applications
No ratings yet
2015KS Mediratta-Big Data Terms, Definitions and Applications
28 pages
2-History and Purposes
No ratings yet
2-History and Purposes
8 pages
Data Engineering Lab
No ratings yet
Data Engineering Lab
4 pages
Bi Lectures Chatgpt
No ratings yet
Bi Lectures Chatgpt
48 pages
Inside Fortianalyzer 50
No ratings yet
Inside Fortianalyzer 50
4 pages
Lab 8 - SQL Aggregate Functions
No ratings yet
Lab 8 - SQL Aggregate Functions
3 pages
Introduction To The Oracle Database Family
No ratings yet
Introduction To The Oracle Database Family
2 pages
Capstone Project - Music Library - JAVAJ2EE
No ratings yet
Capstone Project - Music Library - JAVAJ2EE
3 pages

Data Mining Questions 1st Unit

Uploaded by

Data Mining Questions 1st Unit

Uploaded by

KDD Process (Knowledge discovery in database)

1. Cleaning in case of Missing values.

2. Cleaning noisy data, where noise is a random or variance error.

3. Cleaning with Data discrepancy detection and Data transformation tools.

2. Code generation: Creation of the actual transformation program.

2. The primitives specify:

(4) Interestingness measures and thresholds – support, confidence, etc.

Typical Database management system architecture

You might also like