0% found this document useful (0 votes)

11 views19 pages

Data Mining L-5

The document provides an overview of data mining, including its history, myths, privacy concerns, advantages, and disadvantages. It outlines various data mining functionalities such as classification, clustering, and predictive modeling, as well as the components and techniques used in data mining. Additionally, it emphasizes the importance of compliance with privacy regulations and the potential consequences of non-compliance.

Uploaded by

xataje8102

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views19 pages

Data Mining L-5

Uploaded by

xataje8102

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 19

Rishi Sharma

IIIT Surat
Unit I
Summary and Q/A
Interesting Facts
❖ Who is the founder of data mining: Gregory Piatetsky-Shapiro in 1989 for KDD.
❖ The term "data mining" was coined in the 1990s,Dr. Usama Fayyad
❖ Who is the father of data scientist: William S. Cleveland.
❖ Father of database: E. F. Codd, father of the relational database
Myths And Mistakes About Data Mining

Myths
❖ Data Mining Is Always Invasive And Violates Privacy
❖ Data Mining Is Illegal
❖ Data Mining Is Expensive
❖ Data Mining Is Only For Technical Experts
❖ Data Mining is for Large Companies with Lots of Customer Data
Mistakes
❖ Collecting Too Much Data
❖ Failing To Secure Data
❖ Misinterpreting Data
❖ Ignoring Privacy Regulations
Data Mining Privacy
❖ Obtain consent: Organizations should obtain consent from individuals before collecting and
using their data for data mining purposes.
❖ Anonymize data: Organizations should anonymize data before using it for data mining
purposes to protect individuals’ privacy.
❖ Use secure methods: Organizations should use secure methods to store and transmit data
to prevent unauthorized access.
❖ Limit access: Organizations should limit access to data mining tools and data to only
authorized personnel to prevent misuse or unauthorized access.
❖ Be transparent: Organizations should be transparent about their data mining practices and
inform individuals about the purpose and scope of data mining activities.
❖ Educate users: Educate users about data privacy and the importance of protecting their
personal information. Provide clear and concise information about how their data will be
used and give them the option to opt out if they choose to do so
❖ Regularly review and update policies: Organizations should regularly review and update
their data mining policies to ensure they comply with privacy laws and regulations.
❖ Provide transparency: Be transparent about the data mining process and provide
individuals with information about how their data will be used.
Non-Compliance With Privacy Regulations

Some consequences of non-compliance with privacy regulations can be severe

and may include
❖ Legal penalties,
❖ Financial losses
❖ Reputational damage,
❖ Loss of customer trust,
❖ Loss or theft of sensitive information, and
❖ Potential legal action from affected individuals/Organizations
Knowledge Discovery from Database (KDD)
Advantages of KDD in Data Mining

❖ Helps in Decision Making

❖ Improves Business Performance
❖ Saves Time and Resources
❖ Increases Efficiency
❖ Enhances Customer Experience
❖ Fraud Detection
❖ Enables Predictive Modeling
Disadvantages of KDD in Data Mining

❖ Requires High-Quality Data

❖ Complexity
❖ Privacy and Compliance Concerns
❖ High Cost
Data Mining from Data/Database
❖ Relational Databases
❖ Data Warehouses
❖ Transactional Databases
❖ Object-Relational Databases
❖ Temporal Databases, Sequence Databases, and Time-Series Databases
❖ Spatial Databases and Spatiotemporal Databases
❖ Text Databases and Multimedia Databases
❖ Heterogeneous Databases and Legacy Databases
❖ Data Streams
❖ World Wide Web
Data Mining Functionality

Data Characterization Classification

Data Discrimination Regression

Association Rule Mining Prediction

Clustering Outlier Detection

Visualisation Evolution and Deviation Analysis

Correlation Analysis
Descriptive Data Mining
Descriptive data mining focuses on summarising and describing the characteristics of data. It helps
organisations gain a deeper understanding of their existing data and identify patterns that can inform
strategic decisions.

❖ Data Characterization: Involves summarising the general characteristics of a data set or a specific
group within it. For instance, analysing customer demographics or product attributes.
❖ Data Discrimination: Compares the characteristics of target classes with those of contrasting
classes. This helps identify differentiating factors between groups.
❖ Association Rule Mining: Discovers relationships between items or events that occur frequently
together. Commonly used in market basket analysis to identify product affinities.
❖ Clustering: Groups similar data points together without prior knowledge of group membership.
Useful for customer segmentation, anomaly detection, and image analysis.
❖ Visualisation: Presents data in a graphical format to facilitate understanding and interpretation.
Effective for exploring patterns, trends, and outliers.
Predictive Data Mining
Predictive data mining goes beyond description to forecast future trends and outcomes based on historical
data. It enables organisations to make informed predictions and optimise decision-making processes.

❖ Classification: Assigns data instances to predefined categories or classes. Used for customer churn
prediction, fraud detection, and risk assessment.
❖ Regression: Predicts numerical values based on input variables. Applications include sales
forecasting, price prediction, and demand estimation.
❖ Prediction: Encompasses both classification and regression, aiming to forecast future values or
categories.
❖ Outlier Detection: Identifies data points that deviate significantly from the norm. Helpful in fraud
detection, anomaly detection in sensor data, and quality control.
❖ Evolution and Deviation Analysis: Tracks changes in data patterns over time. Valuable for trend
analysis, market analysis, and monitoring system performance.
❖ Correlation Analysis: Measures the strength and direction of relationships between variables. Used
for identifying dependencies, cause-and-effect relationships, and feature selection.
Data Mining Primitives
Five primitives for data mining task in the form of a data mining query:
❖ The kind of knowledge to be mined,
❖ Background knowledge
❖ Interestingness measures,
❖ Knowledge presentation and
❖ Visualization techniques
Query Language in data Mining
❖ Data mining query languages can be designed to support ad hoc and
interactive data mining.
❖ A data mining query language, such as DMQL, should provide commands for
specifying each of the data mining primitives.
What are the components of data mining?

❖ Databases
❖ Data warehouse server
❖ Knowledge base
❖ Data mining engine
❖ Pattern evaluation module
❖ User interface

What are the areas of text mining in data mining?

❖ Information Retrieval
❖ Natural Language Processing (NLP)
❖ Information Extraction (IE)
❖ Data Mining
Questions
What are The Main Techniques Used in Data Mining?
The main techniques include: classification, clustering, regression, and association rule
learning. Each technique serves different purposes, such as predicting outcomes,
grouping similar data, or identifying relationships between variables.

How Can Data Mining Benefit Businesses?

Data mining helps businesses uncover insights from their data, leading to better
decision-making, improved customer targeting, enhanced operational efficiency, and
increased revenue. It enables organisations to identify trends and opportunities that
would otherwise remain hidden.
Knowledge Discovery from Database (KDD) Vs Data Mining

OLAP VS OLTP

Data Mining Vs Data Warehouse vs database

Find any types of Dataset for Data Mining

Learn any visualization software/Application

Building The Future Telco: Simplify - Automate - Innovate
100% (2)
Building The Future Telco: Simplify - Automate - Innovate
69 pages
Full and Correct Notes For FDS-6th Bca
No ratings yet
Full and Correct Notes For FDS-6th Bca
83 pages
Data Mining
No ratings yet
Data Mining
395 pages
IS352 - Lecture 01
No ratings yet
IS352 - Lecture 01
62 pages
SIC - AI - Chapter 1. Introduction To Artificial Intelligence - Rev2.0
No ratings yet
SIC - AI - Chapter 1. Introduction To Artificial Intelligence - Rev2.0
121 pages
L18 K Means
No ratings yet
L18 K Means
27 pages
Data Mining
No ratings yet
Data Mining
254 pages
Data-Analyst - ERT
No ratings yet
Data-Analyst - ERT
21 pages
Momentum Bias Index (AlgoAlpha) @fxsignalspot
No ratings yet
Momentum Bias Index (AlgoAlpha) @fxsignalspot
2 pages
Hasil Spss Log
No ratings yet
Hasil Spss Log
6 pages
Research 1 5
No ratings yet
Research 1 5
16 pages
Notes DATA MINING MBA III
No ratings yet
Notes DATA MINING MBA III
8 pages
Presentation On Data Mining
100% (1)
Presentation On Data Mining
51 pages
Data Mining Notes1
No ratings yet
Data Mining Notes1
56 pages
Data Mining OVERVIEW
No ratings yet
Data Mining OVERVIEW
8 pages
Training Plan New Format
No ratings yet
Training Plan New Format
35 pages
1 - Lect 1 & 2 Data Mining
No ratings yet
1 - Lect 1 & 2 Data Mining
20 pages
02 DM BI Data Mining
No ratings yet
02 DM BI Data Mining
66 pages
Analyzing The Ipr Strategies and Its Challenges in Pharmaceutical Industry
No ratings yet
Analyzing The Ipr Strategies and Its Challenges in Pharmaceutical Industry
30 pages
Adm Unit - 1
No ratings yet
Adm Unit - 1
62 pages
Unit 1 Data Mining Introduction
No ratings yet
Unit 1 Data Mining Introduction
53 pages
Data Mining Unit 1 (MSC Ds 3 Sem)
No ratings yet
Data Mining Unit 1 (MSC Ds 3 Sem)
119 pages
Data Mining Final
No ratings yet
Data Mining Final
38 pages
Data Mining Mids
No ratings yet
Data Mining Mids
24 pages
3-OLAP Operations-13!08!2021 (13-Aug-2021) Material I 13-Aug-2021 Data Mining - Introductory Slides
No ratings yet
3-OLAP Operations-13!08!2021 (13-Aug-2021) Material I 13-Aug-2021 Data Mining - Introductory Slides
37 pages
Data Mining L1,2
No ratings yet
Data Mining L1,2
26 pages
Business Research Chapter 2
100% (1)
Business Research Chapter 2
41 pages
Knowledge Discovery Process and Data Mining - Final Remarks: - Moore's Law
No ratings yet
Knowledge Discovery Process and Data Mining - Final Remarks: - Moore's Law
25 pages
Fundamentals of Data Science Notes (Module - 1)
No ratings yet
Fundamentals of Data Science Notes (Module - 1)
19 pages
Module 3
No ratings yet
Module 3
187 pages
Introduction To Data Mining
No ratings yet
Introduction To Data Mining
20 pages
Datamining&warehousing
No ratings yet
Datamining&warehousing
65 pages
Data Mining - Digital Notes (Unit I To V)
No ratings yet
Data Mining - Digital Notes (Unit I To V)
85 pages
Data Mining
No ratings yet
Data Mining
88 pages
Full Paper 341
No ratings yet
Full Paper 341
11 pages
01 Intro
No ratings yet
01 Intro
45 pages
DMW Notes by Me
No ratings yet
DMW Notes by Me
45 pages
Multicollinearity
100% (1)
Multicollinearity
2 pages
Unit 1 Data Mining
No ratings yet
Unit 1 Data Mining
30 pages
Introduction
No ratings yet
Introduction
46 pages
Dmi Unit 1 - 186 - N3
No ratings yet
Dmi Unit 1 - 186 - N3
12 pages
Data Science Module 1 Notes
No ratings yet
Data Science Module 1 Notes
16 pages
DWM Unit II
No ratings yet
DWM Unit II
76 pages
Unit 1
No ratings yet
Unit 1
59 pages
Datawarehouse&Data Mining - ALL
No ratings yet
Datawarehouse&Data Mining - ALL
46 pages
Data Mining and Data Warehousing Unit 3 Part 1
No ratings yet
Data Mining and Data Warehousing Unit 3 Part 1
13 pages
Lesson 1
No ratings yet
Lesson 1
32 pages
Advanced Certificate Programme DS 1669897036711 PDF
No ratings yet
Advanced Certificate Programme DS 1669897036711 PDF
34 pages
Module 1
No ratings yet
Module 1
41 pages
Lecture 01 11jan
No ratings yet
Lecture 01 11jan
29 pages
Unit 1 Data Mining
No ratings yet
Unit 1 Data Mining
15 pages
Data Mining Tutorial - Javatpoint
No ratings yet
Data Mining Tutorial - Javatpoint
12 pages
TYBBAA 1007points Tally Show
No ratings yet
TYBBAA 1007points Tally Show
33 pages
L - 1 Data Mining
No ratings yet
L - 1 Data Mining
17 pages
Dadm (1) Sidra
No ratings yet
Dadm (1) Sidra
9 pages
UNIT 1 - Lecture 1 - Introduction To Data Mining
No ratings yet
UNIT 1 - Lecture 1 - Introduction To Data Mining
62 pages
Data Mining Unit 1
No ratings yet
Data Mining Unit 1
13 pages
Course 572
No ratings yet
Course 572
8 pages
Chapter-1 (Introduction)
No ratings yet
Chapter-1 (Introduction)
17 pages
Data Mining
No ratings yet
Data Mining
8 pages
Data Mining:: Dr. Hany Saleeb
No ratings yet
Data Mining:: Dr. Hany Saleeb
37 pages
DM Chapter 1
No ratings yet
DM Chapter 1
10 pages
Estimating A VAR - Gretl
No ratings yet
Estimating A VAR - Gretl
9 pages
Stock Watson 4E Exercisesolutions Chapter3 Instructors
No ratings yet
Stock Watson 4E Exercisesolutions Chapter3 Instructors
25 pages
Unit 1
No ratings yet
Unit 1
7 pages
Unit 4
No ratings yet
Unit 4
17 pages
DM Module1
No ratings yet
DM Module1
15 pages
Introduction To Data Mining-Week1
No ratings yet
Introduction To Data Mining-Week1
43 pages
Data Science Techniques For Predictive Modelling and Decision Making Full Paper
No ratings yet
Data Science Techniques For Predictive Modelling and Decision Making Full Paper
4 pages
Solutions To HW Exercises - Ch. 10
No ratings yet
Solutions To HW Exercises - Ch. 10
2 pages
Data Mining: Concepts and Techniques
No ratings yet
Data Mining: Concepts and Techniques
25 pages
Data Mining Concepts
No ratings yet
Data Mining Concepts
35 pages
3.1 Model Check
No ratings yet
3.1 Model Check
20 pages
Jawaban Soal Problem Brigham Mankeu
No ratings yet
Jawaban Soal Problem Brigham Mankeu
4 pages
2232 CorpuzMNC2013 PDF
No ratings yet
2232 CorpuzMNC2013 PDF
11 pages
Multivariate and Multilevel Data Analysis Using SPSS, Amos, Smartpls and Mplus
No ratings yet
Multivariate and Multilevel Data Analysis Using SPSS, Amos, Smartpls and Mplus
8 pages
Mehrdad Jalali: Jalali@mshdiau - Ac.ir Jalali - Mshdiau.ac - Ir
No ratings yet
Mehrdad Jalali: Jalali@mshdiau - Ac.ir Jalali - Mshdiau.ac - Ir
27 pages
Augmented Dickney Fuller and Phillip-Peron Tests: Prior To Global Contagion
No ratings yet
Augmented Dickney Fuller and Phillip-Peron Tests: Prior To Global Contagion
10 pages
Data Mining
No ratings yet
Data Mining
27 pages
Machine Learing r20 QP
No ratings yet
Machine Learing r20 QP
4 pages
Assignment Brief 2023
No ratings yet
Assignment Brief 2023
10 pages
Exemplos Betas
No ratings yet
Exemplos Betas
12 pages
Assignment
No ratings yet
Assignment
7 pages
Documentation-Humility and Honesty Catch-Up Friday
No ratings yet
Documentation-Humility and Honesty Catch-Up Friday
3 pages
Data Mining Summaries PDF
No ratings yet
Data Mining Summaries PDF
22 pages
1 Intro
No ratings yet
1 Intro
33 pages
Gender Yes NO Total Male 10 23 33 Female 4 4 8 Total 14 27 41
No ratings yet
Gender Yes NO Total Male 10 23 33 Female 4 4 8 Total 14 27 41
5 pages
Chap 1
No ratings yet
Chap 1
32 pages

Data Mining L-5

Uploaded by

Data Mining L-5

Uploaded by

Rishi Sharma

Some consequences of non-compliance with privacy regulations can be severe

❖ Helps in Decision Making

❖ Requires High-Quality Data

Data Characterization Classification

Data Discrimination Regression

Association Rule Mining Prediction

Clustering Outlier Detection

Visualisation Evolution and Deviation Analysis

What are the areas of text mining in data mining?

How Can Data Mining Benefit Businesses?

Data Mining Vs Data Warehouse vs database

Find any types of Dataset for Data Mining

Learn any visualization software/Application

You might also like