0% found this document useful (0 votes)

10 views20 pages

SupervisedLearning Classification

Uploaded by

Giang Nguyễn Doãn Hoàng

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views20 pages

SupervisedLearning Classification

Uploaded by

Giang Nguyễn Doãn Hoàng

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

You are on page 1/ 20

Classification: Definition

 Given a collection of records (training set )

– Each record contains a set of attributes, one of the
attributes is the class.
 Find a model for class attribute as a function
of the values of other attributes.
 Goal: previously unseen records should be
assigned a class as accurately as possible.
– A test set is used to determine the accuracy of the
model. Usually, the given data set is divided into
training and test sets, with training set used to build
the model and test set used to validate it.

© Vipin Kumar CSci 5980 Spring 2004 1

Illustrating Classification Task

Tid Attrib1 Attrib2 Attrib3 Class Learning

No
1 Yes Large 125K
algorithm
2 No Medium 100K No

3 No Small 70K No
4 Yes Medium 120K No
Induction
5 No Large 95K Yes
6 No Medium 60K No

7 Yes Large 220K No Learn

8 No Small 85K Yes Model
9 No Medium 75K No
10 No Small 90K Yes
Model
10

Training Set
Apply
Tid Attrib1 Attrib2 Attrib3 Class Model
11 No Small 55K ?

12 Yes Medium 80K ?

13 Yes Large 110K ? Deduction

14 No Small 95K ?

15 No Large 67K ?
10

Test Set

© Vipin Kumar CSci 5980 Spring 2004 2

Examples of Classification Task

 Predicting tumor cells as benign or malignant

 Classifying credit card transactions

as legitimate or fraudulent

 Classifying secondary structures of protein

as alpha-helix, beta-sheet, or random
coil

 Categorizing news stories as finance,

weather, entertainment, sports, etc
© Vipin Kumar CSci 5980 Spring 2004 3
Classification Techniques

 Decision Tree based Methods

 Rule-based Methods
 Memory based reasoning
 Neural Networks
 Naïve Bayes and Bayesian Belief Networks
 Support Vector Machines

© Vipin Kumar CSci 5980 Spring 2004 4

Example of a Decision Tree

cal cal us
i i o
or or nu
teg
teg
nti
ass
ca ca co cl
Tid Refund Marital Taxable
Splitting Attributes
Status Income Cheat

1 Yes Single 125K No

2 No Married 100K No Refund
3 No Single 70K No
Yes No
4 Yes Married 120K No NO MarSt
5 No Divorced 95K Yes Married
Single, Divorced
6 No Married 60K No
7 Yes Divorced 220K No TaxInc NO
8 No Single 85K Yes < 80K > 80K
9 No Married 75K No
NO YES
10 No Single 90K Yes
10

Training Data Model: Decision Tree

© Vipin Kumar CSci 5980 Spring 2004 5

Another Example of Decision Tree

cal cal us
i i o
or or nu
teg
teg
nti
ass Single,
ca ca co cl MarSt
Married Divorced
Tid Refund Marital Taxable
Status Income Cheat
NO Refund
1 Yes Single 125K No
Yes No
2 No Married 100K No
3 No Single 70K No NO TaxInc
4 Yes Married 120K No < 80K > 80K
5 No Divorced 95K Yes
NO YES
6 No Married 60K No
7 Yes Divorced 220K No
8 No Single 85K Yes
9 No Married 75K No There could be more than one tree that
10 No Single 90K Yes fits the same data!
10

© Vipin Kumar CSci 5980 Spring 2004 6

Practical Issues of Classification

 Underfitting and Overfitting

 Missing Values

 Costs of Classification

© Vipin Kumar CSci 5980 Spring 2004 7

Underfitting and Overfitting
(Example)

500 circular and 500

triangular data points.

Circular points:
0.5  sqrt(x12+x22)  1

Triangular points:
sqrt(x12+x22) > 0.5 or
sqrt(x12+x22) < 1

© Vipin Kumar CSci 5980 Spring 2004 8

Underfitting and Overfitting

Overfitting

Underfitting: when model is too simple, both training and test errors are large

© Vipin Kumar CSci 5980 Spring 2004 9

Overfitting due to Noise

Decision boundary is distorted by noise point

© Vipin Kumar CSci 5980 Spring 2004 10

Overfitting due to Insufficient
Examples

Lack of data points in the lower half of the diagram makes it difficult
to predict correctly the class labels of that region
- Insufficient number of training records in the region causes the
decision tree to predict the test examples using other training
records that are irrelevant to the classification task
© Vipin Kumar CSci 5980 Spring 2004 11
Decision Boundary
1

0.9

0.8
x < 0.43?

0.7
Yes No
0.6

y < 0.33?
y

0.5 y < 0.47?

0.4

0.3
Yes No Yes No

0.2
:4 :0 :0 :4
0.1 :0 :4 :3 :0
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

x
•Border line between two neighboring regions of different classes is
known as decision boundary
•Decision boundary is parallel to axes because test condition involves
a single attribute at-a-time

© Vipin Kumar CSci 5980 Spring 2004 12

Oblique Decision Trees

x+y<1

Class = + Class =

• Test condition may involve multiple attributes

• More expressive representation
• Finding optimal test condition is computationally expensive

© Vipin Kumar CSci 5980 Spring 2004 13

Metrics for Performance
Evaluation

 Focus on the predictive capability of a model

– Rather than how fast it takes to classify or
build models, scalability, etc.
 Confusion Matrix:

PREDICTED CLASS
Class=Yes Class=No
a: TP (true positive)
b: FN (false negative)
Class=Yes a b
ACTUAL c: FP (false positive)

CLASS Class=No c d
d: TN (true negative)

Metrics for Performance
Evaluation…

PREDICTED CLASS
Class=Yes Class=No

Class=Yes a b
ACTUAL (TP) (FN)
CLASS Class=No c d
(FP) (TN)

 Most widely-used metric:

ad TP  TN
Đô chính xác  
a  b  c  d TP  TN  FP  FN

Limitation of Accuracy

 Consider a 2-class problem

– Number of Class 0 examples = 9990
– Number of Class 1 examples = 10

 If model predicts everything to be class 0,

accuracy is 9990/10000 = 99.9 %
– Accuracy is misleading because model does
not detect any class 1 example

Cost Matrix

PREDICTED CLASS

C(i|j) Class=Yes Class=No

Class=Yes C(Yes|Yes) C(No|Yes)

ACTUAL
CLASS Class=No C(Yes|No) C(No|No)

C(i|j): Cost of misclassifying class j example as class i

Computing Cost of Classification

Cost PREDICTED CLASS

Matrix
C(i|j) + -
ACTUAL
+ -1 100
CLASS
- 1 0

Model M1 PREDICTED CLASS Model M2 PREDICTED CLASS

+ - + -
ACTUAL ACTUAL
+ 150 40 + 250 45
CLASS CLASS
- 60 250 - 5 200

Accuracy = 80% Accuracy = 90%

Count PREDICTED CLASS Accuracy is proportional to cost if

1. C(Yes|No)=C(No|Yes) = q
Class=Yes Class=No
2. C(Yes|Yes)=C(No|No) = p
Class=Yes a b
ACTUAL N=a+b+c+d
CLASS Class=No c d

Accuracy = (a + d)/N

Cost PREDICTED CLASS

Cost = p (a + d) + q (b + c)
Class=Yes Class=No
= p (a + d) + q (N – a – d)
Class=Yes p q = q N – (q – p)(a + d)
ACTUAL
CLASS Class=No = N [q – (q-p)  Accuracy]
q p

Cost-Sensitive Measures
a
Precision (p) 
a c
a
Recall (r) 
a b
2rp 2a
F - measure (F)  
r  p 2a  b  c
 Precision is biased towards C(Yes|Yes) & C(Yes|No)
 Recall is biased towards C(Yes|Yes) & C(No|Yes)
 F-measure is biased towards all except C(No|No)
wa w d
Weighted Accuracy  1 4

wa wbwcw d
1 2 3 4

Int3209 - Data Mining: Week 5: Classification Model Improvements
No ratings yet
Int3209 - Data Mining: Week 5: Classification Model Improvements
56 pages
Classification Data Mining
No ratings yet
Classification Data Mining
84 pages
CS-6 Classification Evaluation Metrics
No ratings yet
CS-6 Classification Evaluation Metrics
26 pages
6.data Mining - Classification
No ratings yet
6.data Mining - Classification
37 pages
ClassificationandPrediction Module3
No ratings yet
ClassificationandPrediction Module3
88 pages
Dinamika Sosial, Politik & Hukum, Chaos & Penyalahgunaan Kekuasaan
No ratings yet
Dinamika Sosial, Politik & Hukum, Chaos & Penyalahgunaan Kekuasaan
17 pages
CH 6
No ratings yet
CH 6
24 pages
Rational Choice Theory Larry J. Siegel 8th Edition
No ratings yet
Rational Choice Theory Larry J. Siegel 8th Edition
10 pages
Unit 4 Classification
No ratings yet
Unit 4 Classification
87 pages
Lect 02 Evaluation Part 1
No ratings yet
Lect 02 Evaluation Part 1
33 pages
DMDM Part 2
No ratings yet
DMDM Part 2
94 pages
19-Introduction Classification Algorithm-18-09-2024
No ratings yet
19-Introduction Classification Algorithm-18-09-2024
102 pages
ML 2 PPT Unit 2
No ratings yet
ML 2 PPT Unit 2
214 pages
Lecture 7 - Feature Selection & Model Optimization
No ratings yet
Lecture 7 - Feature Selection & Model Optimization
48 pages
ML Questions
No ratings yet
ML Questions
9 pages
Unit 4 ML
No ratings yet
Unit 4 ML
28 pages
Bakerlok, Now in India
No ratings yet
Bakerlok, Now in India
1 page
IntroClassificationDA 2024
No ratings yet
IntroClassificationDA 2024
129 pages
Present Perfect Continuous: Exercises
No ratings yet
Present Perfect Continuous: Exercises
5 pages
Pranati. Hubli
No ratings yet
Pranati. Hubli
3 pages
Decision Tree and Evalaution
No ratings yet
Decision Tree and Evalaution
50 pages
Lecture 11
No ratings yet
Lecture 11
24 pages
Classification
No ratings yet
Classification
73 pages
MLA Manual
No ratings yet
MLA Manual
25 pages
Machine Learning Note
No ratings yet
Machine Learning Note
40 pages
3-Performance Measures
No ratings yet
3-Performance Measures
35 pages
Saini 2012
No ratings yet
Saini 2012
17 pages
DM Unit-3
No ratings yet
DM Unit-3
23 pages
CH-5 ML
No ratings yet
CH-5 ML
36 pages
EBUS537 Theme4 Week 5
No ratings yet
EBUS537 Theme4 Week 5
26 pages
Module 6
No ratings yet
Module 6
24 pages
Unit 5 Classification PDF
No ratings yet
Unit 5 Classification PDF
131 pages
Developer Manual: Autodesk Productstream Professional 2010
No ratings yet
Developer Manual: Autodesk Productstream Professional 2010
238 pages
CSE4261 Lecture-10
No ratings yet
CSE4261 Lecture-10
50 pages
Unit6 - 7 Issues
No ratings yet
Unit6 - 7 Issues
53 pages
Unit-6: Classification and Prediction
No ratings yet
Unit-6: Classification and Prediction
63 pages
DM - Ch4 - Classification (Part1)
No ratings yet
DM - Ch4 - Classification (Part1)
20 pages
Unit 4 Learning
No ratings yet
Unit 4 Learning
100 pages
3-Classification, Clustering and Prediction
No ratings yet
3-Classification, Clustering and Prediction
142 pages
Unit Ii
No ratings yet
Unit Ii
118 pages
DL IT324a 4
No ratings yet
DL IT324a 4
52 pages
Introduction To Artificial Intelligence: Amna Iftikhar Fall ' 2019 1
No ratings yet
Introduction To Artificial Intelligence: Amna Iftikhar Fall ' 2019 1
33 pages
ML Unit 1
No ratings yet
ML Unit 1
73 pages
KNN Evaluation
No ratings yet
KNN Evaluation
51 pages
Basics of ML and Evaluation
No ratings yet
Basics of ML and Evaluation
42 pages
Unit3 7 Issues
No ratings yet
Unit3 7 Issues
24 pages
Business Statistics Unit-Iv
No ratings yet
Business Statistics Unit-Iv
9 pages
08 Classifier Evaluation
No ratings yet
08 Classifier Evaluation
39 pages
Data Mining: Lecture - 03
No ratings yet
Data Mining: Lecture - 03
56 pages
Netfortris HUD Web - User Guide
No ratings yet
Netfortris HUD Web - User Guide
29 pages
CH 8 Data Mining
No ratings yet
CH 8 Data Mining
30 pages
Answers (Chapter 8)
No ratings yet
Answers (Chapter 8)
8 pages
Unit-4 DM
No ratings yet
Unit-4 DM
19 pages
Week 6 - 7 - Classification
No ratings yet
Week 6 - 7 - Classification
67 pages
2-Training and Testing Models, Evaluation Metrics-01-07-2023
No ratings yet
2-Training and Testing Models, Evaluation Metrics-01-07-2023
23 pages
Classification
No ratings yet
Classification
33 pages
Lecture 8
No ratings yet
Lecture 8
28 pages
Appendix 5: Affirmations For Prosperity and Abundance: Higher Awareness Intuitive Resource List
No ratings yet
Appendix 5: Affirmations For Prosperity and Abundance: Higher Awareness Intuitive Resource List
2 pages
Saraswathi Resume
No ratings yet
Saraswathi Resume
2 pages
CSC4316 9
No ratings yet
CSC4316 9
40 pages
Clase10 11
No ratings yet
Clase10 11
18 pages
Lecture - (3-4) Evaluation Metrices Classification and Regression
No ratings yet
Lecture - (3-4) Evaluation Metrices Classification and Regression
28 pages
177-Article Text-939-1-10-20230723
No ratings yet
177-Article Text-939-1-10-20230723
11 pages
Ai DS 2 Book-Chpt-5
No ratings yet
Ai DS 2 Book-Chpt-5
17 pages
Electronic Mail-A New Style of Communication or Just A New Medium?: An Investigation Into The Text Features of E-Mail
No ratings yet
Electronic Mail-A New Style of Communication or Just A New Medium?: An Investigation Into The Text Features of E-Mail
21 pages
Module 1 Public Relation
100% (3)
Module 1 Public Relation
26 pages
ML-Lec-06-Supervised Learning-Decision Trees
No ratings yet
ML-Lec-06-Supervised Learning-Decision Trees
45 pages
Classification: Basic Concepts, Decision Trees, and Model Evaluation
No ratings yet
Classification: Basic Concepts, Decision Trees, and Model Evaluation
46 pages
Exclusive TED Course Handout PDF
No ratings yet
Exclusive TED Course Handout PDF
63 pages
DSA Lab Manual Final
No ratings yet
DSA Lab Manual Final
44 pages
Project 7nov - Odp
No ratings yet
Project 7nov - Odp
16 pages
"Classifiers": R & D Project by Under The Guidance of
No ratings yet
"Classifiers": R & D Project by Under The Guidance of
59 pages
Session01 DataScience
No ratings yet
Session01 DataScience
79 pages
Checklist For Elections
No ratings yet
Checklist For Elections
4 pages
Classification Problems
No ratings yet
Classification Problems
53 pages
Classification With Decision Trees I: Instructor: Qiang Yang
No ratings yet
Classification With Decision Trees I: Instructor: Qiang Yang
29 pages
IE 527 Intelligent Engineering Systems: Basic Concepts Model/performance Evaluation Overfitting
No ratings yet
IE 527 Intelligent Engineering Systems: Basic Concepts Model/performance Evaluation Overfitting
18 pages
Mosaic-2 A Reading Skills Book
No ratings yet
Mosaic-2 A Reading Skills Book
330 pages
0580 s11 QP 41
No ratings yet
0580 s11 QP 41
16 pages
c2000 Reference Guide
No ratings yet
c2000 Reference Guide
37 pages
20150908-Lecture-3-Draft Asd Def HFL DFGF Lkreglker Lerg Kelr GK
No ratings yet
20150908-Lecture-3-Draft Asd Def HFL DFGF Lkreglker Lerg Kelr GK
15 pages
Shirley Mae P. Sanding: 130 Sampaguita St. Flores Village Bangkal, Davao City
No ratings yet
Shirley Mae P. Sanding: 130 Sampaguita St. Flores Village Bangkal, Davao City
3 pages
A Study To Assess The Patient's Satisfaction On Nursing Care in Emergency Department
No ratings yet
A Study To Assess The Patient's Satisfaction On Nursing Care in Emergency Department
3 pages
Five Qgis Network Analysis Toolboxes For Routing and Isochrones - Free and Open Source Gis Ramblings
No ratings yet
Five Qgis Network Analysis Toolboxes For Routing and Isochrones - Free and Open Source Gis Ramblings
4 pages
DigitalImageFundamentalas GM
No ratings yet
DigitalImageFundamentalas GM
50 pages
Research Journal 3
No ratings yet
Research Journal 3
6 pages
Simatic PDM
No ratings yet
Simatic PDM
16 pages
Cockpit 9000
No ratings yet
Cockpit 9000
4 pages

SupervisedLearning Classification

Uploaded by

SupervisedLearning Classification

Uploaded by

Classification: Definition

 Given a collection of records (training set )

© Vipin Kumar CSci 5980 Spring 2004 1

Tid Attrib1 Attrib2 Attrib3 Class Learning

7 Yes Large 220K No Learn

12 Yes Medium 80K ?

13 Yes Large 110K ? Deduction

© Vipin Kumar CSci 5980 Spring 2004 2

 Predicting tumor cells as benign or malignant

 Classifying credit card transactions

 Classifying secondary structures of protein

 Categorizing news stories as finance,

 Decision Tree based Methods

© Vipin Kumar CSci 5980 Spring 2004 4

1 Yes Single 125K No

Training Data Model: Decision Tree

© Vipin Kumar CSci 5980 Spring 2004 5

© Vipin Kumar CSci 5980 Spring 2004 6

 Underfitting and Overfitting

© Vipin Kumar CSci 5980 Spring 2004 7

500 circular and 500

© Vipin Kumar CSci 5980 Spring 2004 8

© Vipin Kumar CSci 5980 Spring 2004 9

Decision boundary is distorted by noise point

© Vipin Kumar CSci 5980 Spring 2004 10

0.5 y < 0.47?

© Vipin Kumar CSci 5980 Spring 2004 12

• Test condition may involve multiple attributes

© Vipin Kumar CSci 5980 Spring 2004 13

 Focus on the predictive capability of a model

© Vipin Kumar CSci 5980 Spring 2004 14

 Most widely-used metric:

© Vipin Kumar CSci 5980 Spring 2004 15

 Consider a 2-class problem

 If model predicts everything to be class 0,

© Vipin Kumar CSci 5980 Spring 2004 16

C(i|j) Class=Yes Class=No

Class=Yes C(Yes|Yes) C(No|Yes)

C(i|j): Cost of misclassifying class j example as class i

© Vipin Kumar CSci 5980 Spring 2004 17

Cost PREDICTED CLASS

Model M1 PREDICTED CLASS Model M2 PREDICTED CLASS

Accuracy = 80% Accuracy = 90%

Count PREDICTED CLASS Accuracy is proportional to cost if

Cost PREDICTED CLASS

© Vipin Kumar CSci 5980 Spring 2004 19

© Vipin Kumar CSci 5980 Spring 2004 20

You might also like