0% found this document useful (0 votes)

66 views18 pages

Naïve Bayes Classifier: Ke Chen

This document provides an overview of Naive Bayes classifiers. It begins with background on probabilistic classification models. It then explains the probability basics and assumptions of Naive Bayes, which models each attribute as conditionally independent given the class. The document presents the algorithm and provides an example predicting whether to play tennis. It discusses issues like violating independence and handling continuous values. It concludes that Naive Bayes training and testing are efficient while often achieving competitive performance.

Uploaded by

Sgsksbskxvxk

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

66 views18 pages

Naïve Bayes Classifier: Ke Chen

Uploaded by

Sgsksbskxvxk

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

You are on page 1/ 18

Naïve Bayes Classifier

Ke Chen

http://intranet.cs.man.ac.uk/mlo/comp20411/

Extended by Longin Jan Latecki

[email protected]

COMP20411 Machine Learning

Outline

• Background
• Probability Basics
• Probabilistic Classification
• Naïve Bayes
• Example: Play Tennis
• Relevant Issues
• Conclusions

COMP20411 Machine Learning 2

Background
• There are three methods to establish a classifier
a) Model a classification rule directly
Examples: k-NN, decision trees, perceptron, SVM
b) Model the probability of class memberships given input data
Example: multi-layered perceptron with the cross-entropy cost
c) Make a probabilistic model of data within each class
Examples: naive Bayes, model based classifiers
• a) and b) are examples of discriminative classification
• c) is an example of generative classification
• b) and c) are both examples of probabilistic classification

COMP20411 Machine Learning 3

Probability Basics
• Prior, conditional and joint probability
– Prior probability: P(X )
– Conditional probability: P( X1 |X2 ), P(X2 | X1 )
– Joint probability: X  ( X1 , X2 ), P( X )  P(X1 ,X2 )
– Relationship: P(X1 ,X2 )  P( X2 | X1 )P( X1 )  P( X1 | X2 )P( X2 )
– Independence: P( X2 | X1 )  P( X2 ), P( X1 | X2 )  P( X1 ), P(X1 ,X2 )  P( X1 )P( X2 )
• Bayesian Rule

P( X |C )P(C ) Likelihood  Prior

P(C |X )  Posterior 
P( X ) Evidence

COMP20411 Machine Learning 4

Example by Dieter Fox
Probabilistic Classification
• Establishing a probabilistic model for classification
– Discriminative model
P(C |X ) C  c1 ,  , c L , X  (X1 ,  , Xn )
– Generative model
P( X |C ) C  c1 ,  , c L , X  (X1 ,  , Xn )

• MAP classification rule

– MAP: Maximum A Posterior
– Assign x to c* if P(C  c *
| X  x )  P(C  c | X  x ) c  c *
, c  c1 ,  , c L

• Generative classification with the MAP rule

P( X |C )P(C )
– Apply Bayesian rule to convert: P(C |X )   P( X |C )P(C )
P( X )
COMP20411 Machine Learning 8
Feature Histograms

P(x)
C1
C2

Slide by Stephen Marsland

x
Posterior Probability
P(C|x)

0
Slide by Stephen Marsland
x
Naïve Bayes
• Bayes classification
P(C |X )  P( X |C )P(C )  P( X1 ,  , Xn |C )P(C )

Difficulty: learning the joint probability P( X1 ,  , Xn |C )

• Naïve Bayes classification
– Making the assumption that all input attributes are independent
P( X1 , X2 ,  , Xn |C )  P( X1 | X2 ,  , Xn ; C )P( X2 ,  , Xn |C )
 P( X1 |C )P( X2 ,  , Xn |C )
 P( X1 |C )P( X2 |C )    P( Xn |C )

– MAP classification rule

[ P( x1 |c * )    P( xn |c * )]P(c * )  [ P( x1 |c)    P( xn |c)]P(c), c  c * , c  c1 ,  , c L

COMP20411 Machine Learning 11

Naïve Bayes
• Naïve Bayes Algorithm (for discrete input attributes)
– Learning Phase: Given a training set S,
For each target value of ci (ci  c1 ,  , c L )
Pˆ (C  ci )  estimate P(C  ci ) with examples in S;
For every attribute value a jk of each attribute x j ( j  1,  , n; k  1,  , N j )
Pˆ ( X j  a jk |C  ci )  estimate P( X j  a jk |C  ci ) with examples in S;

Output: conditional probability tables; for x j , N j  L elements

– Test Phase: Given an unknown instance X  ( a1 ,  , an ),
Look up tables to assign the label c* to X’ if
[ Pˆ ( a1 |c * )    Pˆ ( an |c * )]Pˆ ( c * )  [ Pˆ ( a1 |c)    Pˆ ( an |c )]Pˆ (c), c  c * , c  c1 ,  , c L

COMP20411 Machine Learning 12

Example
• Example: Play Tennis

COMP20411 Machine Learning 13

Example
• Learning Phase
Outlook Play=Yes Play=No Temperature Play=Yes Play=No
Sunny 2/9 3/5 Hot 2/9 2/5
Overcast 4/9 0/5 Mild 4/9 2/5
Rain 3/9 2/5 Cool 3/9 1/5

Humidity Play=Yes Play=No Wind Play=Yes Play=No

High 3/9 4/5 Strong 3/9 3/5
Normal 6/9 1/5 Weak 6/9 2/5

P(Play=Yes) = 9/14 P(Play=No) = 5/14

COMP20411 Machine Learning 14

Example
• Test Phase
– Given a new instance,
x’=(Outlook=Sunny, Temperature=Cool, Humidity=High, Wind=Strong)
– Look up tables
P(Outlook=Sunny|Play=Yes) = 2/9 P(Outlook=Sunny|Play=No) = 3/5
P(Temperature=Cool|Play=Yes) = 3/9 P(Temperature=Cool|Play==No) = 1/5
P(Huminity=High|Play=Yes) = 3/9 P(Huminity=High|Play=No) = 4/5
P(Wind=Strong|Play=Yes) = 3/9 P(Wind=Strong|Play=No) = 3/5
P(Play=Yes) = 9/14 P(Play=No) = 5/14

Given the fact P(Yes|x’) < P(No|x’), we label x’ to be “No”.

COMP20411 Machine Learning 15

Relevant Issues
• Violation of Independence Assumption
– For many real world tasks, P( X1 ,  , Xn |C )  P( X1 |C )    P( Xn |C )
– Nevertheless, naïve Bayes works surprisingly well anyway!
• Zero conditional probability Problem
– If no example contains the attribute value X j  a jk , Pˆ ( X j  a jk |C  ci )  0
– In this circumstance, Pˆ ( x |c )    Pˆ ( a |c )    Pˆ ( x |c )  0 during test
1 i jk i n i

– For a remedy, conditional probabilities estimated with

n  mp
Pˆ ( X j  a jk |C  ci )  c
nm
nc : number of training examples for which X j  a jk and C  ci
n : number of training examples for which C  ci
p : prior estimate (usually, p  1 / t for t possible values of X j )
m : weight to prior (number of " virtual" examples, m  1)
COMP20411 Machine Learning 16
Relevant Issues
• Continuous-valued Input Attributes
– Numberless values for an attribute
– Conditional probability modeled with the normal distribution
1  ( X j   ji )2 
Pˆ ( X j |C  ci )  exp  
2  ji  2 ji 
2

 ji : mean (avearage) of attribute values X j of examples for which C  ci
 ji : standard deviation of attribute values X j of examples for which C  ci

– Learning Phase: for X  ( X1 ,  , Xn ), C  c1 ,  , c L

Output: n  L normal distributions and P(C  ci ) i  1,  , L
– Test Phase: for X  ( X1 ,  , Xn )
• Calculate conditional probabilities with all the normal distributions
• Apply the MAP rule to make a decision
COMP20411 Machine Learning 17
Conclusions
• Naïve Bayes based on the independence assumption
– Training is very easy and fast; just requiring considering each
attribute in each class separately
– Test is straightforward; just looking up tables or calculating
conditional probabilities with normal distributions
• A popular generative model
– Performance competitive to most of state-of-the-art classifiers
even in presence of violating independence assumption
– Many successful applications, e.g., spam mail filtering
– Apart from classification, naïve Bayes can do more…

COMP20411 Machine Learning 18

2022 Naive Bayes and Probability
No ratings yet
2022 Naive Bayes and Probability
30 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
18 pages
Naive Bayes
No ratings yet
Naive Bayes
18 pages
Naive Bayes Classifier PDF
No ratings yet
Naive Bayes Classifier PDF
17 pages
Naïve Bayes Classifier
No ratings yet
Naïve Bayes Classifier
17 pages
Naïve Bayes Classifier: Dr. Hussain Dawood
No ratings yet
Naïve Bayes Classifier: Dr. Hussain Dawood
20 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
20 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
20 pages
6 Naive-Bayes
No ratings yet
6 Naive-Bayes
18 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
19 pages
Naïve Bayes Classifier: Adopted From Slides by Ke Chen From University of Manchester and Yangqiu Song From Msra
No ratings yet
Naïve Bayes Classifier: Adopted From Slides by Ke Chen From University of Manchester and Yangqiu Song From Msra
25 pages
Naive Bayes Classifier
No ratings yet
Naive Bayes Classifier
24 pages
Data Mining - Module 7
No ratings yet
Data Mining - Module 7
8 pages
Naive Bayes
No ratings yet
Naive Bayes
25 pages
Naive Bayes Classifier
No ratings yet
Naive Bayes Classifier
10 pages
Probabilistic Class I Fiers
No ratings yet
Probabilistic Class I Fiers
5 pages
Lecture 7
No ratings yet
Lecture 7
15 pages
Lecture 5-Naïve Bayes
No ratings yet
Lecture 5-Naïve Bayes
26 pages
Lecture13 Nbayes
No ratings yet
Lecture13 Nbayes
56 pages
Data Classification and Prediction : Lecture-11
No ratings yet
Data Classification and Prediction : Lecture-11
36 pages
Lecture - 4.1 - Bayes Classifier
No ratings yet
Lecture - 4.1 - Bayes Classifier
31 pages
8 ML
No ratings yet
8 ML
22 pages
Bayesian Learning: Berrin Yanikoglu
No ratings yet
Bayesian Learning: Berrin Yanikoglu
64 pages
UNIT4 - Part2 Aiml
No ratings yet
UNIT4 - Part2 Aiml
46 pages
ML 05 Bayesian Classifier
No ratings yet
ML 05 Bayesian Classifier
19 pages
Naïve Bayes Classifier: April 25, 2006
No ratings yet
Naïve Bayes Classifier: April 25, 2006
19 pages
23-Naive Bayes
No ratings yet
23-Naive Bayes
22 pages
Naive Bayes
No ratings yet
Naive Bayes
29 pages
Week 4 - Classification Alternative Techniques
No ratings yet
Week 4 - Classification Alternative Techniques
87 pages
Chapter 4
No ratings yet
Chapter 4
22 pages
Naive Bayes
No ratings yet
Naive Bayes
31 pages
ML Lecture#5
No ratings yet
ML Lecture#5
65 pages
L3 (Week3) Bayesian Classifier
No ratings yet
L3 (Week3) Bayesian Classifier
21 pages
AI Lec 04+05 - Naive Bayes
No ratings yet
AI Lec 04+05 - Naive Bayes
55 pages
Lecture Slide 03 - Bayesian Classifier - Summer 2023
No ratings yet
Lecture Slide 03 - Bayesian Classifier - Summer 2023
23 pages
Lect 7 DM
No ratings yet
Lect 7 DM
65 pages
Ba Yes Naive
No ratings yet
Ba Yes Naive
15 pages
Lecture 3
No ratings yet
Lecture 3
6 pages
Lect9 NB
No ratings yet
Lect9 NB
46 pages
Classification - Naive Bayes
No ratings yet
Classification - Naive Bayes
17 pages
Lecture 4 Classification P1
No ratings yet
Lecture 4 Classification P1
50 pages
2024 - Slide2 - BayesML Sub
No ratings yet
2024 - Slide2 - BayesML Sub
40 pages
29-Naive Bayes-03-10-2024
No ratings yet
29-Naive Bayes-03-10-2024
48 pages
4 22865 IS465 2019 1 2 1 08ClassBasic
No ratings yet
4 22865 IS465 2019 1 2 1 08ClassBasic
43 pages
Bayes Algorithm
No ratings yet
Bayes Algorithm
26 pages
Bayesian Learning: Based On "Machine Learning", T. Mitchell, Mcgraw Hill, 1997, Ch. 6
No ratings yet
Bayesian Learning: Based On "Machine Learning", T. Mitchell, Mcgraw Hill, 1997, Ch. 6
54 pages
Naive Bayes
No ratings yet
Naive Bayes
9 pages
Irs Unit 4 CH 1
No ratings yet
Irs Unit 4 CH 1
58 pages
Bayes Classification Methods
No ratings yet
Bayes Classification Methods
22 pages
Nayes Bayes Classifier
No ratings yet
Nayes Bayes Classifier
46 pages
ML Unit 2
No ratings yet
ML Unit 2
107 pages
Unit 3 Bayesian Learning
No ratings yet
Unit 3 Bayesian Learning
49 pages
05 Classification II 2024
No ratings yet
05 Classification II 2024
54 pages
Naïve Bayes Classifier Algorithm
No ratings yet
Naïve Bayes Classifier Algorithm
14 pages
L4 Naive Bayes
No ratings yet
L4 Naive Bayes
31 pages
Naive by
No ratings yet
Naive by
23 pages
Bayesian Learning
No ratings yet
Bayesian Learning
58 pages
Pattern Recognition - Lec02
No ratings yet
Pattern Recognition - Lec02
44 pages
A-level Maths Revision: Cheeky Revision Shortcuts
From Everand
A-level Maths Revision: Cheeky Revision Shortcuts
Scool Revision
3.5/5 (8)
10+2 Level Mathematics For All Exams GMAT, GRE, CAT, SAT, ACT, IIT JEE, WBJEE, ISI, CMI, RMO, INMO, KVPY Etc.
From Everand
10+2 Level Mathematics For All Exams GMAT, GRE, CAT, SAT, ACT, IIT JEE, WBJEE, ISI, CMI, RMO, INMO, KVPY Etc.
Shubhankar Paul
No ratings yet
Se Bits Unit Bit 5
No ratings yet
Se Bits Unit Bit 5
5 pages
Foxboro CFT50 Digital Coriolis Mass Flowmeter: Custody Transfer For The Dairy Industry
No ratings yet
Foxboro CFT50 Digital Coriolis Mass Flowmeter: Custody Transfer For The Dairy Industry
4 pages
annotated-BUREAU OF CORRECTIONS
No ratings yet
annotated-BUREAU OF CORRECTIONS
6 pages
Woot23 Paper22
No ratings yet
Woot23 Paper22
15 pages
Indian Institute of Management, Sirmaur Postgraduate Programme in Management 2020-22 Term II
No ratings yet
Indian Institute of Management, Sirmaur Postgraduate Programme in Management 2020-22 Term II
5 pages
Fauske-Presentation by Knoechel Wood
No ratings yet
Fauske-Presentation by Knoechel Wood
26 pages
White Label Atm
No ratings yet
White Label Atm
5 pages
CASM Aircrafthistories CanadairCL 30SilverStar
100% (1)
CASM Aircrafthistories CanadairCL 30SilverStar
38 pages
IGC 2 Nebosh Summaries
No ratings yet
IGC 2 Nebosh Summaries
39 pages
Hyatt's Interpretation of Pulmonary Function Tests 5th Edition (FULL VERSION DOWNLOAD)
100% (10)
Hyatt's Interpretation of Pulmonary Function Tests 5th Edition (FULL VERSION DOWNLOAD)
15 pages
Why Use MPC Based Contact For - Bonded - Connections
No ratings yet
Why Use MPC Based Contact For - Bonded - Connections
5 pages
English Language Teacher Motivation and Turnover - Ross Thorburn PDF
No ratings yet
English Language Teacher Motivation and Turnover - Ross Thorburn PDF
3 pages
GOP Moves To Extend Ballot Verification
No ratings yet
GOP Moves To Extend Ballot Verification
6 pages
Environmental Analysis of Big Bazaar For The Year 2010
No ratings yet
Environmental Analysis of Big Bazaar For The Year 2010
14 pages
The Village Noongan District Langowan West)
No ratings yet
The Village Noongan District Langowan West)
8 pages
Agenda & Report 2024-2
No ratings yet
Agenda & Report 2024-2
67 pages
Sample C Memorandum and Articles of Asso
No ratings yet
Sample C Memorandum and Articles of Asso
19 pages
21EC43 2024 July
No ratings yet
21EC43 2024 July
3 pages
Report Socio of Family
No ratings yet
Report Socio of Family
2 pages
Arduino Mario Bros Tunes
No ratings yet
Arduino Mario Bros Tunes
11 pages
A Synopsis Report ON Credit Risk Management AT Icici Bank LTD
No ratings yet
A Synopsis Report ON Credit Risk Management AT Icici Bank LTD
19 pages
Hardness Test
100% (1)
Hardness Test
8 pages
Breeds of Poultry Species
100% (1)
Breeds of Poultry Species
5 pages
Alfredo Medina - Resume - June 09
No ratings yet
Alfredo Medina - Resume - June 09
3 pages
Dicionário de Gastronomia
No ratings yet
Dicionário de Gastronomia
3 pages
Conference Interpreting
No ratings yet
Conference Interpreting
28 pages
Weather Modification Alberta Canada 1980 1985 Study
No ratings yet
Weather Modification Alberta Canada 1980 1985 Study
28 pages
BIOBASE Balance MB-2000 User Manual 202309
No ratings yet
BIOBASE Balance MB-2000 User Manual 202309
1 page
Questions
No ratings yet
Questions
4 pages
1.1 Introduction To Accounting: Transcribed by - To Remove This Message
No ratings yet
1.1 Introduction To Accounting: Transcribed by - To Remove This Message
4 pages

Naïve Bayes Classifier: Ke Chen

Uploaded by

Naïve Bayes Classifier: Ke Chen

Uploaded by

Naïve Bayes Classifier

Extended by Longin Jan Latecki

COMP20411 Machine Learning

COMP20411 Machine Learning 2

COMP20411 Machine Learning 3

P( X |C )P(C ) Likelihood  Prior

COMP20411 Machine Learning 4

• MAP classification rule

• Generative classification with the MAP rule

Slide by Stephen Marsland

Difficulty: learning the joint probability P( X1 ,  , Xn |C )

– MAP classification rule

COMP20411 Machine Learning 11

Output: conditional probability tables; for x j , N j  L elements

COMP20411 Machine Learning 12

COMP20411 Machine Learning 13

Humidity Play=Yes Play=No Wind Play=Yes Play=No

P(Play=Yes) = 9/14 P(Play=No) = 5/14

COMP20411 Machine Learning 14

Given the fact P(Yes|x’) < P(No|x’), we label x’ to be “No”.

COMP20411 Machine Learning 15

– For a remedy, conditional probabilities estimated with

– Learning Phase: for X  ( X1 ,  , Xn ), C  c1 ,  , c L

COMP20411 Machine Learning 18

You might also like