0% found this document useful (0 votes)

15 views18 pages

Naive Bayes

This document provides an overview of Naive Bayes classifiers. It discusses how Naive Bayes makes the assumption that attributes are conditionally independent given the class. This allows it to estimate probabilities using simple multiplication. The document outlines the learning and classification process for Naive Bayes and discusses relevant issues like handling continuous values and dealing with zero probabilities. It concludes that Naive Bayes is a popular generative model that performs competitively despite its independence assumption.

Uploaded by

nada Ltfia

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views18 pages

Naive Bayes

Uploaded by

nada Ltfia

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 18

Naïve Bayes Classifier

Ke Chen

http://intranet.cs.man.ac.uk/mlo/comp20411/

Extended by Longin Jan Latecki

[email protected]

COMP20411 Machine Learning

Outline
• Background
• Probability Basics
• Probabilistic Classification
• Naïve Bayes
• Example: Play Tennis
• Relevant Issues
• Conclusions

COMP20411 Machine Learning 2

Background
• There are three methods to establish a classifier
a) Model a classification rule directly
Examples: k-NN, decision trees, perceptron, SVM
b) Model the probability of class memberships given input data
Example: multi-layered perceptron with the cross-entropy cost
c) Make a probabilistic model of data within each class
Examples: naive Bayes, model based classifiers
• a) and b) are examples of discriminative classification
• c) is an example of generative classification
• b) and c) are both examples of probabilistic classification

COMP20411 Machine Learning 3

Probability Basics
• Prior, conditional and joint probability
– Prior probability: P(X)
– Conditional probability: P(X1 |X2 ), P(X2 |X1 )
– Joint probability: X = (X1 , X2 ), P(X) = P(X1 ,X2 )
– Relationship: P(X1 ,X2 ) = P(X2 |X1 )P(X1 ) = P(X1 |X2 )P(X2 )
– Independence: P(X2 |X1 ) = P(X2 ), P(X1 |X2 ) = P(X1 ), P(X1 ,X2 ) = P(X1 )P(X2 )
• Bayesian Rule

P( X|C)P(C) Likelihood Prior

P(C |X) = Posterior =
P( X) Evidence

COMP20411 Machine Learning 4

Example by Dieter Fox
Probabilistic Classification
• Establishing a probabilistic model for classification
– Discriminative model
P(C|X) C = c1 ,  , cL , X = (X1 ,  , Xn )
– Generative model
P(X|C) C = c1 ,  , cL , X = (X1 ,  , Xn )

• MAP classification rule

– MAP: Maximum A Posterior
– Assign x to c* if P(C = c* |X = x)  P(C = c|X = x) c  c* , c = c1 ,  , cL
• Generative classification with the MAP rule
– Apply Bayesian rule to convert: P(C |X) = P(X|C)P(C)  P(X|C)P(C)
P(X)
COMP20411 Machine Learning 8
Feature Histograms

P(x)
C1
C2

Slide by Stephen Marsland

x
Posterior Probability
P(C|x)

COMP20411 Machine Learning 11

Naïve Bayes
• Naïve Bayes Algorithm (for discrete input attributes)
– Learning Phase: Given a training set S,
For eac h target value of ci (ci = c1 ,  , c L )
Pˆ (C = ci )  estimate P(C = ci ) with examples in S;
For everyattribute value a jk of eac h attribute x j ( j = 1,  , n; k = 1,  , N j )
Pˆ ( X j = a jk |C = ci )  estimate P( X j = a jk |C = ci ) with examples in S;

Output: conditional probability tables; for x j , N j  L elements

– Test Phase: Given an unknown instance X = (a1 ,  , an ),
Look up tables to assign the label c* to X’ if
[ Pˆ ( a1 |c* )    Pˆ ( an |c * )]Pˆ (c* )  [ Pˆ ( a1 |c)    Pˆ ( an |c)]Pˆ (c), c  c * , c = c1 ,  , c L

COMP20411 Machine Learning 12

Example
• Example: Play Tennis

COMP20411 Machine Learning 13

Example
• Learning Phase
Outlook Play=Yes Play=No Temperature Play=Yes Play=No
Sunny 2/9 3/5 Hot 2/9 2/5
Overcast 4/9 0/5 Mild 4/9 2/5
Rain 3/9 2/5 Cool 3/9 1/5

Humidity Play=Yes Play=No Wind Play=Yes Play=No

High 3/9 4/5 Strong 3/9 3/5
Normal 6/9 1/5 Weak 6/9 2/5

P(Play=Yes) = 9/14 P(Play=No) = 5/14

COMP20411 Machine Learning 14

Example
• Test Phase
– Given a new instance,
x’=(Outlook=Sunny, Temperature=Cool, Humidity=High, Wind=Strong)
– Look up tables
P(Outlook=Sunny|Play=Yes) = 2/9 P(Outlook=Sunny|Play=No) = 3/5
P(Temperature=Cool|Play=Yes) = 3/9 P(Temperature=Cool|Play==No) = 1/5
P(Huminity=High|Play=Yes) = 3/9 P(Huminity=High|Play=No) = 4/5
P(Wind=Strong|Play=Yes) = 3/9 P(Wind=Strong|Play=No) = 3/5
P(Play=Yes) = 9/14 P(Play=No) = 5/14

Given the fact P(Yes|x’) < P(No|x’), we label x’ to be “No”.

COMP20411 Machine Learning 15

Relevant Issues
• Violation of Independence Assumption
– For many real world tasks, P(X1 ,  , Xn |C)  P(X1 |C)    P(Xn |C)
– Nevertheless, naïve Bayes works surprisingly well anyway!
• Zero conditional probability Problem
– If no example contains the attribute value Xj = ajk , Pˆ (Xj = ajk |C = ci ) = 0
– In this circumstance, Pˆ (x1 |ci )    Pˆ (ajk |ci )    Pˆ (xn |ci ) = 0 during test
– For a remedy, conditional probabilities estimated with
n + mp
Pˆ ( X j = a jk |C = ci ) = c
n+m
nc : number o f training examples fo r whic h X j = a jk and C = ci
n : number o f training examples fo r whic h C = ci
p : prio r estimate (usually, p = 1 / t fo r t po ssible values o f X j )
m : weig ht to prio r (number o f " virtual" examples, m  1)
COMP20411 Machine Learning 16
Relevant Issues
• Continuous-valued Input Attributes
– Numberless values for an attribute
– Conditional probability modeled with the normal distribution
1  ( X j −  ji )2 
Pˆ ( X j |C = ci ) = exp − 
2  ji  2 ji 
2

 ji : mean (avearage)o f attribute values X j o f examples fo r whic h C = ci
 ji : standard deviatio n o f attribute values X j o f examples fo r whic h C = ci

– Learning Phase: for X = (X1 ,  , Xn ), C = c1 ,  , cL

Output: n L normal distributions and P(C = ci ) i = 1,  , L
– Test Phase: for X = (X1 ,  , Xn )
• Calculate conditional probabilities with all the normal distributions
• Apply the MAP rule to make a decision

COMP20411 Machine Learning 17

Conclusions
• Naïve Bayes based on the independence assumption
– Training is very easy and fast; just requiring considering each
attribute in each class separately
– Test is straightforward; just looking up tables or calculating
conditional probabilities with normal distributions
• A popular generative model
– Performance competitive to most of state-of-the-art classifiers
even in presence of violating independence assumption
– Many successful applications, e.g., spam mail filtering
– Apart from classification, naïve Bayes can do more…

COMP20411 Machine Learning 18

Bayesian Learning
No ratings yet
Bayesian Learning
58 pages
6 Naive-Bayes
No ratings yet
6 Naive-Bayes
18 pages
UNIT4 - Part2 Aiml
No ratings yet
UNIT4 - Part2 Aiml
46 pages
Unit 3 Bayesian Learning
No ratings yet
Unit 3 Bayesian Learning
49 pages
Naive Bayes
No ratings yet
Naive Bayes
25 pages
ML Unit 2
No ratings yet
ML Unit 2
107 pages
Week 4 - Classification Alternative Techniques
No ratings yet
Week 4 - Classification Alternative Techniques
87 pages
23-Naive Bayes
No ratings yet
23-Naive Bayes
22 pages
Lecture 5-Naïve Bayes
No ratings yet
Lecture 5-Naïve Bayes
26 pages
Lecture13 Nbayes
No ratings yet
Lecture13 Nbayes
56 pages
Lec04 Classifiers NBC
No ratings yet
Lec04 Classifiers NBC
24 pages
Classification - Naive Bayes
No ratings yet
Classification - Naive Bayes
17 pages
Naive Bayes
No ratings yet
Naive Bayes
31 pages
Naive Bayes Classifier
No ratings yet
Naive Bayes Classifier
24 pages
05 Classification II 2024
No ratings yet
05 Classification II 2024
54 pages
Naïve Bayes Classifier: Adopted From Slides by Ke Chen From University of Manchester and Yangqiu Song From Msra
No ratings yet
Naïve Bayes Classifier: Adopted From Slides by Ke Chen From University of Manchester and Yangqiu Song From Msra
25 pages
8 ML
No ratings yet
8 ML
22 pages
Lecture 4 Classification P1
No ratings yet
Lecture 4 Classification P1
50 pages
Chapter 4
No ratings yet
Chapter 4
22 pages
Naïve Bayes Classifier: Dr. Hussain Dawood
No ratings yet
Naïve Bayes Classifier: Dr. Hussain Dawood
20 pages
2024 - Slide2 - BayesML Sub
No ratings yet
2024 - Slide2 - BayesML Sub
40 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
20 pages
Lecture 7
No ratings yet
Lecture 7
15 pages
Lect 7 DM
No ratings yet
Lect 7 DM
65 pages
ML Lecture#5
No ratings yet
ML Lecture#5
65 pages
Irs Unit 4 CH 1
No ratings yet
Irs Unit 4 CH 1
58 pages
Ba Yes Naive
No ratings yet
Ba Yes Naive
15 pages
Naïve Bayes Classifier Algorithm
No ratings yet
Naïve Bayes Classifier Algorithm
14 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
19 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
18 pages
Nayes Bayes Classifier
No ratings yet
Nayes Bayes Classifier
46 pages
Lecture 3
No ratings yet
Lecture 3
6 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
20 pages
Naive Bayes Classifier
No ratings yet
Naive Bayes Classifier
10 pages
Naive Bayes
No ratings yet
Naive Bayes
9 pages
L3 (Week3) Bayesian Classifier
No ratings yet
L3 (Week3) Bayesian Classifier
21 pages
4 22865 IS465 2019 1 2 1 08ClassBasic
No ratings yet
4 22865 IS465 2019 1 2 1 08ClassBasic
43 pages
Bayes Algorithm
No ratings yet
Bayes Algorithm
26 pages
Lecture - 4.1 - Bayes Classifier
No ratings yet
Lecture - 4.1 - Bayes Classifier
31 pages
ML 05 Bayesian Classifier
No ratings yet
ML 05 Bayesian Classifier
19 pages
Introduction To Machine Learning
No ratings yet
Introduction To Machine Learning
1 page
Statistical Inference INF312 - Is - Lecture 03 - Part 3
No ratings yet
Statistical Inference INF312 - Is - Lecture 03 - Part 3
18 pages
Data Mining - Module 7
No ratings yet
Data Mining - Module 7
8 pages
DM See M4
No ratings yet
DM See M4
8 pages
L10-Naive Bayes Continuous
No ratings yet
L10-Naive Bayes Continuous
16 pages
Data Classification and Prediction : Lecture-11
No ratings yet
Data Classification and Prediction : Lecture-11
36 pages
Naive Bayes
No ratings yet
Naive Bayes
29 pages
Probabilistic Class I Fiers
No ratings yet
Probabilistic Class I Fiers
5 pages
Bayesian Learning: Based On "Machine Learning", T. Mitchell, Mcgraw Hill, 1997, Ch. 6
No ratings yet
Bayesian Learning: Based On "Machine Learning", T. Mitchell, Mcgraw Hill, 1997, Ch. 6
54 pages
AI Lec 04+05 - Naive Bayes
No ratings yet
AI Lec 04+05 - Naive Bayes
55 pages
Lecture Slide 03 - Bayesian Classifier - Summer 2023
No ratings yet
Lecture Slide 03 - Bayesian Classifier - Summer 2023
23 pages
Bayesian Learning: Berrin Yanikoglu
No ratings yet
Bayesian Learning: Berrin Yanikoglu
64 pages
Naïve Bayes Classifier: April 25, 2006
No ratings yet
Naïve Bayes Classifier: April 25, 2006
19 pages
Netflix Movies and TV Shows Clustering
No ratings yet
Netflix Movies and TV Shows Clustering
29 pages
CH 07 Specification and Data Issues TQT
No ratings yet
CH 07 Specification and Data Issues TQT
45 pages
Test For Normality PDF
No ratings yet
Test For Normality PDF
30 pages
Naive Bayes Classification
No ratings yet
Naive Bayes Classification
47 pages
Evans Analytics2e PPT 04
No ratings yet
Evans Analytics2e PPT 04
63 pages
Bayesian Learning
No ratings yet
Bayesian Learning
49 pages
Lecture 5 Bayesian Classification
No ratings yet
Lecture 5 Bayesian Classification
16 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
18 pages
Naïve Bayes Classifier
No ratings yet
Naïve Bayes Classifier
17 pages
Best Document For Smart PLS
No ratings yet
Best Document For Smart PLS
8 pages
Naive Bayes Classifier PDF
No ratings yet
Naive Bayes Classifier PDF
17 pages
MODULE 9 - Practical Research 1 (STEM) : Most Frequently Used Data Collection Techniques
No ratings yet
MODULE 9 - Practical Research 1 (STEM) : Most Frequently Used Data Collection Techniques
8 pages
Econometrics II CH-4
No ratings yet
Econometrics II CH-4
25 pages
Module 7
No ratings yet
Module 7
11 pages
Syllabus SP 20 Stat 300 Hybrid (8 Weeks) Sunday
No ratings yet
Syllabus SP 20 Stat 300 Hybrid (8 Weeks) Sunday
7 pages
Module 8 - Normal Distribution
No ratings yet
Module 8 - Normal Distribution
9 pages
Written Assignment
No ratings yet
Written Assignment
3 pages
Miller and Freunds Probability and Statistics For Engineers 9th Edition Johnson Solutions Manual Download
100% (4)
Miller and Freunds Probability and Statistics For Engineers 9th Edition Johnson Solutions Manual Download
52 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
Wooldridge 6e AppE IM
No ratings yet
Wooldridge 6e AppE IM
5 pages
Median
No ratings yet
Median
42 pages
Leveraging Machine Learning For Predicting Mental Health Outcomes A Data-Driven Approach
No ratings yet
Leveraging Machine Learning For Predicting Mental Health Outcomes A Data-Driven Approach
9 pages
Univariate Statistics
No ratings yet
Univariate Statistics
4 pages
R - Packages With Applications From Complete and Censored Samples
No ratings yet
R - Packages With Applications From Complete and Censored Samples
43 pages
Solution To Probability Lecture-I
No ratings yet
Solution To Probability Lecture-I
17 pages
Risk and Return - Section 11.2
No ratings yet
Risk and Return - Section 11.2
99 pages
Meas T
No ratings yet
Meas T
8 pages
Research Methodology - Measurement & Scaling Techniques
No ratings yet
Research Methodology - Measurement & Scaling Techniques
13 pages
Impact of Firms' Profitability On Environmental Performance: Evidence From Companies in India
No ratings yet
Impact of Firms' Profitability On Environmental Performance: Evidence From Companies in India
11 pages
Power Calculation
No ratings yet
Power Calculation
2 pages
24 - Lya Afriasih - Gda Prepost Kontrol
No ratings yet
24 - Lya Afriasih - Gda Prepost Kontrol
3 pages
Psy 230 Independent Samples T-Test: Figure 10-3 (P. 314)
No ratings yet
Psy 230 Independent Samples T-Test: Figure 10-3 (P. 314)
5 pages
Case Processing Summary 1
No ratings yet
Case Processing Summary 1
3 pages
Data Estrus SPSS
No ratings yet
Data Estrus SPSS
3 pages
Bangayan, Melody D. Discussion 4
No ratings yet
Bangayan, Melody D. Discussion 4
1 page