0% found this document useful (0 votes)

48 views14 pages

Bayesian Classification

This document provides an overview of linear classification methods. It discusses the classification problem and Bayesian decision theory which formalizes classification as minimizing risk. Linear discriminant analysis (LDA) is introduced as a method that finds a linear transformation of inputs to maximize discrimination between classes. LDA works by projecting data to a line that separates class means while minimizing variance. The document derives the LDA solution and shows how it can be applied to a sample iris dataset. Bayesian classification using multivariate normal distributions is also briefly covered.

Uploaded by

nishi21

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

48 views14 pages

Bayesian Classification

Uploaded by

nishi21

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 14

Linear Classication Methods

Sridhar Mahadevan
[email protected]

University of Massachusetts

CMPSCI 689 p. 1/2

Outline
Classification problem
Bayesian Decision Theory: Minimum risk formalization
Linear discriminant analysis (LDA)
Bayesian classification using Multivariate Normal
Distributions

CMPSCI 689 p. 2/2

Classication Problem

CMPSCI 689 p. 3/2

Classication Problem
!
"
#
"
!
$
%
!

%
CMPSCI 689 p. 4/2

Classication:
Geometrical View
+

margin

<w,x> + b = 0
CMPSCI 689 p. 5/2

Many Approaches
Parametric models:
Linear discriminant analysis (LDA)
Bayesian classifiers
Logistic regression
Nonparametric models:
Decision trees
k nearest neighbor method
Support vector machines

CMPSCI 689 p. 6/2

Classication as
Probabilistic Inference
Posterior =

Likelihood Prior
Evidence

P (ci |X) =

P (X|ci )P (ci )
P (X)

where the evidence(denominator) term can be computed

as
!
P (X) =
P (X|ci )P (ci )
i

CMPSCI 689 p. 7/2

Bayes Decision Theory

The object of classification is to minimize the risk

R(i |x) =

c
!
j=1

(i |cj )P (cj |x)

CMPSCI 689 p. 8/2

Class Conditional
Densities
p(x|i)
0.4

2
1

0.3

0.2

0.1

x
9

CMPSCI 689 p. 9/2

Posterior Densities
P(i|x)
1

0.8

0.6

0.4

2
0.2

x
9

CMPSCI 689 p. 10/2

Minimum Risk
Classication
R(1 |x) = 11 P (c1 |x) + 12 P (c2 |x)
R(2 |x) = 21 P (c1 |x) + 22 P (c2 |x)
Minimum risk rule: Choose class 1 if R(1 |x) < R(2 |x)
(11 21 )P (c1 |x) < (12 22 )P (c2 |x)
We can reformulate this as
(11 21 )P (x|c1 )P (c1 ) < (12 22 )P (x|c2 )P (c2 )

CMPSCI 689 p. 11/2

Likelihood Ratio
p(x|1)
p(x|2)

b
a

CMPSCI 689 p. 12/2

Discriminant Functions
A discriminant function is any function that enables
successful classification.
For each class ci , define the discriminant function as
gi (x).
Examples:
gi (x) = P (ci |x) (Bayesian posterior distribution)
gi (x) = P (x|ci )P (ci ) (unnormalized posterior)
gi (x) = ln P (x|ci ) + ln P (ci )

CMPSCI 689 p. 13/2

Linear Discriminant
Analysis
LDA finds a linear transformation of the input X that
results in the maximum discrimination among classes.
Define Y = lT X, where X is a p-dim column vector, l is
a p dim row vector, and Y is a scalar.
Define i = E(X|ci ) as the conditional mean of the
input data from class ci .
Define Yi = E(Y |ci ) as the conditional mean of the
projected input data from class ci .
Goal: find the l such that the distance between the
means of the projected data is as large as possible,
and its variance is as small as possible.
CMPSCI 689 p. 14/2

PCA vs. LDA

$
CMPSCI 689 p. 15/2

PCA vs. LDA

$
CMPSCI 689 p. 16/2

Statistics: Projected Data

The mean of the projected data is
E(Y |ci ) = E(lT X|ci ) = lT i
What is the variance of the projected data?
Critical assumption:

Assume each class has the same

covariance!
V ar(Y ) = V ar(lT X) = lT Cov(X)l = lT l

CMPSCI 689 p. 17/2

LDA: Formalization
The optimization objective of LDA can now be
formalized as maximizing the ratio
Squared distance between projected means
Variance of Y
Y
Y 2
(1 2 )
=
Y Y
T
(l 1 lT 2 )2
=
lT l
lT (1 2 )(1 2 )T l
=
lT l
=

CMPSCI 689 p. 18/2

LDA Solution
We can solve the optimization problem using Lagrange
multipliers (setting the denominator to 1)
J(l, ) = (lT (1 2 )(1 2 )T l) (lT l 1)
J
= 2(1 2 )(1 2 )T l 2l
l
Setting the partial derivative to 0, we get the
generalized eigenvalue problem:
(1 2 )(1 2 )T l = l
CMPSCI 689 p. 19/2

LDA Solution
Notice that
(1 2 )(1 2 )T l = (1 2 )
is a vector that lies in the direction 1 2
With this insight, we can finally express Fishers linear
discriminant function as
l = 1 (1 2 )
So, the projected data Y can be written as
Y = lT X = (1 2 )T 1 X
CMPSCI 689 p. 20/2

LDA from Sampled Data

Define the sample mean as
i =
Projected means are
Yi = lT
i
Define the sample scatter as S =

1
n

i (xi

1 )(xi
2 )T

Fishers linear discriminant can then be written as

l = S 1 (
1
2 )
The projected sampled data is then
y = lT x = (
1
2 )T S 1 x
CMPSCI 689 p. 21/2

LDA Classication Rule

The decision boundary for LDA is linear, and at the
midpoint of the two projected means.
1 Y
Y2 )
(
1 +
2
1 T
=
1 + lT
2 )
(l
2
1
=
2 )T S 1 (
1 +
2 )
(
1
2

m =

A new point x is assigned to class 1 if

(
1
2 )T S 1 x > m
CMPSCI 689 p. 22/2

IRIS Dataset
!"#

!"#

!"!

!"#$%&'&

! ! ! ! ! ! !

!"#

!"#$%&'&

!"#

!"#$%&'&

!"#

!"!

!"#

! ! ! ! ! ! !

!"# !"# !"# !"# !"#

!"#

!"#$%&'&

!"# !"# !"# !"# !"#

CMPSCI 689 p. 23/2

LDA on IRIS Dataset

Group means:
Sepal.L. Sepal.W.
c 5.827273 2.750000
s 5.034615 3.450000
v 6.448148 2.951852

Petal.L. Petal.W.
4.150000 1.2863636
1.484615 0.2346154
5.437037 2.0259259

Coefficients of linear discriminants:

LD1
LD2
Sepal.L. 0.7387515 -0.1005218
Sepal.W. 1.4981563 -1.7595845
Petal.L. -2.2201789 1.2011187
Petal.W. -2.6147776 -3.2202932
CMPSCI 689 p. 24/2

Discriminant Functions:
Multivariate Gaussians
Multivariate Gaussian
1
T 1
1
p (x) =
e 2 (x) (x)
d
||

(2) 2

Discriminant function: gi (x) = ln P (x|ci ) + ln P (ci )

where P (x|ci ) is given by
1
d
1
(x i )T 1
ln 2 ln |i | + ln P (ci )
i (x i )
2
2
2
Case 1: Equal diagonal covariances: i = 2 I
Case 2 : Equal general covariances: i =
Case 3: Arbitrary general covariances: i
CMPSCI 689 p. 25/2

Equal Diagonal
Covariances
1
i =

1
, |i |
2

= 2d

The discriminant function gi (x) simplifies to

(x i )T (x i )
+ ln P (wi )
gi (x) =
2 2
1 T
=
x + wi0
2 i
0

-2

p(x|i)
0.4

0.15

1
0

P(2)=.5

0.1

0.05
1

0.3

0.2
-1

P(2)=.5

0.1

P(1)=.5
x
-2

P(1)=.5

P(2)=.5

-2

P(1)=.5 R1

-2
-2
-1

CMPSCI 689 p. 26/2

Equal Arbitrary
Covariances
1
(x i )T 1 (x i ) + ln P (ci )
2
= 1 Ti x + wi0 + ln P (ci )

gi (x) =

0.2

-0.1

P(2)=.5
R2

P(2)=.9

P(1)=.5

-5

0
5

-5

7.5

P(1)=.5

7.5

P(1)=.1 5
1

2
P(2)=.5

-2

2.5

1
R2

R1
P(1)=.1

-5

-2.5
-2

0
2
-2

-2.5

P(2)=.9

0
2

-2

CMPSCI 689 p. 27/2

Arbitrary Covariances
1
1
gi (x) = xT 1
i x + i i + wi0
2

CMPSCI 689 p. 28/2

SMAI-M20-L09: Aspects of Supervised Learning: C. V. Jawahar
No ratings yet
SMAI-M20-L09: Aspects of Supervised Learning: C. V. Jawahar
16 pages
Machine Learning and Data Mining: Prof. Alexander Ihler
No ratings yet
Machine Learning and Data Mining: Prof. Alexander Ihler
46 pages
ML Unit4
No ratings yet
ML Unit4
41 pages
Linear Discriminant Analysis
No ratings yet
Linear Discriminant Analysis
12 pages
Reviewed - IJAMSS - Equivalence of Fisher Discriminant Analysis and Least Square
No ratings yet
Reviewed - IJAMSS - Equivalence of Fisher Discriminant Analysis and Least Square
11 pages
Week 3
No ratings yet
Week 3
3 pages
Pattern Recognition (CSE4213) : Linear Discriminant Analysis (LDA)
No ratings yet
Pattern Recognition (CSE4213) : Linear Discriminant Analysis (LDA)
33 pages
DADM S14 Linear Discriminant Analysis
No ratings yet
DADM S14 Linear Discriminant Analysis
13 pages
Cheat Sheet
No ratings yet
Cheat Sheet
4 pages
Data Preprocessing-VI (Feature Extraction - LDA)
No ratings yet
Data Preprocessing-VI (Feature Extraction - LDA)
24 pages
Discriminant Functions
No ratings yet
Discriminant Functions
33 pages
Linear - Classification
No ratings yet
Linear - Classification
72 pages
14 Linear Discriminant Analysis 05-09-2024
No ratings yet
14 Linear Discriminant Analysis 05-09-2024
3 pages
LDA Final
No ratings yet
LDA Final
25 pages
Slide ML 0915
No ratings yet
Slide ML 0915
24 pages
Linear Classifiers
No ratings yet
Linear Classifiers
48 pages
Fisher Linear Discriminant Analysis: 1 What's LDA
No ratings yet
Fisher Linear Discriminant Analysis: 1 What's LDA
6 pages
Lec-04 - Linear Discriminant Analysis
No ratings yet
Lec-04 - Linear Discriminant Analysis
23 pages
Weekly Homework X
No ratings yet
Weekly Homework X
15 pages
FDA Class 2025
No ratings yet
FDA Class 2025
29 pages
Week2 Part1 Summer Partial Notes
No ratings yet
Week2 Part1 Summer Partial Notes
75 pages
Lecture14 Discriminant Analysis
No ratings yet
Lecture14 Discriminant Analysis
38 pages
Supervised Machine Learning
No ratings yet
Supervised Machine Learning
74 pages
Week 7 Notes
No ratings yet
Week 7 Notes
24 pages
Fishers LDA
No ratings yet
Fishers LDA
47 pages
cs221 Lecture11
No ratings yet
cs221 Lecture11
71 pages
Lecture 03 Bayes Classifier With Prob Concepts
No ratings yet
Lecture 03 Bayes Classifier With Prob Concepts
70 pages
ML Unit4
No ratings yet
ML Unit4
44 pages
Lecturer4 - Bayesian Decision Theory
No ratings yet
Lecturer4 - Bayesian Decision Theory
40 pages
Fisher's Linear Discriminant
No ratings yet
Fisher's Linear Discriminant
25 pages
Linear Discriminant Analysis: Intelligent Data Analysis and Probabilistic Inference
No ratings yet
Linear Discriminant Analysis: Intelligent Data Analysis and Probabilistic Inference
81 pages
9 - Linear Discriminant Analysis
No ratings yet
9 - Linear Discriminant Analysis
19 pages
Lda PDF
No ratings yet
Lda PDF
47 pages
Reference Material - LDA
No ratings yet
Reference Material - LDA
24 pages
1.2. Linear and Quadratic Discriminant Analysis - Scikit-Learn 1.6.1 Documentati
No ratings yet
1.2. Linear and Quadratic Discriminant Analysis - Scikit-Learn 1.6.1 Documentati
10 pages
Lec 9 Lda
No ratings yet
Lec 9 Lda
48 pages
C30 C35 LinearModelForClassification
No ratings yet
C30 C35 LinearModelForClassification
50 pages
Lecture 9: Classification, LDA: Reading: Chapter 4
No ratings yet
Lecture 9: Classification, LDA: Reading: Chapter 4
55 pages
AE - Tema 5 - Two-Class Fisher Discriminant Analysis
No ratings yet
AE - Tema 5 - Two-Class Fisher Discriminant Analysis
6 pages
Objectives:: Linear Discriminant Analysis
No ratings yet
Objectives:: Linear Discriminant Analysis
10 pages
Incomplete 1
No ratings yet
Incomplete 1
9 pages
Linear and Quadratic Discriminant Analysis: Tutorial: Benyamin Ghojogh
No ratings yet
Linear and Quadratic Discriminant Analysis: Tutorial: Benyamin Ghojogh
16 pages
Pattern Recognition Linear Classifier by Zaheer Ahmad
0% (1)
Pattern Recognition Linear Classifier by Zaheer Ahmad
37 pages
Linear Discriminant Analysis Reference
No ratings yet
Linear Discriminant Analysis Reference
6 pages
Linear Discriminant Analysis: January 2015
No ratings yet
Linear Discriminant Analysis: January 2015
67 pages
Linear Methods For Classification
No ratings yet
Linear Methods For Classification
29 pages
Supervised Learning: Linear Methods (1/2) : Applied Multivariate Statistics - Spring 2012
No ratings yet
Supervised Learning: Linear Methods (1/2) : Applied Multivariate Statistics - Spring 2012
15 pages
LDA Tutorial
No ratings yet
LDA Tutorial
47 pages
B22CS014 Report
No ratings yet
B22CS014 Report
11 pages
Linear Discriminat Analysis
No ratings yet
Linear Discriminat Analysis
23 pages
Bayesian Classifier Linear Disciminant Analysis (LDA) Quadratic Discriminant Analysis (QDA)
No ratings yet
Bayesian Classifier Linear Disciminant Analysis (LDA) Quadratic Discriminant Analysis (QDA)
18 pages
Bayesian
No ratings yet
Bayesian
21 pages
Dimensions Reduction
No ratings yet
Dimensions Reduction
27 pages
Reference Material - LDA
No ratings yet
Reference Material - LDA
24 pages
Linear Discriminant Analysis
No ratings yet
Linear Discriminant Analysis
16 pages
Experiments and Quasi-Experiments: Fourth Edition, Allen Rubin. Earl Babbie
100% (1)
Experiments and Quasi-Experiments: Fourth Edition, Allen Rubin. Earl Babbie
36 pages
Chapter 6 Correlation and Regression 2
No ratings yet
Chapter 6 Correlation and Regression 2
19 pages
CSE 474/574 Introduction To Machine Learning Fall 2011 Assignment 3
No ratings yet
CSE 474/574 Introduction To Machine Learning Fall 2011 Assignment 3
3 pages
Cambridge AS Biology 9700 Practical Notes
100% (1)
Cambridge AS Biology 9700 Practical Notes
2 pages
n9 PDF
No ratings yet
n9 PDF
6 pages
Anderson-Darling Test - Real Statistics Using Excel
No ratings yet
Anderson-Darling Test - Real Statistics Using Excel
37 pages
Collection of Data
No ratings yet
Collection of Data
8 pages
SB Test Bank Chapter 9
No ratings yet
SB Test Bank Chapter 9
46 pages
Salary Structure Design Tutorial Simulasi
No ratings yet
Salary Structure Design Tutorial Simulasi
18 pages
Chapter 5 - Forecasting PDF
No ratings yet
Chapter 5 - Forecasting PDF
80 pages
Summary MAS291
No ratings yet
Summary MAS291
7 pages
Analysisof Rainfall Variabilityin Sylhet Regionof Bangladesh
No ratings yet
Analysisof Rainfall Variabilityin Sylhet Regionof Bangladesh
11 pages
Statistical Process Control: Purpose
No ratings yet
Statistical Process Control: Purpose
42 pages
Simple Linear Regression Analysis
No ratings yet
Simple Linear Regression Analysis
21 pages
Section 2 Mathematics As A Tool Gecmat Chmsu - Cas Mathematics Department
No ratings yet
Section 2 Mathematics As A Tool Gecmat Chmsu - Cas Mathematics Department
42 pages
Sec 8 1 Steps in Hypothesis Testing Traditional Method
No ratings yet
Sec 8 1 Steps in Hypothesis Testing Traditional Method
37 pages
Unit 5 Notes
No ratings yet
Unit 5 Notes
26 pages
4 211 A&E Mills & Gay. 2016. Glossary MERAH 11th Eds. Educational - Research - Competencies - For - Analysis - and - Applications
No ratings yet
4 211 A&E Mills & Gay. 2016. Glossary MERAH 11th Eds. Educational - Research - Competencies - For - Analysis - and - Applications
12 pages
Georglm: A Package For Generalised Linear Spatial Models Introductory Session
No ratings yet
Georglm: A Package For Generalised Linear Spatial Models Introductory Session
10 pages
GMM
No ratings yet
GMM
25 pages
Topic 7. Double Grouping. Latin Squares (ST&D 9.10-9.15)
No ratings yet
Topic 7. Double Grouping. Latin Squares (ST&D 9.10-9.15)
8 pages
Statistics PYQ
No ratings yet
Statistics PYQ
6 pages
Cross-Sectional and Cohort Designs
No ratings yet
Cross-Sectional and Cohort Designs
21 pages
Chapter3 Lesson1
No ratings yet
Chapter3 Lesson1
27 pages
2021 Quiz2 Sample
No ratings yet
2021 Quiz2 Sample
7 pages
Honors Assignment - Probability Distributions and Normal Distribution Instructions
No ratings yet
Honors Assignment - Probability Distributions and Normal Distribution Instructions
3 pages
The Effect of Computerized Accounting Information Systems Big Data Analysis and Internal Audit
No ratings yet
The Effect of Computerized Accounting Information Systems Big Data Analysis and Internal Audit
6 pages
ANOVA Examples
No ratings yet
ANOVA Examples
5 pages
7.5 Trip Generation: Definitions of Terms
No ratings yet
7.5 Trip Generation: Definitions of Terms
9 pages
My Courses: Home UGRD-GE6114-2113T Week 10: Midterm Examination Midterm Exam
No ratings yet
My Courses: Home UGRD-GE6114-2113T Week 10: Midterm Examination Midterm Exam
10 pages
Chapter 2 (Subtopics and Mechancs of Writing)
No ratings yet
Chapter 2 (Subtopics and Mechancs of Writing)
4 pages
Ouput Spss Hasil Kegiatan Imunisasi
No ratings yet
Ouput Spss Hasil Kegiatan Imunisasi
6 pages
Digital Signal and Image Processing using MATLAB, Volume 3: Advances and Applications, The Stochastic Case
From Everand
Digital Signal and Image Processing using MATLAB, Volume 3: Advances and Applications, The Stochastic Case
Gérard Blanchet
3/5 (1)
Shortcuts to College Calculus Refreshment Kit
From Everand
Shortcuts to College Calculus Refreshment Kit
Juan Acevedo
No ratings yet
Mathematical Functions
From Everand
Mathematical Functions
Oliver Linton
No ratings yet