0% found this document useful (0 votes)
64 views10 pages

Face Recognition: A Comparison of Appearance-Based Approaches

The document summarizes and compares three face recognition methods: direct correlation, eigenfaces, and fisherfaces. It describes applying each method to a database of over 250,000 facial images to evaluate performance under variations in lighting, expression, and orientation. Pre-processing techniques are also explored to determine the best approach for each recognition method and improve accuracy rates. Results are presented showing the equal error rates for each configuration.

Uploaded by

faizanmulla1532
Copyright
© Attribution Non-Commercial (BY-NC)
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
64 views10 pages

Face Recognition: A Comparison of Appearance-Based Approaches

The document summarizes and compares three face recognition methods: direct correlation, eigenfaces, and fisherfaces. It describes applying each method to a database of over 250,000 facial images to evaluate performance under variations in lighting, expression, and orientation. Pre-processing techniques are also explored to determine the best approach for each recognition method and improve accuracy rates. Results are presented showing the equal error rates for each configuration.

Uploaded by

faizanmulla1532
Copyright
© Attribution Non-Commercial (BY-NC)
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 10

Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S.

and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

Face Recognition: A Comparison of Appearance-Based 
Approaches 

Thomas Heseltine1, Nick Pears, Jim Austin, Zezhi Chen 

Advanced Computer Architectures Group, Department of Computer Science, 
The University of York, York, England 
1
[email protected] 
http://www.cs.york.ac.uk/~tomh 

Abstract.  We  investigate  the  effect  of  image  processing  techniques  when 
applied as a pre-processing step to three methods of face recognition: the direct 
correlation method, the eigenface method and fisherface method.  Effectiveness 
is evaluated by comparing false acceptance rates, false rejection rates and equal 
error rates calculated from over 250,000 verification operations on a large test 
set  of  facial  images,  which  present  typical  difficulties  when  attempting 
recognition,  such  as  strong  variations  in  lighting  conditions  and  changes  in 
facial  expression.    We  identify  some  key  advantages  and  determine  the  best 
image processing technique for each face recognition method. 

1   Introduction 

Despite  significant  advances  in  face  recognition  technology,  it  has  yet  to  be  put  to 
wide use in commerce or industry, primarily because the error rates are still too high 
for many of the applications in mind.  These problems stem from the fact that existing 
systems  are  highly  sensitive  to  environmental  factors  during  image  capture,  such  as 
variations in  facial orientation, expression and lighting conditions.  In this paper  we 
attempt  to  address  these  issues  by  use  of  image  pre-processing  techniques,  focusing 
on  three  face  recognition  methods,  all  coming  under  the  general  heading  of 
appearance-based  approaches:  direct  correlation;  the  eigenface  method  and  the 
fisherface method. 
We begin with brief explanations of each face recognition method (section 2, 3 and 
4), followed by a performance comparison of each system (section 5) with no image 
pre-processing (the ëbaseline systemsí).  In Section 6 we outline a range of image pre-
processing techniques, which may improve the baseline systems. 
By applying the face recognition methods to a substantial database of facial images 
(described  in  Section  7),  producing  graphs  of  FAR  (False  Acceptance  Rate)  against 
FRR  (False  Rejection  Rate),  from  which  the  EER  (equal  error  rate)  is  taken  as  a 
single comparative value, we compare the recognition accuracy across the full range 
of systems (Section 9). 

59
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

2   The Direct Correlation Method 

The  direct  correlation  method  of  face  recognition  (also  referred  to  as  template 
matching  by  Brunelli  and  Poggio  [1])  involves  the  direct  comparison  of  pixel 
intensity  values  taken  from  facial  images.    We  convert  bitmap  images  of  65  by  82 
pixels into a vector of 5330 elements, describing a point  within a 5330 dimensional 
image space.  By measuring the distance between these points, we gain an indication 
of image similarity.  Similar images are located close together within the image space, 
while dissimilar images are spaced far apart.  Extending this idea to faces, calculating 
the Euclidean distance d, between two  facial image vectors (often referred to as the 
query image q, and gallery image g), we get an indication of similarity.  A threshold is 
then applied to make the final verification decision. 
 

d = q−g   ( d ≤ threshold ⇒ accept ) ∧ ( d > threshold ⇒ reject )  .               (1) 

3   The Eigenface Method 

In  this  section  we  give  a  brief  explanation  of  the  eigenface  method  of  face 
recognition, while referring the reader to Turk and Pentland [2, 3] for more detailed 
explanations. 
We  compute  the  covariance  matrix  C,  of  facial  images  from  a  set  of  M  (60) 
training images: {Γ1, Γ2, Γ3, Ö  ΓM}, 
 
M
A = [Φ1Φ 2Φ3 ...Φ M ]
C = 1
M ∑
n =1
Φ nΦ T
n   
Φ n = Γn − Ψ
T
= AA M
Ψ = M1 ∑ Γn
n =1
.                (2) 
 

The  eigenvectors  and  eigenvalues  of  this  covariance  matrix  are  calculated  using 
standard linear methods and the M` eigenvectors with the highest eigenvalues chosen 
to formulate the projection matrix u.  For the sake of consistency with the fisherface 
method, we use the first 59 principal components when testing the eigenface method. 
 

                   
Fig. 1. The average face and first five eigenfaces computed with no image pre-processing 

A face-key ω (image vector projected into face space) can then be produced by the 
following equation. 
ω k = u kT (Γ − Ψ )       for k = 1 Ö  M`  .          (3) 
 

These  face-keys  (vectors  of  59  principal  component  coefficients)  can  than  be 
compared using the Euclidean distance measure as with the direct correlation method 
(see equation 1). 

60
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

4   The Fisherface Method 

The fisherface  method of  face recognition as described by Belhumeur et al [4] uses 


both  principal  component  analysis  and  linear  discriminant  analysis  to  produce  a 
subspace projection  matrix,  similar to that used in  the eigenface  method.  However, 
the  fisherface  method  is  able  to  take  advantage  of  ëwithin-classí  information, 
minimising variation within each class, yet still maximising class separation. 
To accomplish this we expand the training set to contain multiple images of each 
person,  providing  examples  of  how  a  personís  face  may  change  from  one  image  to 
another  due  to  variations  in  lighting  conditions,  facial  expression  and  even  small 
changes in orientation.  We define the training set as, 
 

            .          (4) 
 

Where  Γi  is  a  facial  image  and  the  training  set  is  partitioned  into  c  classes,  such 
that  all  the  images  in  each  class  Xi  are  of  the  same  person  and  no  single  person  is 
present in more than one class. 
We begin by computing  three scatter  matrices, representing the  within-class (Sw), 
between-class  (Sb)  and  total  (St)  distribution  of  the  training  set  throughout  image 
space. 
 

(5) 
 
M
Where  Ψ= 1
M ∑ Γn ,  is  the  average  image  vector  of  the  entire  training  set,  and 
n =1

Ψi = 1
Xi ∑ Γ , the average of each individual class Xi (person).  By performing PCA 
Γi ∈ X i
i

on  the  total  scatter  matrix  St,  and  taking  the  top  M-c  principal  components,  we 
produce  a  projection  matrix  Upca,  which  is  used  to  reduce  the  dimensionality  of  the 
within-class scatter matrix, ensuring it is non-singular, before computing the top c-1 
(in our case 59) eigenvectors of the reduced scatter matrices, Ufld as shown below. 
 U TU Tpca S BU pcaU   
U fld = arg max T T   .
U U U S U U 
 pca W pca  (6) 
Finally, the matrix Uff is calculated as shown in equation 7, such that it will project 
a facial image into a reduced image space of c-1 dimensions, in which the between-
class scatter is maximised for all c classes, while the within-class scatter is minimised 
for each class Xi. 
U ff = U fld U pca
 .                         (7) 
 

Once the Uff  matrix  has been constructed it is used in  much the  same  way as the 


projection  matrix  in  the  eigenface  system  (see  equation  3),  reducing  the 
dimensionality of the image vectors from 5330 to just 59 (c-1) elements.  Again, like 

61
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

the  eigenface  system,  the  components  of  the  projection  matrix  can  be  viewed  as 
images, referred to as fisherfaces. 
 

             
Fig. 2.  The first five fisherfaces, defining a face space with no image pre-processing 

5   Baseline Results 

We  begin  with  some  preliminary 


experimentation;  comparing  the  three 
baseline  systems  (direct  correlation, 
eigenface and fisherface) with no image 
pre-processing,  applied  to  the  same 
database  used  by  Heseltine,  Pears  and 
Austin  in  previous  eigenface 
experiments  [5].    The  results  clearly 
show  that  the  fisherface  method  has  a 
significantly  higher  EER  than  the 
eigenface  and  direct  correlation 
methods  (Fig.  3).    This  seems 
contradictory  to  other  investigations  [4, 
6], which identify the fisherface method 
as the superior system. 
However,  looking  at  the  error  rate 
curve,  we  see that a  steep drop in FAR 
occurs just as the FRR increases above 
40%,  to  the  point  where  the  fisherface 
system  outperforms  both  the  eigenface 
and  direct  correlation  methods.    Also, 
applying  the  fisherface  system  to  the 
training  set  achieves  perfect 
classification. 
This suggests that within the test set 
there  are  some  images  for  which  the 
fisherface system is not suitable, but as 
the  threshold  decreases,  effectively 
discounting  these  images  from  the 
statistics,  we  see  an  improvement  in 
performance.    After  removing  the 
partially  occluded  images  from  the  test 
set,  it  becomes  obvious  that  these 

62
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

images were the causes of the high EER.  The fisherface method is clearly the most 
accurate, with an EER of 20%, especially if an application is required with a low false 
acceptance rate. 
It is also evident that there is no significant difference between the accuracy of the 
eigenface  and  direct  correlation  methods,  with  EERs  of  25.5%  and  25.1% 
respectively.  However, each system does have other advantages, in that the eigenface 
method requires much less processing time per verification, whereas direct correlation 
takes more time per verification, but does not required a training phase. 

6   Image Pre-processing 

It  has  been  shown  that  introducing  an  image  pre-processing  step  to  the  eigenface 
method of face recognition can significantly reduce error rates [5].  We now continue 
this  line  of  investigation;  by  applying  the  same  pre-processing  techniques  to  the 
fisherface and direct correlation methods, prior to training and testing each method. 
The  image  pre-processing  techniques  fall  into  four  main  categories:  colour 
normalisation,  statistical  methods,  convolution  filters  and  combinations  of  these 
methods.   A summary of these techniques (described in more detail by Heseltine et al 
[5]) is given in table 1. 

Table 1.  Brief descriptions of image pre-processing techniques, with examples of the average 
face and equations and pixel template kernels given where appropriate 

Colour Normalisation Techniques 
Comprehensive  Comprehensive colour normalization as described by Finlayson[8], invariant to 
lighting geometry and colour. 
The  method  involves  the  repetition  of  intensity  normalisation  and  grey  world 
normalisation, until a stable state is reached. 

 
Chromaticities  Summation of the R, G  Comprehensive  Summation of the R, G 
components of colour intensity  chromes  components of comprehensive 
normalisation.  normalisation. 

 
 
Grey world  Grey world normalisation.  Bgi hue  Brightness and gamma invariant 
hue, introduced by Finlayson and 
Schaefer [7]. 
log(r) − log(g)
H = tan−1
    log(r) + log(g) − 2 log(b)
 
Intensity  Intensity normalisation.  Hsv hue  Standard hue definition. 

 
 
   

63
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

 
Statistical Methods 
Brightness  Global transformation of  Local brightness  Application  of  brightness 
brightness, such that intensity  method  to  individual  local 
moments are normalised.  regions of the image. 

   
Brightness mean  Global transformation of  Vertical brightness  Application of brightness 
brightness, such that the mean  method to individual columns 
becomes a constant specified  of pixels. 
value. 

   
Horizontal  Application of brightness  Local brightness  Transformation of brightness, 
brightness  method to individual rows of  mean  such that the mean becomes a 
pixels.  constant specified value within 
local regions of the image. 

   
Convolution Filters 
Smooth  Standard low-pass filtering  Find edges  Edge detection followed by 
using a 3x3 pixel template.  segmentation by application of 
  a threshold. 
1  1  1  -1  -1  -1 
1  5  1  -1   8  -1 
  1  1  1    -1  -1  -1 
 
Smooth more  Smooth filtering with a larger  Blur  An extreme blurring effect. 
5x5 pixel neighbourhood.  1   1   1   1   1 
1   1   1   1  1  1   0   0   0   1 
1   5   5   5  1  1   0   0   0   1 
1   5  44  5  1  1   0   0   0   1 
  1   5   5   5  1    1   1   1   1   1 
1  1   1   1   1 
Contour  Edge detection by application  Detail  Enhance areas of high contrast. 
of a 3x3 template.  0  -1   0 
-1  -1  -1  -1  10  -1 
-1   8  -1  0  -1   0 
-1  -1  -1   
   
Edge  Enhances the edges of an  Sharpen  Reduces the blur in the image. 
image.   
-1  -1  -1  -2  -2  -2 
-1  10 -1  -2  32 -2 
-1  -1  -1  -2  -2  -2 
   
Edge more  Another edge enhancement  Emboss  A stylising filter that enhances 
filter.  edges with a shadow casting 
-1  -1  -1  affect. 
-1   9  -1  -1   0   0 
-1  -1  -1  0   1   0 
      0   0   0 

64
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

Method Combinations 
Contour -> Smooth  Contour filtering  Contour + Local brightness  The summation of the 
followed by smoothing.  resulting images from 
the Contour filter and 
the Local Brightness 
transformation. 
   
Smooth->Contour  Smoothing followed by  Local brightness ->Smooth  Local brightness 
contour filtering.  transformation 
followed by 
smoothing. 

   
C->S + LB  Contour filtering  Local brightness -> Contour  Local brightness 
followed by smoothing,  transformation 
summed with the Local  followed by contour 
Brightness  filtering. 
transformation. 
   
S->LB->C  Smoothing followed by     
the Local Brightness 
transformation and 
Contour filtering. 

7   The Face Database 

We  conduct  experiments  using  a  database  of  960  bitmap  images  of  120  individuals 
(60 male, 60 female) of various race and age, extracted from the AR Face Database 
provided by Martinez and Benavente [9].  The database is separated into two disjoint 
sets: i) The training set, containing 240 images of 60 people under a range of lighting 
conditions and facial expressions; ii) the test set containing 720 images (60 people of 
various  gender,  race  and  age,  12  images  each).    The  six  examples  shown  in  table  2 
were repeated on two days, making up the 12 images of each subject in the test set. 
All  the  images  are  pre-aligned  with  the  centres  of  the  eyes  25  pixels  apart.    Each 
image is cropped to a width and height of 65 and 82 pixels respectively. 

Table 2.  Image capture conditions included in the database test set. 
Lighting  Natural  From left  From right  Left & right  Natural  Natural 
Expression  Neutral  Neutral  Neutral  Neutral  Happy  Angry 

Example 
         

8   Test Procedure 

Effectiveness  of  the  face  recognition  methods  is  evaluated  using  error  rate  curves 
(FRR against FAR) for the verification operation.  The 720 images in the test set are 

65
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

compared  with  every  other  image  using  one  of  the  face  recognition  methods, 
producing a distance value using equation 1.  No image is  compared  with itself and 
each  pair  is  compared  only  once  (the  relationship  is  symmetric).    A  threshold  is 
applied  in  order  to  derive  the  rejection/acceptance  decision.    Hence,  each  FRR 
(percentage  of  incorrect  rejections),  and  FAR  (percentage  of  incorrect  acceptances) 
pair is calculated from 258,840 verification operations.  By varying the threshold we 
produce a set of FRR FAR plots, forming the error rate curve, as shown in fig. 5.  We 
then take the EER (point at which FRR equals FAR) as a single comparative value. 

9   Results 

Having  tested  the  full  range  of  image 


pre-processing  techniques,  we  present 
the  EERs  in  fig.  6,  identifying  optimum 
image processing techniques  for each of 
the three face recognition methods.  Both 
the  direct  correlation  and  eigenface 
methods  perform  best  when  used  with 
intensity  normalisation,  achieving  an 
EER  of  18.0%  and  20.4%  respectively.  
The  fisherface  method  achieves  the 
lowest  EER  of  17.8%,  when  used  with 
the ì slbcî  pre-processing technique. 
We  also  see  that  only  a  slight 
improvement is gained by the fisherface 
method,  from  20.1%  to  17.8%  EER, 
whereas  direct  correlation  has  a  much 
more  significant  improvement,  from 
25.1%  down  to  18.0%.    In  fact,  when  using  the  optimum  image  pre-processing 
technique  the  fisherface  method  is  only  marginally  better  than  direct  correlation, 
although  it  still  maintains  the  advantage  of  a  reduced  processing  time,  due  to  the 
shorter length of the projected image vectors. 

10   Conclusion 

Initial comparison of the baseline  systems produced results that are contradictory to 
other experiments carried out on the eigenface and fisherface methods [4, 6].  Further 
investigation  identified  that  the  training  set  used  for  the  fisherface  method  did  not 
include sufficient examples of all conditions represented in the test data.  In order for 
the fisherface method to perform recognition effectively, it is vital that the training set 
is an adequate representation of the real application data.  If such training data is not 
available,  or  the  real  world  image  capture  conditions  cannot  be  predicted,  the 
eigenface and direct correlation methods are a better alternative.  However, providing 
a suitable training set is available, the fisherface method has significantly lower error 

66
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

rates  (20.1%)  than  both  the  eigenface  (25.5%)  and  direct  correlation  methods 
(25.1%),  which  are  comparable  in  terms  of  recognition  accuracy.    However,  with 
image vectors of 5330 elements, the processing time and storage requirements of the 
direct  correlation  method  are  significantly  higher  than  the  eigenface  method,  which 
uses vectors of only 59 elements. 
We  have  shown  that  the  use  of  image  pre-processing  is  able  to  significantly 
improve  all  three  methods  of  face  recognition,  reducing  the  EER  of  the  eigenface, 
fisherface and direct correlation methods by 2.3, 5.1 and 7.1 respectively.  However, 
it has also become apparent that different image pre-processing techniques affect each 
method of face recognition differently.  Although some image processing techniques 
are typically detrimental (blurring, smoothing, hue representations and comprehensive 
normalisation)  and  others  are  generally  beneficial  (slbc,  sharpen,  detail,  edge 
enhance)  to  recognition,  there  are  also  techniques  that  will  decrease  error  rates  for 
some methods while increasing error rates for others.  The most prominent example 
of this is intensity normalisation, which is evidently the best technique for both direct 
correlation and eigenface methods, yet increases the EER for the fisherface method. 
Taking  the  optimum  image  pre-processing  technique  shows  that  the  fisherface 
method  has  the  lowest  EER  (17.8%),  yet  its  lead  over  the  other  two  methods  is 
considerably reduced.  In this case, although much more computationally efficient, it 
is  only  marginally  better  than  direct  correlation  (EER  18.0%),  but  still  maintains  a 
significant improvement over the eigenface method (EER 20.4%). 
Further experimentation is required in order to identify which specific features are 
enhanced  by  which  pre-processing  method  and  in  what  circumstances  a  given  pre-
processing  method  is  most  effective.    In  addition,  it  may  be  the  case  that  using  a 
different number of principal components will reduce error rates further, but this may 
also be dependent on the pre-processing method used. 

References 

1. Brunelli, R., Poggio, T.: Face Recognition: Features versus Templates. IEEE Transactions on 
Pattern Analysis and Machine Intelligence 15 (1993) 1042-1052 
2. Turk, M., Pentland, A.: Eignefaces for Recognition. Journal of Cognitive Neuroscience, Vol. 
3, (1991) 72-86 
3.  Turk,  M.,  Pentland,  A.:  Face  Recognition  Using  Eignefaces.  In  Proc.  IEEE  Conf.  on 
Computer Vision and Pattern Recognition. (1991) 586-591 
4.  Belhumeur,  P.,  Hespanha,  J.,  Kriegman,  D.:  Eigenfaces  vs.  Fisherfaces:  Face  Recognition 
using class specific linear projection. In Proc. ECCV, (1996) 45-58 
5.  Heseltine,  T.,  Pears,  N.,  Austin,  J.:  Evaluation  of  image  pre-processing  techniques  for 
eigenface based face recognition. In Proc. of the Second International Conference on Image 
and Graphics, SPIE vol. 4875, (2002) 677-685 
6  Marcialis,  G.,  Roli,  F.:  Fusion  of  LDA  and  PCA  for  Face  Recognition.  Department  of 
Electrical and Electronic Engineering, University of Cagliari, Piazza díArmi 
7.  Finlayson,  G.,  Schaefer,  G.:  Hue  that  is  Invariant  to  Brightness  and  Gamma.  BMVC01, 
Session 3: Colour & Systems, (2001) 
8.  Finlayson,  G.,  Schiele,  B.,  Crowley,  J.:  Comprehensive  Colour  Image  Normalisation.  In 
Proc. ECCV '98, LNCS 1406, Springer, (1998) 475-490 
9. Martinez, A., Benavente, R.: The AR Face Database. CVC Technical Report #24, (1998) 

67
Proc. VIIth Digital Image Computing: Techniques and Applications, Sun C., Talbot H., Ourselin S. and Adriaansen T. (Eds.), 10-12 Dec. 2003, Sydney

Appendix: Results Table 
 

 
Fig. 6.  Equal Error Rates of face recognition methods used with a range of image pre-
processing techniques 

68

You might also like