Course Material For cs391

This document discusses image features for object and scene recognition using machine learning. It describes the machine learning framework of training classifiers on labeled image features to perform recognition. Common image features include global descriptors like GIST and bags-of-features built from local patches. Bags-of-features represent images as histograms of visual words learned from clustering local descriptors. Spatial information can improve recognition of actions by extracting space-time interest points. Overall, the document outlines key steps in extracting and encoding image features to train classifiers for visual recognition tasks.

Uploaded by

Why Bother

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

83 views21 pages

Course Material For cs391

Uploaded by

Why Bother

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 21

Image Features for

Recognition
CSC 391: Introduction to Computer Vision
Recognition review
• Recognition tasks
• scene categorization, annotation, detection, activity
recognition, parsing
• Object categorization
• Machine learning framework
• training, testing, generalization
• Example classifiers
• Nearest neighbor
• Linear classifiers
The machine learning framework
y = f(x)
output Image feature
prediction function

 
• Training: given a training set of labeled examples  
{(x1,y1), …, (xN,yN)}, estimate the prediction function f by minimizing the prediction error
on the training set
• Testing: apply f to a never before seen test example x and output the predicted value y =
f(x)
Steps
Training Training
Labels
Training
Images
Image Learned
Training
Features model

Learned
model
Testing

Image
Prediction
Features
Test Image Slide credit: D. Hoiem
Image features
• Spatial
support:

Pixel or local patch Segmentation region

Bounding box Whole image

Image features
• Global image features for whole-image
classification tasks

• GIST descriptors
• Bags of features
GIST descriptors
• Oliva & Torralba (2001)

http://people.csail.mit.edu/torralba/code/spatialenvelope/
Bags of features
Bag-of-features steps
1. Extract local features
2. Learn “visual vocabulary”
3. Quantize local features using visual vocabulary
4. Represent images by frequencies of “visual words”

14.
1. Local feature extraction

• Regular grid or interest regions

1. Local feature extraction

Compute
descriptor Normalize patch

Detect patches

Slide credit: Josef Sivic

1. Local feature extraction

Slide credit: Josef Sivic

2. Learning the visual vocabulary

Slide credit: Josef Sivic

2. Learning the visual vocabulary

Clustering

Slide credit: Josef Sivic

2. Learning the visual vocabulary
Visual vocabulary
…

Clustering

Slide credit: Josef Sivic

Review: K-means clustering
• Want to minimize sum of squared Euclidean
distances between features xi and their nearest
cluster centers mk 
  2
D( X , M ) = ∑ ∑ (x i − mk )
  cluster k point i in
cluster k

Algorithm:
• Randomly initialize K cluster centers
• Iterate until convergence:
• Assign each feature to the nearest center
• Recompute each cluster center as the mean of all features assigned to it
Bag-of-features steps
1. Extract local features
2. Learn “visual vocabulary”
3. Quantize local features using visual vocabulary
4. Represent images by frequencies of “visual words”
Visual vocabularies: Details
• How to choose vocabulary size?
• Too small: visual words not representative of all patches
• Too large: quantization artifacts, overfitting
• Right size is application-dependent

• Improving efficiency of quantization

• Vocabulary trees (Nister and Stewenius, 2005)

• Improving vocabulary quality

• Discriminative/supervised training of codebooks
• Sparse coding, non-exclusive assignment to codewords

• More discriminative bag-of-words representations

• Fisher Vectors (Perronnin et al., 2007), VLAD (Jegou et al., 2010)

• Incorporating spatial information

Bags of features for action recognition
Space-time interest points

Juan Carlos Niebles, Hongcheng Wang and Li Fei-Fei, Unsupervised Learning of Human
Action Categories Using Spatial-Temporal Words, IJCV 2008.
Bags of features for action recognition

Juan Carlos Niebles, Hongcheng Wang and Li Fei-Fei, Unsupervised Learning of Human
Action Categories Using Spatial-Temporal Words, IJCV 2008.
Credit:
Slide set developed by S. Lazebnik, University
of Illinois at Urbana-Champaign

Non-Exact Differential Equation: Integrating Factors
80% (10)
Non-Exact Differential Equation: Integrating Factors
7 pages
Patatoukas - Primer On Time Value of Money
No ratings yet
Patatoukas - Primer On Time Value of Money
4 pages
Violin Repertoire
No ratings yet
Violin Repertoire
7 pages
Yoko Kanno Adieu Piano
100% (1)
Yoko Kanno Adieu Piano
8 pages
3.4-16 Edited
No ratings yet
3.4-16 Edited
4 pages
CV Lecture 07 BagOfFeatures
No ratings yet
CV Lecture 07 BagOfFeatures
42 pages
Bag of Feature
No ratings yet
Bag of Feature
75 pages
CV 2025 Spring 12 Short
No ratings yet
CV 2025 Spring 12 Short
120 pages
Local Features and Bag of Words Models
No ratings yet
Local Features and Bag of Words Models
60 pages
Image Classification AI
No ratings yet
Image Classification AI
150 pages
Bag-Of-Words Models: Noah Snavely
No ratings yet
Bag-Of-Words Models: Noah Snavely
47 pages
Introduction To Object Recognition: Slides Adapted From Fei-Fei Li, Rob Fergus, Antonio Torralba, and Others
No ratings yet
Introduction To Object Recognition: Slides Adapted From Fei-Fei Li, Rob Fergus, Antonio Torralba, and Others
60 pages
Bag of Words
No ratings yet
Bag of Words
72 pages
IT5409 - Ch7 - Part2 - Object Recognition - v2 - 4pages
No ratings yet
IT5409 - Ch7 - Part2 - Object Recognition - v2 - 4pages
38 pages
Lecture6 2
No ratings yet
Lecture6 2
37 pages
Part 11 MD
No ratings yet
Part 11 MD
53 pages
14
No ratings yet
14
72 pages
Image Features and Categorization: Computer Vision Jia-Bin Huang, Virginia Tech
No ratings yet
Image Features and Categorization: Computer Vision Jia-Bin Huang, Virginia Tech
70 pages
Quiz 1 On Wednesday
No ratings yet
Quiz 1 On Wednesday
46 pages
Bag of Features
No ratings yet
Bag of Features
49 pages
03-3 Feature Descriptors
No ratings yet
03-3 Feature Descriptors
58 pages
Understanding Bag-Of-Words Model: A Statistical Framework
No ratings yet
Understanding Bag-Of-Words Model: A Statistical Framework
10 pages
Machine Learning Crash Course: Computer Vision James Hays
No ratings yet
Machine Learning Crash Course: Computer Vision James Hays
38 pages
Lec23 Categorization Wide
No ratings yet
Lec23 Categorization Wide
53 pages
SWE622 Lecture 3 Classification
No ratings yet
SWE622 Lecture 3 Classification
57 pages
Understanding Bag-Of-Words Model A Statistical Fra
No ratings yet
Understanding Bag-Of-Words Model A Statistical Fra
16 pages
Object Recog
No ratings yet
Object Recog
102 pages
Bai09 Descriptors
No ratings yet
Bai09 Descriptors
81 pages
Feature Extraction: Dr. Mallikarjun Hangarge
No ratings yet
Feature Extraction: Dr. Mallikarjun Hangarge
17 pages
Visual Categorization With Bags of Keypoints
No ratings yet
Visual Categorization With Bags of Keypoints
17 pages
2 Bow
No ratings yet
2 Bow
59 pages
Lecture 06
No ratings yet
Lecture 06
72 pages
RO47002 - Lecture 2A - Case Study Visual Object Detection
No ratings yet
RO47002 - Lecture 2A - Case Study Visual Object Detection
24 pages
Week 10
No ratings yet
Week 10
31 pages
Lecture10-Featurebased Image Matching
No ratings yet
Lecture10-Featurebased Image Matching
33 pages
Image Classification Using Bag of Visual Words (Bovw) : 10.22401/anjs.21.4.11
No ratings yet
Image Classification Using Bag of Visual Words (Bovw) : 10.22401/anjs.21.4.11
7 pages
CV4 F
No ratings yet
CV4 F
43 pages
Clustering
No ratings yet
Clustering
41 pages
Classifier
No ratings yet
Classifier
39 pages
Lab4 103169894
No ratings yet
Lab4 103169894
34 pages
Classification Techniques
No ratings yet
Classification Techniques
99 pages
4.1 - Unsupervised Visual Representation Learning by Context Prediction
No ratings yet
4.1 - Unsupervised Visual Representation Learning by Context Prediction
10 pages
PROJECT Presentation Medical Multimodal Image Retrieval
No ratings yet
PROJECT Presentation Medical Multimodal Image Retrieval
57 pages
Unit II - Chapter 4 - Feature Detection
No ratings yet
Unit II - Chapter 4 - Feature Detection
56 pages
02 Feature Extraction & DLCV
No ratings yet
02 Feature Extraction & DLCV
165 pages
SP14 CS188 Lecture 23 - Kernels and Clustering - Print
No ratings yet
SP14 CS188 Lecture 23 - Kernels and Clustering - Print
39 pages
Bag of Words: The Framework
No ratings yet
Bag of Words: The Framework
44 pages
9.913 Pattern Recognition For Vision: Class VII, Part I - Techniques For Clustering Yuri Ivanov
No ratings yet
9.913 Pattern Recognition For Vision: Class VII, Part I - Techniques For Clustering Yuri Ivanov
52 pages
Lec 14
No ratings yet
Lec 14
18 pages
08classification I
No ratings yet
08classification I
52 pages
Eccv 06
No ratings yet
Eccv 06
15 pages
Pattern Recognition 14
No ratings yet
Pattern Recognition 14
46 pages
DSH - L5 - Data-Driven Approaches - Concepts
No ratings yet
DSH - L5 - Data-Driven Approaches - Concepts
38 pages
Discriminative and Generative Methods For Bags of Features: Zebra Non-Zebra
No ratings yet
Discriminative and Generative Methods For Bags of Features: Zebra Non-Zebra
40 pages
BOW Assignment 210097
No ratings yet
BOW Assignment 210097
10 pages
Computer Vision Presentation
No ratings yet
Computer Vision Presentation
19 pages
Features
No ratings yet
Features
60 pages
Spatial Feat Embedding
No ratings yet
Spatial Feat Embedding
4 pages
Visualization 1 Introduction 1
No ratings yet
Visualization 1 Introduction 1
53 pages
Cv2021-Lec1-Introduction 1600 PDF - Gdrive.vip
No ratings yet
Cv2021-Lec1-Introduction 1600 PDF - Gdrive.vip
61 pages
Lect 08 - Recognition
No ratings yet
Lect 08 - Recognition
34 pages
1 Introduction
No ratings yet
1 Introduction
81 pages
CVR 3
100% (1)
CVR 3
32 pages
Religion 106final17
No ratings yet
Religion 106final17
2 pages
Anderson2003 2
No ratings yet
Anderson2003 2
19 pages
Anderson 2003
No ratings yet
Anderson 2003
9 pages
Figure 1. Samples of First Layer Features of Each Stacked Autoencoder. Each Number Corresponds To A Different Dataset, Consistent With Tables 1 and 2
No ratings yet
Figure 1. Samples of First Layer Features of Each Stacked Autoencoder. Each Number Corresponds To A Different Dataset, Consistent With Tables 1 and 2
1 page
Campen Ella
No ratings yet
Campen Ella
21 pages
NaCl: Silver Nanoparticles
No ratings yet
NaCl: Silver Nanoparticles
12 pages
Smiley
No ratings yet
Smiley
1 page
1 Concepts: Computer Vision: Midterm Study Guide
No ratings yet
1 Concepts: Computer Vision: Midterm Study Guide
3 pages
Buster B Jones Guitar Styles and Techniques of Jerry Reed
100% (5)
Buster B Jones Guitar Styles and Techniques of Jerry Reed
29 pages
Full Thesis PDF
No ratings yet
Full Thesis PDF
124 pages
An Incremental Clustering Algorithm Based On Mahalanobis Distance
No ratings yet
An Incremental Clustering Algorithm Based On Mahalanobis Distance
1 page
ISSN: 2320-7493 (Online) 2320-8449 (Print)
No ratings yet
ISSN: 2320-7493 (Online) 2320-8449 (Print)
2 pages
LZ77
No ratings yet
LZ77
18 pages
Week 4 Security
No ratings yet
Week 4 Security
13 pages
Rishi S S (41111058) Final Report
No ratings yet
Rishi S S (41111058) Final Report
60 pages
Business Analytics Data Analysis Decision Making 6th Edition Business Analytics Data Analysis Decision Making PDF Download
No ratings yet
Business Analytics Data Analysis Decision Making 6th Edition Business Analytics Data Analysis Decision Making PDF Download
84 pages
Artificial Intelligence
100% (1)
Artificial Intelligence
17 pages
Tree Search Using MPI With Static and Dynamic Partitioning PDF
No ratings yet
Tree Search Using MPI With Static and Dynamic Partitioning PDF
9 pages
Anshul's Resume
No ratings yet
Anshul's Resume
1 page
Rearranging Formulae Answers MME
No ratings yet
Rearranging Formulae Answers MME
2 pages
Amitabha Bagchi, Rahul Muthu - Algorithms and Discrete Applied Mathematics 2023
No ratings yet
Amitabha Bagchi, Rahul Muthu - Algorithms and Discrete Applied Mathematics 2023
464 pages
Exe 1 DL
No ratings yet
Exe 1 DL
3 pages
Or Assignment
No ratings yet
Or Assignment
9 pages
Teaching Introductory Artificial Intelligence With Pac-Man: January 2010
No ratings yet
Teaching Introductory Artificial Intelligence With Pac-Man: January 2010
6 pages
C1&C2
No ratings yet
C1&C2
44 pages
A Python Based Multi-Point Geostatistics by Using Direct Sampling Algorithm
No ratings yet
A Python Based Multi-Point Geostatistics by Using Direct Sampling Algorithm
4 pages
Immediate Download Spectral Analysis For Univariate Time Series 2nd Edition Donald B. Percival Ebooks 2024
100% (1)
Immediate Download Spectral Analysis For Univariate Time Series 2nd Edition Donald B. Percival Ebooks 2024
65 pages
Data Structures and Algorithm MANUAL
No ratings yet
Data Structures and Algorithm MANUAL
92 pages
Module 10 Math 8
No ratings yet
Module 10 Math 8
6 pages
MAE101 - SU2018 (Có Đáp Án)
No ratings yet
MAE101 - SU2018 (Có Đáp Án)
7 pages
Chapter 2 (Part 1) OOP Vs SP
No ratings yet
Chapter 2 (Part 1) OOP Vs SP
11 pages
Jwasham - Google-Interview-University - A Complete Daily Plan For Studying To Become A Google Software Engineer
No ratings yet
Jwasham - Google-Interview-University - A Complete Daily Plan For Studying To Become A Google Software Engineer
42 pages
Quintic B-Spline Method For Numerical Solution of Fourth Order Singular Perturbation Boundary Value Problems
No ratings yet
Quintic B-Spline Method For Numerical Solution of Fourth Order Singular Perturbation Boundary Value Problems
11 pages
PLC Program To Implement A Combinational Logic Circuit (2) - Sanfoundry
No ratings yet
PLC Program To Implement A Combinational Logic Circuit (2) - Sanfoundry
4 pages
Null 7
No ratings yet
Null 7
11 pages
The Problem of Overfitting - Coursera
No ratings yet
The Problem of Overfitting - Coursera
1 page