0% found this document useful (0 votes)

22 views6 pages

1 - Nearest Neighbor Classification Handout

Uploaded by

Murali Krishna

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views6 pages

1 - Nearest Neighbor Classification Handout

Uploaded by

Murali Krishna

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

Nearest neighbor classification

Topics we’ll cover

1 What is a classification problem?

2 The training set and test set
3 Representing data as vectors
4 Distance in Euclidean space
5 The 1-NN classifier
6 Training error versus test error
7 The error of a random classifier
The problem we’ll solve today
Given an image of a handwritten digit, say which digit it is.

=⇒ 3

Some more examples:

The machine learning approach

Assemble a data set:

The MNIST data set of handwritten digits:

• Training set of 60,000 images and their labels.
• Test set of 10,000 images and their labels.
And let the machine figure out the underlying patterns.
Nearest neighbor classification
Training images x (1) , x (2) , x (3) , . . . , x (60000)
Labels y (1) , y (2) , y (3) , . . . , y (60000) are numbers in the range 0 − 9

How to classify a new image x?

• Find its nearest neighbor amongst the x (i)
• Return y (i)

The data space

How to measure the distance between images?

MNIST images:
• Size 28 × 28 (total: 784 pixels)
• Each pixel is grayscale: 0-255

Stretch each image into a vector with 784 coordinates:

• Data space X = R784

• Label space Y = {0, 1, . . . , 9}
The distance function
Remember Euclidean distance in two dimensions?

z = (3, 5)

x = (1, 2)

Euclidean distance in higher dimension

Euclidean distance between 784-dimensional vectors x, z is

v
u 784
uX
kx − zk = t (xi − zi )2
i=1

Here xi is the ith coordinate of x.

Nearest neighbor classification
Training images x (1) , . . . , x (60000) , labels y (1) , . . . , y (60000)

To classify a new image x:

• Find its nearest neighbor amongst the x (i)
using Euclidean distance in R784
• Return y (i)

How accurate is this classifier?

Accuracy of nearest neighbor on MNIST

Training set of 60,000 points.

• What is the error rate on training points? Zero.

In general, training error is an overly optimistic predictor of future performance.

• A better gauge: separate test set of 10,000 points.

Test error = fraction of test points incorrectly classified.

• What test error would we expect for a random classifier?

(One that picks a label 0 − 9 at random?) 90%.

• Test error of nearest neighbor: 3.09%.

Examples of errors

Test set of 10,000 points:

• 309 are misclassified
• Error rate 3.09%

Examples of errors:
Query

AAI Lecture 11 SP 25
No ratings yet
AAI Lecture 11 SP 25
77 pages
Unit 3
No ratings yet
Unit 3
100 pages
02-knn Slides
No ratings yet
02-knn Slides
57 pages
ShortCourse QTT Lecture1
No ratings yet
ShortCourse QTT Lecture1
40 pages
Machine Learning Algorithms - pptx-1
No ratings yet
Machine Learning Algorithms - pptx-1
129 pages
Lecture 5-KNN
No ratings yet
Lecture 5-KNN
55 pages
4K-Nearest Neighbor
No ratings yet
4K-Nearest Neighbor
38 pages
Lec 02
No ratings yet
Lec 02
27 pages
K-Nearest Neighbors
No ratings yet
K-Nearest Neighbors
35 pages
UNIT-2 ML Notes
No ratings yet
UNIT-2 ML Notes
15 pages
T6 - KNN - Features, Distances &amp Amp Non-Parametric Models
No ratings yet
T6 - KNN - Features, Distances &amp Amp Non-Parametric Models
23 pages
Mlfa Autumn 22 Lec 03
No ratings yet
Mlfa Autumn 22 Lec 03
61 pages
cs4302 Lecture2
No ratings yet
cs4302 Lecture2
40 pages
3 KNN
No ratings yet
3 KNN
18 pages
Lecture 5
No ratings yet
Lecture 5
21 pages
03 Supervised Classification
No ratings yet
03 Supervised Classification
68 pages
L3 KNN
No ratings yet
L3 KNN
17 pages
Classification (K-Nearest Neighbor)
No ratings yet
Classification (K-Nearest Neighbor)
22 pages
Machine Learning and Data Mining: Prof. Alexander Ihler
No ratings yet
Machine Learning and Data Mining: Prof. Alexander Ihler
21 pages
Lecture Slides-Week15,16
No ratings yet
Lecture Slides-Week15,16
50 pages
2EL1730-ML-Lecture04-Non Parametric Learning and Nearest Neighbor
No ratings yet
2EL1730-ML-Lecture04-Non Parametric Learning and Nearest Neighbor
47 pages
CSE445 NSU Week - 5
No ratings yet
CSE445 NSU Week - 5
26 pages
Ch2 - Lec2 - K Nearest Neighbour (KNN)
No ratings yet
Ch2 - Lec2 - K Nearest Neighbour (KNN)
18 pages
PowerPoint Presentation - KNN Presentation
No ratings yet
PowerPoint Presentation - KNN Presentation
16 pages
K-Nearest Neighbor: General Gist
No ratings yet
K-Nearest Neighbor: General Gist
14 pages
Improving Performance Handout
No ratings yet
Improving Performance Handout
4 pages
KNN CIML
No ratings yet
KNN CIML
12 pages
Chapter#10 (Part#01) SL (K-NN)
No ratings yet
Chapter#10 (Part#01) SL (K-NN)
27 pages
Lab 1 1.2
No ratings yet
Lab 1 1.2
4 pages
Lab 1
No ratings yet
Lab 1
3 pages
Distance Based Method
No ratings yet
Distance Based Method
67 pages
AIML-Unit 4 Notes-Assignment 4
No ratings yet
AIML-Unit 4 Notes-Assignment 4
21 pages
Practicl Work - 02
No ratings yet
Practicl Work - 02
2 pages
Topic 7.7 K-Nearest Neighbor Analysis
No ratings yet
Topic 7.7 K-Nearest Neighbor Analysis
5 pages
Distance Metric Learning For Large Margin Nearest Neighbor Classification
No ratings yet
Distance Metric Learning For Large Margin Nearest Neighbor Classification
8 pages
Week 07
No ratings yet
Week 07
24 pages
K-Nearest Neighbour Classifiers
No ratings yet
K-Nearest Neighbour Classifiers
18 pages
Nearest-Neighbor Classifier: MTL 782 Iit Delhi
No ratings yet
Nearest-Neighbor Classifier: MTL 782 Iit Delhi
16 pages
K Nearest Neighbor Classification
No ratings yet
K Nearest Neighbor Classification
16 pages
20 KNN Presentation
No ratings yet
20 KNN Presentation
16 pages
Assignment 3 B
No ratings yet
Assignment 3 B
7 pages
4.4-InstanceBasedLearning Part 1
No ratings yet
4.4-InstanceBasedLearning Part 1
16 pages
ML DSBA Lab4
No ratings yet
ML DSBA Lab4
5 pages
COS4852 2023 Unit 2 - KNN
No ratings yet
COS4852 2023 Unit 2 - KNN
10 pages
Lecture8 KNN1
No ratings yet
Lecture8 KNN1
16 pages
5c. Nearest Neighbour Classifier
No ratings yet
5c. Nearest Neighbour Classifier
2 pages
KNN Presentation
No ratings yet
KNN Presentation
16 pages
IV Distance and Rule Based Models 4.1 Distance Based Models
No ratings yet
IV Distance and Rule Based Models 4.1 Distance Based Models
45 pages
Huawei SRv6
100% (1)
Huawei SRv6
97 pages
Metric-Based Classifiers: Nuno Vasconcelos (Ken Kreutz-Delgado)
No ratings yet
Metric-Based Classifiers: Nuno Vasconcelos (Ken Kreutz-Delgado)
32 pages
Instance Based Learning
No ratings yet
Instance Based Learning
20 pages
KNN For Classification
No ratings yet
KNN For Classification
1 page
Non Parametric Classification: Pattern Recognition
No ratings yet
Non Parametric Classification: Pattern Recognition
74 pages
LFD 2005 Nearest Neighbour
No ratings yet
LFD 2005 Nearest Neighbour
6 pages
Decision Tree KNN
No ratings yet
Decision Tree KNN
9 pages
A Review of Data Classification Using K-Nearest Neighbour
No ratings yet
A Review of Data Classification Using K-Nearest Neighbour
7 pages
Textbook ML - Removed
No ratings yet
Textbook ML - Removed
10 pages
BGP Overview FAL
100% (1)
BGP Overview FAL
24 pages
001-2023-0714 DLBDSIDS01 Course Book
No ratings yet
001-2023-0714 DLBDSIDS01 Course Book
90 pages
Road Traffic Algorithm
No ratings yet
Road Traffic Algorithm
5 pages
Lecture 3
No ratings yet
Lecture 3
17 pages
Distance Based Models
No ratings yet
Distance Based Models
58 pages
01-01 Segment Routing
No ratings yet
01-01 Segment Routing
12 pages
MER December 2024
No ratings yet
MER December 2024
52 pages
Simplified Evpn Vxlan
No ratings yet
Simplified Evpn Vxlan
75 pages
AIL Quiz
No ratings yet
AIL Quiz
30 pages
Iit M Diploma Quiz2 Exam QPD2
No ratings yet
Iit M Diploma Quiz2 Exam QPD2
221 pages
Millet Leaf Disease Prediction
No ratings yet
Millet Leaf Disease Prediction
26 pages
3 - Evolution of The Transport System
No ratings yet
3 - Evolution of The Transport System
4 pages
1 s2.0 S1369703X22004338 Main
No ratings yet
1 s2.0 S1369703X22004338 Main
21 pages
Onur Comparch Fall2018 Lecture10b Memorylatency Afterlecture
No ratings yet
Onur Comparch Fall2018 Lecture10b Memorylatency Afterlecture
115 pages
Parkinsons Disease Pase 1
No ratings yet
Parkinsons Disease Pase 1
17 pages
ML 04 Validation Regularization
No ratings yet
ML 04 Validation Regularization
57 pages
2425s Csec520 08 Naive Bayes KNN
No ratings yet
2425s Csec520 08 Naive Bayes KNN
44 pages
Op Jeeva1
No ratings yet
Op Jeeva1
36 pages
Sms Spam Term Paper
No ratings yet
Sms Spam Term Paper
10 pages
Aiml Final Report
No ratings yet
Aiml Final Report
39 pages
Lecture9 ML-Algorithms
No ratings yet
Lecture9 ML-Algorithms
22 pages
DL Unit-2
No ratings yet
DL Unit-2
32 pages
A Survey On Evaluation of Large Language Models
No ratings yet
A Survey On Evaluation of Large Language Models
24 pages
Final Year Publishing Paper Air Quality Index Prediction-39120034
No ratings yet
Final Year Publishing Paper Air Quality Index Prediction-39120034
8 pages
Inversion Study of Baiyangdian Water Quality Param
No ratings yet
Inversion Study of Baiyangdian Water Quality Param
7 pages
Presentaton PPT Stock Prediction
No ratings yet
Presentaton PPT Stock Prediction
10 pages
YASHVEER2
No ratings yet
YASHVEER2
33 pages
Visitors Authentication Using Face Recognition
No ratings yet
Visitors Authentication Using Face Recognition
15 pages
Gradnorm: Gradient Normalization For Adaptive Loss Balancing in Deep Multitask Networks
No ratings yet
Gradnorm: Gradient Normalization For Adaptive Loss Balancing in Deep Multitask Networks
12 pages
Introduction To Datascience
No ratings yet
Introduction To Datascience
15 pages
Project Proposal
No ratings yet
Project Proposal
2 pages
C1 W1 Lab02 Model Representation Soln
No ratings yet
C1 W1 Lab02 Model Representation Soln
7 pages
Web Sraping
No ratings yet
Web Sraping
11 pages
Twitter Sentiment Analysis Using Support Vector Machine and Deep Learning Model in E-Learning Implementation During The Covid-19 Outbreak
No ratings yet
Twitter Sentiment Analysis Using Support Vector Machine and Deep Learning Model in E-Learning Implementation During The Covid-19 Outbreak
11 pages
Unveiling The Power: A Comparative Analysis of Data Mining Tools Through Decision Tree Classification On The Bank Marketing Dataset
No ratings yet
Unveiling The Power: A Comparative Analysis of Data Mining Tools Through Decision Tree Classification On The Bank Marketing Dataset
11 pages
Atharva Kale 10..
No ratings yet
Atharva Kale 10..
7 pages
2 - PORTIONS - COMPLETED - WEEKLY - UPDATES - GRADE - 4 - 4th NOV 2024 - 9th NOV 2024
No ratings yet
2 - PORTIONS - COMPLETED - WEEKLY - UPDATES - GRADE - 4 - 4th NOV 2024 - 9th NOV 2024
4 pages
Deep Learning-Based Quality Assessment of 3d Point Clouds Without Reference
No ratings yet
Deep Learning-Based Quality Assessment of 3d Point Clouds Without Reference
6 pages
Good Machine Learning Practice
No ratings yet
Good Machine Learning Practice
8 pages
6 - PORTIONS - COMPLETED - WEEKLY - UPDATES - GRADE - 4 - 2nd DEC 2024 - 6th DEC 2024
No ratings yet
6 - PORTIONS - COMPLETED - WEEKLY - UPDATES - GRADE - 4 - 2nd DEC 2024 - 6th DEC 2024
3 pages
K Nearest Neighbor Algorithm: Fundamentals and Applications
From Everand
K Nearest Neighbor Algorithm: Fundamentals and Applications
Fouad Sabry
No ratings yet