Assignment 11-17-15: Michael Petzold November 19, 2015

This document loads libraries and data to perform support vector machine (SVM) classification on handwritten digit recognition. It reads in image and label data, preprocesses it, and splits it into training and test sets. It trains SVMs with different kernels on the data and evaluates the prediction accuracy. The best performing model uses a radial kernel and achieves a prediction accuracy of around 90% on the test set. Parameter tuning is done to find the optimal regularization parameter C value.

Uploaded by

mikey p

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views4 pages

Assignment 11-17-15: Michael Petzold November 19, 2015

Uploaded by

mikey p

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Assignment 11-17-15

Michael Petzold
November 19, 2015
library(dplyr)
##
## Attaching package: 'dplyr'
##
## The following objects are masked from 'package:stats':
##
##
filter, lag
##
## The following objects are masked from 'package:base':
##
##
intersect, setdiff, setequal, union
library(e1071)
images1.df <- read.csv("images1.csv",sep=' ', header=F)
labels1.df <- read.csv("labels1.csv",sep=' ', header=F)
names(labels1.df) <- "digit"
labels1.df <- mutate(labels1.df,digit=factor(digit))
nrow(labels1.df)
## [1] 10000
images2.df <- read.csv("images2.csv",sep=' ', header=F)
labels2.df <- read.csv("labels2.csv",sep=' ', header=F)
names(labels2.df) <- "digit"
labels2.df <- mutate(labels2.df,digit=factor(digit))
nrow(labels2.df)
## [1] 60000
k <- 300
labels1.df[k,]
## [1] 8
## Levels: 0 1 2 3 4 5 6 7 8 9
img <matrix(as.numeric(images1.df[k,]),ncol=28)
img <- img[,28:1]
image(img,col=c("white","black"))

1.0
0.8
0.6
0.4
0.2
0.0
0.0

0.2

0.4

0.6

data1.df <- data.frame(labels1.df,images1.df)

data2.df <- data.frame(labels2.df,images2.df)
k <- 299
labels1.df[k,]
## [1] 2
## Levels: 0 1 2 3 4 5 6 7 8 9
img <matrix(as.numeric(images1.df[k,]),ncol=28)
img <- img[,28:1]
image(img,col=c("white","black"))

0.8

1.0

1.0
0.8
0.6
0.4
0.2
0.0
0.0

0.2

0.4

0.6

0.8

data.df <- data.frame(labels1.df,images1.df)

## labels are response variable
## predictors are the columns in imaging
## 784 predictors of 0's and 1's. From these predictors, can we predict label?
## It takes WAY too long to train on all of data2.df, so we'll take 5000 rows
rows= sample(60000,5000,rep=F)
train.df <- data2.df[rows,]
test.df <- data1.df
C <- 1
svmfitBigC <- svm(digit~.,data=train.df,kernel="linear",cost=C,scale=F)
##
## cross validate to get the optimal value of C
## use different kernels
## use images2 which is much bigger for train data
svmfit <- svmfitBigC
prediction <- predict(svmfit,newdata=test.df)
mean(prediction==test.df$digit)
## [1] 0.9011
## mean of around .8983
## polynomial kernel
svmfitBigC <- svm(digit~.,data=train.df,kernel="polynomial",cost=C,scale=F)
svmfit1 <- svmfitBigC
3

1.0

prediction <- predict(svmfit1,newdata=test.df)

mean(prediction==test.df$digit)
## [1] 0.1248
## really bad, prediction of only .1211. Was there a mistake? Is it 1-.1211?
## That would be more consistent
## radial kernel
svmfitBigC <- svm(digit~.,data=train.df,kernel="radial",cost=C,scale=F)
svmfit2 <- svmfitBigC
prediction <- predict(svmfit2,newdata=test.df)
mean(prediction==test.df$digit)
## [1] 0.9103
## prediction of .9071, seems to be the best predictor.
## test other values of C
c=seq(0,1,length=11)[2:11]
maximum=0
value.of.c <- 0
## this code takes 10 minutes to
# for (i in c){
#
svmfitBigC <- svm(digit~.,data=train.df,kernel="linear",cost=i,scale=F)
#
svmfit <- svmfitBigC
#
prediction <- predict(svmfit,newdata=test.df)
#
predict.rate=mean(prediction==test.df$digit)
#
if (predict.rate>maximum){
#
maximum <- predict.rate
#
value.of.c <- i
#
}
# }
maximum
## [1] 0
## around .9062
value.of.c
## [1] 0
## around .1

Learning Book 11 Feb
No ratings yet
Learning Book 11 Feb
322 pages
Supervised Learning
100% (1)
Supervised Learning
15 pages
2021 UNAS REFER Rafi Yon Saputra 173112706420242 Kernel Primer
No ratings yet
2021 UNAS REFER Rafi Yon Saputra 173112706420242 Kernel Primer
65 pages
Project
No ratings yet
Project
16 pages
Analysis Using Statistical: Introduction & Data Exploration
No ratings yet
Analysis Using Statistical: Introduction & Data Exploration
23 pages
Matlab Homework Experts 2
No ratings yet
Matlab Homework Experts 2
10 pages
R Assignment
No ratings yet
R Assignment
8 pages
Da Lab File
No ratings yet
Da Lab File
33 pages
36-708 Statistical Machine Learning Homework #3 Solutions: DUE: March 29, 2019
No ratings yet
36-708 Statistical Machine Learning Homework #3 Solutions: DUE: March 29, 2019
22 pages
BDA MSC It
No ratings yet
BDA MSC It
35 pages
ModuleAr Merged
No ratings yet
ModuleAr Merged
42 pages
DA Programs
No ratings yet
DA Programs
44 pages
Lab Manual - DSR
No ratings yet
Lab Manual - DSR
32 pages
Image Classifaction
No ratings yet
Image Classifaction
17 pages
Machine Learning Project Checklist
No ratings yet
Machine Learning Project Checklist
30 pages
Vighnesh - S Log 13
No ratings yet
Vighnesh - S Log 13
4 pages
Saurabh
No ratings yet
Saurabh
22 pages
Da Thoery
No ratings yet
Da Thoery
24 pages
Applied Statistics MAT1011
No ratings yet
Applied Statistics MAT1011
22 pages
R Examples
No ratings yet
R Examples
56 pages
R Program
No ratings yet
R Program
22 pages
BDA Lab Manual (12 Weeks)
No ratings yet
BDA Lab Manual (12 Weeks)
22 pages
Analysis Course HW2
No ratings yet
Analysis Course HW2
13 pages
ISYE6501 HW1 Kevin
No ratings yet
ISYE6501 HW1 Kevin
7 pages
Da Lab It
No ratings yet
Da Lab It
20 pages
Data Science
No ratings yet
Data Science
15 pages
Final Cost Practical
No ratings yet
Final Cost Practical
29 pages
Model 1
No ratings yet
Model 1
14 pages
R Codes
No ratings yet
R Codes
23 pages
20mia1032 A Sri Karthik - Lab - Assessment
No ratings yet
20mia1032 A Sri Karthik - Lab - Assessment
6 pages
ISYE6501 Homework 2
No ratings yet
ISYE6501 Homework 2
11 pages
Da Lab File 2
No ratings yet
Da Lab File 2
13 pages
R File Code
No ratings yet
R File Code
16 pages
Cost Practical
No ratings yet
Cost Practical
13 pages
Data Science Using R
No ratings yet
Data Science Using R
11 pages
ISYE6501 Homework 1
No ratings yet
ISYE6501 Homework 1
7 pages
7708 - MBA PredAnanBigDataNov21
No ratings yet
7708 - MBA PredAnanBigDataNov21
11 pages
Model Lab
No ratings yet
Model Lab
6 pages
R Functions
No ratings yet
R Functions
8 pages
Solution 1
No ratings yet
Solution 1
6 pages
Map Assign 8
No ratings yet
Map Assign 8
7 pages
Grid Search For SVM
No ratings yet
Grid Search For SVM
9 pages
A Short List of The Most Useful R Commands
No ratings yet
A Short List of The Most Useful R Commands
11 pages
R Syntax Examples 1
No ratings yet
R Syntax Examples 1
6 pages
Rstudio Study Notes For PA 20181126
No ratings yet
Rstudio Study Notes For PA 20181126
6 pages
STAT-2450 Assignment 1: Name:, Student ID: B00
No ratings yet
STAT-2450 Assignment 1: Name:, Student ID: B00
9 pages
Unit - 3 Learning Notes
No ratings yet
Unit - 3 Learning Notes
8 pages
A Short List of The Most Useful R Commands
No ratings yet
A Short List of The Most Useful R Commands
8 pages
R Console
No ratings yet
R Console
6 pages
KNN - Model: Train Test CL K
No ratings yet
KNN - Model: Train Test CL K
2 pages
Question 2.2
No ratings yet
Question 2.2
2 pages
Solution 2.2
No ratings yet
Solution 2.2
4 pages
Praktikum Modul 3
No ratings yet
Praktikum Modul 3
5 pages
Week 1 HW
No ratings yet
Week 1 HW
3 pages
BAN5
No ratings yet
BAN5
2 pages

Assignment 11-17-15: Michael Petzold November 19, 2015

Uploaded by

Assignment 11-17-15: Michael Petzold November 19, 2015

Uploaded by

Assignment 11-17-15

data1.df <- data.frame(labels1.df,images1.df)

data.df <- data.frame(labels1.df,images1.df)

prediction <- predict(svmfit1,newdata=test.df)

You might also like