0% found this document useful (0 votes)

21 views17 pages

Image Classifaction

The document describes using R code to classify images into two groups, IMCU and MS, using k-nearest neighbors (KNN) and support vector machine (SVM) models. The code loads image data from two directories, preprocesses the images by converting to grayscale, resizing, and converting pixels to numeric data. It combines the data and applies KNN and SVM classifiers. The KNN model achieves 81% accuracy while the SVM model perfectly classifies all images, indicating it is a good classifier for this task.

Uploaded by

mk10oct

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views17 pages

Image Classifaction

Uploaded by

mk10oct

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 17

Image Classifaction

Dr Manohar Kapse
1 April 2019

# classification of Image into two group

# Library raster, rasterimage

rm(list=ls())

library(imager)

## Loading required package: magrittr

##
## Attaching package: 'imager'

## The following object is masked from 'package:magrittr':

##
## add

## The following objects are masked from 'package:stats':

##
## convolve, spectrum

## The following object is masked from 'package:graphics':

##
## frame

## The following object is masked from 'package:base':

##
## save.image
# import images from Directory or load images of IMCU faculty members
IMCU.Images<- load.dir(path="C:/Users/LENOVO/Desktop/Image classification/institute of Management", pattern=".jpg")
#str(IMCU.Images)
# plot(IMCU.Images[1])

# Use for loop

#--------------------------------------------#
# convert image into gray scale
for (i in 1:length(IMCU.Images))
{
IMCU.Images[[i]]<- grayscale(IMCU.Images[[i]])
}

#str(IMCU.Images)
class(IMCU.Images)

## [1] "imlist" "list"

# plot(IMCU.Images[[1]])

#--------------------------------------------#
# conver image to same size- rescale
for (i in 1:length(IMCU.Images))
{
IMCU.Images[[i]]<-resize(IMCU.Images[[i]], size_x = 100, size_y = 100, size_z = 1, size_c = 1)
}

IMCU.Images

## Image list of size 66

#str(IMCU.Images)
class(IMCU.Images)
## [1] "imlist" "list"

#plot(IMCU.Images[[1]])

#-------------------------------------------------#

# save the each image pixel data as numeric

for (i in 1:length(IMCU.Images))
{
IMCU.Images[[i]]<-as.numeric(IMCU.Images[[i]]) # convert to number
}

#str(IMCU.Images)
class(IMCU.Images)

## [1] "imlist" "list"

#-------------------------------------------------#
# convert data into data frame

IMCU.Images.data<-as.data.frame(IMCU.Images)
str(IMCU.Images.data)

## 'data.frame': 660000 obs. of 2 variables:

## $ im: chr "E1125.jpg" "E1125.jpg" "E1125.jpg" "E1125.jpg" ...
## $ v : num 1 1 1 1 1 1 1 1 1 1 ...

#---------------------------------------------#
# adding unique ids to the data,
# since we know each image has 100*100 points

IMCU.Images.data$id<-seq(1:10000)
str(IMCU.Images.data)
## 'data.frame': 660000 obs. of 3 variables:
## $ im: chr "E1125.jpg" "E1125.jpg" "E1125.jpg" "E1125.jpg" ...
## $ v : num 1 1 1 1 1 1 1 1 1 1 ...
## $ id: int 1 2 3 4 5 6 7 8 9 10 ...

#---------------------------------#
# add grouping variable to the data set
IMCU.Images.data$group1<-"imcu"
str(IMCU.Images.data)

## 'data.frame': 660000 obs. of 4 variables:

## $ im : chr "E1125.jpg" "E1125.jpg" "E1125.jpg" "E1125.jpg" ...
## $ v : num 1 1 1 1 1 1 1 1 1 1 ...
## $ id : int 1 2 3 4 5 6 7 8 9 10 ...
## $ group1: chr "imcu" "imcu" "imcu" "imcu" ...

IMCU.Images.data$group1<-as.factor(IMCU.Images.data$group1)

# rearrange the data

IMCU.Images.data<-IMCU.Images.data[,c("id","group1","im","v")]
str(IMCU.Images.data)

## 'data.frame': 660000 obs. of 4 variables:

## $ id : int 1 2 3 4 5 6 7 8 9 10 ...
## $ group1: Factor w/ 1 level "imcu": 1 1 1 1 1 1 1 1 1 1 ...
## $ im : chr "E1125.jpg" "E1125.jpg" "E1125.jpg" "E1125.jpg" ...
## $ v : num 1 1 1 1 1 1 1 1 1 1 ...

#IMCU.Images.data

#----------------------------#
# since the data created is a single col with all pixel positions
# converting 10000 pixels address as variables

library(tidyr)
##
## Attaching package: 'tidyr'

## The following object is masked from 'package:imager':

##
## fill

## The following object is masked from 'package:magrittr':

##
## extract

IMCU.Images.data.1<-spread(IMCU.Images.data, id, v)
#str(IMCU.Images.data.1)

now create a data set for the other department Management Science

# import images from Directory or load images of IMCU faculty members

MS.Images<- load.dir(path="C:/Users/LENOVO/Desktop/Image classification/management studies", pattern=".jpg")
#str(MS.Images)
#plot(MS.Images[1])

# Use for loop

#--------------------------------------------#
# convert image into gray scale
for (i in 1:length(MS.Images))
{
MS.Images[[i]]<- grayscale(MS.Images[[i]])
}

#str(MS.Images)
class(MS.Images)

## [1] "imlist" "list"

#--------------------------------------------#
# conver image to same size- rescale
for (i in 1:length(MS.Images))
{
MS.Images[[i]]<-resize(MS.Images[[i]], size_x = 100, size_y = 100, size_z = 1, size_c = 1)
}

MS.Images

## Image list of size 40

#str(MS.Images)
class(MS.Images)

## [1] "imlist" "list"

# plot(MS.Images[[1]])

#-------------------------------------------------#

# save the each image pixel data as numeric

for (i in 1:length(MS.Images))
{
MS.Images[[i]]<-as.numeric(MS.Images[[i]]) # convert to number
}

#str(MS.Images)
class(MS.Images)

## [1] "imlist" "list"

#-------------------------------------------------#
# convert data into data frame

MS.Images.data<-as.data.frame(MS.Images)

#---------------------------------------------#
# adding unique ids to the data,
# since we know each image has 100*100 points

MS.Images.data$id<-seq(1:10000)
str(MS.Images.data)

## 'data.frame': 400000 obs. of 3 variables:

## $ im: chr "E1247.jpg" "E1247.jpg" "E1247.jpg" "E1247.jpg" ...
## $ v : num 0.922 0.941 0.945 0.937 0.941 ...
## $ id: int 1 2 3 4 5 6 7 8 9 10 ...

#---------------------------------#
# add grouping variable to the data set
MS.Images.data$group1<-"MS"
str(MS.Images.data)

## 'data.frame': 400000 obs. of 4 variables:

## $ im : chr "E1247.jpg" "E1247.jpg" "E1247.jpg" "E1247.jpg" ...
## $ v : num 0.922 0.941 0.945 0.937 0.941 ...
## $ id : int 1 2 3 4 5 6 7 8 9 10 ...
## $ group1: chr "MS" "MS" "MS" "MS" ...

MS.Images.data$group1<-as.factor(MS.Images.data$group1)

# rearrange the data

MS.Images.data<-MS.Images.data[,c("id","group1","im","v")]
str(MS.Images.data)
## 'data.frame': 400000 obs. of 4 variables:
## $ id : int 1 2 3 4 5 6 7 8 9 10 ...
## $ group1: Factor w/ 1 level "MS": 1 1 1 1 1 1 1 1 1 1 ...
## $ im : chr "E1247.jpg" "E1247.jpg" "E1247.jpg" "E1247.jpg" ...
## $ v : num 0.922 0.941 0.945 0.937 0.941 ...

# MS.Images.data

#----------------------------#
# since the data created is a single col with all pixel positions
# converting 10000 pixels address as variables

library(tidyr)
MS.Images.data.1<-spread(MS.Images.data, id, v)
#str(MS.Images.data.1)

combine the two data set created

CU.images.data<-rbind(IMCU.Images.data.1, MS.Images.data.1)
# str(CU.images.data)

apply model for classification

apply the knn on the whole data
# remove the variable im
CU.images.data<-CU.images.data[,-2]
# use caret package for KNN
library(caret)

## Loading required package: lattice

## Loading required package: ggplot2

fitControl = trainControl(method="cv")

knnMod2 = train(group1 ~ ., data=CU.images.data,

method="knn",
trControl=fitControl,
preProcess=c("center","scale"),
tuneLength=5)

summary(knnMod2)

## Length Class Mode

## learn 2 -none- list
## k 1 -none- numeric
## theDots 0 -none- list
## xNames 10000 -none- character
## problemType 1 -none- character
## tuneValue 1 data.frame list
## obsLevels 2 -none- character
## param 0 -none- list

print(knnMod2)
## k-Nearest Neighbors
##
## 106 samples
## 10000 predictors
## 2 classes: 'imcu', 'MS'
##
## Pre-processing: centered (10000), scaled (10000)
## Resampling: Cross-Validated (10 fold)
## Summary of sample sizes: 96, 95, 96, 95, 95, 96, ...
## Resampling results across tuning parameters:
##
## k Accuracy Kappa
## 5 0.6754545 0.3341953
## 7 0.6690909 0.3081981
## 9 0.6300000 0.2157474
## 11 0.6209091 0.1961218
## 13 0.6127273 0.1482331
##
## Accuracy was used to select the optimal model using the largest value.
## The final value used for the model was k = 5.

plot(knnMod2)
pred = predict(knnMod2, newdata=CU.images.data)
confusionMatrix(pred, CU.images.data[,1])
## Confusion Matrix and Statistics
##
## Reference
## Prediction imcu MS
## imcu 56 10
## MS 10 30
##
## Accuracy : 0.8113
## 95% CI : (0.7238, 0.8808)
## No Information Rate : 0.6226
## P-Value [Acc > NIR] : 2.122e-05
##
## Kappa : 0.5985
## Mcnemar's Test P-Value : 1
##
## Sensitivity : 0.8485
## Specificity : 0.7500
## Pos Pred Value : 0.8485
## Neg Pred Value : 0.7500
## Prevalence : 0.6226
## Detection Rate : 0.5283
## Detection Prevalence : 0.6226
## Balanced Accuracy : 0.7992
##
## 'Positive' Class : imcu
##

—————————————————-
SUpport vector Machine
library(e1071)

dtm1<-svm(group1~., data = CU.images.data,kernel = "linear",scale = TRUE)

summary(dtm1)
##
## Call:
## svm(formula = group1 ~ ., data = CU.images.data, kernel = "linear",
## scale = TRUE)
##
##
## Parameters:
## SVM-Type: C-classification
## SVM-Kernel: linear
## cost: 1
## gamma: 1e-04
##
## Number of Support Vectors: 85
##
## ( 50 35 )
##
##
## Number of Classes: 2
##
## Levels:
## imcu MS

#dtm1$SV
#dtm1$kernel
#dtm1$tot.nSV
#dtm1$decision.values
#dtm1$fitted
#dtm1$coefs

# to check is it a good classifier we will use confusion matrix

predict1<-predict(dtm1,CU.images.data)
confusionMatrix(predict1,CU.images.data$group1)
## Confusion Matrix and Statistics
##
## Reference
## Prediction imcu MS
## imcu 66 0
## MS 0 40
##
## Accuracy : 1
## 95% CI : (0.9658, 1)
## No Information Rate : 0.6226
## P-Value [Acc > NIR] : < 2.2e-16
##
## Kappa : 1
## Mcnemar's Test P-Value : NA
##
## Sensitivity : 1.0000
## Specificity : 1.0000
## Pos Pred Value : 1.0000
## Neg Pred Value : 1.0000
## Prevalence : 0.6226
## Detection Rate : 0.6226
## Detection Prevalence : 0.6226
## Balanced Accuracy : 1.0000
##
## 'Positive' Class : imcu
##

————————————————————-
Predicting for image out of data set
test data set
import images from Directory or load images of IMCU
faculty members
test.Images<- load.dir(path="C:/Users/LENOVO/Desktop/Image classification/test", pattern=".jpg")

# convert image into gray scale

for (i in 1:length(test.Images))
{
test.Images[[i]]<- grayscale(test.Images[[i]])
}

# conver image to same size- rescale

for (i in 1:length(test.Images))
{
test.Images[[i]]<-resize(test.Images[[i]], size_x = 100, size_y = 100, size_z = 1, size_c = 1)
}
# save the each image pixel data as numeric

for (i in 1:length(test.Images))
{
test.Images[[i]]<-as.numeric(test.Images[[i]]) # convert to number
}

#-------------------------------------------------#
# convert data into data frame

test.Images.data<-as.data.frame(test.Images)

#---------------------------------------------#
# adding unique ids to the data,
# since we know each image has 100*100 points

test.Images.data$id<-seq(1:10000)

#---------------------------------#
# add grouping variable to the data set
test.Images.data$group1<-"test"
test.Images.data$group1<-as.factor(test.Images.data$group1)

# rearrange the data

test.Images.data<-test.Images.data[,c("id","group1","im","v")]
#----------------------------#
# converting 10000 pixels address as variables

library(tidyr)

test.Images.data.1<-spread(test.Images.data, id, v)
#str(test.Images.data.1)
test.Images.data.1<-test.Images.data.1[,-2]

# to check is it a good classifier we will use confusion matrix

predict1<-predict(dtm1,test.Images.data.1)
predict1

## 1 2 3 4
## imcu imcu imcu imcu
## Levels: imcu MS

———————————————-
Random Forest tree
takes lot of time - Not useful

Map Assign 8
No ratings yet
Map Assign 8
7 pages
Grid Search For KNN
No ratings yet
Grid Search For KNN
17 pages
SVM K NN MLP With Sklearn Jupyter NoteBo
No ratings yet
SVM K NN MLP With Sklearn Jupyter NoteBo
22 pages
Grid Search For SVM
No ratings yet
Grid Search For SVM
9 pages
Analysis Course HW2
No ratings yet
Analysis Course HW2
13 pages
Da Thoery
No ratings yet
Da Thoery
24 pages
Da 06-10
No ratings yet
Da 06-10
14 pages
Chenhao HW1
No ratings yet
Chenhao HW1
5 pages
Assignment 11-17-15: Michael Petzold November 19, 2015
No ratings yet
Assignment 11-17-15: Michael Petzold November 19, 2015
4 pages
ISYE6501 Homework 2
No ratings yet
ISYE6501 Homework 2
11 pages
Practical Machine Learning
No ratings yet
Practical Machine Learning
11 pages
Mla - 2 (Cia - 1) - 20221013
No ratings yet
Mla - 2 (Cia - 1) - 20221013
14 pages
R Assignment
No ratings yet
R Assignment
8 pages
A008 - KNN.R: # Load The Dataset
No ratings yet
A008 - KNN.R: # Load The Dataset
4 pages
Final Data Lab
No ratings yet
Final Data Lab
21 pages
Vighnesh - S Log 13
No ratings yet
Vighnesh - S Log 13
4 pages
Predicting Earnings Manipulation - FinalDoc
No ratings yet
Predicting Earnings Manipulation - FinalDoc
29 pages
Ebay Auction Case Solution
No ratings yet
Ebay Auction Case Solution
9 pages
Matlab Code:: All 'Train - CSV' 'Test - Org - CSV' 'Testme - CSV'
No ratings yet
Matlab Code:: All 'Train - CSV' 'Test - Org - CSV' 'Testme - CSV'
3 pages
Week 10 Abhishek Srivastava VFinal
No ratings yet
Week 10 Abhishek Srivastava VFinal
14 pages
Assigmnent 3 (Data Mining)
No ratings yet
Assigmnent 3 (Data Mining)
18 pages
Da Exp9,10
No ratings yet
Da Exp9,10
9 pages
Implementation
No ratings yet
Implementation
14 pages
ISYE 6501 Georgia Tech Hmwk3.1a
No ratings yet
ISYE 6501 Georgia Tech Hmwk3.1a
4 pages
R Course - Part7 ML - Exercise Sheet 2024
No ratings yet
R Course - Part7 ML - Exercise Sheet 2024
8 pages
ML RECORD EX 5,6,7,8,9 (Without Border)
No ratings yet
ML RECORD EX 5,6,7,8,9 (Without Border)
13 pages
DATAMINING
No ratings yet
DATAMINING
24 pages
R Lab Program
No ratings yet
R Lab Program
20 pages
G 203008076 - 4 - Christhian Quiñonez - Ex1 - 2 A PDF
No ratings yet
G 203008076 - 4 - Christhian Quiñonez - Ex1 - 2 A PDF
20 pages
Shark Tank Deal Prediction - Uudhya - Dec 2019
No ratings yet
Shark Tank Deal Prediction - Uudhya - Dec 2019
16 pages
BDA Lab Manual (12 Weeks)
No ratings yet
BDA Lab Manual (12 Weeks)
22 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
26 pages
Data604 Sravani FinalCombined
No ratings yet
Data604 Sravani FinalCombined
22 pages
Data604 Final Submission Sravani
No ratings yet
Data604 Final Submission Sravani
21 pages
ISYE6501 Homework 1
No ratings yet
ISYE6501 Homework 1
7 pages
R Fourier
No ratings yet
R Fourier
18 pages
Data Cleaning
No ratings yet
Data Cleaning
4 pages
Question 2.2
No ratings yet
Question 2.2
4 pages
Machine Learning Assignment
No ratings yet
Machine Learning Assignment
8 pages
PCA Codebase
No ratings yet
PCA Codebase
6 pages
K-Nearest Neighbors in MATLAB & Classification Learner App - Machine Learning - @MATLABHelper
No ratings yet
K-Nearest Neighbors in MATLAB & Classification Learner App - Machine Learning - @MATLABHelper
6 pages
Fashion MNIST-6
No ratings yet
Fashion MNIST-6
10 pages
Assignment 1
No ratings yet
Assignment 1
17 pages
22mid0187 ML Lab-5
No ratings yet
22mid0187 ML Lab-5
13 pages
Lab Assignment 3 UCS522: Computer Vision: Thapar Institute of Engineering and Technology Patiala, Punjab
No ratings yet
Lab Assignment 3 UCS522: Computer Vision: Thapar Institute of Engineering and Technology Patiala, Punjab
20 pages
Machine Learning Algorithm
No ratings yet
Machine Learning Algorithm
18 pages
Lecture 3 - MachineLearning-CrashCourse2023
No ratings yet
Lecture 3 - MachineLearning-CrashCourse2023
99 pages
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
Classification
No ratings yet
Classification
4 pages
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
No ratings yet
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
8 pages
Machine Learning Programs
No ratings yet
Machine Learning Programs
10 pages
7708 - MBA PredAnanBigDataNov21
No ratings yet
7708 - MBA PredAnanBigDataNov21
11 pages
DMDW Lab8
No ratings yet
DMDW Lab8
3 pages
Datamining Lab Record
No ratings yet
Datamining Lab Record
36 pages
Solution 1
No ratings yet
Solution 1
6 pages
Practical 6
No ratings yet
Practical 6
8 pages
Learning Book 11 Feb
No ratings yet
Learning Book 11 Feb
322 pages
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Spiral 2020 16-9 PP
No ratings yet
Spiral 2020 16-9 PP
1 page
MAT 2021 Question Paper With Solutions
No ratings yet
MAT 2021 Question Paper With Solutions
33 pages
# Adding One More Categorical Variable-Use Fill
No ratings yet
# Adding One More Categorical Variable-Use Fill
2 pages
Image Classification Using Image
No ratings yet
Image Classification Using Image
50 pages
One Categorical and One Scale Variable X Axis Scale, Y-Axis Categorical
No ratings yet
One Categorical and One Scale Variable X Axis Scale, Y-Axis Categorical
2 pages
Vedant
No ratings yet
Vedant
1 page
Sequence and Series
No ratings yet
Sequence and Series
3 pages
Factor 1
No ratings yet
Factor 1
14 pages
Correlation 2
No ratings yet
Correlation 2
1 page
Nmoup Unit 2
No ratings yet
Nmoup Unit 2
9 pages
Algorithm of Finding Maximum and Minimum Element From An Array
No ratings yet
Algorithm of Finding Maximum and Minimum Element From An Array
1 page
12-IntegerProgramming (Repaired)
No ratings yet
12-IntegerProgramming (Repaired)
9 pages
DAA Unit 1
No ratings yet
DAA Unit 1
106 pages
C G Sample Programs
No ratings yet
C G Sample Programs
26 pages
100 Days of Machine Learning
No ratings yet
100 Days of Machine Learning
45 pages
Divide and Conquer 06 Class Notes PDF
No ratings yet
Divide and Conquer 06 Class Notes PDF
36 pages
CTDL GT
No ratings yet
CTDL GT
8 pages
Mobile Information Systems - 2021 - Liu - Dynamic Adjustment Strategy of Rail Guide Vehicle
No ratings yet
Mobile Information Systems - 2021 - Liu - Dynamic Adjustment Strategy of Rail Guide Vehicle
9 pages
Assignment Unit 2 Problem Solving by Search
No ratings yet
Assignment Unit 2 Problem Solving by Search
2 pages
How To Find A Value in An Array?
No ratings yet
How To Find A Value in An Array?
33 pages
3.6 Single Source Shortest Paths
No ratings yet
3.6 Single Source Shortest Paths
5 pages
CLIQUE Algorithm Grid-Based Subspace Clustering
No ratings yet
CLIQUE Algorithm Grid-Based Subspace Clustering
10 pages
Eversign Document Hash
No ratings yet
Eversign Document Hash
7 pages
Os Final Project VM
No ratings yet
Os Final Project VM
13 pages
ML QB (Vtu)
No ratings yet
ML QB (Vtu)
6 pages
Example-35: Solve The Following Non-Linear Programming Problem Using Kuhn
No ratings yet
Example-35: Solve The Following Non-Linear Programming Problem Using Kuhn
17 pages
Solved Examples For Chapter 19
No ratings yet
Solved Examples For Chapter 19
7 pages
Octatrack MKII Gain Staging
No ratings yet
Octatrack MKII Gain Staging
1 page
Gujarat Technological University
No ratings yet
Gujarat Technological University
2 pages
Question Paper Code: Electronics and Communication Engineering EC 6501 - Digital Communication
No ratings yet
Question Paper Code: Electronics and Communication Engineering EC 6501 - Digital Communication
3 pages
Ali DSP Lab4Report.
No ratings yet
Ali DSP Lab4Report.
17 pages
Stability
No ratings yet
Stability
20 pages
DC Tutorial Sheet 1
No ratings yet
DC Tutorial Sheet 1
2 pages
Algorithm Questionbank
No ratings yet
Algorithm Questionbank
9 pages
Class - 03 Convolution Discrete PDF
No ratings yet
Class - 03 Convolution Discrete PDF
21 pages
Adaptive Intensity Transformation
No ratings yet
Adaptive Intensity Transformation
1 page
Loyd Lesson Plan1
No ratings yet
Loyd Lesson Plan1
4 pages
VV in CFD 2016
No ratings yet
VV in CFD 2016
11 pages
9-Error Detection and Correction-21!01!2022 (21-Jan-2022) Material I 21-01-2022 Error Detection - Correction-Up
No ratings yet
9-Error Detection and Correction-21!01!2022 (21-Jan-2022) Material I 21-01-2022 Error Detection - Correction-Up
56 pages