0% found this document useful (0 votes)

2 views

Lecture 11

Uploaded by

Kawtar Dakham

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views

Lecture 11

Uploaded by

Kawtar Dakham

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 35

Kernels'(SVMs,'Logistic'

Regression)

Aarti&Singh

Machine&Learning&101315
Oct&2,&2019
Constrained+optimization+– dual+problem

Primal+problem:

b++ve

Moving+the+constraint+to+objective+function
Lagrangian:

If$strong$duality$holds,$then$d*$=$p*$ Dual+problem:
and$x*,$!*$satisfy$KKT$conditions$
including
!*(x*<b)$=$0 2
Dual%SVM%– linearly%separable%case
n'training'points,'d'features (x1,'…,'xn)'where'xi is'a'd?dimensional'
vector'

• Primal'problem:

w – weights on features (d-dim problem)

• Dual'problem'(derivation):

! – weights on training pts (n-dim problem)

3
Dual%SVM%– linearly%separable%case

Dual%problem%is%also%QP
Solution%gives%!js

Use%support%vectors%with%!k>0%to%
compute%b%since%constraint%is%tight%
(w.xk +%b)yk =%1 4
Dual%SVM%– non,separable%case
• Primal(problem:
,{ξj}(

Lagrange%
• Dual(problem:(( Multipliers

,{ξj}( L(w, b, ⇠, ↵, µ)

5
Dual%SVM%– non,separable%case

comes&from
@L Intuition:
=0 If&C→∞,&recover&hard@margin&SVM
@⇠

Dual&problem&is&also&QP
Solution&gives&!js
6
So#why#solve#the#dual#SVM?
• There%are%some%quadratic%programming%
algorithms%that%can%solve%the%dual%faster%than%
the%primal,%(specially%in%high%dimensions%d>>n)

• But,%more%importantly,%the%“kernel#trick”!!!

7
Separable(using(higher/order(features

x2 !

x1 r&=&√x12+x22

x12

8
x1
What%if%data%is%not%linearly%separable?
Use%features%of%features%
of%features%of%features….

Φ(x)(=((x12,(x22,(x1x2,(….,(exp(x1))

Feature(space(becomes(really(large(very(quickly!
9
Higher'Order'Polynomials
m$– input$features$ d$– degree$of$polynomial

grows$fast!
d$=$6,$m$=$100
about$1.6$billion$terms

10
Dual%formulation%only%depends%on%
dot2products,%not%on%w!

Φ(x)%– High+dimensional%feature%space,%but%never%need%it%explicitly%as%long%
as%we%can%compute%the%dot%product%fast%using%some%Kernel%K
11
Dot$Product$of$Polynomials

d=1

d=2

d 12
Finally:(The(Kernel(Trick!

• Never'represent'features'explicitly
– Compute'dot'products'in'closed'
form

• Constant8time'high8dimensional'dot8
products'for'many'classes'of'features

13
Common%Kernels
• Polynomials,of,degree,d

• Polynomials,of,degree,up,to,d

• Gaussian/Radial,kernels,(polynomials,of,all,orders,– recall,
series,expansion,of,exp)

• Sigmoid

14
Mercer%Kernels
What'functions'are'valid'kernels'that'correspond'to'feature'
vectors'!(x)?

Answer:'Mercer'kernels'K
• K'is'continuous'
• K'is'symmetric
• K'is'positive'semi?definite,'i.e.''xTKx ≥'0'for'all'x

15
Overfitting
• Huge'feature'space'with'kernels,'what'about'
overfitting???
– Maximizing'margin'leads'to'sparse'set'of'support'
vectors'
– Some'interesting'theory'says'that'SVMs'search'for'
simple'hypothesis'with'large'margin
– Often'robust'to'overfitting

16
What%about%classification%time?
• For&a&new&input&x,&if&we&need&to&represent&!(x),&we&are&in&trouble!
• Recall&classifier:&sign(w.!(x)+b)

• Using&kernels&we&are&cool!

17
SVMs%with%Kernels
• Choose(a(set(of(features(and(kernel(function
• Solve(dual(problem(to(obtain(support(vectors(!i
• At(classification(time,(compute:

Classify%as

18
SVMs%with%Kernels
• Iris%dataset,%2%vs 13,%Linear%Kernel

19
SVMs%with%Kernels
• Iris%dataset,%1%vs 23,%Polynomial%Kernel%degree%2

20
SVMs%with%Kernels
• Iris%dataset,%1%vs 23,%Gaussian%RBF%kernel

21
SVMs%with%Kernels
• Iris%dataset,%1%vs 23,%Gaussian%RBF%kernel

22
SVMs%with%Kernels
• Chessboard*dataset,*Gaussian*RBF*kernel

23
SVMs%with%Kernels
• Chessboard*dataset,*Polynomial*kernel

24
Corel&Dataset

25
Corel&Dataset

Olivier)Chapelle 1998 26
USPS$Handwritten$digits

27
SVMs%vs.%Logistic%Regression
SVMs Logistic
Regression
Loss/function Hinge&loss Log+loss

28
SVMs%vs.%Logistic%Regression
SVM : Hinge%loss

Logistic.Regression :.Log%loss% (.4ve log.conditional.likelihood)

Log%loss Hinge%loss

051%loss

51 0 1
29
SVMs%vs.%Logistic%Regression
SVMs Logistic
Regression
Loss/function Hinge&loss Log+loss

High/dimensional/ Yes! Yes!

features/with/
kernels
Solution/sparse Often&yes! Almost&always&no!

Semantics/of/ “Margin” Real&probabilities

output
30
Kernels'in'Logistic'Regression

• Define(weights(in(terms(of(features:

• Derive(simple(gradient(descent(rule(on(!i 31
SVMs%vs.%Logistic%Regression
SVMs Logistic
Regression
Loss/function Hinge&loss Log+loss

High/dimensional/ Yes! Yes!

features/with/
kernels
Solution/sparse Often&yes! Almost&always&no!

Semantics/of/ “Margin” Real&probabilities

output
32
SVMs%vs.%Logistic%Regression
SVMs Logistic
Regression
Loss/function Hinge&loss Log+loss

High/dimensional/ Yes! Yes!

features/with/
kernels
Solution/sparse Often&yes! Almost&always&no!

Semantics/of/ “Margin” Real&probabilities

output
33
SVMs%vs.%Logistic%Regression
SVMs Logistic
Regression
Loss/function Hinge&loss Log+loss

High/dimensional/ Yes! Yes!

features/with/
kernels
Solution/sparse Often&yes! Almost&always&no!

Semantics/of/ “Margin” Real&probabilities

output
34
What%you%need%to%know
• Maximizing)margin
• Derivation)of)SVM)formulation
• Slack)variables)and)hinge)loss
• Relationship)between)SVMs)and)logistic)regression
– 0/1)loss
– Hinge)loss
– Log)loss
• Tackling)multiple)class
– One)against)All
– Multiclass SVMs
• Dual)SVM)formulation
– Easier to solve)when dimension high)d >)n
– Kernel Trick 35

2 LinearRegression2
No ratings yet
2 LinearRegression2
45 pages
Lecture 3 - MachineLearning-CrashCourse2023
No ratings yet
Lecture 3 - MachineLearning-CrashCourse2023
99 pages
Handout 03 Classic Classifiers
No ratings yet
Handout 03 Classic Classifiers
39 pages
Numerical Computation Presentation
No ratings yet
Numerical Computation Presentation
34 pages
CMPE 442 Introduction To Machine Learning: Support Vector Machines
No ratings yet
CMPE 442 Introduction To Machine Learning: Support Vector Machines
64 pages
Feature Selection For SVMS: by J. Weston, S. Mukherjee, O. Chapelle, M. Pontil, T. Poggio, V. Vapnik
No ratings yet
Feature Selection For SVMS: by J. Weston, S. Mukherjee, O. Chapelle, M. Pontil, T. Poggio, V. Vapnik
19 pages
TensorFlow With R
No ratings yet
TensorFlow With R
46 pages
SVM Assignment ABA Course To Be Returned With Your Answers
No ratings yet
SVM Assignment ABA Course To Be Returned With Your Answers
10 pages
ML cheat sheet(1)
No ratings yet
ML cheat sheet(1)
2 pages
Curvefitting PDF
No ratings yet
Curvefitting PDF
6 pages
abstract data structures
No ratings yet
abstract data structures
22 pages
Regularization For Deep Learning: Tsz-Chiu Au Chiu@unist - Ac.kr
No ratings yet
Regularization For Deep Learning: Tsz-Chiu Au Chiu@unist - Ac.kr
100 pages
Sesion4
No ratings yet
Sesion4
37 pages
Machine Learning
No ratings yet
Machine Learning
45 pages
ML.1.Lecture.9 (Where It Actually Comes From)
No ratings yet
ML.1.Lecture.9 (Where It Actually Comes From)
31 pages
Matlab Tutorial
No ratings yet
Matlab Tutorial
42 pages
Hands-On Machine Learning: Chapter 5: Support Vector Machines
No ratings yet
Hands-On Machine Learning: Chapter 5: Support Vector Machines
32 pages
Divide
No ratings yet
Divide
35 pages
Lecture3_Linear Regression and Logistic Regression
No ratings yet
Lecture3_Linear Regression and Logistic Regression
60 pages
PSP
No ratings yet
PSP
45 pages
Matlab Optimization Toolbox Optimtool
No ratings yet
Matlab Optimization Toolbox Optimtool
77 pages
Numberical Methods For Civil Engineers
No ratings yet
Numberical Methods For Civil Engineers
182 pages
Memory-Based Learning: ENPM808F: Robot Learning Summer 2017
No ratings yet
Memory-Based Learning: ENPM808F: Robot Learning Summer 2017
56 pages
ML4 Linear Models
No ratings yet
ML4 Linear Models
34 pages
Atc Lecture Tyliu
No ratings yet
Atc Lecture Tyliu
48 pages
2-7 Linear Programming
No ratings yet
2-7 Linear Programming
15 pages
Lec 10 SVM
No ratings yet
Lec 10 SVM
35 pages
Introduction To Support Vector Machines: BTR Workshop Fall 2006
No ratings yet
Introduction To Support Vector Machines: BTR Workshop Fall 2006
88 pages
SVM1
No ratings yet
SVM1
4 pages
2.3+Value+Function+Approximation
No ratings yet
2.3+Value+Function+Approximation
55 pages
CIS 4526: Foundations of Machine Learning Linear Regression: (Modified From Sanja Fidler)
No ratings yet
CIS 4526: Foundations of Machine Learning Linear Regression: (Modified From Sanja Fidler)
20 pages
esm2024-mizrahi-slides (2)
No ratings yet
esm2024-mizrahi-slides (2)
77 pages
ML Support Vector Machines 2
No ratings yet
ML Support Vector Machines 2
22 pages
Computer Implementation For 1D and 2D Problems: 4.1 MATLAB Code For 1D FEM (Steady1d.m)
No ratings yet
Computer Implementation For 1D and 2D Problems: 4.1 MATLAB Code For 1D FEM (Steady1d.m)
41 pages
BRR Matlab
No ratings yet
BRR Matlab
37 pages
Weight initialization in ANNs
No ratings yet
Weight initialization in ANNs
13 pages
02A-DL2023-NN-basics
No ratings yet
02A-DL2023-NN-basics
52 pages
Introducere in Matlab PDF
No ratings yet
Introducere in Matlab PDF
77 pages
05 AIS302 ANN-Optimization
No ratings yet
05 AIS302 ANN-Optimization
44 pages
6 Lec SVM Kernel
No ratings yet
6 Lec SVM Kernel
36 pages
Lecture 7 - Part A - Mutli Class and Overfitting and Regularization
No ratings yet
Lecture 7 - Part A - Mutli Class and Overfitting and Regularization
43 pages
Lab 4 Classification v.0
No ratings yet
Lab 4 Classification v.0
5 pages
Linear Regression 18may
No ratings yet
Linear Regression 18may
28 pages
A Modern Formatting Library For C++ - Victor Zverovich - CppCon 2017
No ratings yet
A Modern Formatting Library For C++ - Victor Zverovich - CppCon 2017
74 pages
MATLAB Workshop 2022
No ratings yet
MATLAB Workshop 2022
12 pages
SVM
No ratings yet
SVM
36 pages
2.b Applied Machine Learning Secret Sauce - Slides
No ratings yet
2.b Applied Machine Learning Secret Sauce - Slides
41 pages
lec10svm
No ratings yet
lec10svm
35 pages
Bomb Lab
No ratings yet
Bomb Lab
19 pages
SVMs
No ratings yet
SVMs
30 pages
13 PracticalMachineLearning
100% (1)
13 PracticalMachineLearning
84 pages
Summary of New Features in 12.0
No ratings yet
Summary of New Features in 12.0
19 pages
Cs224n 2024 Lecture02 Wordvecs2
No ratings yet
Cs224n 2024 Lecture02 Wordvecs2
45 pages
Introduction To Machine Learning Lecture 2: Linear Regression
No ratings yet
Introduction To Machine Learning Lecture 2: Linear Regression
38 pages
Lec06-PracticalML
No ratings yet
Lec06-PracticalML
40 pages
Introduction Computational Engineering
No ratings yet
Introduction Computational Engineering
80 pages
5-R
No ratings yet
5-R
65 pages
Introduction To Matlab: SIN Sine of Argument in Radians. SIN (X) Is The Sine of The Elements of X. See Also ASIN, SIND
No ratings yet
Introduction To Matlab: SIN Sine of Argument in Radians. SIN (X) Is The Sine of The Elements of X. See Also ASIN, SIND
21 pages
The Mathematical Theory of Relativity
From Everand
The Mathematical Theory of Relativity
Sir Arthur Stanley Eddington
No ratings yet
AP Calculus Flashcards, Fourth Edition: Up-to-Date Review and Practice
From Everand
AP Calculus Flashcards, Fourth Edition: Up-to-Date Review and Practice
Barron's Educational Series
No ratings yet
Entertainment Speech
No ratings yet
Entertainment Speech
5 pages
Personal Letter Steven Putera Rejeki XI MIPA 2
No ratings yet
Personal Letter Steven Putera Rejeki XI MIPA 2
6 pages
Lesson 32a, Prefix and Suffix Game, Happy Families
100% (1)
Lesson 32a, Prefix and Suffix Game, Happy Families
6 pages
Class of Service - AT&T
No ratings yet
Class of Service - AT&T
22 pages
I Know Why the Caged Birds Sing by Maya Angelou
No ratings yet
I Know Why the Caged Birds Sing by Maya Angelou
18 pages
Medieval Lit - King Arthur Tales
No ratings yet
Medieval Lit - King Arthur Tales
14 pages
Đề thi Chính Thức vào lớp 10 môn Tiếng Anh Đà Nẵng 2014 có đáp án
No ratings yet
Đề thi Chính Thức vào lớp 10 môn Tiếng Anh Đà Nẵng 2014 có đáp án
8 pages
11 English Mixed Test Paper 06
No ratings yet
11 English Mixed Test Paper 06
3 pages
An ER Diagram Is A Pictorial Representation of The Information That Can Be Captured by A Database. Such A "Picture" Serves Two Purposes
No ratings yet
An ER Diagram Is A Pictorial Representation of The Information That Can Be Captured by A Database. Such A "Picture" Serves Two Purposes
23 pages
Product Data Sheet 6ES7215-1BG40-0XB0: General Information Engineering With
No ratings yet
Product Data Sheet 6ES7215-1BG40-0XB0: General Information Engineering With
8 pages
Prophecy in Israel
No ratings yet
Prophecy in Israel
25 pages
Amy Cuddy
No ratings yet
Amy Cuddy
5 pages
Topic 03-BA Platforms
No ratings yet
Topic 03-BA Platforms
24 pages
Ebooks File Starting To Teach Latin 2nd Edition Steven Hunt All Chapters
No ratings yet
Ebooks File Starting To Teach Latin 2nd Edition Steven Hunt All Chapters
41 pages
Hoffman - An Art of Lenses
No ratings yet
Hoffman - An Art of Lenses
7 pages
Graphic Organizers Listening: Tuesday, October 5th 2021
No ratings yet
Graphic Organizers Listening: Tuesday, October 5th 2021
19 pages
GUIDELINES ON EsP ORATORICAL CONTEST
No ratings yet
GUIDELINES ON EsP ORATORICAL CONTEST
5 pages
Advanced Systems Analysis & Design
33% (3)
Advanced Systems Analysis & Design
136 pages
The Heavenly Footman
No ratings yet
The Heavenly Footman
69 pages
Assignment 7
No ratings yet
Assignment 7
2 pages
Stochastic Regular Expressions
No ratings yet
Stochastic Regular Expressions
16 pages
Last Exception
No ratings yet
Last Exception
2 pages
Introduction To Web-Engineering (2+1) CS-106 Labs Topics Checklist
No ratings yet
Introduction To Web-Engineering (2+1) CS-106 Labs Topics Checklist
6 pages
Genesis As A Hidden Source of Manichaeism: Evgenia Moiseeva
No ratings yet
Genesis As A Hidden Source of Manichaeism: Evgenia Moiseeva
14 pages
67769b9b37bb36c93fe60348_##_Operation on Algebraic Expression _ DPP 02 __ Mathematics Olympiad Beginners Program 2025
No ratings yet
67769b9b37bb36c93fe60348_##_Operation on Algebraic Expression _ DPP 02 __ Mathematics Olympiad Beginners Program 2025
3 pages
Hillman Culture and The Animal Soul
No ratings yet
Hillman Culture and The Animal Soul
31 pages
ABLA-R (Folha de Registro)
100% (2)
ABLA-R (Folha de Registro)
6 pages
Android - PayPal Intigration in Android
No ratings yet
Android - PayPal Intigration in Android
8 pages
Computer Science Program File
No ratings yet
Computer Science Program File
24 pages
ourlog_4602
No ratings yet
ourlog_4602
3 pages