DSE 2020-21 2nd Sem DL Problem Solving 2.0

This document discusses different optimization techniques for machine learning models, including calculating optimal learning rates for gradient descent on quadratic error functions, weight updates using ordinary gradient descent, momentum method, and RProp (resilient backpropagation). It provides examples of calculating weight updates and convergence for each method on sample error functions. The optimal learning rate that leads to fastest convergence on the given multivariate quadratic error function is 0.125.

Uploaded by

srirams007

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

235 views9 pages

DSE 2020-21 2nd Sem DL Problem Solving 2.0

Uploaded by

srirams007

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 9

Deep Learning

Dr. Sugata Ghosal

BITS [email protected]
Pilani
Pilani Campus
Pilani Campus
BITS
Pilani
Pilani Campus

Worked Out Problems

Optimization
These slides are assembled by the instructor with grateful acknowledgement of the many
others who made their course materials freely available online .
Optimal Learning Rate: Multivariate Diagonal Quadratic
Error Function
Error surface is given by E(x,y,z) = 3x2 +2y2 + 4z2 +6. What is the optimal
learning rate that leads to fastest convergence to the global minimum?

ɳx,opt = 1/6
ɳy,opt = 1/4
ɳz,opt = 1/8

Optimal learning rate =

min(ɳx,opt , ɳy,opt , ɳy,opt ) = 0.125

Largest learning rate for convergence =

min (2ɳx,opt , 2ɳy,opt , 2ɳy,opt) = 0.333
Dependence on learning rate –
Error Minimization

• 1,opt 2,opt

• 2,opt

• 2,opt
Minimization of Quadratic Error Function
Weight Updates – Ordinary Gradient Descent
Weight Updates – Ordinary Gradient Descent

Nestorov
w1_int=1.5+0.9x.5=1.95 w2_inter=2.0+0.9*1=2.9
dE/dw1(w1_int,w2_int)=0.5x(1.95-3)-(2.9-4)/6=-0.342
dE/dw2(w1_int,w2_int)=2/9x(2.9-4)-(1.95-3)/6=-0.0694
W1(t+1)=1.95+0.3*0.342=2.0526 w2(t+1)=2.9+0.3x0.0694=2.92
Weight Updates – Momentum Method

w2(t+1)= 2.058+0.9*(2.0-1.0)=2.958

Assume, α = 1.5, β = 0.6

What will be (w1,w2) at (t+1)?

At time t-1,
dE/dw1 =0.5*(1-3)-(1-4)/6=-0.5
dE/w2=2/9*(1-4)-(1- 3)/6=-0.333

At time t,
dE/dw1 =0.5*(1.5-3)-(2.0-4)/6=0.4167
dE/w2=2/9*(2-4)-(1.5- 3)/6=-0.194

Delta w1 = 1.5-1 =0.5 Delta w2 = 2-1=1

w1(t+1)= 1+0.5*0.6 = 1.3, sign of derivation became different

w2(t+1)= 2.0+1.5*1=3.5, sign of derivative remained same

Controlability & Reachability
No ratings yet
Controlability & Reachability
3 pages
Text Book
No ratings yet
Text Book
2 pages
LoRA Retains More
No ratings yet
LoRA Retains More
3 pages
Artificial Intelligence - KCS701 - 2022-23 - AKTU - Solution - PDF.PDF - Crdownload
No ratings yet
Artificial Intelligence - KCS701 - 2022-23 - AKTU - Solution - PDF.PDF - Crdownload
28 pages
The Datadog Handbook: A Guide to Monitoring, Metrics, and Tracing
From Everand
The Datadog Handbook: A Guide to Monitoring, Metrics, and Tracing
Robert Johnson
No ratings yet
Spring 2024 Project #2
No ratings yet
Spring 2024 Project #2
2 pages
MCQ Soft Computing
No ratings yet
MCQ Soft Computing
23 pages
EXP-1-To Implement Linear Regression
No ratings yet
EXP-1-To Implement Linear Regression
5 pages
Lecture 9 Queing Theory
No ratings yet
Lecture 9 Queing Theory
58 pages
Dsa Lab 01
No ratings yet
Dsa Lab 01
10 pages
Maintenance Engineering 5
No ratings yet
Maintenance Engineering 5
38 pages
Introduction To Data Science
67% (3)
Introduction To Data Science
363 pages
EC8352 - Signals and Systems 2 Marks Q & A
No ratings yet
EC8352 - Signals and Systems 2 Marks Q & A
19 pages
Chemical Elements
No ratings yet
Chemical Elements
1 page
Evaluasi Kinerja Struktur Bangunan Gedung Asrama Tiga Lantai Menggunakan Static Nonlinear Pushover
No ratings yet
Evaluasi Kinerja Struktur Bangunan Gedung Asrama Tiga Lantai Menggunakan Static Nonlinear Pushover
9 pages
Computer Organization and Architecture 10th Edition Stallings Test Bank PDF
No ratings yet
Computer Organization and Architecture 10th Edition Stallings Test Bank PDF
7 pages
REGULA - FALSI METHOD Notes
0% (1)
REGULA - FALSI METHOD Notes
14 pages
Deep Learning - Unit-III Two Marks
100% (1)
Deep Learning - Unit-III Two Marks
3 pages
NLP2 7
No ratings yet
NLP2 7
400 pages
DL Regularization
No ratings yet
DL Regularization
51 pages
PPT6 - Binary Search Tree
No ratings yet
PPT6 - Binary Search Tree
33 pages
DVI Assignment - Construction Analysis
No ratings yet
DVI Assignment - Construction Analysis
3 pages
Human Emotion Detection With Speech Recognition Using Mel-Frequency Cepstral Coefficient and CNN - New
No ratings yet
Human Emotion Detection With Speech Recognition Using Mel-Frequency Cepstral Coefficient and CNN - New
2 pages
Malamud y Turcotte
No ratings yet
Malamud y Turcotte
24 pages
Tutorial Overview of Model Predictive Control
No ratings yet
Tutorial Overview of Model Predictive Control
15 pages
CPM Test - Fadhli Nadhif - Kirana Sekar Arini
No ratings yet
CPM Test - Fadhli Nadhif - Kirana Sekar Arini
2 pages
3) S2 - 19 - ISM - SECTION A - Session 3 - 12th Sept 2020
No ratings yet
3) S2 - 19 - ISM - SECTION A - Session 3 - 12th Sept 2020
65 pages
4) S2 - 19 - ISM - SECTION A - Session 4 - 19th Sept 2020
No ratings yet
4) S2 - 19 - ISM - SECTION A - Session 4 - 19th Sept 2020
43 pages
4) S2-19-ISM-SECTION A - Session 4-19th Sept 2020-Modified
No ratings yet
4) S2-19-ISM-SECTION A - Session 4-19th Sept 2020-Modified
40 pages
Graph Theory
No ratings yet
Graph Theory
18 pages
Ad3501-Dl-Unit 2 Notes
No ratings yet
Ad3501-Dl-Unit 2 Notes
29 pages
SPA Full Course PPTs (9 Files Merged)
No ratings yet
SPA Full Course PPTs (9 Files Merged)
239 pages
SECTION 1 - DSE - Session 1 - 29th August 2020
No ratings yet
SECTION 1 - DSE - Session 1 - 29th August 2020
79 pages
Dapr For NET Developers
No ratings yet
Dapr For NET Developers
129 pages
Lecture-5-HCL-DSE - Sumita Narang-2
No ratings yet
Lecture-5-HCL-DSE - Sumita Narang-2
40 pages
Unit4 DL Final
No ratings yet
Unit4 DL Final
30 pages
Lecture-4-HCL-DSE - Sumita Narang
No ratings yet
Lecture-4-HCL-DSE - Sumita Narang
31 pages
IDS - 3 - Data Analytics - Part-2 - Methodologies - Dantu
No ratings yet
IDS - 3 - Data Analytics - Part-2 - Methodologies - Dantu
60 pages
Lecture-6-HCL-DSE-Sumita Narang
No ratings yet
Lecture-6-HCL-DSE-Sumita Narang
25 pages
Lecture-7-HCL-DSE - Sumita Narang
No ratings yet
Lecture-7-HCL-DSE - Sumita Narang
65 pages
Lecture-1-HCL-DSE - Sumita Narang
No ratings yet
Lecture-1-HCL-DSE - Sumita Narang
42 pages
Lecture-8-HCL-DSE - Sumita Narang
No ratings yet
Lecture-8-HCL-DSE - Sumita Narang
37 pages
Dsecl Zg519-Ec3m PDF
No ratings yet
Dsecl Zg519-Ec3m PDF
3 pages
Technical Note 21
No ratings yet
Technical Note 21
2 pages
ML LAB Mannual-1
No ratings yet
ML LAB Mannual-1
79 pages
Database Design For Dynamic Online Surveys: Conference Paper
No ratings yet
Database Design For Dynamic Online Surveys: Conference Paper
9 pages
Data Structure and Algorithm
No ratings yet
Data Structure and Algorithm
30 pages
A Fast and Elitist Multiobjective Genetic Algorithm: Nsga-Ii
No ratings yet
A Fast and Elitist Multiobjective Genetic Algorithm: Nsga-Ii
16 pages
Architecting Cloud Native NET Apps For Azure
100% (2)
Architecting Cloud Native NET Apps For Azure
195 pages
#Include: STD Selectionsort A N I J Min Temp I I N I Min I J I J N J A J A Min Min J Temp A I A I A Min A Min Temp
No ratings yet
#Include: STD Selectionsort A N I J Min Temp I I N I Min I J I J N J A J A Min Min J Temp A I A I A Min A Min Temp
10 pages
Lecture-1to8-HCL-DSE - Sumita Narang - IDS PDF
No ratings yet
Lecture-1to8-HCL-DSE - Sumita Narang - IDS PDF
304 pages
RAG With Math
No ratings yet
RAG With Math
7 pages
Module2.3 Hyperparameter Optimization
No ratings yet
Module2.3 Hyperparameter Optimization
29 pages
Dsecl Zg519-Ec3r-1 PDF
No ratings yet
Dsecl Zg519-Ec3r-1 PDF
3 pages
Unit 4
No ratings yet
Unit 4
79 pages
Data Mining Comprehensive Exam - Regular PDF
No ratings yet
Data Mining Comprehensive Exam - Regular PDF
3 pages
Data Mining Comprehensive Exam - Regular PDF
No ratings yet
Data Mining Comprehensive Exam - Regular PDF
3 pages
ML Unit-2
No ratings yet
ML Unit-2
26 pages
Data Structures and Algorithms Design (Regular) DSE PDF
No ratings yet
Data Structures and Algorithms Design (Regular) DSE PDF
9 pages
Explain The Issues in Designing Distributed Systems
No ratings yet
Explain The Issues in Designing Distributed Systems
6 pages
C Algorithms For Real-Time DSP - EMBREE
100% (1)
C Algorithms For Real-Time DSP - EMBREE
125 pages
Pattern Recognition Machine Learning: Chapter 1: Introduction
No ratings yet
Pattern Recognition Machine Learning: Chapter 1: Introduction
59 pages
The Floyd-Warshall Algorithm: Andreas Klappenecker
No ratings yet
The Floyd-Warshall Algorithm: Andreas Klappenecker
15 pages
6th Semester Project Poster
No ratings yet
6th Semester Project Poster
1 page
Fundamentals of Kalman Filtering - A Practical Approach
No ratings yet
Fundamentals of Kalman Filtering - A Practical Approach
67 pages
Handwritten Marathi Compound Character PDF
No ratings yet
Handwritten Marathi Compound Character PDF
6 pages
Exponential Convergence Rates For Batch Normalization - 4
No ratings yet
Exponential Convergence Rates For Batch Normalization - 4
1 page
ML Unit-Iv
No ratings yet
ML Unit-Iv
18 pages
Solution Dseclzg524 05-07-2020 Ec3r
No ratings yet
Solution Dseclzg524 05-07-2020 Ec3r
7 pages
ML Unit-3
No ratings yet
ML Unit-3
24 pages
CS 601 Machine Learning Unit 3
No ratings yet
CS 601 Machine Learning Unit 3
37 pages
Unit 4
No ratings yet
Unit 4
4 pages
ML-3-Decision Tree
No ratings yet
ML-3-Decision Tree
17 pages
CS 601 Machine Learning Unit 5
No ratings yet
CS 601 Machine Learning Unit 5
18 pages
Overfitting vs. Underfitting, Bias vs. Variance
No ratings yet
Overfitting vs. Underfitting, Bias vs. Variance
7 pages
Assignment #3 Solution
No ratings yet
Assignment #3 Solution
5 pages
Unit 4
No ratings yet
Unit 4
24 pages
Deep Learning Notes
No ratings yet
Deep Learning Notes
14 pages
ML UNIT-2 Notes
No ratings yet
ML UNIT-2 Notes
15 pages
Solution Dseclzg524!01!102020 Ec2r
100% (1)
Solution Dseclzg524!01!102020 Ec2r
6 pages
Handling Missing Value
No ratings yet
Handling Missing Value
12 pages
ML Unit-Iv
No ratings yet
ML Unit-Iv
19 pages
Artificial Neural Networks
No ratings yet
Artificial Neural Networks
18 pages
Machine Learning Bits
100% (2)
Machine Learning Bits
28 pages
ML - CSA 301 - ML Perspective and Issues
No ratings yet
ML - CSA 301 - ML Perspective and Issues
34 pages
Midsem Regular QP
No ratings yet
Midsem Regular QP
2 pages
Assignment Coa Wase Wims2019
No ratings yet
Assignment Coa Wase Wims2019
8 pages
Lesson 4 Gradient Descent
No ratings yet
Lesson 4 Gradient Descent
13 pages
CNN Cheat Sheet
No ratings yet
CNN Cheat Sheet
5 pages
Self Organizing Maps
No ratings yet
Self Organizing Maps
27 pages
Assignment # 01 Bscs - 7 Semester: Machine Learning
100% (1)
Assignment # 01 Bscs - 7 Semester: Machine Learning
5 pages
Ensemble Methods Bagging Boosting and Stacking
100% (1)
Ensemble Methods Bagging Boosting and Stacking
19 pages
An Introduction To Kohonen Self Organizing Maps: Rajarshi Guha
No ratings yet
An Introduction To Kohonen Self Organizing Maps: Rajarshi Guha
12 pages
Machine Learning Notes
No ratings yet
Machine Learning Notes
3 pages
Chandigarh Group of Colleges College of Engineering Landran, Mohali
No ratings yet
Chandigarh Group of Colleges College of Engineering Landran, Mohali
47 pages
ML Question Bank
No ratings yet
ML Question Bank
29 pages
Lectures Machine Learning
No ratings yet
Lectures Machine Learning
205 pages
Optimization Techniques in Deep Learning
No ratings yet
Optimization Techniques in Deep Learning
14 pages
CP5191 Machine Learning Techniques L T P C3 0 0 3
No ratings yet
CP5191 Machine Learning Techniques L T P C3 0 0 3
7 pages
NN LMS DR Gamal PDF
No ratings yet
NN LMS DR Gamal PDF
34 pages
Neuro Fuzzy Systems
100% (1)
Neuro Fuzzy Systems
27 pages
The Problem of Overfitting: Overfitting With Linear Regression
No ratings yet
The Problem of Overfitting: Overfitting With Linear Regression
32 pages
Algo PPT of Bits Wilp
No ratings yet
Algo PPT of Bits Wilp
62 pages
Machine Learning Revision Notes
No ratings yet
Machine Learning Revision Notes
6 pages
Support Vector Machines: Dominik Wisniewski Wojciech Wawrzyniak
No ratings yet
Support Vector Machines: Dominik Wisniewski Wojciech Wawrzyniak
16 pages
Deep Learning: Prof:Naveen Ghorpade
No ratings yet
Deep Learning: Prof:Naveen Ghorpade
43 pages
Seminar Report Machine Learning
No ratings yet
Seminar Report Machine Learning
20 pages
Install OpenMPI in Linux
No ratings yet
Install OpenMPI in Linux
5 pages
Notes On Backpropagation
No ratings yet
Notes On Backpropagation
14 pages
Routinemap Patterns of Life in Spatiotemporal Visualization
No ratings yet
Routinemap Patterns of Life in Spatiotemporal Visualization
10 pages
Decision Trees & The Iterative Dichotomiser 3 (ID3) Algorithm
100% (1)
Decision Trees & The Iterative Dichotomiser 3 (ID3) Algorithm
8 pages
RBM, DBN, and DBM
No ratings yet
RBM, DBN, and DBM
79 pages
Building Powerful Image Classification Models Using Very Little Data
No ratings yet
Building Powerful Image Classification Models Using Very Little Data
20 pages
(2007) - The Aesthetics of Graph Visualization
No ratings yet
(2007) - The Aesthetics of Graph Visualization
8 pages
Data Mining-Outlier Analysis
No ratings yet
Data Mining-Outlier Analysis
6 pages
RBF, KNN, SVM, DT
No ratings yet
RBF, KNN, SVM, DT
9 pages
Mpi Openmp Examples
No ratings yet
Mpi Openmp Examples
27 pages

DSE 2020-21 2nd Sem DL Problem Solving 2.0

Uploaded by

DSE 2020-21 2nd Sem DL Problem Solving 2.0

Uploaded by

Deep Learning

Dr. Sugata Ghosal

Worked Out Problems

Optimal learning rate =

Largest learning rate for convergence =

Assume, α = 1.5, β = 0.6

Delta w1 = 1.5-1 =0.5 Delta w2 = 2-1=1

w1(t+1)= 1+0.5*0.6 = 1.3, sign of derivation became different

You might also like