Gradient Descent

Gradient descent is an iterative algorithm that finds the minimum of a function by taking steps proportional to the negative of the gradient of the function. It works by computing the gradient at a point and moving slightly in the opposite direction to reach the minimum. Limitations include only finding local minima, step size affecting convergence, and requiring differentiability of the function.

Uploaded by

pcjoshi02

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

92 views18 pages

Gradient Descent

Uploaded by

pcjoshi02

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 18

Gradient Descent

Objective
Gradient descent algorithm is an iterative process that takes us to the
minimum of a function
What is Gradient Descent?

The million-dollar question!

Let’s say you are playing a game where the players are at the top of a mountain, and they are asked to
reach the lowest point of the mountain. Additionally, they are blindfolded. So, what approach do you
think would make you reach the lake?
Gradient descent was originally proposed by CAUCHY in 1847. It is also known as steepest descent.
Gradient descent is an iterative optimization algorithm for finding the local

minimum of a function.

The goal of the gradient descent algorithm is to minimize the given function (say cost
function). To achieve this goal, it performs two steps iteratively:

1.Compute the gradient (slope), the first order derivative of the function at that point

1.Make a step (move) in the direction opposite to the gradient, opposite direction of
slope increase from the current point by alpha times the gradient at that point
Limitations

Gradient descent
Gradient descent is a general-purpose algorithm that numerically finds minima of multivariable functions.
1. One of its limitations is that it only finds local minima (rather than the global minimum). As
soon as the algorithm finds some point that's at a local minimum, it will never escape as long
as the step size doesn't exceed the size of the ditch.
2. Another limitation of gradient descent concerns the step size. A good step size
moves toward the minimum rapidly, each step making substantial progress.
If the step size is too large, however, we may never converge to a local
minimum because we overshoot it every time.
3. A final limitation is that gradient descent only works when our function is differentiable
everywhere. Otherwise we might come to a point where the gradient isn't defined, and then
we can't use our update formula.
Function requirements
Gradient descent algorithm does not work for all functions. There are two specific
requirements. A function has to be:

● differentiable

● convex
Differentiable: If a function is differentiable it has a derivative for each point
in its domain

Examples of differentiable functions

Typical non-differentiable functions have a step a cusp or a discontinuity:
Gradient Descent method

1. Choose a starting point (initialisation)

2. Calculate gradient at this point
3. Make a scaled step in the opposite direction to the gradient (objective:
minimise)
4. Repeat points 2 and 3 until one of the criteria is met:
5. Maximum number of iterations reached
6. Step size is smaller than the tolerance
For more detailed clarity about GD algo
https://towardsdatascience.com/understanding-the-mathematics-behind-gradient-d
escent-dde5dc9be06e

https://towardsdatascience.com/gradient-descent-algorithm-a-deep-dive-cf04e811
5f21

(N.P. Bali, Manish Goyal) A Textbook of Engineerin PDF
67% (9)
(N.P. Bali, Manish Goyal) A Textbook of Engineerin PDF
590 pages
B.Tech EC Syllabus 3rd Year
No ratings yet
B.Tech EC Syllabus 3rd Year
35 pages
Gradient Descent Algorithm in Machine Learning
No ratings yet
Gradient Descent Algorithm in Machine Learning
21 pages
CCS355 Neural Networks and Deep Learning
No ratings yet
CCS355 Neural Networks and Deep Learning
142 pages
General Mathematics 11
100% (1)
General Mathematics 11
3 pages
Gradient Descent Unit3
No ratings yet
Gradient Descent Unit3
9 pages
Gradient Descent in Linear Regression
No ratings yet
Gradient Descent in Linear Regression
30 pages
R05 Certified Reliability Engineer
100% (1)
R05 Certified Reliability Engineer
3 pages
Gradient Descent - Problem of Hiking Down A Mountain: Derivatives
No ratings yet
Gradient Descent - Problem of Hiking Down A Mountain: Derivatives
8 pages
Gradient Descent Algorithm in Machine Learning - Analytics Vidhya
No ratings yet
Gradient Descent Algorithm in Machine Learning - Analytics Vidhya
11 pages
06 23ECE216 GradientDescent v2
No ratings yet
06 23ECE216 GradientDescent v2
73 pages
Math Lecture 4
No ratings yet
Math Lecture 4
27 pages
Gradient Descend
No ratings yet
Gradient Descend
64 pages
03 Saintek
No ratings yet
03 Saintek
8 pages
Lec05-1-Gradient Descent-Detailed
No ratings yet
Lec05-1-Gradient Descent-Detailed
62 pages
11 Gradient Descent
No ratings yet
11 Gradient Descent
58 pages
Gradient Descent
No ratings yet
Gradient Descent
58 pages
Assembling and Running An 8051 Program
No ratings yet
Assembling and Running An 8051 Program
5 pages
Optimization and Gradient Descent Algorithm
No ratings yet
Optimization and Gradient Descent Algorithm
37 pages
ML Lec 08 Gradient Descent
No ratings yet
ML Lec 08 Gradient Descent
37 pages
Gradient Descent
No ratings yet
Gradient Descent
55 pages
Gradient Descent A Fundamental Optimization Algorithm
No ratings yet
Gradient Descent A Fundamental Optimization Algorithm
30 pages
PR1 Module 2
No ratings yet
PR1 Module 2
12 pages
Lect 5 - Gradient Descent
No ratings yet
Lect 5 - Gradient Descent
31 pages
Statistical Analysis: Session 2: Measures of Central Tendency
100% (1)
Statistical Analysis: Session 2: Measures of Central Tendency
41 pages
Gradient Descent Final
No ratings yet
Gradient Descent Final
27 pages
Adam Optimizer
No ratings yet
Adam Optimizer
22 pages
Lec 5 - Gradient-Descent
No ratings yet
Lec 5 - Gradient-Descent
31 pages
GD Algo
No ratings yet
GD Algo
18 pages
Gradient Decent
No ratings yet
Gradient Decent
40 pages
Integrated Circuit
No ratings yet
Integrated Circuit
160 pages
DL Unit - 2
No ratings yet
DL Unit - 2
20 pages
Gradient Descent Algorithm in Machine Learning: Dr. P. K. Chaurasia
No ratings yet
Gradient Descent Algorithm in Machine Learning: Dr. P. K. Chaurasia
24 pages
Gradient Descent Deep Learning: by T.K. Damodharan Vice President, RBS Reg - No: PC2013003013008
No ratings yet
Gradient Descent Deep Learning: by T.K. Damodharan Vice President, RBS Reg - No: PC2013003013008
37 pages
Gradient Descent
No ratings yet
Gradient Descent
4 pages
Gradient Descent
No ratings yet
Gradient Descent
13 pages
Gradient Descent
No ratings yet
Gradient Descent
12 pages
Gradient Descent - A Quick, Simple Introduction - Built in
No ratings yet
Gradient Descent - A Quick, Simple Introduction - Built in
15 pages
Deep Learning (Part 8) - Coursesteach
No ratings yet
Deep Learning (Part 8) - Coursesteach
16 pages
Gradient Descent
No ratings yet
Gradient Descent
14 pages
Interview Question What Is Gradient Descent 1679467271
No ratings yet
Interview Question What Is Gradient Descent 1679467271
16 pages
LInear
No ratings yet
LInear
14 pages
Gradient Descent
No ratings yet
Gradient Descent
15 pages
What Is Gradient Descent - Built in
No ratings yet
What Is Gradient Descent - Built in
11 pages
Gradient Descent: By-Vineet Ahuja BCA-V1-E 00221102021
No ratings yet
Gradient Descent: By-Vineet Ahuja BCA-V1-E 00221102021
10 pages
Introduction To Gradient Descent
No ratings yet
Introduction To Gradient Descent
8 pages
Gradient Descent
No ratings yet
Gradient Descent
12 pages
04gradient Descent
No ratings yet
04gradient Descent
21 pages
Gradient Descent From Scratch Complete Intuition
No ratings yet
Gradient Descent From Scratch Complete Intuition
8 pages
Gradient Descent Algorithm.Y...
No ratings yet
Gradient Descent Algorithm.Y...
10 pages
Gradient Descent Explained. A Comprehensive Guide To Gradient - by Daksh Trehan - Towards Data Science
No ratings yet
Gradient Descent Explained. A Comprehensive Guide To Gradient - by Daksh Trehan - Towards Data Science
9 pages
Gradient Descent Algorithm Is A First
No ratings yet
Gradient Descent Algorithm Is A First
5 pages
Gradient DescentSummartyL5
No ratings yet
Gradient DescentSummartyL5
7 pages
Gradient Descent
No ratings yet
Gradient Descent
8 pages
Gradient Descent
No ratings yet
Gradient Descent
9 pages
MAT6007 - Session8 - Gradient Descent
No ratings yet
MAT6007 - Session8 - Gradient Descent
16 pages
Assignment B 4 GradientDescent
No ratings yet
Assignment B 4 GradientDescent
5 pages
Gradient Descent
No ratings yet
Gradient Descent
6 pages
Gradient Descent
No ratings yet
Gradient Descent
9 pages
Gradient Descent
No ratings yet
Gradient Descent
6 pages
chp2 Gradient Descent Algorithm
No ratings yet
chp2 Gradient Descent Algorithm
5 pages
AI33
No ratings yet
AI33
6 pages
Gradient Descent
No ratings yet
Gradient Descent
5 pages
An Introduction To Gradient Descent and Linear Regression
No ratings yet
An Introduction To Gradient Descent and Linear Regression
8 pages
Lecture Notes: Some Notes On Gradient Descent: Marc Toussaint
No ratings yet
Lecture Notes: Some Notes On Gradient Descent: Marc Toussaint
4 pages
Yash 21bsds12
No ratings yet
Yash 21bsds12
3 pages
Gradient Descent
No ratings yet
Gradient Descent
2 pages
CNN 1
No ratings yet
CNN 1
23 pages
Social Media Influencers Literature Review, Trends and Research Agenda
No ratings yet
Social Media Influencers Literature Review, Trends and Research Agenda
30 pages
Electronics Engineering Syllabus
No ratings yet
Electronics Engineering Syllabus
1 page
Advance Digital Design Using Veilog
No ratings yet
Advance Digital Design Using Veilog
99 pages
ECD Lab NEC 752
No ratings yet
ECD Lab NEC 752
17 pages
B.Tech EC Final Year
No ratings yet
B.Tech EC Final Year
18 pages
Statistical Analysis of Grades of Rtu College Students in Calculus/Statistics
No ratings yet
Statistical Analysis of Grades of Rtu College Students in Calculus/Statistics
9 pages
31 Analysis Design Asynchronous Sequential Circuits PDF
No ratings yet
31 Analysis Design Asynchronous Sequential Circuits PDF
72 pages
7 Limbs of State
No ratings yet
7 Limbs of State
8 pages
KSP KOS PID Tuning
No ratings yet
KSP KOS PID Tuning
200 pages
Steps For Simulating VHDL Programs in OrCAD
No ratings yet
Steps For Simulating VHDL Programs in OrCAD
8 pages
Assignment (Ch-Continuity & Differentiabilty)
No ratings yet
Assignment (Ch-Continuity & Differentiabilty)
15 pages
Suraj PDF
No ratings yet
Suraj PDF
8 pages
Demir - IJCTA - 2000 Floquet Theory and Non-Linear Perturbation Analysis For Oscillators With Differential-Algebraic Equations
No ratings yet
Demir - IJCTA - 2000 Floquet Theory and Non-Linear Perturbation Analysis For Oscillators With Differential-Algebraic Equations
23 pages
Attempt All Sections. If Require Any Missing Data Then Choose Suitably
No ratings yet
Attempt All Sections. If Require Any Missing Data Then Choose Suitably
3 pages
Arithmetic Mean
No ratings yet
Arithmetic Mean
4 pages
Chapter 1 Introduction To Portfolio Theory: 1.1 Portfolios of Two Risky Assets
No ratings yet
Chapter 1 Introduction To Portfolio Theory: 1.1 Portfolios of Two Risky Assets
62 pages
Cad Lab Cmos Inverter PDF
No ratings yet
Cad Lab Cmos Inverter PDF
4 pages
Poetry Analysis Essay Thesis Example
100% (2)
Poetry Analysis Essay Thesis Example
4 pages
Time: 3 Hours Max. Marks: 70 Note: Be Precise in Your Answer. in Case of Numerical Problem Assume Data Wherever Not Provided
No ratings yet
Time: 3 Hours Max. Marks: 70 Note: Be Precise in Your Answer. in Case of Numerical Problem Assume Data Wherever Not Provided
2 pages
Spain University
No ratings yet
Spain University
16 pages
Biquad Filter PDF
100% (1)
Biquad Filter PDF
5 pages
Tammetin
No ratings yet
Tammetin
15 pages
Convolutional Neural Network (CNN)
No ratings yet
Convolutional Neural Network (CNN)
27 pages
Limit, Continuity and Differentiability of A Function at A Point
No ratings yet
Limit, Continuity and Differentiability of A Function at A Point
15 pages
CHAPTER - 10 - (Measures of Cental Tendency and Dispersion.)
No ratings yet
CHAPTER - 10 - (Measures of Cental Tendency and Dispersion.)
18 pages
Mathematics4 (2) CHME
No ratings yet
Mathematics4 (2) CHME
40 pages
Balwinder Sir 1st Class
No ratings yet
Balwinder Sir 1st Class
6 pages
Auto Trend Fib Signals BY Studio Divin
No ratings yet
Auto Trend Fib Signals BY Studio Divin
2 pages
Lecture 2 HYPOTHESIS TESTING Real
No ratings yet
Lecture 2 HYPOTHESIS TESTING Real
10 pages
X X MD X X MD X: Assignment XI (Statistics)
No ratings yet
X X MD X X MD X: Assignment XI (Statistics)
2 pages
Strong Mixing Condition
No ratings yet
Strong Mixing Condition
38 pages
5 - Production Planning problems-LPP Models
No ratings yet
5 - Production Planning problems-LPP Models
7 pages
LHR and Improper Integrals
No ratings yet
LHR and Improper Integrals
22 pages
Swarm Optimization (Gso) Dalam Penyelesaian
No ratings yet
Swarm Optimization (Gso) Dalam Penyelesaian
10 pages
Chapter 1 - 4
No ratings yet
Chapter 1 - 4
3 pages
Sop For Vitamin K3
No ratings yet
Sop For Vitamin K3
3 pages
Uji Validitas Dan Reliabilitas (Lubis)
No ratings yet
Uji Validitas Dan Reliabilitas (Lubis)
5 pages
Analisis Data Penelitian
No ratings yet
Analisis Data Penelitian
3 pages

Gradient Descent

Uploaded by

Gradient Descent

Uploaded by

Gradient Descent

The million-dollar question!

Examples of differentiable functions

1. Choose a starting point (initialisation)

You might also like