Open navigation menu

Scribd

0% found this document useful (0 votes)

2 views

Lecture 22 - Value Function Approximation

The document outlines a lecture on Value Function Approximation in Reinforcement Learning, covering key topics such as Monte Carlo Learning, Temporal Difference Learning, and Q Learning. It emphasizes the importance of Gradient Descent and Stochastic Gradient Descent in the context of linear value function approximation. Additionally, it discusses the differences between tabular methods and approximation methods, and the use of neural networks as function approximators.

Uploaded by

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views

Lecture 22 - Value Function Approximation

The document outlines a lecture on Value Function Approximation in Reinforcement Learning, covering key topics such as Monte Carlo Learning, Temporal Difference Learning, and Q Learning. It emphasizes the importance of Gradient Descent and Stochastic Gradient Descent in the context of linear value function approximation. Additionally, it discusses the differences between tabular methods and approximation methods, and the use of neural networks as function approximators.

Uploaded by

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 17

AI-832 Reinforcement Learning

Instructor: Dr. Zuhair Zafar

Lecture # 22: Value Function Approximation

Recap

• Monte Carlo Learning

• Prediction

• Control

• Temporal Difference Learning

• Prediction

• TD (0), n-step TD, lambda return, TD(lambda)

• Control (On-policy Learning)

• SARSA (0), n-step SARSA, SARSA (Lambda), Expected SARSA

• Q Learning (Off-policy Learning)

Today’s Agenda

• Value Function Approximation

• Gradient Descent

• Stochastic Gradient Descent

• Linear Value Function Approximation

Large-Scale Reinforcement Learning
Large-Scale Reinforcement Learning
Value Function Approximation
Types of Value Function Approximation
Tabular Methods vs. Approximation Methods

Monte Carlo / Temporal Difference Learning

Neural Network
Which Function Approximator?
Which Function Approximator?
Today’s Agenda

• Value Function Approximation

• Gradient Descent

• Stochastic Gradient Descent

• Linear Value Function Approximation

Gradient Descent
Value Function Approx. By Stochastic Gradient Descent
Today’s Agenda

• Value Function Approximation

• Gradient Descent

• Stochastic Gradient Descent

• Linear Value Function Approximation

Feature Vectors
Linear Value Function Approximation
Table Lookup Features

You might also like

Introduction To Reinforcement Learning: Instructor: Sergey Levine UC Berkeley
No ratings yet
Introduction To Reinforcement Learning: Instructor: Sergey Levine UC Berkeley
46 pages
Lnotes 05
No ratings yet
Lnotes 05
5 pages
Lecture 5: Value Function Approximation: Emma Brunskill
No ratings yet
Lecture 5: Value Function Approximation: Emma Brunskill
59 pages
2.3+Value+Function+Approximation
No ratings yet
2.3+Value+Function+Approximation
55 pages
Reinforcement Learning (Part 2) : Nguyen Do Van, PHD
No ratings yet
Reinforcement Learning (Part 2) : Nguyen Do Van, PHD
46 pages
20AI903_RL_UNIT 4
No ratings yet
20AI903_RL_UNIT 4
49 pages
2023 Week4 Funcapproximate Update
No ratings yet
2023 Week4 Funcapproximate Update
69 pages
Lecture 6: Value Function Approximation: David Silver
No ratings yet
Lecture 6: Value Function Approximation: David Silver
56 pages
Lecture 6 Value Function Approximation
No ratings yet
Lecture 6 Value Function Approximation
56 pages
07 FA Methods
No ratings yet
07 FA Methods
58 pages
Lecture 5 - ModelFreePrediction
No ratings yet
Lecture 5 - ModelFreePrediction
79 pages
What is TD Learning
No ratings yet
What is TD Learning
15 pages
Serge Levine Course Introduction To Reinforcement Learning 3: RL Introduction
No ratings yet
Serge Levine Course Introduction To Reinforcement Learning 3: RL Introduction
46 pages
19 - Monte Carlo and Temporal Difference for Markov Decision Processes.pptx
No ratings yet
19 - Monte Carlo and Temporal Difference for Markov Decision Processes.pptx
57 pages
RL With LCS
No ratings yet
RL With LCS
29 pages
12 ML Reinforcement Learning Value Based Control
No ratings yet
12 ML Reinforcement Learning Value Based Control
12 pages
Serge Levine Course Introduction To Reinforcement Learning 6 Value Function
No ratings yet
Serge Levine Course Introduction To Reinforcement Learning 6 Value Function
27 pages
Monte Carlo 1
No ratings yet
Monte Carlo 1
245 pages
Unit Iii Monte Carlo & Temporal Difference Methods
No ratings yet
Unit Iii Monte Carlo & Temporal Difference Methods
18 pages
Policy Gradient Methods
No ratings yet
Policy Gradient Methods
28 pages
Q_Networks[1]-31-50
No ratings yet
Q_Networks[1]-31-50
20 pages
dis9-sol
No ratings yet
dis9-sol
8 pages
RL chap 4
No ratings yet
RL chap 4
7 pages
11-DL-Deep Learning For Reinforcement Learning
No ratings yet
11-DL-Deep Learning For Reinforcement Learning
47 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
46 pages
5 - Policy Gradient Methods
No ratings yet
5 - Policy Gradient Methods
57 pages
RL Theory Tutorial
No ratings yet
RL Theory Tutorial
80 pages
Rl Dp and Value and Policy
No ratings yet
Rl Dp and Value and Policy
4 pages
Reinforcement Learning: Instructor: Max Welling
No ratings yet
Reinforcement Learning: Instructor: Max Welling
18 pages
8200 Non Delusional Q Learning and Value Iteration
No ratings yet
8200 Non Delusional Q Learning and Value Iteration
11 pages
07 Deep Reinforcement Learning (John)
No ratings yet
07 Deep Reinforcement Learning (John)
52 pages
M3
No ratings yet
M3
57 pages
DRL
No ratings yet
DRL
9 pages
EE675A Lecture 16
No ratings yet
EE675A Lecture 16
6 pages
MAS-Lab7-QFA
No ratings yet
MAS-Lab7-QFA
10 pages
CO431 RL 2023 End Nov
No ratings yet
CO431 RL 2023 End Nov
3 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
45 pages
qp ans
No ratings yet
qp ans
40 pages
Lecture Notes v1.0 687 F22
No ratings yet
Lecture Notes v1.0 687 F22
115 pages
CH3_2 Montecarlo Control
No ratings yet
CH3_2 Montecarlo Control
33 pages
RL Concepts and Methods
No ratings yet
RL Concepts and Methods
8 pages
10 - Reinforcement Learning
No ratings yet
10 - Reinforcement Learning
24 pages
37 RL
No ratings yet
37 RL
18 pages
RL 10 QUESTIONS FOR MID II Scheme of Evaluvation
No ratings yet
RL 10 QUESTIONS FOR MID II Scheme of Evaluvation
15 pages
lec22
No ratings yet
lec22
22 pages
Universal Value Function Approximators.
No ratings yet
Universal Value Function Approximators.
9 pages
games2-6pp
No ratings yet
games2-6pp
15 pages
Unit 5 Deep Learning
No ratings yet
Unit 5 Deep Learning
24 pages
Fa Ii
No ratings yet
Fa Ii
62 pages
Policy Gradient Methods
No ratings yet
Policy Gradient Methods
70 pages
5 Temporal Difference Learning
No ratings yet
5 Temporal Difference Learning
25 pages
2.2+Model Free+Control
No ratings yet
2.2+Model Free+Control
92 pages
Reinforcement LN-6
No ratings yet
Reinforcement LN-6
13 pages
Reinforcement Learning: Csci 5512: Artificial Intelligence Ii
No ratings yet
Reinforcement Learning: Csci 5512: Artificial Intelligence Ii
30 pages
Reinforcement Learning I:: The Setting and Classical Stochastic Dynamic Programming Algorithms
No ratings yet
Reinforcement Learning I:: The Setting and Classical Stochastic Dynamic Programming Algorithms
42 pages
Deep Reinforcement Learning
No ratings yet
Deep Reinforcement Learning
93 pages
Sdfesdf
No ratings yet
Sdfesdf
23 pages
lecture doubts
No ratings yet
lecture doubts
2 pages
Deep RL Tutorial Small
No ratings yet
Deep RL Tutorial Small
66 pages
data science course training in india hyderabad: innomatics research labs
From Everand
data science course training in india hyderabad: innomatics research labs
innomatics research labs
No ratings yet
Lecture W7ab
No ratings yet
Lecture W7ab
21 pages
CS-878 Lecture-02 Logistic Regression
No ratings yet
CS-878 Lecture-02 Logistic Regression
55 pages
Lecture W5ab
No ratings yet
Lecture W5ab
56 pages
Self Reading - KNN - Notes
No ratings yet
Self Reading - KNN - Notes
7 pages
Lecture W6b
No ratings yet
Lecture W6b
33 pages
Lesson 8-Image Segmentation - Traditional Approaches
No ratings yet
Lesson 8-Image Segmentation - Traditional Approaches
35 pages
Lecture 11 12 - Model Free Prediction, Monte-Carlo Learning, Temporal Difference Learning
No ratings yet
Lecture 11 12 - Model Free Prediction, Monte-Carlo Learning, Temporal Difference Learning
24 pages
Lecture W3
No ratings yet
Lecture W3
28 pages
Lecture 14 15 - Temporal Difference Learning, Lambda-return, Backward View of TD (Lambda)
No ratings yet
Lecture 14 15 - Temporal Difference Learning, Lambda-return, Backward View of TD (Lambda)
26 pages
11. Eigen Values and Eigen Vectors
No ratings yet
11. Eigen Values and Eigen Vectors
53 pages
Lecture 19 - Model-free Control, Off-Policy Learning
No ratings yet
Lecture 19 - Model-free Control, Off-Policy Learning
9 pages
Lecture 34 - Model Based Reinforcement Learning
No ratings yet
Lecture 34 - Model Based Reinforcement Learning
26 pages
Lecture 35 36 - Exploration vs. Exploitation
No ratings yet
Lecture 35 36 - Exploration vs. Exploitation
18 pages