Practice Assignment 4: Reinforcement Learning Prof. B. Ravindran

The document is a practice assignment on reinforcement learning. It contains 5 multiple choice questions about reinforcement learning concepts like the Bellman optimality equation, properties of Markov decision processes (MDPs), and benefits of using reinforcement learning algorithms to solve MDPs. The key points are: 1) The correct Bellman optimality equation is given. 2) For general MDPs, a state-action pair can lead to multiple resultant states with different probabilities. 3) The state transition graph of an MDP is not necessarily a directed acyclic graph as it can include cycles. 4) The optimal policy can be determined from the optimal q-value function alone. 5) A benefit of reinforcement learning algorithms is that

Uploaded by

udayraj singh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

830 views2 pages

Practice Assignment 4: Reinforcement Learning Prof. B. Ravindran

Uploaded by

udayraj singh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Practice Assignment 4

Reinforcement Learning
Prof. B. Ravindran
1. Select the correct Bellman optimality equation:
(a) v ∗ (s) = maxa s′ p(s′ |s, a)[E[r|s, a, s′ ] + γv ∗ (s′ )]
P

(b) v ∗ (s) = maxa s′ p(s′ |s, a)v ∗ (s′ )

(c) v ∗ (s) = maxa s′ p(s′ |s, a)[γE[r|s, a, s′ ] + v ∗ (s′ )]

(d) v ∗ (s) = maxa s′ p(s′ |s, a)γ[E[r|s, a, s′ ] + v ∗ (s′ )]

Sol. (a)
Refer to video on Bellman optimality equation
2. State True/False
In MDPs, there is a unique resultant state for any given state-action pair.
(a) True
(b) False
Sol. (b)
The statement is true for deterministic MDPs, but for general MDPs, for a given state-action
pair, there can be multiple resultant states with different probabilities associated with them.
3. State True/False The state transition graph for any MDP is a directed acyclic graph.
(a) True
(b) False
Sol. (b)
The statement is false. There is a possibility of transitioning to the same state, as well as
having other cycles.
4. Consider the following statements:
(i) The optimal policy of an MDP is unique.
(ii) We can determine an optimal policy for a MDP using only the optimal value function(v ∗ ),
without accessing the MDP parameters.
(iii) We can determine an optimal policy for a given MDP using only the optimal q-value
function(q ∗ ), without accessing the MDP parameters.
Which of these statements are true?
(a) Only (ii)
(b) Only (iii)
(c) Only (i), (ii)
(d) Only (i), (iii)
(e) Only (ii), (iii)

1
Sol. (b)
Optimal policy can be recovered from an optimal q-value function.
5. Which of the following is a benefit of using RL algorithms for solving MDPs?
(a) They do not require the state of the agent for solving a MDP.
(b) They do not require the action taken by the agent for solving a MDP.
(c) They do not require the state transition probability matrix for solving a MDP.
(d) They do not require the reward signal for solving a MDP.
Sol. (c)
RL algorithms require to know the state the agent is in, the action it takes and a reward
signal from the environment to solve the MDP. However, they do not need to know the state
transition probability matrix.

DEEP LEARNING IIT Kharagpur Assignment - 4 - 2024
100% (2)
DEEP LEARNING IIT Kharagpur Assignment - 4 - 2024
7 pages
Artificial Intelligence - Knowledge Representation and Reasoning - Unit 4 - Week 1
No ratings yet
Artificial Intelligence - Knowledge Representation and Reasoning - Unit 4 - Week 1
4 pages
DL - Assignment 9 Solution
100% (3)
DL - Assignment 9 Solution
7 pages
Assignment 1: Reinforcement Learning Prof. B. Ravindran
100% (2)
Assignment 1: Reinforcement Learning Prof. B. Ravindran
4 pages
Introduction To Machine Learning Assignment-Week 4
No ratings yet
Introduction To Machine Learning Assignment-Week 4
5 pages
Assignment 11: Introduction To Machine Learning Prof. B. Ravindran
100% (1)
Assignment 11: Introduction To Machine Learning Prof. B. Ravindran
3 pages
Assignment 1 (Sol.) : Introduction To Machine Learning Prof. B. Ravindran
No ratings yet
Assignment 1 (Sol.) : Introduction To Machine Learning Prof. B. Ravindran
7 pages
AI 3000 / CS5500: Reinforcement Learning Exam 1: Instructions
0% (1)
AI 3000 / CS5500: Reinforcement Learning Exam 1: Instructions
4 pages
Assignment 5 (Sol.) : Reinforcement Learning
100% (1)
Assignment 5 (Sol.) : Reinforcement Learning
4 pages
Reinforcement Learning - Unit 6 - Week 4
No ratings yet
Reinforcement Learning - Unit 6 - Week 4
3 pages
Assignment 4: Reinforcement Learning Prof. B. Ravindran
No ratings yet
Assignment 4: Reinforcement Learning Prof. B. Ravindran
4 pages
Assignment 3: Reinforcement Learning Prof. B. Ravindran
100% (1)
Assignment 3: Reinforcement Learning Prof. B. Ravindran
4 pages
Assignment 7 (Sol.) : Reinforcement Learning
0% (1)
Assignment 7 (Sol.) : Reinforcement Learning
3 pages
Practice Assignment 6: Reinforcement Learning Prof. B. Ravindran
No ratings yet
Practice Assignment 6: Reinforcement Learning Prof. B. Ravindran
24 pages
Assignment 11: Reinforcement Learning Prof. B. Ravindran
No ratings yet
Assignment 11: Reinforcement Learning Prof. B. Ravindran
4 pages
Week3 Assignment
No ratings yet
Week3 Assignment
6 pages
Introduction To Machine Learning - Unit 3 - Week 1
No ratings yet
Introduction To Machine Learning - Unit 3 - Week 1
3 pages
Machine Learning, ML Ass 5
No ratings yet
Machine Learning, ML Ass 5
6 pages
Assignment 8: Reinforcement Learning Prof. B. Ravindran
No ratings yet
Assignment 8: Reinforcement Learning Prof. B. Ravindran
4 pages
MCQ Question
No ratings yet
MCQ Question
5 pages
Artificial Intelligence - Knowledge Representation and Reasoning - Unit 6 - Week 3
No ratings yet
Artificial Intelligence - Knowledge Representation and Reasoning - Unit 6 - Week 3
5 pages
Assignment 11: Introduction To Machine Learning Prof. B. Ravindran
100% (2)
Assignment 11: Introduction To Machine Learning Prof. B. Ravindran
3 pages
PA12
100% (2)
PA12
3 pages
DL - Assignment 11 Solution
No ratings yet
DL - Assignment 11 Solution
7 pages
Artificial Intelligence - Knowledge Representation and Reasoning - Unit 8 - Week 5
100% (1)
Artificial Intelligence - Knowledge Representation and Reasoning - Unit 8 - Week 5
5 pages
Machine Learning, ML Ass 7
No ratings yet
Machine Learning, ML Ass 7
7 pages
Deep Learning - IIT Ropar - Unit 6 - Week 3
No ratings yet
Deep Learning - IIT Ropar - Unit 6 - Week 3
4 pages
Assignment Week 8-Deep-Learning PDF
100% (1)
Assignment Week 8-Deep-Learning PDF
5 pages
Assignment Week 4-Deep-Learning PDF
100% (1)
Assignment Week 4-Deep-Learning PDF
7 pages
Introduction To Machine Learning - Unit 3 - Week 1 - Non - Graded
No ratings yet
Introduction To Machine Learning - Unit 3 - Week 1 - Non - Graded
3 pages
Assignment 12: Introduction To Machine Learning Prof. B. Ravindran
100% (1)
Assignment 12: Introduction To Machine Learning Prof. B. Ravindran
4 pages
2022 ML Assignments
No ratings yet
2022 ML Assignments
45 pages
DEEP LEARNING IIT Kharagpur Assignment - 5 - 2024
No ratings yet
DEEP LEARNING IIT Kharagpur Assignment - 5 - 2024
9 pages
DL - Assignment 12 Solution
No ratings yet
DL - Assignment 12 Solution
7 pages
Thank You For Taking The Week 3: Assignment 3. Week 3: Assignment 3
No ratings yet
Thank You For Taking The Week 3: Assignment 3. Week 3: Assignment 3
3 pages
DL - Assignment 2 Solution
No ratings yet
DL - Assignment 2 Solution
7 pages
DEEP LEARNING IIT Kharagpur Assignment - 2 - 2024 - Updated
No ratings yet
DEEP LEARNING IIT Kharagpur Assignment - 2 - 2024 - Updated
6 pages
Introduction To Machine Learning - Unit 4 - Week 2
100% (1)
Introduction To Machine Learning - Unit 4 - Week 2
3 pages
Unit 4
100% (1)
Unit 4
7 pages
Deep Learning - IIT Ropar - Unit 7 - Week 4
100% (1)
Deep Learning - IIT Ropar - Unit 7 - Week 4
5 pages
Assignment - Week 6 (Neural Networks) Type of Question: MCQ/MSQ
No ratings yet
Assignment - Week 6 (Neural Networks) Type of Question: MCQ/MSQ
4 pages
Deep Learning - IIT Ropar - Unit 4 - Week 1
No ratings yet
Deep Learning - IIT Ropar - Unit 4 - Week 1
8 pages
Assignment 6
No ratings yet
Assignment 6
2 pages
DL - Assignment 4 Solution
No ratings yet
DL - Assignment 4 Solution
6 pages
DL - Assignment 3 Solution
No ratings yet
DL - Assignment 3 Solution
7 pages
DL - Assignment 1 Solution
No ratings yet
DL - Assignment 1 Solution
8 pages
Assignment Week 11-Deep-Learning PDF
100% (2)
Assignment Week 11-Deep-Learning PDF
7 pages
DEEP LEARNING IIT Kharagpur Assignment - 1 - 2024 - Updated
No ratings yet
DEEP LEARNING IIT Kharagpur Assignment - 1 - 2024 - Updated
6 pages
Assignment9 DeepLearning
No ratings yet
Assignment9 DeepLearning
6 pages
Assignment 1
No ratings yet
Assignment 1
7 pages
NPTEL Introduction To Machine Learning Assignment 10 Answers
100% (1)
NPTEL Introduction To Machine Learning Assignment 10 Answers
7 pages
DL - Assignment 8 Solution
100% (2)
DL - Assignment 8 Solution
6 pages
Introduction To Machine Learning - IITKGP - Unit 4 - Week 2
No ratings yet
Introduction To Machine Learning - IITKGP - Unit 4 - Week 2
5 pages
Assignment 2
No ratings yet
Assignment 2
7 pages
Unit 5 Reinforcement Learning Notes
No ratings yet
Unit 5 Reinforcement Learning Notes
20 pages
IML-IITKGP - Assignment 1 Solution
No ratings yet
IML-IITKGP - Assignment 1 Solution
7 pages
Deep Learning - IIT Ropar - Unit 6 - Week 4
No ratings yet
Deep Learning - IIT Ropar - Unit 6 - Week 4
5 pages
Assignment 7
No ratings yet
Assignment 7
3 pages
Data Science - Assignment 2
No ratings yet
Data Science - Assignment 2
4 pages
Deep Learning - IIT Ropar - Unit 8 - Week 5
No ratings yet
Deep Learning - IIT Ropar - Unit 8 - Week 5
4 pages
AMIOA08 MODBUS RTU Commamd
No ratings yet
AMIOA08 MODBUS RTU Commamd
12 pages
Experiment - 5 Raymond Classifier: Name: Aman Agrawal Roll No:18CH30003
No ratings yet
Experiment - 5 Raymond Classifier: Name: Aman Agrawal Roll No:18CH30003
6 pages
Stainless Steel
No ratings yet
Stainless Steel
4 pages
Cribbage Rules1
No ratings yet
Cribbage Rules1
5 pages
General Motors Bypass Passkey 2
100% (1)
General Motors Bypass Passkey 2
4 pages
3.3 Science of Failure RFCA
No ratings yet
3.3 Science of Failure RFCA
166 pages
1Z0 1087 24 Demo
No ratings yet
1Z0 1087 24 Demo
4 pages
C#&,3#/#0 (W%A# (E&A (4 %'S, (W%A# (E&A (: Fqzpi (DJG FQZPP (DJG (
No ratings yet
C#&,3#/#0 (W%A# (E&A (4 %'S, (W%A# (E&A (: Fqzpi (DJG FQZPP (DJG (
19 pages
Boiler Tube Facts Book
No ratings yet
Boiler Tube Facts Book
29 pages
JR RSM Two - Year PDF
No ratings yet
JR RSM Two - Year PDF
4 pages
Detail Estimate Numericals
No ratings yet
Detail Estimate Numericals
11 pages
Handout4-ReviewJavaBasis-OCA Java SE 8 Programmer I
No ratings yet
Handout4-ReviewJavaBasis-OCA Java SE 8 Programmer I
5 pages
Behavior of Laterally Loaded Piles
100% (1)
Behavior of Laterally Loaded Piles
3 pages
GIS Assignment
No ratings yet
GIS Assignment
9 pages
Total Automation Solution in Super Critical Thermal Power Plant PDF
No ratings yet
Total Automation Solution in Super Critical Thermal Power Plant PDF
28 pages
Seven Segment Display Description
No ratings yet
Seven Segment Display Description
8 pages
Excel 365 Charts
No ratings yet
Excel 365 Charts
63 pages
Afm B200C PDF
No ratings yet
Afm B200C PDF
1 page
P5x30 Selection Guide
No ratings yet
P5x30 Selection Guide
2 pages
Automatic Waste Segregator and Monitoring System: January 2016
No ratings yet
Automatic Waste Segregator and Monitoring System: January 2016
8 pages
2005 - A Robotic Mechanism For Grasping Sacks
No ratings yet
2005 - A Robotic Mechanism For Grasping Sacks
11 pages
Common Mode Noise On Bob Smith Termination
No ratings yet
Common Mode Noise On Bob Smith Termination
15 pages
MODULE T4 - DCC50242 BIM Terbaru
No ratings yet
MODULE T4 - DCC50242 BIM Terbaru
147 pages
Nodal Analysis
100% (1)
Nodal Analysis
4 pages
Matrix Decompo 2024
No ratings yet
Matrix Decompo 2024
16 pages
Exercise 2.1 Page 143 PDF
No ratings yet
Exercise 2.1 Page 143 PDF
3 pages
Chemical Reaction Engineering (CRE) Is The
No ratings yet
Chemical Reaction Engineering (CRE) Is The
61 pages
Bicosome BicowhiteComplex
No ratings yet
Bicosome BicowhiteComplex
2 pages
CAN Article in Mikrobasic PRO For PIC
No ratings yet
CAN Article in Mikrobasic PRO For PIC
2 pages
IGCSE TP Hooke's Law
No ratings yet
IGCSE TP Hooke's Law
10 pages

Practice Assignment 4: Reinforcement Learning Prof. B. Ravindran

Uploaded by

Practice Assignment 4: Reinforcement Learning Prof. B. Ravindran

Uploaded by

Practice Assignment 4

(b) v ∗ (s) = maxa s′ p(s′ |s, a)v ∗ (s′ )

(c) v ∗ (s) = maxa s′ p(s′ |s, a)[γE[r|s, a, s′ ] + v ∗ (s′ )]

(d) v ∗ (s) = maxa s′ p(s′ |s, a)γ[E[r|s, a, s′ ] + v ∗ (s′ )]

You might also like