E1 277 January-April 3:1 Reinforcement Learning: Instructor

This document provides information about a reinforcement learning course including the instructor, teaching assistants, schedule, prerequisites, syllabus, course outcomes, grading policy, and resources. The course deals with probabilistic models and algorithms for dynamic decision making under uncertainty, covering topics like stochastic dynamic programming, Q-learning, temporal difference learning, and actor-critic algorithms. Students will learn modeling and analysis techniques that can be applied to problems involving sequential decision making and will gain an understanding of commonly used reinforcement learning algorithms.

Uploaded by

praveen

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

166 views2 pages

E1 277 January-April 3:1 Reinforcement Learning: Instructor

Uploaded by

praveen

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

E1 277 January-April 3:1

Reinforcement Learning

Instructor
Shalabh Bhatnagar
Email: [email protected]
Teaching Assistant
Sindhu P.R., Raghuram Bharadwaj
Email: [email protected], [email protected]

Department: Computer Science and Automation

Course Time: Tuesday/Thursday 9:30-11:00
Lecture venue: CSA 252
Detailed Course Page:

Announcements

Brief description of the course

The course deals with probabilistic models for problems of dynamic decision making under uncertainty.

Stochastic dynamic programming is a general framework for modelling such problems. However, one requires

knowledge of transition probabilities (i.e., the system dynamics) as well as the associated cost function. Both

of these quantities are normally not known and one only has access to data that is available from the

experiment. For instance, one may not know the transition probabilities but one may see what the next state is

given the current state and the action or control chosen. The course deals with building first the model based

dynamic programming techniques and subsequently the model free, data driven algorithms, and deals with the

theoretical foundations of these.

Prerequisites
Any student who has done the course E0 232 -- Probability and Statistics or an equivalent probability course.
Syllabus
Introduction to reinforcement learning, introduction to stochastic dynamic programming, finite and infinite

horizon models, the dynamic programming algorithm, infinite horizon discounted cost and average cost

Page 1/2
problems, numerical solution methodologies, full state representations, function approximation techniques,

approximate dynamic programming, partially observable Markov decision processes, Q-learning, temporal

difference learning, actor-critic algorithms.

Course outcomes
The students will get to know modelling and analysis tools and techniques for problems of dynamic decision

making under uncertainty. They will know the algorithms they can apply when faced with such problems and

the convergence and accuracy guarantees that such algorithms would provide.
Grading policy
Two mid term exams, One course project, and One final exam
Assignments

Resources

Page 2/2

Control Systems and Reinforcement Learning (Sean Meyn) (Z-Library)
No ratings yet
Control Systems and Reinforcement Learning (Sean Meyn) (Z-Library)
453 pages
RL Class Notes
No ratings yet
RL Class Notes
68 pages
RL Frontmatter
No ratings yet
RL Frontmatter
11 pages
Lecture 10
No ratings yet
Lecture 10
25 pages
RLcourseoutline 2025
No ratings yet
RLcourseoutline 2025
2 pages
RL-Notes Book
No ratings yet
RL-Notes Book
119 pages
Algorithms For Reinforced Learning
No ratings yet
Algorithms For Reinforced Learning
98 pages
DP by Bellman Functional Equation
No ratings yet
DP by Bellman Functional Equation
296 pages
Reinforcement Learning and Optimal Control - Draft Version by Dmitri Bertsekas
No ratings yet
Reinforcement Learning and Optimal Control - Draft Version by Dmitri Bertsekas
268 pages
An Introduction To Reinforcement Learning From Theory To Algorithms (December 19, 2024) - Joon Kwon
No ratings yet
An Introduction To Reinforcement Learning From Theory To Algorithms (December 19, 2024) - Joon Kwon
66 pages
MIT6 231F15 Notes PDF
No ratings yet
MIT6 231F15 Notes PDF
303 pages
Bayesian Reinforcement Learning
No ratings yet
Bayesian Reinforcement Learning
27 pages
Reinforcement Learning: Foundations
No ratings yet
Reinforcement Learning: Foundations
276 pages
Algorithms For Reinforcement Learning - Szepesvari
No ratings yet
Algorithms For Reinforcement Learning - Szepesvari
98 pages
Acrl Syllabus
No ratings yet
Acrl Syllabus
2 pages
La5 PDF
No ratings yet
La5 PDF
35 pages
DL Unit 6 QP Solution
No ratings yet
DL Unit 6 QP Solution
15 pages
Lecture 1
No ratings yet
Lecture 1
26 pages
Powell-Tutorial-ComputationalStochasticOptimization Informs Nov152014
No ratings yet
Powell-Tutorial-ComputationalStochasticOptimization Informs Nov152014
142 pages
CSA3003 - REINFORCEMENT-LEARNING - LT - 1.0 - 1 - CSA3003 - Reinforcement Learning
No ratings yet
CSA3003 - REINFORCEMENT-LEARNING - LT - 1.0 - 1 - CSA3003 - Reinforcement Learning
2 pages
Unit 5
No ratings yet
Unit 5
39 pages
RLAlgs in MDPs
No ratings yet
RLAlgs in MDPs
98 pages
Lecture13 Postclass
No ratings yet
Lecture13 Postclass
36 pages
Gujarat Technological University: Bachelor of Engineering Syllabus Subject Code: Subject Name
No ratings yet
Gujarat Technological University: Bachelor of Engineering Syllabus Subject Code: Subject Name
3 pages
RL Test Leif
No ratings yet
RL Test Leif
163 pages
RL Monograph1
No ratings yet
RL Monograph1
42 pages
Application of Reinforcement Learning - Finance
No ratings yet
Application of Reinforcement Learning - Finance
540 pages
Control Systems and Reinforcement Learning - Sean Meyn - 2022 - Cambridge University Press - 9781009051873 - Anna's Archive
No ratings yet
Control Systems and Reinforcement Learning - Sean Meyn - 2022 - Cambridge University Press - 9781009051873 - Anna's Archive
454 pages
Markov Decision Processes: Lecture Notes For STP 425: Jay Taylor
100% (1)
Markov Decision Processes: Lecture Notes For STP 425: Jay Taylor
86 pages
Simulation-Based Optimization Parametric Optimizat
100% (1)
Simulation-Based Optimization Parametric Optimizat
11 pages
Deep Reinforcement Learning Handout v2.0
0% (1)
Deep Reinforcement Learning Handout v2.0
6 pages
Ashwin Rao, Tikhon Jelvis - Foundations of Reinforcement Learning With Applications in Finance-CRC Press - Chapman & Hall (2022)
No ratings yet
Ashwin Rao, Tikhon Jelvis - Foundations of Reinforcement Learning With Applications in Finance-CRC Press - Chapman & Hall (2022)
522 pages
Approximate Dynamic Programming - II: Algorithms: Warren B. Powell
No ratings yet
Approximate Dynamic Programming - II: Algorithms: Warren B. Powell
22 pages
MIT6 231F11 Notes Short
No ratings yet
MIT6 231F11 Notes Short
125 pages
AIML II Test Scheme and Soluion 2023
No ratings yet
AIML II Test Scheme and Soluion 2023
12 pages
Tut21 RL
No ratings yet
Tut21 RL
101 pages
RL Module 4
No ratings yet
RL Module 4
50 pages
5SC28 L7 Machine Learning
No ratings yet
5SC28 L7 Machine Learning
61 pages
Approximate Dynamic Programming and Reinforcement Learning - Algorithms, Analysis and An Application
No ratings yet
Approximate Dynamic Programming and Reinforcement Learning - Algorithms, Analysis and An Application
139 pages
Deep Reinforcement Learning: Lecture Notes
No ratings yet
Deep Reinforcement Learning: Lecture Notes
60 pages
Abstract Dynamic Programming
No ratings yet
Abstract Dynamic Programming
257 pages
20ai903 - RL - Unit 2
No ratings yet
20ai903 - RL - Unit 2
27 pages
5.4-Reinforcement Learning-Part1-Introduction
No ratings yet
5.4-Reinforcement Learning-Part1-Introduction
15 pages
Audio To Text Embedding
No ratings yet
Audio To Text Embedding
144 pages
Lecture 30 Reinforcement-Learning
No ratings yet
Lecture 30 Reinforcement-Learning
50 pages
5SC28 Machine Learning For Systems and Control
No ratings yet
5SC28 Machine Learning For Systems and Control
68 pages
Chapter 1 PDF
No ratings yet
Chapter 1 PDF
45 pages
Introduction To Stochastic Dynamic Programming: Sheldon Ross
No ratings yet
Introduction To Stochastic Dynamic Programming: Sheldon Ross
4 pages
Adprl Chapter Icis
No ratings yet
Adprl Chapter Icis
43 pages
AbstractDynamic Programming
No ratings yet
AbstractDynamic Programming
422 pages
DLMAIRIL01 Q4-2024 Session2
No ratings yet
DLMAIRIL01 Q4-2024 Session2
68 pages
Reinforcement Learning and Dynamic Programming For Control
100% (1)
Reinforcement Learning and Dynamic Programming For Control
111 pages
An Overview of Machine Learning
No ratings yet
An Overview of Machine Learning
42 pages
Fundamentals of Reinforcement Learning Learning Objectives
No ratings yet
Fundamentals of Reinforcement Learning Learning Objectives
3 pages
MIT6 231F15 Complete Slide
No ratings yet
MIT6 231F15 Complete Slide
166 pages
Add-On DRL CS06
No ratings yet
Add-On DRL CS06
23 pages
CS 4501-Introduction To Reinforcement Learning
No ratings yet
CS 4501-Introduction To Reinforcement Learning
7 pages
Reinforcement Learning I:: The Setting and Classical Stochastic Dynamic Programming Algorithms
No ratings yet
Reinforcement Learning I:: The Setting and Classical Stochastic Dynamic Programming Algorithms
42 pages
Pathways to Machine Learning and Soft Computing: 邁向機器學習與軟計算之路（國際英文版）
From Everand
Pathways to Machine Learning and Soft Computing: 邁向機器學習與軟計算之路（國際英文版）
Jyh-Horng Jeng
No ratings yet
Teaching and Learning in STEM With Computation, Modeling, and Simulation Practices: A Guide for Practitioners and Researchers
From Everand
Teaching and Learning in STEM With Computation, Modeling, and Simulation Practices: A Guide for Practitioners and Researchers
Alejandra J. Magana
No ratings yet
Helmholtz Pitch Notation
No ratings yet
Helmholtz Pitch Notation
13 pages
Phye222 13
No ratings yet
Phye222 13
3 pages
Cinnamic Acid
No ratings yet
Cinnamic Acid
18 pages
Protestation at Speyer PDF
No ratings yet
Protestation at Speyer PDF
28 pages
Nautical Time
No ratings yet
Nautical Time
16 pages
Clock Rate: Clock Cycles Per Second or Its Equivalent
No ratings yet
Clock Rate: Clock Cycles Per Second or Its Equivalent
19 pages
TOPIO
No ratings yet
TOPIO
10 pages
Anglo-French Conference On Time-Keeping at Sea
No ratings yet
Anglo-French Conference On Time-Keeping at Sea
6 pages
Proof of Delivery
No ratings yet
Proof of Delivery
8 pages
Scan Chain: Scan Chain Is A Technique Used in Design
No ratings yet
Scan Chain: Scan Chain Is A Technique Used in Design
7 pages
Data Signaling Rate
No ratings yet
Data Signaling Rate
10 pages
Scheduled Power Outages in Northern California Begin
No ratings yet
Scheduled Power Outages in Northern California Begin
8 pages
Product Binning Is The Categorizing of
No ratings yet
Product Binning Is The Categorizing of
11 pages
Biophilia Hypothesis
100% (1)
Biophilia Hypothesis
23 pages
Conservation Status: Near Threatened (IUCN 3.1)
No ratings yet
Conservation Status: Near Threatened (IUCN 3.1)
1 page
Bionomical Name
No ratings yet
Bionomical Name
1 page
List Suggested Books Indian Authors Publishers PDF
No ratings yet
List Suggested Books Indian Authors Publishers PDF
52 pages
Origins of Frame Story
No ratings yet
Origins of Frame Story
1 page
Breed Registry: Herdbook, Studbook or Register, in Animal
No ratings yet
Breed Registry: Herdbook, Studbook or Register, in Animal
35 pages
Color Breed PDF
No ratings yet
Color Breed PDF
9 pages
Structure of The Comprehensive Examination in The ME Department For Circulation To Students
No ratings yet
Structure of The Comprehensive Examination in The ME Department For Circulation To Students
4 pages
ME 688 Advanced Machining Processes (3-0-0-6) : Textbooks
No ratings yet
ME 688 Advanced Machining Processes (3-0-0-6) : Textbooks
1 page
ME150 Non-Conventional Manufacturing
No ratings yet
ME150 Non-Conventional Manufacturing
1 page
The Art of Reinforcement Learning: Fundamentals, Mathematics, and Implementations With Python 1st Edition Michael Hu
No ratings yet
The Art of Reinforcement Learning: Fundamentals, Mathematics, and Implementations With Python 1st Edition Michael Hu
49 pages
LLM Agent
No ratings yet
LLM Agent
10 pages
1 Automatic Collective Motion Tuning Using Actor-Critic Deep Reinforcement Learning
No ratings yet
1 Automatic Collective Motion Tuning Using Actor-Critic Deep Reinforcement Learning
15 pages
Reinforcement Learning Is " ": Teach by Experience
No ratings yet
Reinforcement Learning Is " ": Teach by Experience
5 pages
Master Thesis
No ratings yet
Master Thesis
77 pages
Adaptive Laser Welding Control A Reinforcement Learning Approach
No ratings yet
Adaptive Laser Welding Control A Reinforcement Learning Approach
13 pages
Lecture 4
No ratings yet
Lecture 4
21 pages
Flexible Job-Shop Scheduling Via Graph Neural Network and Deep Reinforcement Learning
No ratings yet
Flexible Job-Shop Scheduling Via Graph Neural Network and Deep Reinforcement Learning
11 pages
Section 2 - Introduction To Machine Learning-Bje Edits - Ipynb - Colab
No ratings yet
Section 2 - Introduction To Machine Learning-Bje Edits - Ipynb - Colab
7 pages
CM3 Cooperative Multi-Goal Multi-Stage Multi-Agent Reinforcement Learning
No ratings yet
CM3 Cooperative Multi-Goal Multi-Stage Multi-Agent Reinforcement Learning
24 pages
Unit V
No ratings yet
Unit V
165 pages
Stanford CME241
No ratings yet
Stanford CME241
35 pages
Depth First Learning Learning
No ratings yet
Depth First Learning Learning
6 pages
FSI Document Bhavya PDF
No ratings yet
FSI Document Bhavya PDF
80 pages
Large Language Models Are Neurosymbolic Reasoners
No ratings yet
Large Language Models Are Neurosymbolic Reasoners
9 pages
Reinforcement Learning
100% (1)
Reinforcement Learning
31 pages
Paper 105
No ratings yet
Paper 105
4 pages
Ballistic Missile Maneuver Penetration Based On Reinforcement Learning
No ratings yet
Ballistic Missile Maneuver Penetration Based On Reinforcement Learning
5 pages
Assignment 2 - Policy Gradients
No ratings yet
Assignment 2 - Policy Gradients
7 pages
B.tech 2 2 CSE AI ML CSE AI R20 Course Structue Syllabi
No ratings yet
B.tech 2 2 CSE AI ML CSE AI R20 Course Structue Syllabi
38 pages
Model Ensemble Trpo
No ratings yet
Model Ensemble Trpo
15 pages
Choi Ahn 2025 Uncertainty Aware Autonomous Mars Landing Guidance With Curriculum Reinforcement Learning
No ratings yet
Choi Ahn 2025 Uncertainty Aware Autonomous Mars Landing Guidance With Curriculum Reinforcement Learning
20 pages
Agents 101: Artificial Intelligence & Machine Learning
100% (1)
Agents 101: Artificial Intelligence & Machine Learning
27 pages
Ashwin Kumar REPORT - 1BI21IS019
No ratings yet
Ashwin Kumar REPORT - 1BI21IS019
57 pages
TS21
No ratings yet
TS21
163 pages
Kubernetes and Container Orchestration: Exploring Advanced Scheduling and Resource Optimization Techniques
No ratings yet
Kubernetes and Container Orchestration: Exploring Advanced Scheduling and Resource Optimization Techniques
16 pages
Machine Learning For Dynamic Pricing in E-Commerce
No ratings yet
Machine Learning For Dynamic Pricing in E-Commerce
7 pages
Survey
No ratings yet
Survey
20 pages
Multi-Agent Reinforcement Learning For Traffic Signal Control Through Universal Communication Method
No ratings yet
Multi-Agent Reinforcement Learning For Traffic Signal Control Through Universal Communication Method
12 pages

E1 277 January-April 3:1 Reinforcement Learning: Instructor

Uploaded by

E1 277 January-April 3:1 Reinforcement Learning: Instructor

Uploaded by

E1 277 January-April 3:1

Department: Computer Science and Automation

Brief description of the course

theoretical foundations of these.

difference learning, actor-critic algorithms.

You might also like