Reinforcement Learning- Introduction

Uploaded by

rajputdhruvi12

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views

Reinforcement Learning- Introduction

Uploaded by

rajputdhruvi12

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 12

Reinforcement Learning

Definition

• Software agent learns to perform certain actions in an environment

which lead it to maximum reward.
• Exploration and Exploitation
• Multiple Trials
Type of ML

Machine Learning
Reinforcement:
Supervised • Cause and Effect
• Agent learns to interact
with environment for
reward.
Unsupervised

Reinforcement
Intuitive example

• Imagine you are supposed to cross an unknown field in the middle of

a pitch-black night without a torch.
• There can be pits and stones in the field, the position of those are
unfamiliar to you.
• There's a simple rule - if you fall into a hole or hit a rock, you must
start again from your initial point.
Block Diagram
Definitions

• Agent: Entity performing action in environment to gain reward.

• Action (a): All possible moves by agent.
• Environment (e): Scenario faced by agent.
• State (s): Current situation returned by the agent.
Definitions
• Reward(R): An immediate return sent from Environment to evaluate
last action by agent.
• Policy (𝜋): Strategy that an agent employs to determine next action
based on state s.
• Value (V): The expected long-term return with discount 𝑉𝜋 𝑠 .
Opposed to R.
• Q value or action value (Q): 𝑄𝜋 𝑠, 𝑎 : Long term return of current
state s, taking action a under policy 𝜋
Types of Reinforcement Learning

Reinforcement
Value Based

Policy based

Model Based
Value Based
• Try to maximize a value function 𝑉(𝑠)
max 𝑉𝜋(𝑠)

• The value of reward which the agent expects to gain in the future
upon starting at that state s.
• 𝐸- 𝑅/01 + 𝛾𝑅/04 + 𝛾 4 𝑅/05 + ⋯ |𝑆/ = 𝑠
Policy Based
• Try to produce a policy such that the action performed at each state is
optimal to gain maximum reward in the future.
• 𝜋 𝑠, 𝑎

• Deterministic
• At any state s, same action a is produced by policy 𝜋

• Stochastic: 𝜋 𝑎 𝑠 = 𝑃(𝐴/ = 𝑎|𝑆/ = 𝑠)

• Each action has a certain probability.
Model Based

• In this type of reinforcement learning, create a virtual model for each

environment,
• The agent learns to perform in that specific environment.
• Since the model differs for each environment, there is no singular
solution or algorithm for this type.
Multi-arm Bandit Problem
• Consider Casino section with 10 slot machine. It has written “Play for
Free ! Max. payout is $10.
• Each slot machine has different average payout.

• Goal: Find which one gives most average reward so as to maximize

reward in shortest time.

Motion To Dismiss With Prejudice
86% (42)
Motion To Dismiss With Prejudice
90 pages
Pediatric Evaluation Report
100% (3)
Pediatric Evaluation Report
3 pages
Context Clues Definitions and Restatement
100% (4)
Context Clues Definitions and Restatement
60 pages
Unit-5 Mla
No ratings yet
Unit-5 Mla
22 pages
UNIT-3
No ratings yet
UNIT-3
29 pages
Reinforced Learning
No ratings yet
Reinforced Learning
25 pages
Lecture 5
No ratings yet
Lecture 5
28 pages
Reinforcement Learning
100% (1)
Reinforcement Learning
25 pages
Reinforcement
No ratings yet
Reinforcement
9 pages
L-14 - Reinforcement-L-d-07062024-111949am
No ratings yet
L-14 - Reinforcement-L-d-07062024-111949am
22 pages
What Is Reinforcement Learning
No ratings yet
What Is Reinforcement Learning
15 pages
What Is Reinforcement Learning
No ratings yet
What Is Reinforcement Learning
5 pages
Neural Networks: 1 October, 2016
No ratings yet
Neural Networks: 1 October, 2016
51 pages
RL Vishnu Sankar
No ratings yet
RL Vishnu Sankar
26 pages
Reinforcement Learning: Karan Kathpalia
No ratings yet
Reinforcement Learning: Karan Kathpalia
80 pages
Unit-5 (AI)
No ratings yet
Unit-5 (AI)
21 pages
Reinforcement Learning MY101
No ratings yet
Reinforcement Learning MY101
15 pages
L11 Reinforcement Learning 1
No ratings yet
L11 Reinforcement Learning 1
18 pages
Unit 5
No ratings yet
Unit 5
45 pages
lecture 9 Reiforcement learning (1)
No ratings yet
lecture 9 Reiforcement learning (1)
29 pages
UNIT-4
No ratings yet
UNIT-4
56 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
32 pages
ML-10
No ratings yet
ML-10
9 pages
MLT Unit-5 notes
No ratings yet
MLT Unit-5 notes
17 pages
Module 1
No ratings yet
Module 1
72 pages
Lecture Week12
No ratings yet
Lecture Week12
37 pages
7.reinforcement Learning-Introduction-The Learning Task Q-Learning
No ratings yet
7.reinforcement Learning-Introduction-The Learning Task Q-Learning
34 pages
Unit V Reinforcement Learning and Genetic Algorithm
No ratings yet
Unit V Reinforcement Learning and Genetic Algorithm
40 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
30 pages
RL & DL Notes
No ratings yet
RL & DL Notes
43 pages
Module_1 - Reinforcement Learning and Markov Decision Process
No ratings yet
Module_1 - Reinforcement Learning and Markov Decision Process
19 pages
Introduction To Reinforcement Learning: Presented by - Rohit Mahto
No ratings yet
Introduction To Reinforcement Learning: Presented by - Rohit Mahto
9 pages
RL & DL Notes
No ratings yet
RL & DL Notes
73 pages
Fundamentals of Reinforcement Learning
No ratings yet
Fundamentals of Reinforcement Learning
33 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
29 pages
UNIT VI
No ratings yet
UNIT VI
17 pages
L13 Reinforcement Learning
No ratings yet
L13 Reinforcement Learning
57 pages
AI Week 15
No ratings yet
AI Week 15
3 pages
Reinforcement Learning-1
No ratings yet
Reinforcement Learning-1
13 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
6 pages
Ai Unit 3
No ratings yet
Ai Unit 3
23 pages
ML UNIT 5
No ratings yet
ML UNIT 5
13 pages
Unit 5 - Reinforcement Learning
No ratings yet
Unit 5 - Reinforcement Learning
15 pages
Artificial Intelligence: Computer Science & Engineering, Khulna University
No ratings yet
Artificial Intelligence: Computer Science & Engineering, Khulna University
30 pages
Types of Data:: Reference Website
No ratings yet
Types of Data:: Reference Website
15 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
32 pages
Unit-5
No ratings yet
Unit-5
58 pages
Unit-8 - Reinforcement Learning
No ratings yet
Unit-8 - Reinforcement Learning
52 pages
Unit 5 ML 3year
No ratings yet
Unit 5 ML 3year
17 pages
Unit 5
No ratings yet
Unit 5
10 pages
Unit-5 ML Notes
No ratings yet
Unit-5 ML Notes
31 pages
RL Unit 1
100% (1)
RL Unit 1
26 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
8 pages
AI (IT) UNIT-5
No ratings yet
AI (IT) UNIT-5
43 pages
Chapter 18 - Reinforcement Learning
No ratings yet
Chapter 18 - Reinforcement Learning
29 pages
Sara Reinforcement Learning
No ratings yet
Sara Reinforcement Learning
69 pages
AI unit -3.docx
No ratings yet
AI unit -3.docx
102 pages
Reinforcement Learning: Nazia Bibi
100% (1)
Reinforcement Learning: Nazia Bibi
61 pages
21ai020 & Reinforcement Learning UNIT 1-LM:1
No ratings yet
21ai020 & Reinforcement Learning UNIT 1-LM:1
8 pages
Reinforcement Learning: By: Chandra Prakash IIITM Gwalior
No ratings yet
Reinforcement Learning: By: Chandra Prakash IIITM Gwalior
64 pages
Ai PPT New
No ratings yet
Ai PPT New
14 pages
RL
No ratings yet
RL
27 pages
Reinforcement Learning Explained - A Step-by-Step Guide to Reward-Driven AI
From Everand
Reinforcement Learning Explained - A Step-by-Step Guide to Reward-Driven AI
Luka Nikolic
No ratings yet
CV Latest
No ratings yet
CV Latest
2 pages
Suicide, Assisted Suicide and Euthanasia - A Buddhist Perspective
No ratings yet
Suicide, Assisted Suicide and Euthanasia - A Buddhist Perspective
22 pages
1.hindu Websites Sorted Alphabetically
No ratings yet
1.hindu Websites Sorted Alphabetically
522 pages
Teacher Qualification and Experience As Determinants of Quality Chemistry Education in Nigeria
No ratings yet
Teacher Qualification and Experience As Determinants of Quality Chemistry Education in Nigeria
9 pages
Sexism in Childrens Lit
No ratings yet
Sexism in Childrens Lit
18 pages
Central New Hampshire Health Partnership Community Health Needs Assessment 2011
No ratings yet
Central New Hampshire Health Partnership Community Health Needs Assessment 2011
200 pages
Understanding German Prepositions 1
No ratings yet
Understanding German Prepositions 1
7 pages
Project Management For Engineers
No ratings yet
Project Management For Engineers
2 pages
Criminal Apeal 184-2020
No ratings yet
Criminal Apeal 184-2020
4 pages
Is Quality Education A Livelihood Strategy?
No ratings yet
Is Quality Education A Livelihood Strategy?
136 pages
Macromolecules 2005, 38, 6770-6774
No ratings yet
Macromolecules 2005, 38, 6770-6774
5 pages
PSSC Chapter 12
No ratings yet
PSSC Chapter 12
20 pages
HRM Course Outline
No ratings yet
HRM Course Outline
3 pages
A Rule-Based Lemmatizing Approach For Sinhala Language: Maheshi Nandathilaka Supunmali Ahangama G. Thilini Weerasuriya
No ratings yet
A Rule-Based Lemmatizing Approach For Sinhala Language: Maheshi Nandathilaka Supunmali Ahangama G. Thilini Weerasuriya
5 pages
Unit 5 - Property and Power - Mutual Gains and Conflicting Introduction, 5
No ratings yet
Unit 5 - Property and Power - Mutual Gains and Conflicting Introduction, 5
5 pages
2ND EXAM STS WITH TABLE OF SPECIFICATION (TOS)
No ratings yet
2ND EXAM STS WITH TABLE OF SPECIFICATION (TOS)
4 pages
The Making of A Survivor
No ratings yet
The Making of A Survivor
11 pages
CV Phadi 2009 Admin.
100% (2)
CV Phadi 2009 Admin.
3 pages
Untitled Presentation
No ratings yet
Untitled Presentation
5 pages
SQL Primjeri
No ratings yet
SQL Primjeri
18 pages
Ultrasonic Testing
No ratings yet
Ultrasonic Testing
2 pages
UNDERSTANDING THE SELF
No ratings yet
UNDERSTANDING THE SELF
14 pages
G and E Workbook 2017 - REDUCED
No ratings yet
G and E Workbook 2017 - REDUCED
53 pages
No. 93-5080, 27 F.3d 58, 3rd Cir. (1994)
No ratings yet
No. 93-5080, 27 F.3d 58, 3rd Cir. (1994)
12 pages
BTech Civil Engineering PDF
No ratings yet
BTech Civil Engineering PDF
4 pages
HEC-HMS Release Notes 4.3
No ratings yet
HEC-HMS Release Notes 4.3
25 pages
Geometric Patterns with Creative Coding: Coding for the Arts 1st Edition Selçuk Artut - The complete ebook set is ready for download today
100% (5)
Geometric Patterns with Creative Coding: Coding for the Arts 1st Edition Selçuk Artut - The complete ebook set is ready for download today
74 pages