0% found this document useful (0 votes)

51 views10 pages

Slides-ASR Presentation Formulation

This document provides an overview of real-time machine learning using PyBrain. It discusses PyBrain and alternative machine learning frameworks, how reinforcement learning differs from other types of machine learning problems, and how PyBrain supports reinforcement learning. It then gives examples of using PyBrain for real-time reinforcement learning, including an inverted pendulum and maze navigation problem. The document concludes by outlining some potential modifications to PyBrain's source code for reinforcement learning tasks.

Uploaded by

Bisma Nusa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

51 views10 pages

Slides-ASR Presentation Formulation

Uploaded by

Bisma Nusa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 10

Real-Time Machine Learning with PyBrain

Boris Mocialov

Engineering & Physical Sciences

Heriot-Watt University,
Edinburgh Centre For Robotics

2015

1 / 10
Outline

PyBrain

Alternatives

Short on RL

PyBrain RL

Examples

Source Alterations

2 / 10
PyBrain

I Easy-To-Use
I Algorithms for ANN, UL, SL, RL, Evolution
I Modular
I FF/R-NN, LSTM, Deep Belief, Boltzmann Machines

3 / 10
ML Alternatives
I FANN(.c/.cpp)
Fast, evolving topologies, adjust parameters on-the-fly
I Encog(.java)
Multi-threaded, SVM, ANN, GP, BN, HMM, GA
I Theano(.py)
Number-crunching framework, tight integration with Numpy,
fast, many sub-projects:
I Pylearn, Theanets [scientific]
I Lasagne [lightweight (FF/C/R-NN), LSTM, CPU/GPU]
I Keras [modular, minimalistic, (C/R-NN), CPU/GPU]
I Caffe(.cpp)
models defined separately, CPU/GPU
I Accord(.net)
combined with audio/video processing libraries, backprop,
DBN, BM
etc.
4 / 10
Short on RL

I Data is spread out in the environment and spates are

distinguished
I Algorithm (agent) must learn mapping between input and
output (behaviour)
I Agent must explore the environment
I Agent receives reinforcement based on the state transitions

5 / 10
PyBrain RL

PyBrain src pybrain.rl.environments.mazes

PyBrain src pybrain.rl.learners.valuebased 6 / 10

Examples
I Inverted Pendulum (aka pole balancing)
Continuous states
Certain Transitions
Neuro-Fitted Q-Learning
Epsilon-Greedy
Stationary
Fully Observable
Finite Horizon

I Maze
Discrete states
Certain Transitions
Q-Learning
Epsilon-Greedy
(Non-)Stationary
Fully Observable
Finite Horizon
7 / 10
Source Alterations
I pybrain.rl.environments.mazes.maze
class Maze(Environment, Named):
initPos = None
def __init__(self, topology, goal, **args):
if self.initPos == None:
self.initPos = self._freePos()
def _freePos(self):
if self.punishing_states != None:
if (i, j) not in self.punishing_states:
res.append((i, j))

I pybrain.rl.environments.mazes.tasks
class MDPMazeTask(Task):
def getReward(self):
if self.env.goal == self.env.perseus:
self.env.reset()
reward = 1
elif self.env.punishing_states != None and
self.env.perseus in self.env.punishing_states:
self.env.reset()
reward = -1
else:
reward = -0.02
return rewar

I pybrain.rl.explorers.discrete.egreedy
class EpsilonGreedyExplorer(DiscreteExplorer):
#self.epsilon *= self.decay

8 / 10
Maze Real-Time Learning Set-Up
envmatrix = array([[1, 1, 1, 1, 1, 1, 1, 1, 1],
...])
env = Maze(envmatrix, (1, 7), [(1, 1)], [(1, 6)])

# create task
task = MDPMazeTask(env)

# create value table and initialize with ones

table = ActionValueTable(81, 4)
table.initialize(0.)

# create agent with controller and learner

learner = Q()

# create agent
agent = LearningAgent(table, learner)

# create experiment
experiment = Experiment(task, agent)

for i in range(5000):
# interact with the environment (here in batch mode)
experiment.doInteractions(200)
agent.learn()
agent.reset()

if i == 2500:
env.clearPunishingStates()

9 / 10
Results

First 2500 Iterations

Second 2500 Iterations

10 / 10

Resilient H State Estimation For Discrete-Time Stochastic Delayed Memristive Neural Networks A Dynamic Event-Triggered Mechanism
No ratings yet
Resilient H State Estimation For Discrete-Time Stochastic Delayed Memristive Neural Networks A Dynamic Event-Triggered Mechanism
9 pages
Lec-All Deep Learning Coursework
100% (2)
Lec-All Deep Learning Coursework
639 pages
C++ Notes
67% (3)
C++ Notes
45 pages
A Gentle Introduction To Neural Networks With Python
100% (1)
A Gentle Introduction To Neural Networks With Python
85 pages
RLDL128
No ratings yet
RLDL128
73 pages
A Gentle Introduction To Neural Networks With Python
No ratings yet
A Gentle Introduction To Neural Networks With Python
85 pages
Monte Carlo Simulations
No ratings yet
Monte Carlo Simulations
17 pages
Best Machine Learning Platform Comparison
No ratings yet
Best Machine Learning Platform Comparison
38 pages
Aa 7 1 Awp Sec Guid
100% (1)
Aa 7 1 Awp Sec Guid
144 pages
Electronic Data Backup SOP
No ratings yet
Electronic Data Backup SOP
8 pages
Quiz 3
No ratings yet
Quiz 3
5 pages
Reinforcement Learning For IoT - Final
No ratings yet
Reinforcement Learning For IoT - Final
45 pages
MachineLearningSlides PartTwo
No ratings yet
MachineLearningSlides PartTwo
141 pages
2015.08.26.Lecture01Intro 2
No ratings yet
2015.08.26.Lecture01Intro 2
37 pages
A Crash Course On Reinforcement Learning
No ratings yet
A Crash Course On Reinforcement Learning
40 pages
0905IT161047 Sandesh
No ratings yet
0905IT161047 Sandesh
38 pages
Deepmind Control Suite
No ratings yet
Deepmind Control Suite
24 pages
Algorithm For Intelligent Systems and robotics-STUDEXGUD
No ratings yet
Algorithm For Intelligent Systems and robotics-STUDEXGUD
83 pages
ICML 2018 Notes: Stockholm, Sweden
No ratings yet
ICML 2018 Notes: Stockholm, Sweden
55 pages
Technical Report: Supervised Training of Convolutional Spiking Neural Networks With Pytorch
No ratings yet
Technical Report: Supervised Training of Convolutional Spiking Neural Networks With Pytorch
24 pages
Do Large Language Models Need Sensory Grounding For Meaning and Understanding?
No ratings yet
Do Large Language Models Need Sensory Grounding For Meaning and Understanding?
38 pages
MachineLearningSlides PartOne
No ratings yet
MachineLearningSlides PartOne
252 pages
Neuroevolution Through Erlang: Erlang Factory San Francisco - March 2012
No ratings yet
Neuroevolution Through Erlang: Erlang Factory San Francisco - March 2012
92 pages
Neural Networks
No ratings yet
Neural Networks
39 pages
IBest DeepLearning
No ratings yet
IBest DeepLearning
123 pages
PyBrain Slides
No ratings yet
PyBrain Slides
20 pages
Practical
No ratings yet
Practical
6 pages
( (Soft Computing) ) (IT - 8002) : Enrollment No.-:0905IT161041 Department - :information Technology Batch - : 2016-2020
No ratings yet
( (Soft Computing) ) (IT - 8002) : Enrollment No.-:0905IT161041 Department - :information Technology Batch - : 2016-2020
37 pages
Lecture 15
No ratings yet
Lecture 15
43 pages
ML Unit-5
No ratings yet
ML Unit-5
14 pages
Assignment-1 MLDS Lab
No ratings yet
Assignment-1 MLDS Lab
3 pages
Artificial Neural Network: Jony Sugianto 0812-13086659
No ratings yet
Artificial Neural Network: Jony Sugianto 0812-13086659
52 pages
Lec3 MLP Optimization
No ratings yet
Lec3 MLP Optimization
86 pages
Short MCMC Supplementary
No ratings yet
Short MCMC Supplementary
5 pages
Institute of Engineering and Technology Davv, Indore: Lab Assingment On
No ratings yet
Institute of Engineering and Technology Davv, Indore: Lab Assingment On
14 pages
Rlpyt: A Research Code Base For Deep Reinforcement Learning in Pytorch
No ratings yet
Rlpyt: A Research Code Base For Deep Reinforcement Learning in Pytorch
12 pages
Unit - 1
No ratings yet
Unit - 1
14 pages
AIDL03 EvolutionOfAI
No ratings yet
AIDL03 EvolutionOfAI
22 pages
Control Using Soft Computing PDF
No ratings yet
Control Using Soft Computing PDF
8 pages
SocrAI Day 4
No ratings yet
SocrAI Day 4
38 pages
Documentation
No ratings yet
Documentation
75 pages
Module 4
No ratings yet
Module 4
36 pages
Ems729 230784176
No ratings yet
Ems729 230784176
7 pages
Lab 6
No ratings yet
Lab 6
29 pages
GPT2 From Scratch in PyTorch
No ratings yet
GPT2 From Scratch in PyTorch
13 pages
Sid AIML SEM6
No ratings yet
Sid AIML SEM6
32 pages
IP SAN BestPractice WP PDF
No ratings yet
IP SAN BestPractice WP PDF
11 pages
Computational Models For Generic Cortical Microcircuits
No ratings yet
Computational Models For Generic Cortical Microcircuits
26 pages
Basic Interview Question
No ratings yet
Basic Interview Question
8 pages
Le 64
No ratings yet
Le 64
1 page
Ile 44
No ratings yet
Ile 44
1 page
Project 3 2025 Opt Undergrad - 987675519 250520 133740
No ratings yet
Project 3 2025 Opt Undergrad - 987675519 250520 133740
52 pages
Ile 50
No ratings yet
Ile 50
1 page
Le 67
No ratings yet
Le 67
1 page
WebPortal - SLDA Software Update - V1.2 PDF
No ratings yet
WebPortal - SLDA Software Update - V1.2 PDF
2 pages
Dynamic Neural Learning Engine Complete
No ratings yet
Dynamic Neural Learning Engine Complete
9 pages
Avoiding Death Through Fear Intrinsic Conditioning: Rodney Sanchez
No ratings yet
Avoiding Death Through Fear Intrinsic Conditioning: Rodney Sanchez
22 pages
RLDL
No ratings yet
RLDL
23 pages
Introduction To Neural Networks
No ratings yet
Introduction To Neural Networks
54 pages
Rupam's Master Thesis
No ratings yet
Rupam's Master Thesis
58 pages
Ile 66
No ratings yet
Ile 66
1 page
Step 1
No ratings yet
Step 1
1 page
Experiment-10 (Adder & Subtractor)
No ratings yet
Experiment-10 (Adder & Subtractor)
7 pages
HTTPSWWW - Eecs.tufts - Edu Jsinapovteachingcomp138 RL Spring2025slides17 Approximation For Control PDF
No ratings yet
HTTPSWWW - Eecs.tufts - Edu Jsinapovteachingcomp138 RL Spring2025slides17 Approximation For Control PDF
34 pages
PMID901 BN06.01.003.015.01 Firmware Upgrade Guide 4.0v1 - OTA
No ratings yet
PMID901 BN06.01.003.015.01 Firmware Upgrade Guide 4.0v1 - OTA
7 pages
Report ML Aat g1 Final
No ratings yet
Report ML Aat g1 Final
8 pages
127 STD 12 Viva Question Answers
0% (2)
127 STD 12 Viva Question Answers
15 pages
Mid Sem AI Humorous With Problems
No ratings yet
Mid Sem AI Humorous With Problems
2 pages
Apd5 Readme en
No ratings yet
Apd5 Readme en
4 pages
Passive Income100 Legit Ways To Earn Money Online
No ratings yet
Passive Income100 Legit Ways To Earn Money Online
2 pages
Server Poweredge t710 Technical Guide Book
No ratings yet
Server Poweredge t710 Technical Guide Book
56 pages
Reducing Computation Time For Short Bit Width Twos Compliment Multiplier
No ratings yet
Reducing Computation Time For Short Bit Width Twos Compliment Multiplier
57 pages
RPT Literasi Komputer Tingkatan 2
No ratings yet
RPT Literasi Komputer Tingkatan 2
12 pages
Crash Recovery
No ratings yet
Crash Recovery
20 pages
Chapter 2: Linear Programming: Source: Tayloriii (2007)
No ratings yet
Chapter 2: Linear Programming: Source: Tayloriii (2007)
52 pages
A Top-Level View of Computer Function and Interconnection
No ratings yet
A Top-Level View of Computer Function and Interconnection
61 pages
Computer Evolution (進化) and Performance
No ratings yet
Computer Evolution (進化) and Performance
56 pages
Computer Evolution (進化) and Performance
No ratings yet
Computer Evolution (進化) and Performance
56 pages
Topic 6 Online Security
No ratings yet
Topic 6 Online Security
47 pages
Motherboard: Steps To Dissemble The Motherboard
No ratings yet
Motherboard: Steps To Dissemble The Motherboard
4 pages
Three Day SQL Workshop
No ratings yet
Three Day SQL Workshop
1 page
A Chemical Spread Sheet in Microsoft Excel
No ratings yet
A Chemical Spread Sheet in Microsoft Excel
7 pages
Core Java SampleQA
No ratings yet
Core Java SampleQA
93 pages
Sinap New Data Sheet
No ratings yet
Sinap New Data Sheet
4 pages
PlottingMK Rapatedited Plotting
No ratings yet
PlottingMK Rapatedited Plotting
28 pages
Ceh Parte 2
No ratings yet
Ceh Parte 2
17 pages
TMP 17804-MFA Registration578347740
No ratings yet
TMP 17804-MFA Registration578347740
7 pages
A Simple Secure Addressing Scheme For Ipv6 Autoconfiguration (Ssas)
No ratings yet
A Simple Secure Addressing Scheme For Ipv6 Autoconfiguration (Ssas)
9 pages
Measuring Face Translation and Rotation in ANSYS® v14
No ratings yet
Measuring Face Translation and Rotation in ANSYS® v14
5 pages
Integrity Lifecycle Manager 12 Product Platforms PDF
No ratings yet
Integrity Lifecycle Manager 12 Product Platforms PDF
3 pages
Auspy Datasheet
No ratings yet
Auspy Datasheet
2 pages
LNM 6
No ratings yet
LNM 6
4 pages
(Sekolah) : 322 MK - Terpasang Kelas Pagi Kelas Sore SKS - GANJIL - 2016 Nama Dosen Hari
No ratings yet
(Sekolah) : 322 MK - Terpasang Kelas Pagi Kelas Sore SKS - GANJIL - 2016 Nama Dosen Hari
2 pages
Kode - MK Nama - MK Sks Hari - Jamke: SELASA - 1/2
No ratings yet
Kode - MK Nama - MK Sks Hari - Jamke: SELASA - 1/2
1 page
R 312-313 R 314-315 R 316-317 R 318-319 LAB 1-2 SM-5 SM-7 Hari JAM SM-1 SM-3
No ratings yet
R 312-313 R 314-315 R 316-317 R 318-319 LAB 1-2 SM-5 SM-7 Hari JAM SM-1 SM-3
1 page
R 312-313 R 314-315 R 316-317 R 318-319 LAB 1-2 SM-5 SM-7 Hari JAM SM-1 SM-3
No ratings yet
R 312-313 R 314-315 R 316-317 R 318-319 LAB 1-2 SM-5 SM-7 Hari JAM SM-1 SM-3
1 page
Basics of Python Programming: A Quick Guide for Beginners
From Everand
Basics of Python Programming: A Quick Guide for Beginners
Krishna Kumar Mohbey
No ratings yet
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet
Introduction to PHP, Part 5, Second Edition
From Everand
Introduction to PHP, Part 5, Second Edition
Adam Majczak
No ratings yet

Slides-ASR Presentation Formulation

Uploaded by

Slides-ASR Presentation Formulation

Uploaded by

Real-Time Machine Learning with PyBrain

Engineering & Physical Sciences

I Data is spread out in the environment and spates are

PyBrain src pybrain.rl.environments.mazes

PyBrain src pybrain.rl.learners.valuebased 6 / 10

# create value table and initialize with ones

# create agent with controller and learner

First 2500 Iterations

Second 2500 Iterations

You might also like