0% found this document useful (0 votes)

272 views65 pages

Deep Learning Handson

This document provides an overview of deep learning and training a deep neural network (DNN) in Python. It discusses problem definition, training a DNN which involves data analysis, architecture engineering, optimization, and training. It also covers improving the DNN through analysis capabilities, data augmentation, and monitoring layers' training. Finally, it discusses open source packages for hardware, Python frameworks like Theano, and deep learning packages that can help estimate effort. The overall document is a high-level tutorial on deep learning concepts and hands-on training of DNNs in Python.

Uploaded by

Alan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

272 views65 pages

Deep Learning Handson

Uploaded by

Alan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 65

Hands-on

Deep Learning in Python

Imry Kissos
Deep Learning Meetup
TLV August 2015
Outline
● Problem Definition
● Training a DNN

● Improving the DNN

● Open Source Packages
● Summary
2
Problem Definition

Deep
Convolution
Network

1 http://danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-detect-facial-keypoints-tutorial/ 3
Tutorial
● Goal: Detect facial
landmarks on (normal)
face images
● Data set provided by
Dr. Yoshua Bengio
● Tutorial code available:
https://github.com/dnouri/kfkd-tutorial/blob/master/kfkd.py
4
Flow

Train Model Train Model Predict Points

General “Nose Tip” on Test Set

Train Model
“Mouth Corners”
5
Flow

Train Images Fit Trained

Train Points Net

6
Flow

Test Predict Predicted

Images Points

7
Python Deep Learning Framework
High Level

nolearn - Wrapper to Lasagne

Lasagne - Theano extension for Deep Learning

Theano - Define, optimize, and mathematical expressions

Efficient Cuda GPU for DNN Low Level

HW Supports: GPU & CPU

OS: Linux, OS X, Windows 8
Training a Deep Neural Network
1. Data Analysis
2. Architecture Engineering
3. Optimization
4. Training the DNN

9
Training a Deep Neural Network
1. Data Analysis
a. Exploration + Validation
b. Pre-Processing
c. Batch and Split
2. Architecture Engineering
3. Optimization
4. Training the DNN
10
Data Exploration + Validation 1

Data:
● 7K gray-scale images of detected faces
● 96x96 pixels per image
● 15 landmarks per image (?)

Data validation:
● Some Landmarks are missing

11
Pre-Processing

Data
Normalization

Shuffle train data

12
Batch
-
- t - train batch
⇐One Epoch’s data
- validation batch

- - test batch
train/valid/test splits are constant 13
Train / Validation Split

Classification - Train/Validation preserve classes proportion

14
Training a Deep Neural Network
1. Data Analysis
2. Architecture Engineering
a. Layers Definition
b. Layers Implementation
3. Optimization
4. Training

15
Architecture

Conv Pool Dense Output

16
Layers Definition

17
Activation Function 1

ReLU

18
Dense Layer

19
Dropout

20
Dropout

21
Training a Deep Neural Network
1. Data Analysis
2. Architecture Engineering
3. Optimization
a. Back Propagation
b. Objective
c. SGD
d. Updates
e. Convergence Tuning
4. Training the DNN 22
Back Propagation
Forward Path

Output
Conv Dense Points

23
Back Propagation
Forward Path

XY XY

Output Training
Conv Dense Points Points

24
Back Propagation
Backward Path

Conv Dense

25
Back Propagation
Update
For All Layers:

Conv Dense

26
Objective

27
S.G.D Updates the network after each batch

Karpathy - “Babysitting”: weights/updates ~1e3 28

Optimization - Updates

29
Alec Radford
Adjusting Learning Rate & Momentum

Linear in epoch

30
Convergence Tuning

stops according to validation loss

returns best weights

31
Training a Deep Neural Network
1. Data Analysis
2. Architecture Engineering
3. Optimization
4. Training the DNN
a. Fit
b. Fine Tune Pre-Trained
c. Learning Curves

32
Fit

Loop over train batchs

Forward+BackProp

Loop over validation batchs

Forward

33
Fine Tune Pre-Trained
fgd

change output layer

load pre-trained weight

fine tune specialist

34
Learning Curves
Loop over 6 Nets:

Epochs

35
Learning Curves Analysis
Net 1

Net 2
RMSE

RMSE
Epochs Epochs

Convergence Overfitting
Jittering 36
Part 1 Summary
Training a DNN:

37
Part 1 End
Break
Part 2
Beyond Training
Outline
● Problem Definition
● Motivation
● Training a DNN
● Improving the DNN
● Open Source Packages
● Summary

40
Beyond Training
1. Improving the DNN
a. Analysis Capabilities
b. Augmentation
c. Forward - Backward Path
d. Monitor Layers’ Training
2. Open Source Packages
3. Summary

41
Improving the DNN
Very tempting:
● >1M images
● >1M parameters
● Large gap: Theory ↔ Practice

⇒Brute force experiments?!

42
Analysis Capabilities
1. Theoretical explanation
a. Eg. dropout and augmentation decrease overfit
2. Empirical claims about a phenomena
a. Eg. normalization improves convergence
3. Numerical understanding
a. Eg. exploding / vanishing updates

43
Reduce Overfitting Net 1

Net 2

Solution:
Data Augmentation

Epochs

Overfitting
44
Data Augmentation

Horizontal Flip Perturbation

45
Advanced Augmentation

http://benanne.github.io/2015/03/17/plankton.html 46
Convergence Challenges
RMSE

Epochs Epochs
Normalization Data Error
Need to monitor forward + backward path
47
Forward - Backward Path
Forward

Backward:
Gradient w.r.t parameters

48
Monitor Layers’ Training
nolearn - visualize.py

49
Monitor Layers’ Training

X. Glorot ,Y. Bengio, Understanding the difficulty of training deep feedforward neural networks:
“Monitoring activation and gradients across layers and training
iterations is a powerful investigation tool”

Easy to monitor in Theano Framework

50
Weight Initialization matters (1)
Layer 1- Gradient are close to zero - vanishing gradients

51
Weight Initialization matters (2)
Network returns close to zero values for all inputs

52
Monitoring Activation
plateaus sometimes seen when training neural
networks

For most epochs the network returns close to zero output for all inputs

Objective plateaus sometimes can be explained by saturation 53

Monitoring weights/update ratio
3e-1

Max of Weights of Conv1: 2e-1

1e-1

0 Epoch

3e-3
Max of Updates of Conv1:
2e-3

1e-3

0 Epoch

http://cs231n.github.io/neural-networks-3/#baby 54
Beyond Training
1. Improving the DNN
2. Open Source Packages
a. Hardware and OS
b. Python Framework
c. Deep Learning Open Source Packages
d. Effort Estimation
3. Summary

55
Hardware and OS
● Amazon Cloud GPU:
AWS Lasagne GPU Setup
Spot ~ $0.0031 per GPU Instance Hour
● IBM Cloud GPU:
http://www-03.ibm.com/systems/platformcomputing/products/symphony/gpuharvesting.html
● Your Linux machine GPU:
pip install -r https://raw.githubusercontent.com/dnouri/kfkd-
tutorial/master/requirements.txt

● Window install

http://deeplearning.net/software/theano/install_windows.html#install-windows
56
Starting Tips
● Sanity Checks:
○ DNN Architecture : “Overfit a tiny subset of data” Karpathy
○ Check Regularization ↗ Loss ↗
● Use pre-trained VGG as a base line
● Start with ~3 conv layer with ~16 filter each - quickly iterate

57
Python

● Rich eco-system
● State-of-the-art
● Easy to port from prototype to production

Podcast : http://www.reversim.com/2015/10/277-scientific-python.html
58
Python Deep
Learning Framework

Keras ,pylearn2, OpenDeep, Lasagne - common base 59

Tips from Deep Learning Packages
Torch code organization Caffe’s separation
configuration ↔code

NeuralNet → YAML text format

defining experiment’s configuration

60
Deep Learning
Open Source Packages
Open source progress rapidly→ impossible to predict industry’s standard
Caffe for applications
Torch and Theano for research on Deep Learning itself
http://fastml.com/torch-vs-theano/

White Box Black Box

61
Disruptive Effort Estimation
Feature Eng Deep Learning

Still requires algorithmic expertise 62

Summary
● Dove into Training a DNN
● Presented Analysis Capabilities
● Reviewed Open Source Packages

63
References
Hinton Coursera Neuronal Network
https://www.coursera.org/course/neuralnets
Technion Deep Learning course
http://moodle.technion.ac.il/course/view.php?id=4128
Oxford Deep Learning course
https://www.youtube.com/playlist?list=PLE6Wd9FR--EfW8dtjAuPoTuPcqmOV53Fu
CS231n CNN for Visual Recognition
http://cs231n.github.io/
Deep Learning Book
http://www.iro.umontreal.ca/~bengioy/dlbook/
Montreal DL summer school
http://videolectures.net/deeplearning2015_montreal/

64
Questions?

Deep
Convolution
Regression
Network

P30 Lite (HL2MARM) Schematic Diagram
100% (4)
P30 Lite (HL2MARM) Schematic Diagram
74 pages
Adv. OS Notes Module-04
100% (1)
Adv. OS Notes Module-04
8 pages
CS3352 Fds
No ratings yet
CS3352 Fds
23 pages
Ch-5 Uncertain Knowledge and Reasoning
No ratings yet
Ch-5 Uncertain Knowledge and Reasoning
25 pages
Training Deep Neural Networks
No ratings yet
Training Deep Neural Networks
55 pages
Ad3002 - Question Bank Health Care
100% (1)
Ad3002 - Question Bank Health Care
16 pages
IC Tester TSH 06F
No ratings yet
IC Tester TSH 06F
3 pages
Chap 11 12 - Practical Methodology and Applications - Heechul Lim
100% (1)
Chap 11 12 - Practical Methodology and Applications - Heechul Lim
60 pages
THE FAKE ACCOUNT DETECTION IN ONLINE SOCIAL NETWORKS (OSNs) USING RANDOM FOREST
No ratings yet
THE FAKE ACCOUNT DETECTION IN ONLINE SOCIAL NETWORKS (OSNs) USING RANDOM FOREST
95 pages
AI Bayes Theorem
No ratings yet
AI Bayes Theorem
10 pages
Unit III
No ratings yet
Unit III
58 pages
Dimensionality Reduction
No ratings yet
Dimensionality Reduction
85 pages
81.phishing Detection System Through Hybrid Machine Learning Based On Url
No ratings yet
81.phishing Detection System Through Hybrid Machine Learning Based On Url
99 pages
Unit4 DL Final
No ratings yet
Unit4 DL Final
30 pages
Best Machine Learning Platform Comparison
No ratings yet
Best Machine Learning Platform Comparison
38 pages
Deep Learning Notes
No ratings yet
Deep Learning Notes
51 pages
Decision Theory
No ratings yet
Decision Theory
40 pages
Dsf-Pyt-Lab Manual
No ratings yet
Dsf-Pyt-Lab Manual
50 pages
Module 3 - Social Media Overview & Security
No ratings yet
Module 3 - Social Media Overview & Security
8 pages
Q-Learning and Deep Q Networks (DQN)
No ratings yet
Q-Learning and Deep Q Networks (DQN)
52 pages
Shivajees MCQ On Microprocessor (Instruction Set) - GATE
No ratings yet
Shivajees MCQ On Microprocessor (Instruction Set) - GATE
13 pages
CS 601 Machine Learning Unit 5
No ratings yet
CS 601 Machine Learning Unit 5
18 pages
Lesson 1 To 10-1
No ratings yet
Lesson 1 To 10-1
108 pages
Research Project-I Guidelines
No ratings yet
Research Project-I Guidelines
12 pages
Digital Image Processing
No ratings yet
Digital Image Processing
5 pages
Phishing Detection Using Machine Learning and Deep Learning Techniques: A Review
No ratings yet
Phishing Detection Using Machine Learning and Deep Learning Techniques: A Review
9 pages
Powerscript Reference v2019r3
No ratings yet
Powerscript Reference v2019r3
1,596 pages
Final
No ratings yet
Final
26 pages
18 May Bollu Meli
No ratings yet
18 May Bollu Meli
2 pages
Mini Project Phishing Website Detection Using ML
No ratings yet
Mini Project Phishing Website Detection Using ML
45 pages
Eng PCB800860 Edp 30 40 Lvds 40 - 240826 - 211500
0% (1)
Eng PCB800860 Edp 30 40 Lvds 40 - 240826 - 211500
14 pages
Data Normalization
No ratings yet
Data Normalization
7 pages
Unit 2
No ratings yet
Unit 2
52 pages
E200z760n3 Power Architecture Reference Manual - 2012
No ratings yet
E200z760n3 Power Architecture Reference Manual - 2012
793 pages
Big Data - SRM University PDF
No ratings yet
Big Data - SRM University PDF
29 pages
Activation Functions - Ipynb - Colaboratory
No ratings yet
Activation Functions - Ipynb - Colaboratory
10 pages
Udacity Deep Learning Notes
No ratings yet
Udacity Deep Learning Notes
46 pages
Plant Disease Identification
No ratings yet
Plant Disease Identification
17 pages
Tableau Lab Example
No ratings yet
Tableau Lab Example
9 pages
SCT - QB - Anwers - p1
No ratings yet
SCT - QB - Anwers - p1
53 pages
Packages in Python
No ratings yet
Packages in Python
54 pages
Unit-1
100% (1)
Unit-1
76 pages
Big Data NOTES and QB
No ratings yet
Big Data NOTES and QB
92 pages
Unit V Data Visualization
No ratings yet
Unit V Data Visualization
49 pages
Chandigarh Group of Colleges College of Engineering Landran, Mohali
No ratings yet
Chandigarh Group of Colleges College of Engineering Landran, Mohali
47 pages
Jagadish
No ratings yet
Jagadish
13 pages
CS 601 Machine Learning Unit 3
No ratings yet
CS 601 Machine Learning Unit 3
37 pages
Notes - EDA-Unit1
No ratings yet
Notes - EDA-Unit1
34 pages
Lecture 2.1.2activation Function
No ratings yet
Lecture 2.1.2activation Function
15 pages
Dahuahdcvidvrusersmanual XVR X
No ratings yet
Dahuahdcvidvrusersmanual XVR X
307 pages
CS 224n Assignment #2: Word2vec (43 Points)
No ratings yet
CS 224n Assignment #2: Word2vec (43 Points)
4 pages
Unit 4 Part A
No ratings yet
Unit 4 Part A
51 pages
ML QB With Answer
No ratings yet
ML QB With Answer
20 pages
Mathematics For Machine Learning-I
No ratings yet
Mathematics For Machine Learning-I
10 pages
ML Question Bank
No ratings yet
ML Question Bank
29 pages
ITB1 Documentation Detection of Phishing Website Using ML
No ratings yet
ITB1 Documentation Detection of Phishing Website Using ML
49 pages
Module 1 AWS
No ratings yet
Module 1 AWS
96 pages
AD3461 ML Lab Manual
No ratings yet
AD3461 ML Lab Manual
32 pages
Tree Traversals (Inorder, Preorder and Postorder)
No ratings yet
Tree Traversals (Inorder, Preorder and Postorder)
4 pages
Clustering & Association Algorithms 4
No ratings yet
Clustering & Association Algorithms 4
17 pages
Deep Learnig
No ratings yet
Deep Learnig
16 pages
Control Systems: Gate Classes
No ratings yet
Control Systems: Gate Classes
27 pages
Unit - 3
No ratings yet
Unit - 3
42 pages
Subject Code:Mb20Ba01 Subject Name: Data Visulization For Managers Faculty Name: Dr.M.Karthikeyan
No ratings yet
Subject Code:Mb20Ba01 Subject Name: Data Visulization For Managers Faculty Name: Dr.M.Karthikeyan
34 pages
Cp7029 Information Storage Management
100% (1)
Cp7029 Information Storage Management
1 page
Dimensionality Reduction Lecture Slide
No ratings yet
Dimensionality Reduction Lecture Slide
27 pages
8 Deep Learning CNN
No ratings yet
8 Deep Learning CNN
63 pages
Software Engineering
No ratings yet
Software Engineering
5 pages
Scripting Languages Digital Notes 2022-2023
No ratings yet
Scripting Languages Digital Notes 2022-2023
92 pages
Deep Learning and CNNFYTGS5101-Guoyangxie
No ratings yet
Deep Learning and CNNFYTGS5101-Guoyangxie
42 pages
HTML5 Cheat Sheet
No ratings yet
HTML5 Cheat Sheet
11 pages
HTML5 Cheat Sheet
No ratings yet
HTML5 Cheat Sheet
11 pages
Unit Iv - NNDL
No ratings yet
Unit Iv - NNDL
32 pages
Blackview BV7000 Stock Rom Firmware
No ratings yet
Blackview BV7000 Stock Rom Firmware
3 pages
SSH Lib
No ratings yet
SSH Lib
7 pages
A 07 OOPs Concepts With Python
No ratings yet
A 07 OOPs Concepts With Python
70 pages
Installing Window 98: How To Install Windows 98? Step-by-Step
No ratings yet
Installing Window 98: How To Install Windows 98? Step-by-Step
16 pages
Introduction To Parallel Computing Design and Anal
No ratings yet
Introduction To Parallel Computing Design and Anal
53 pages
Coreano PID Thesis
No ratings yet
Coreano PID Thesis
70 pages
Machine Learning Assignment
No ratings yet
Machine Learning Assignment
5 pages
Deep Learning With Keras - Quick Guide
No ratings yet
Deep Learning With Keras - Quick Guide
22 pages
Autonomous Database Ecpu Faq
No ratings yet
Autonomous Database Ecpu Faq
5 pages
Applied Sciences
No ratings yet
Applied Sciences
15 pages
Pattern Recognition
No ratings yet
Pattern Recognition
3 pages
Next-Gpt: Any-To-Any Multimodal LLM: Project
No ratings yet
Next-Gpt: Any-To-Any Multimodal LLM: Project
22 pages
CWT5010 Commands
No ratings yet
CWT5010 Commands
14 pages
Understanding Processor Utilization With Ibm Powervm
No ratings yet
Understanding Processor Utilization With Ibm Powervm
15 pages
428 Training Text Classifiers in Create ML
No ratings yet
428 Training Text Classifiers in Create ML
31 pages
2
No ratings yet
2
6 pages
Cns Lessonplan
No ratings yet
Cns Lessonplan
2 pages
Watertank Simulink Model - MATLAB & Simulink
No ratings yet
Watertank Simulink Model - MATLAB & Simulink
2 pages
Lab Report CS 9
No ratings yet
Lab Report CS 9
7 pages
Energies: Photovoltaic Cell Parameter Estimation Using Hybrid Particle Swarm Optimization and Simulated Annealing
No ratings yet
Energies: Photovoltaic Cell Parameter Estimation Using Hybrid Particle Swarm Optimization and Simulated Annealing
14 pages
Control Your Arduino From Your PC With The QT Gui
No ratings yet
Control Your Arduino From Your PC With The QT Gui
10 pages
Getting Started: Default Logger Settings
No ratings yet
Getting Started: Default Logger Settings
4 pages
Cell: +91 9578578180 E-Mail:: Rajkumar G
No ratings yet
Cell: +91 9578578180 E-Mail:: Rajkumar G
3 pages
MQWRD 01 01 93 D6P - B3a WS 1.1 en
No ratings yet
MQWRD 01 01 93 D6P - B3a WS 1.1 en
2 pages
CoursesS
No ratings yet
CoursesS
2 pages
Most Flexible and Secure Coin Validator: CPI Headquarters 3222 Phoenixville Pike, Suite 200, Malvern, PA 19355 USA
No ratings yet
Most Flexible and Secure Coin Validator: CPI Headquarters 3222 Phoenixville Pike, Suite 200, Malvern, PA 19355 USA
2 pages

Deep Learning Handson

Uploaded by

Deep Learning Handson

Uploaded by

Hands-on

Deep Learning in Python

● Improving the DNN

Train Model Train Model Predict Points

Train Images Fit Trained

Test Predict Predicted

nolearn - Wrapper to Lasagne

Lasagne - Theano extension for Deep Learning

Theano - Define, optimize, and mathematical expressions

Efficient Cuda GPU for DNN Low Level

HW Supports: GPU & CPU

Shuffle train data

Classification - Train/Validation preserve classes proportion

Conv Pool Dense Output

Karpathy - “Babysitting”: weights/updates ~1e3 28

stops according to validation loss

returns best weights

Loop over train batchs

Loop over validation batchs

change output layer

load pre-trained weight

fine tune specialist

⇒Brute force experiments?!

Horizontal Flip Perturbation

Easy to monitor in Theano Framework

Objective plateaus sometimes can be explained by saturation 53

Max of Weights of Conv1: 2e-1

Keras ,pylearn2, OpenDeep, Lasagne - common base 59

NeuralNet → YAML text format

White Box Black Box

Still requires algorithmic expertise 62

You might also like