0% found this document useful (0 votes)

392 views16 pages

DCGAN Presentation

This was a presentation for Multi-modal Perception Lab @ IIIT-B. Link to more of them: https://github.com/Nikunj-Gupta/Presentations

Uploaded by

Nikunj Gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

392 views16 pages

DCGAN Presentation

This was a presentation for Multi-modal Perception Lab @ IIIT-B. Link to more of them: https://github.com/Nikunj-Gupta/Presentations

Uploaded by

Nikunj Gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 16

Unsupervised Representation

Learning Through Deep

Convolutional Generative
Adversarial Networks (DCGANs)

-Alec Radford & Luke Metz

indico Research
Boston, MA
-Soumith Chintala
Facebook AI Research
New York, NY

Presented by
Nikunj Gupta
Contributions

● Stabilizing the training of GANs in most settings.

○ By proposing and evaluating a set of constraints on the architecture of GANs.

● Usage of trained discriminators for image classification tasks.

● Visualization of the filters learnt by GANs

○ And empirically show that specific filters have learned to draw specific
objects.

● Showing that generators have interesting vector arithmetic properties

○ For easy manipulation of many semantic qualities of generated samples.
Related Work

● Representation Learning from Unlabelled Data

○ Clustering (K-means, etc.)
○ Hierarchical Clustering
○ Auto encoders
○ Deep Belief Networks

● Generating Natural Images

○ Variational Sampling Approach in GANs
○ Laplacian Pyramid Extension to GANs

● Visualizing the Internals of CNN

○ Using deconvolutions and filtering the maximal activations (Zieler et. al.)
GAN Architecture
Inside GAN Architecture
Approach and Model Architecture

● Replace any pooling layers with

○ strided convolutions (discriminator), and
○ fractional-strided convolutions (generator).

● Use Batch Normalisation in both the generator and the discriminator.

● Remove fully connected hidden layers for deeper architectures.

● Use ReLU activation in generator for all layers except for the output, which uses
Tanh.

● Use LeakyReLU activation in the discriminator for all layers.

Generator Network
Discriminator Network
Goals

● Generator Goal: D(G(z)) = 1

● Discriminator Goal: D(G(z)) = 0,

● Both goals are conflicting and unsupervised.

Details of Adversarial Training

● The training is done on 3 datasets: LSUN, ImageNet-1K, Faces Dataset

● Preprocessing: Scale images between -1 and +1 (tanh range)

● Mini batch SGD (m = 128)

● Weight Initialisation: zero centered normal distribution (std dev = 0.02)

● Leaky ReLU slope: 0.2

● Adam Optimizer

● Learning Rate: 0.0002

● Momentum Term = 0.5, to stabilize training

Results

Classification using the Discriminator Network

Bedroom Generation from LSUN Dataset
Face Generation
Interesting Vector Arithmetic
Representations
One more example…
Thank You

Deep Learning 117 MCQ
No ratings yet
Deep Learning 117 MCQ
33 pages
Deep Learning Lab Practicals
No ratings yet
Deep Learning Lab Practicals
24 pages
2022 ML Assignments
No ratings yet
2022 ML Assignments
45 pages
Unit 4 Deeplearning
No ratings yet
Unit 4 Deeplearning
41 pages
FZX Catlog
No ratings yet
FZX Catlog
61 pages
ML Assignment 3 Nptel 2019
No ratings yet
ML Assignment 3 Nptel 2019
26 pages
Gen AI 10-1
No ratings yet
Gen AI 10-1
60 pages
ANN Quiz - PDF - Artificial Neural Network - Computational Science
No ratings yet
ANN Quiz - PDF - Artificial Neural Network - Computational Science
17 pages
UNIT2
No ratings yet
UNIT2
25 pages
12-DL-Deep Learning For GANS
No ratings yet
12-DL-Deep Learning For GANS
75 pages
Deep Learning - Unit-III Two Marks
100% (1)
Deep Learning - Unit-III Two Marks
3 pages
2023 ML Assignment
No ratings yet
2023 ML Assignment
57 pages
Deep Learning (MODULE-3)
No ratings yet
Deep Learning (MODULE-3)
85 pages
Btech CSE
No ratings yet
Btech CSE
17 pages
Soft Computing Unit 2 Notes..
No ratings yet
Soft Computing Unit 2 Notes..
24 pages
Rajesh (DL Unit1) 04dec2024
No ratings yet
Rajesh (DL Unit1) 04dec2024
125 pages
Unit 2
No ratings yet
Unit 2
112 pages
Must Know Questions Deep Learning
No ratings yet
Must Know Questions Deep Learning
22 pages
Answers For End-Sem Exam Part - 2 (Deep Learning)
No ratings yet
Answers For End-Sem Exam Part - 2 (Deep Learning)
20 pages
Deep Learning
No ratings yet
Deep Learning
6 pages
Deep Learning Exp
No ratings yet
Deep Learning Exp
25 pages
CS 601 Machine Learning Unit 5
No ratings yet
CS 601 Machine Learning Unit 5
18 pages
CS230 Midterm Fall 2022
No ratings yet
CS230 Midterm Fall 2022
14 pages
UNIT-I - Introduction To Computer Vision
No ratings yet
UNIT-I - Introduction To Computer Vision
45 pages
1157 CS F425 20231222015056 Mid Semester Question Paper DL
No ratings yet
1157 CS F425 20231222015056 Mid Semester Question Paper DL
2 pages
RAG With Math
No ratings yet
RAG With Math
7 pages
Artificial Neural Networks Quiz Questions 1
No ratings yet
Artificial Neural Networks Quiz Questions 1
17 pages
1694601295-Unit 3.6 Generalized Discriminant Analysis CU 2.0
100% (1)
1694601295-Unit 3.6 Generalized Discriminant Analysis CU 2.0
15 pages
CS230 Midterm Solutions Fall 2022
No ratings yet
CS230 Midterm Solutions Fall 2022
20 pages
Module2.3 Hyperparameter Optimization
No ratings yet
Module2.3 Hyperparameter Optimization
29 pages
Nueral Network Mcqs
No ratings yet
Nueral Network Mcqs
6 pages
Practice Final sp22
No ratings yet
Practice Final sp22
10 pages
Question Bank Module-1: Department of Computer Applications 18mca53 - Machine Learning
No ratings yet
Question Bank Module-1: Department of Computer Applications 18mca53 - Machine Learning
7 pages
UNIT - V Question Bank
No ratings yet
UNIT - V Question Bank
1 page
MCQ All Unit
No ratings yet
MCQ All Unit
35 pages
Machine Learning Unit 3
No ratings yet
Machine Learning Unit 3
40 pages
Autoencoders - Presentation
No ratings yet
Autoencoders - Presentation
18 pages
Machine Learning Full Question Bank
No ratings yet
Machine Learning Full Question Bank
14 pages
CS 601 Machine Learning Unit 3
No ratings yet
CS 601 Machine Learning Unit 3
37 pages
Assignment - Week 6 (Neural Networks) Type of Question: MCQ/MSQ
No ratings yet
Assignment - Week 6 (Neural Networks) Type of Question: MCQ/MSQ
4 pages
Query Operation 2021
No ratings yet
Query Operation 2021
35 pages
ML Unit-Iv
No ratings yet
ML Unit-Iv
18 pages
Unit-5 Part C 1) Explain The Q Function and Q Learning Algorithm Assuming Deterministic Rewards and Actions With Example. Ans)
No ratings yet
Unit-5 Part C 1) Explain The Q Function and Q Learning Algorithm Assuming Deterministic Rewards and Actions With Example. Ans)
11 pages
Optimization Techniques in Deep Learning
No ratings yet
Optimization Techniques in Deep Learning
14 pages
DL Unit-2 Notes PPT
No ratings yet
DL Unit-2 Notes PPT
39 pages
Artificial Intelligence and Deep Learning
0% (1)
Artificial Intelligence and Deep Learning
9 pages
DCGAN (Deep Convolution Generative Adversarial Networks)
No ratings yet
DCGAN (Deep Convolution Generative Adversarial Networks)
27 pages
Unit - 3
No ratings yet
Unit - 3
42 pages
NN DL
No ratings yet
NN DL
1 page
Overfitting vs. Underfitting, Bias vs. Variance
No ratings yet
Overfitting vs. Underfitting, Bias vs. Variance
7 pages
RBM, DBN, and DBM
No ratings yet
RBM, DBN, and DBM
79 pages
Hyperparameters
No ratings yet
Hyperparameters
15 pages
Autoencoder Report 1
No ratings yet
Autoencoder Report 1
34 pages
ML Unit-Iv
No ratings yet
ML Unit-Iv
19 pages
Understanding Machine Learning Solution Manual: 2 Gentle Start
No ratings yet
Understanding Machine Learning Solution Manual: 2 Gentle Start
67 pages
NN Question Bank VIISem
No ratings yet
NN Question Bank VIISem
42 pages
Unit-I Introduction and ANN Structure
No ratings yet
Unit-I Introduction and ANN Structure
15 pages
CNN Architectures: Lenet, Alexnet, VGG, Googlenet, Resnet and More
No ratings yet
CNN Architectures: Lenet, Alexnet, VGG, Googlenet, Resnet and More
9 pages
Natural Language Processing (NLP) Introduction:: Top 10 NLP Interview Questions For Beginners
No ratings yet
Natural Language Processing (NLP) Introduction:: Top 10 NLP Interview Questions For Beginners
24 pages
IIT Madras Notes Machine Learning
No ratings yet
IIT Madras Notes Machine Learning
13 pages
TDS 4532 Tce5 1
100% (1)
TDS 4532 Tce5 1
2 pages
Jar 4
100% (1)
Jar 4
1 page
KNN Algorithm
No ratings yet
KNN Algorithm
3 pages
Datasheet - Am-3-7 - 8-CIRC-CR
No ratings yet
Datasheet - Am-3-7 - 8-CIRC-CR
14 pages
Thermal Analysis of Composite Wall
No ratings yet
Thermal Analysis of Composite Wall
14 pages
Concrete Design Properties According To En1992-1-1 ( 1.50, F 500 Mpa)
No ratings yet
Concrete Design Properties According To En1992-1-1 ( 1.50, F 500 Mpa)
8 pages
HINO Catalogue 2008
No ratings yet
HINO Catalogue 2008
43 pages
Bolt Patterns: Exhaust Stack
No ratings yet
Bolt Patterns: Exhaust Stack
8 pages
Troythix A Usa Eng Pds
No ratings yet
Troythix A Usa Eng Pds
2 pages
MECH2210 Tutorial 10 Solution
No ratings yet
MECH2210 Tutorial 10 Solution
23 pages
Federal Standard RR-C-271D - Chains & Attachments, Welded and Weldless PDF
No ratings yet
Federal Standard RR-C-271D - Chains & Attachments, Welded and Weldless PDF
53 pages
Liquid Filled Thermometers With Contacts - 1144, 1147, 1184, 1186, 1187
No ratings yet
Liquid Filled Thermometers With Contacts - 1144, 1147, 1184, 1186, 1187
7 pages
Section E - Technical
No ratings yet
Section E - Technical
49 pages
Nortec 500 Series Portable Eddy Current Flaw Detectors: Operation Manual
No ratings yet
Nortec 500 Series Portable Eddy Current Flaw Detectors: Operation Manual
96 pages
Pmu Segaluid Substation Structures Packing List
No ratings yet
Pmu Segaluid Substation Structures Packing List
9 pages
Power System Analysis and Design Fifth Edition J. Duncan Glover PDF Download
No ratings yet
Power System Analysis and Design Fifth Edition J. Duncan Glover PDF Download
49 pages
T1 - Sem1 2022 - 2023 (Ques)
No ratings yet
T1 - Sem1 2022 - 2023 (Ques)
3 pages
Victrex Injection-Molding-Brochure Jan2022
No ratings yet
Victrex Injection-Molding-Brochure Jan2022
16 pages
210 VGP PDF
No ratings yet
210 VGP PDF
100 pages
Salome Code Aster User Manual
No ratings yet
Salome Code Aster User Manual
18 pages
RWD62U Programmable Controller Installation and Commissioning Guide
No ratings yet
RWD62U Programmable Controller Installation and Commissioning Guide
10 pages
Brad Boehler, P.Eng, Vice President, Engineering
No ratings yet
Brad Boehler, P.Eng, Vice President, Engineering
3 pages
EX 3 Personal Statement
No ratings yet
EX 3 Personal Statement
3 pages
Captcha: Kiit University
No ratings yet
Captcha: Kiit University
27 pages
Waltco RGL RGBL Parts
No ratings yet
Waltco RGL RGBL Parts
23 pages
Refer Slide Time: 00:59
No ratings yet
Refer Slide Time: 00:59
31 pages
Chapter 13 Station Review
No ratings yet
Chapter 13 Station Review
5 pages
Gtu Teaching Scheme
No ratings yet
Gtu Teaching Scheme
1 page
LTC4231
No ratings yet
LTC4231
22 pages
International Research Journal of Engineering and Technology (IRJET)
No ratings yet
International Research Journal of Engineering and Technology (IRJET)
8 pages

DCGAN Presentation

Uploaded by

DCGAN Presentation

Uploaded by

Unsupervised Representation

Learning Through Deep

-Alec Radford & Luke Metz

● Stabilizing the training of GANs in most settings.

● Usage of trained discriminators for image classification tasks.

● Visualization of the filters learnt by GANs

● Showing that generators have interesting vector arithmetic properties

● Representation Learning from Unlabelled Data

● Generating Natural Images

● Visualizing the Internals of CNN

● Replace any pooling layers with

● Use Batch Normalisation in both the generator and the discriminator.

● Remove fully connected hidden layers for deeper architectures.

● Use LeakyReLU activation in the discriminator for all layers.

● Generator Goal: D(G(z)) = 1

● Both goals are conflicting and unsupervised.

● The training is done on 3 datasets: LSUN, ImageNet-1K, Faces Dataset

● Preprocessing: Scale images between -1 and +1 (tanh range)

● Mini batch SGD (m = 128)

● Weight Initialisation: zero centered normal distribution (std dev = 0.02)

● Leaky ReLU slope: 0.2

● Learning Rate: 0.0002

● Momentum Term = 0.5, to stabilize training

Classification using the Discriminator Network

You might also like