0% found this document useful (0 votes)

28 views89 pages

Deeplearning - Ai Deeplearning - Ai

Uploaded by

posacc551

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

28 views89 pages

Deeplearning - Ai Deeplearning - Ai

Uploaded by

posacc551

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 89

Copyright Notice

These slides are distributed under the Creative Commons License.

DeepLearning.AI makes these slides available for educational purposes. You may not use or
distribute these slides for commercial purposes. You may make copies of these slides and
use or distribute them for educational purposes as long as you cite DeepLearning.AI as the
source of the slides.

For the rest of the details of the license, see

https://creativecommons.org/licenses/by-sa/2.0/legalcode
GAN
Improvements
deeplearning.ai
Outline
● How GANs have improved

● State of the art methods for improving GANs performance

GANs Over Time
Main Improvements: (1) Stability

High standard Low standard

deviation deviation

Use batch standard deviation to

encourage diversity
Main Improvements: (1) Stability : gradient

Improve stability by enforcing

1-Lipschitz continuity

E.g. WGAN-GP and Spectral

Normalization
Main Improvements: (1) Stability

Take average
Generator of the weights
Generator Generator
Generator
Generator
Generator

Generator at
different iterations
Main Improvements: (1) Stability
No averaging

Exponential
averaging
Use moving average for
smoother results

Available from: https://arxiv.org/abs/1806.04498v2

Main Improvements: (1) Stability

Progressive growing gradually trains

GAN at increasing resolutions

Available from: https://arxiv.org/abs/1710.10196

Main Improvements: (2) Capacity

Larger models can use

higher resolution images
Main Improvements: (3) Diversity

Available from: https://github.com/NVlabs/stylegan

Summary
● GANs have improved because of:

○ Stability - longer training and better images

○ Capacity - larger models and higher resolution images

○ Diversity - increasing variety in generated images

StyleGAN
Overview
deeplearning.ai
Outline
● StyleGAN achievements

● What styles are

● Introduction to StyleGAN architecture and components

StyleGAN Goals
1. Greater ﬁdelity on high-resolution images
2. Increased diversity of outputs
3. More control over image features
Greater Fidelity

Not fooling anyone I’m shook

(Left) Available from: https://arxiv.org/abs/1406.2661
(Right) Available from: https://github.com/NVlabs/stylegan
Increased Diversity

Available from: https://arxiv.org/abs/1812.04948

Increased Diversity
More Feature Control

Hair color/style →

← Glasses

Available from: https://arxiv.org/abs/1812.04948

Style in GANs
Style = variation in an
image

Early styles are coarser like

face shape

Later styles are ﬁner like

hair wisps

Available from: https://arxiv.org/abs/1812.04948

The Style-Based Generator Noise vector: z

Noise vector: z Mapping Random noise

Generator Network

Intermediate StyleGAN
noise: w Generator

Traditional architecture
StyleGAN architecture
Progressive Growing

Available from: https://arxiv.org/abs/1710.10196

Summary
● StyleGAN’s goals:
○ Greater ﬁdelity, increased diversity, improved control over features
● Style is any variation in the image
● Main components of StyleGAN:
○ Progressive growing
○ Noise mapping network
○ Adaptive instance normalization (AdaIN)
Progressive
Growing
deeplearning.ai
Outline
● Progressive growing intuition and motivation

● How to implement it
Progressive Growing
Latent Latent Latent
G 4x4 4x4 4x4
8x8

1024x1024

Reals Reals
... Reals
D 1024x1024

4x4
4x4 8x8 4x4
Training progress
Based on: https://arxiv.org/abs/1710.10196
Progressive Growing in Action

Available from: https://www.gwern.net/images/gan/2019-03-16-stylegan-facestraining.mp4

Progressive Growing: Generator
Conv 16x16

Upsample 2x

99% 1%
Conv 32x32

Based on: https://arxiv.org/abs/1710.10196

Progressive Growing: Generator
Conv 16x16

Upsample 2x

50% 50%
Conv 32x32

Based on: https://arxiv.org/abs/1710.10196

Progressive Growing: Generator
Conv 16x16

Upsample 2x

1% 99%
Conv 32x32

Based on: https://arxiv.org/abs/1710.10196

Progressive Growing: Generator
Conv 16x16

Upsample 2x

Conv 32x32

Based on: https://arxiv.org/abs/1710.10196

Progressive Growing: Discriminator

Downsample 0.5x

Conv 32x32

Conv 16x16

...
Real/Fake
Based on: https://arxiv.org/abs/1710.10196
Progressive Growing: Discriminator

Downsample 0.5x

Conv 32x32

Conv 16x16

...
Real/Fake
Based on: https://arxiv.org/abs/1710.10196
Progressive Growing in Context

4x4
8x8
16x16

...

1024x1024

Based on: https://arxiv.org/abs/1812.04948

Progressive Growing in Context

4x4 Upsample

8x8 Convolution
16x16 Convolution

...

1024x1024

Based on: https://arxiv.org/abs/1812.04948

Summary
● Progressive growing gradually doubles image resolution

● Helps with faster, more stable training for higher resolutions

Noise Mapping
Network
deeplearning.ai
Outline
● Noise mapping network structure

● Motivation behind the noise mapping network

● Where its output goes

Noise Mapping Network

Mapping Network
FC

Intermediate noise vector

Based on: https://arxiv.org/abs/1812.04948

Remember: Z-Space Entanglement
Glasses
Beard
Noise vector Output
Hair
features
Eyes
Age

Not possible to control single output features

W-Space: Less Entangled
Glasses
Intermediate Beard
noise vector Output
Hair
features
Eyes
Age

More possible to control single output features

Mapping Network in Context

Based on: https://arxiv.org/abs/1812.04948

Mapping Network in Context

Based on: https://arxiv.org/abs/1812.04948

Summary
● Noise mapping allows for a more disentangled noise space

● The intermediate noise vector is used as input to the generator

Adaptive Instance
Normalization
(AdaIN)
deeplearning.ai
Outline
● Instance Normalization

● Adaptive Instance Normalization (AdaIN)

● Where and why AdaIN is used

AdaIN in Context

Based on: https://arxiv.org/abs/1812.04948

AdaIN in Context

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution

AdaIN

Convolution

AdaIN

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 1: Normalize convolution outputs

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 1: Normalize convolution outputs using Instance Normalization

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Batch norm
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 1: Normalize convolution outputs using Instance Normalization

(Left) Available from: https://medium.com/syncedreview/facebook-ai-proposes-group-normalization-alternative-to-batch-normalization-fb0699bffae7

(Right) Based on: https://arxiv.org/abs/1812.04948
AdaIN
Batch norm Instance norm
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 1: Normalize convolution outputs using Instance Normalization

(Left) Available from: https://medium.com/syncedreview/facebook-ai-proposes-group-normalization-alternative-to-batch-normalization-fb0699bffae7

(Right) Based on: https://arxiv.org/abs/1812.04948
AdaIN
Batch norm Instance norm
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 1: Normalize convolution outputs using Instance Normalization

(Left) Available from: https://medium.com/syncedreview/facebook-ai-proposes-group-normalization-alternative-to-batch-normalization-fb0699bffae7

(Right) Based on: https://arxiv.org/abs/1812.04948
AdaIN
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 2: Apply adaptive styles

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution
Mapping
AdaIN
Network
Convolution

AdaIN

Step 2: Apply adaptive styles using the intermediate noise vector

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 2: Apply adaptive styles using the intermediate noise vector

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 2: Apply adaptive styles using the intermediate noise vector

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution

AdaIN

Convolution
FC FC
AdaIN

Step 2: Apply adaptive styles using the intermediate noise vector

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution

AdaIN

Convolution
FC FC
AdaIN

Step 2: Apply adaptive styles using the intermediate noise vector

Based on: https://arxiv.org/abs/1812.04948

AdaIN
Upsample

Convolution

AdaIN

Convolution

AdaIN

Step 2: Apply adaptive styles using the intermediate noise vector

Based on: https://arxiv.org/abs/1812.04948

AdaIN

Step 1: Instance normalization

AdaIN

Step 2: Adaptive styles

AdaIN in Context

Based on: https://arxiv.org/abs/1812.04948

Summary
● AdaIN transfers style information onto the generated image from the
intermediate noise vector

● Instance Normalization is used to normalize individual examples before

apply style statistics from
Style Mixing &
Stochastic
Noise
deeplearning.ai
Outline
● Controlling coarse and ﬁne styles with StyleGAN

● Style mixing for increased diversity during training/inference

● Stochastic noise for additional variation

Style Mixing

Tabby
Cat

Tuxedo
Cat
Style Mixing

Tabby
Cat

Tuxedo
Cat
Style Mixing in Context

Based on: https://arxiv.org/abs/1812.04948

Style Mixing in Context

Based on: https://arxiv.org/abs/1812.04948

Style Mixing in Context

Based on: https://arxiv.org/abs/1812.04948

Style Mixing in Context

Based on: https://arxiv.org/abs/1812.04948

Style Mixing

Source B
Source A

Coarse styles from B

Middle styles from B

Fine styles from B

Available from: https://arxiv.org/abs/1812.04948

Stochastic Variation
Fine
layers

Coarse
layers

Available from: https://arxiv.org/abs/1812.04948

Stochastic Noise in Context

Based on: https://arxiv.org/abs/1812.04948

Stochastic Noise in Context

1. Sample noise from

Normal distribution

Based on: https://arxiv.org/abs/1812.04948

Stochastic Noise in Context

1. Sample noise from

Normal distribution
2. Concatenate noise to x,
before AdaIN
Based on: https://arxiv.org/abs/1812.04948
Stochastic Variation
Small details: hair strands,
wrinkles, etc.

Different extra noise values

create stochastic variation

Available from: https://arxiv.org/abs/1812.04948

Summary
● Style mixing increases diversity that the model sees during training

● Stochastic noise causes small variations to output

● Coarse or ﬁneness depends where in the network style or noise is added

○ Earlier for coarser variation
○ Later for ﬁner variation
Putting It All
Together
deeplearning.ai
Outline
● Putting all the StyleGAN components together!
StyleGAN Architecture: Progressive Growing

Based on: https://arxiv.org/abs/1812.04948

StyleGAN Architecture: Noise Mapping Network

Based on: https://arxiv.org/abs/1812.04948

StyleGAN Architecture: AdaIN

Based on: https://arxiv.org/abs/1812.04948

StyleGAN Architecture: Style Mixing

Based on: https://arxiv.org/abs/1812.04948

StyleGAN Architecture: Stochastic Noise

Based on: https://arxiv.org/abs/1812.04948

StyleGAN Architecture: That’s a Wrap!

Based on: https://arxiv.org/abs/1812.04948

Summary
● Main components of StyleGAN:
○ Progressive Growing
○ Noise Mapping Network
○ AdaIN
○ Style Mixing
○ Stochastic Noise

Dell Wembley-Mt-Dt-Ra01-Pd Optiplex 980
No ratings yet
Dell Wembley-Mt-Dt-Ra01-Pd Optiplex 980
61 pages
Rich Content in The Online Environment and The User Experience
100% (3)
Rich Content in The Online Environment and The User Experience
14 pages
Slides 1
No ratings yet
Slides 1
50 pages
Masterclass GANs
No ratings yet
Masterclass GANs
20 pages
GenAI 2025 StyleGAN
No ratings yet
GenAI 2025 StyleGAN
57 pages
Gan June 2019
No ratings yet
Gan June 2019
28 pages
A Style-Based Generator Architecture For Generative Adversarial Networks
No ratings yet
A Style-Based Generator Architecture For Generative Adversarial Networks
12 pages
Presentation #7 A Style-Based GANs
No ratings yet
Presentation #7 A Style-Based GANs
23 pages
Adversarial Digit Creation
No ratings yet
Adversarial Digit Creation
10 pages
Class Note 2: Intermediate Concepts in Generative AI
No ratings yet
Class Note 2: Intermediate Concepts in Generative AI
4 pages
Vladislav Kolbasin Introduction To Generative Adversarial Networks Gans 180316190108
No ratings yet
Vladislav Kolbasin Introduction To Generative Adversarial Networks Gans 180316190108
59 pages
Urn CH SLSP ZBZ 9781098134181 Ihv PDF
No ratings yet
Urn CH SLSP ZBZ 9781098134181 Ihv PDF
7 pages
Advanced Design For AI Algorithms: Lec.: 1 GAN
No ratings yet
Advanced Design For AI Algorithms: Lec.: 1 GAN
223 pages
Stable Diffusion A Tutorial
100% (1)
Stable Diffusion A Tutorial
66 pages
Unit 2
No ratings yet
Unit 2
28 pages
Deeplearning - Ai Deeplearning - Ai
No ratings yet
Deeplearning - Ai Deeplearning - Ai
88 pages
Large Scale GAN Training For High Fidelity Natural Image Synthesis
No ratings yet
Large Scale GAN Training For High Fidelity Natural Image Synthesis
28 pages
Deep Learning - Image Synthesis
No ratings yet
Deep Learning - Image Synthesis
36 pages
Lecture 08
No ratings yet
Lecture 08
43 pages
AI Resubmtion
No ratings yet
AI Resubmtion
18 pages
Adversarial Digit Creation
No ratings yet
Adversarial Digit Creation
10 pages
Ch10 Deep Learning
No ratings yet
Ch10 Deep Learning
104 pages
GAN Presentation
No ratings yet
GAN Presentation
46 pages
6-DeepVisualLearning L6
No ratings yet
6-DeepVisualLearning L6
82 pages
23 DeepLearning PDF
No ratings yet
23 DeepLearning PDF
74 pages
AI Slide 2
No ratings yet
AI Slide 2
82 pages
07 1.gan 2
No ratings yet
07 1.gan 2
56 pages
Generative Adversarial Networks (GANs) - Engine and Applications PDF
No ratings yet
Generative Adversarial Networks (GANs) - Engine and Applications PDF
13 pages
Karras Analyzing and Improving The Image Quality of StyleGAN CVPR 2020 Paper
No ratings yet
Karras Analyzing and Improving The Image Quality of StyleGAN CVPR 2020 Paper
10 pages
Deeplearning - Ai Deeplearning - Ai
No ratings yet
Deeplearning - Ai Deeplearning - Ai
81 pages
The Six Fronts of The Generative Adversarial Networks
No ratings yet
The Six Fronts of The Generative Adversarial Networks
11 pages
Images, Neural Networks, CNNs
No ratings yet
Images, Neural Networks, CNNs
26 pages
Military AI-Week 05-AI in Computer Vision
No ratings yet
Military AI-Week 05-AI in Computer Vision
65 pages
L S Gan T H F N I S: Arge Cale Raining For IGH Idelity Atural Mage Ynthesis
No ratings yet
L S Gan T H F N I S: Arge Cale Raining For IGH Idelity Atural Mage Ynthesis
35 pages
L09-10 DL and CNN
No ratings yet
L09-10 DL and CNN
56 pages
DAAI - Lecture - 15 - 23nov22
No ratings yet
DAAI - Lecture - 15 - 23nov22
113 pages
Some Studies On Convolution Neural Network
No ratings yet
Some Studies On Convolution Neural Network
10 pages
A Review of Generative Adversarial Networks For Computer Vision TasksElectronics Switzerland
No ratings yet
A Review of Generative Adversarial Networks For Computer Vision TasksElectronics Switzerland
17 pages
NeurIPS 2020 Ganspace Discovering Interpretable Gan Controls Paper
No ratings yet
NeurIPS 2020 Ganspace Discovering Interpretable Gan Controls Paper
10 pages
Unit 3
No ratings yet
Unit 3
105 pages
Genai Week5
No ratings yet
Genai Week5
33 pages
Sr. No Title Published Problem Statement Methodology Dataset Dataset Avail-Ability
No ratings yet
Sr. No Title Published Problem Statement Methodology Dataset Dataset Avail-Ability
2 pages
12-DL-Deep Learning For GANS
No ratings yet
12-DL-Deep Learning For GANS
75 pages
Generative Adversarial Networks (Gans) : An Overview of Theoretical Model, Evaluation Metrics, and Recent Developments
No ratings yet
Generative Adversarial Networks (Gans) : An Overview of Theoretical Model, Evaluation Metrics, and Recent Developments
17 pages
Bao Cao Tien Do GK Slides
No ratings yet
Bao Cao Tien Do GK Slides
9 pages
CNN
No ratings yet
CNN
31 pages
Intro CNN PDF
No ratings yet
Intro CNN PDF
31 pages
Convolutional Neural Networks: CS 535 Deep Learning, Winter 2020 Fuxin Li
No ratings yet
Convolutional Neural Networks: CS 535 Deep Learning, Winter 2020 Fuxin Li
44 pages
Lecture 7-8
No ratings yet
Lecture 7-8
56 pages
Background and Literature Review
No ratings yet
Background and Literature Review
7 pages
Background and Literature Review
No ratings yet
Background and Literature Review
17 pages
Lecture4 GAN B
No ratings yet
Lecture4 GAN B
38 pages
Notes Conv Nets Slides
No ratings yet
Notes Conv Nets Slides
207 pages
Module11 - NNandDeep Learning
No ratings yet
Module11 - NNandDeep Learning
84 pages
DL Unit-4
No ratings yet
DL Unit-4
26 pages
Exploring The Various Machine Learning Models For Image Generation - A Comprehensive Survey Unlocking The Future of Digital Creativity
No ratings yet
Exploring The Various Machine Learning Models For Image Generation - A Comprehensive Survey Unlocking The Future of Digital Creativity
15 pages
2017 Beginner's Review of Generative Adversarial Networks (GAN) Architectures
No ratings yet
2017 Beginner's Review of Generative Adversarial Networks (GAN) Architectures
9 pages
Why Convolutions?: Till Now in MLP
No ratings yet
Why Convolutions?: Till Now in MLP
38 pages
Image Classification and Generation of Images
No ratings yet
Image Classification and Generation of Images
21 pages
Generative Adversarial Networks (GANs)
No ratings yet
Generative Adversarial Networks (GANs)
37 pages
HTML5 canvas in real time
From Everand
HTML5 canvas in real time
Antonio Taccetti
No ratings yet
Blender Pro Studio Advanced Techniques for Real-World Projects: Blender, #3
From Everand
Blender Pro Studio Advanced Techniques for Real-World Projects: Blender, #3
Steven Mcananey
No ratings yet
Graphic Designer Resume Sample
100% (1)
Graphic Designer Resume Sample
4 pages
PLSQL and SQL Coding Guidelines
No ratings yet
PLSQL and SQL Coding Guidelines
196 pages
Exam Questions ITIL-4-Foundation
100% (1)
Exam Questions ITIL-4-Foundation
15 pages
Automation, Production Systems, and Computer-Integrated Manufacturing, 5e Mikell P. Groover PDF Download
No ratings yet
Automation, Production Systems, and Computer-Integrated Manufacturing, 5e Mikell P. Groover PDF Download
54 pages
Sans Emea Curriculum Overview Catalogue 2020
No ratings yet
Sans Emea Curriculum Overview Catalogue 2020
20 pages
Soft Q-Learning With Mutual Information Regularization
No ratings yet
Soft Q-Learning With Mutual Information Regularization
19 pages
Final Exam Comp 213
No ratings yet
Final Exam Comp 213
11 pages
Release Notes
No ratings yet
Release Notes
30 pages
Hox Correctipon
No ratings yet
Hox Correctipon
79 pages
Font Type WP Hebrew David (TrueType)
No ratings yet
Font Type WP Hebrew David (TrueType)
1 page
كتالوج التركيب GUY-GRIP - Dead-End 2
No ratings yet
كتالوج التركيب GUY-GRIP - Dead-End 2
4 pages
Geoffrey Riggs: Memorandum
No ratings yet
Geoffrey Riggs: Memorandum
7 pages
SD 25 Manual
No ratings yet
SD 25 Manual
16 pages
Techno Various Fonts Dafont - Com 3
No ratings yet
Techno Various Fonts Dafont - Com 3
1 page
GDOH HIS SAP Business Client Configuration
No ratings yet
GDOH HIS SAP Business Client Configuration
14 pages
Chapter3-Professional Practice in Nepal
No ratings yet
Chapter3-Professional Practice in Nepal
4 pages
G Usb BLSTR v2.5-876789
No ratings yet
G Usb BLSTR v2.5-876789
30 pages
Tracking Data Changes: With Temporal Tables and More
No ratings yet
Tracking Data Changes: With Temporal Tables and More
22 pages
Cs8592-Object Oriented Analysis and Design
No ratings yet
Cs8592-Object Oriented Analysis and Design
8 pages
Id-11659 Scrapping Web
No ratings yet
Id-11659 Scrapping Web
295 pages
Brochure Advia 2120I
No ratings yet
Brochure Advia 2120I
2 pages
MIN-EM-GL-008 - FLS MIE Enovia Naming Conventions
No ratings yet
MIN-EM-GL-008 - FLS MIE Enovia Naming Conventions
5 pages
Stock Analysis Spreadsheet (10YR, 2024) (Vers 4.2) PUBLIC
No ratings yet
Stock Analysis Spreadsheet (10YR, 2024) (Vers 4.2) PUBLIC
17 pages
Reading and Writing Set 2 Assgn
No ratings yet
Reading and Writing Set 2 Assgn
16 pages
REPORT Legal Document Summarization Tool
No ratings yet
REPORT Legal Document Summarization Tool
20 pages
Coex Ex e MB Power Supply Unit: Data Sheet
No ratings yet
Coex Ex e MB Power Supply Unit: Data Sheet
2 pages
Self Assessment User Guide
No ratings yet
Self Assessment User Guide
5 pages
Report AMRUTHA FINAL
No ratings yet
Report AMRUTHA FINAL
12 pages