0% found this document useful (0 votes)

63 views20 pages

Neural Architecture Search: Basics

This document discusses neural architecture search (NAS), which aims to automatically find the optimal neural network architecture through searching over a large design space. It defines NAS and describes the basic components of a NAS problem, including the search space of architectural hyperparameters, the outcome of NAS as a specific CNN architecture, and challenges in NAS such as the high cost of evaluating each candidate architecture and the enormous size of the search space. Baseline random search is presented as a simple NAS approach.

Uploaded by

MInh Thanh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

63 views20 pages

Neural Architecture Search: Basics

Uploaded by

MInh Thanh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 20

Neural Architecture Search Basics

Shusen Wang

http://wangshusen.github.io/
• Parameters

• Hyper-parameters
Training
data

Parameters (aka weights)

Testing Test
data accuracy
Training Hyper-
data parameters

Parameters (aka weights)

Testing Test
data accuracy
Architecture
Training Hyper-
data parameters
Algorithm

Parameters (aka weights)

Testing Test
data accuracy
Architecture
Training Hyper-
data parameters
Algorithm

Parameters (aka weights)

Testing Test
data accuracy
CNN Architectures

• Architectural hyper-parameters of a CNN include

• numbers of conv and dense layers,
• number of filters, size of filters, and stride in each conv layer,
• width of each dense layer.
CNN Architectures

• Architectural hyper-parameters of a CNN include

• numbers of conv and dense layers,
• number of filters, size of filters, and stride in each conv layer,
• width of each dense layer.

• Popular CNN architectures are manually designed.

• E.g., ResNet, MobileNet, etc.
• Manually tuning the architectural hyper-parameters.
CNN Architectures

• # of filters • # of filters • # of filters

• size of filters • size of filters ⋯ • size of filters
• stride • stride • stride

Conv Layer 1 Conv Layer 2 Conv Layer 20

Neural Architecture Search (NAS)

Definition: Neural Architecture Search (NAS).

Find the architecture that leads to the best validation accuracy
(or other metrics such as efficiency.)

• Example: ResNet has better accuracy than VGG.

• Example: MobileNet is more efficient than ResNet, although
MobileNet has lower accuracy.
Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2

# of filters ∈ { 10, 11, 12, 13, ..., 98, 99, 100 }

Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2
Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2

Search space: The set containing all the possible architectures.

• We want to build a CNN with 20 Conv layers.
• Search space:
24, 36, 48, 64 -. × 3×3, 5×5, 7×7 -.
× 1, 2 -.
.
Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2

Search space: The set containing all the possible architectures.

• We want to build a CNN with 20 Conv layers.
• Search space:
24, 36, 48, 64 -. × 3×3, 5×5, 7×7 -. × 1, 2 -. .
• Size of search space (i.e., number of possible architectures):
4×3×2 -. = 4×10-2 .
Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2

Search space: The set containing all the possible architectures.

• For example, this is an outcome of NAS:

Layer 1 Layer 2 ⋯ Layer 20

# of filters 24 48 ⋯ 64
Size of filters 5×5 3×3 ⋯ 3×3
Stride 1 1 ⋯ 2
Baseline: Random Search

Train Evaluate
randomly selected
CNN model val acc = 82%
hyper-parameters

randomly selected
CNN model val acc = 94%
hyper-parameters
Baseline: Random Search

Train Evaluate
randomly selected
CNN model val acc = 82%
hyper-parameters

randomly selected
CNN model val acc = 94%
hyper-parameters

randomly selected
CNN model val acc = 91%
hyper-parameters

randomly selected
CNN model val acc = 88%
hyper-parameters
Challenges in NAS

Challenge 1: Each trial is expensive.

• Training a CNN from scratch takes hours or days, if a single
GPU is used.

Challenge 2: The search space is too big.

• Number of possible architectures:
4×3×2 -. = 4×10-2 .
Thank You!

http://wangshusen.github.io/

05introduction To Convolutional Neural Networks
No ratings yet
05introduction To Convolutional Neural Networks
72 pages
A Study On The Role of Ai in Digital Marketing With Special Reference To Chennai City
No ratings yet
A Study On The Role of Ai in Digital Marketing With Special Reference To Chennai City
133 pages
FFCNN: Fast FPGA Based Acceleration For Convolution Neural Network Inference
No ratings yet
FFCNN: Fast FPGA Based Acceleration For Convolution Neural Network Inference
5 pages
2019 Neurips Tutorial
No ratings yet
2019 Neurips Tutorial
138 pages
CNN MLFA Ons-Part1
No ratings yet
CNN MLFA Ons-Part1
65 pages
MLP and CNN
No ratings yet
MLP and CNN
56 pages
PNAL9 CNNs
No ratings yet
PNAL9 CNNs
61 pages
Final Nas PDF
No ratings yet
Final Nas PDF
46 pages
Final Nas
No ratings yet
Final Nas
46 pages
Summary
No ratings yet
Summary
36 pages
CNN Students
No ratings yet
CNN Students
170 pages
Deep Architecture
No ratings yet
Deep Architecture
33 pages
ML 2
No ratings yet
ML 2
70 pages
Unit 3
No ratings yet
Unit 3
105 pages
Final
No ratings yet
Final
30 pages
CNN 190813145957
No ratings yet
CNN 190813145957
34 pages
CNN and Genetic Algorithm
No ratings yet
CNN and Genetic Algorithm
12 pages
JNTUK R20 UNIT-IV DEEP LEARNING TECHNIQUES (WWW - Jntumaterials.co - In)
No ratings yet
JNTUK R20 UNIT-IV DEEP LEARNING TECHNIQUES (WWW - Jntumaterials.co - In)
26 pages
11deep Neural Network Module 8 NeuralNetworkSearch CS13
No ratings yet
11deep Neural Network Module 8 NeuralNetworkSearch CS13
24 pages
ANN-Unit 9 - Convolutionary Neural Networks
No ratings yet
ANN-Unit 9 - Convolutionary Neural Networks
22 pages
MRS Sot Seminar Report
No ratings yet
MRS Sot Seminar Report
16 pages
CNN (Neural Network)
No ratings yet
CNN (Neural Network)
32 pages
CNN
No ratings yet
CNN
37 pages
An Introduction To Convolutional Neural Networks: November 2015
No ratings yet
An Introduction To Convolutional Neural Networks: November 2015
12 pages
ML Seminar
No ratings yet
ML Seminar
58 pages
A Dynamically Configurable Coprocessor For Convolutional Neural Networks
No ratings yet
A Dynamically Configurable Coprocessor For Convolutional Neural Networks
11 pages
S2DNAS Transforming Static CNN Model For Dynamic Inference Via Neural Architecture Search
No ratings yet
S2DNAS Transforming Static CNN Model For Dynamic Inference Via Neural Architecture Search
18 pages
NAT: Neural Architecture Transformer For Accurate and Compact Architectures
No ratings yet
NAT: Neural Architecture Transformer For Accurate and Compact Architectures
12 pages
Assignment1 C EE569
No ratings yet
Assignment1 C EE569
9 pages
FT04 Haghighat Independent 2023
No ratings yet
FT04 Haghighat Independent 2023
40 pages
Efficient Neural Architecture Search (NAS)
No ratings yet
Efficient Neural Architecture Search (NAS)
2 pages
3 DL ConvNets
No ratings yet
3 DL ConvNets
46 pages
Paper 1
No ratings yet
Paper 1
4 pages
A Survey of FPGA Based Accelerators For
No ratings yet
A Survey of FPGA Based Accelerators For
32 pages
Co2 CNN 3
No ratings yet
Co2 CNN 3
31 pages
SCT 3
No ratings yet
SCT 3
9 pages
4a Convolutional Neural Networks
No ratings yet
4a Convolutional Neural Networks
56 pages
CNN 1
No ratings yet
CNN 1
19 pages
AI Periodic Test-1
100% (1)
AI Periodic Test-1
2 pages
Auto CNN
No ratings yet
Auto CNN
11 pages
03 - CNN
No ratings yet
03 - CNN
10 pages
CNN Project
No ratings yet
CNN Project
16 pages
Advanced DL Computer Vision
No ratings yet
Advanced DL Computer Vision
10 pages
Unit 2
No ratings yet
Unit 2
20 pages
A Genetic Programming Approach To Designing Convolutional
No ratings yet
A Genetic Programming Approach To Designing Convolutional
9 pages
An Introduction To Convolutional Neural Networks: November 2015
No ratings yet
An Introduction To Convolutional Neural Networks: November 2015
12 pages
Merged Hcia Ai Huawei Mock Exam Written
No ratings yet
Merged Hcia Ai Huawei Mock Exam Written
28 pages
PEC CS 802C Deep Learning
No ratings yet
PEC CS 802C Deep Learning
13 pages
High Throughput and Low Bandwidth Demand Accelerating CNN Inference Block-By-block On FPGAs
No ratings yet
High Throughput and Low Bandwidth Demand Accelerating CNN Inference Block-By-block On FPGAs
9 pages
CNN Notes Architecture
No ratings yet
CNN Notes Architecture
4 pages
Grid Search Random Search Genetic Algorithm A Big
No ratings yet
Grid Search Random Search Genetic Algorithm A Big
11 pages
5-Convolutional Neural Network
No ratings yet
5-Convolutional Neural Network
43 pages
What Is A Convolutional Neural Network (CNN) ?
No ratings yet
What Is A Convolutional Neural Network (CNN) ?
5 pages
UNIT 2 Self Notes
No ratings yet
UNIT 2 Self Notes
10 pages
03 Convolution Neural Networks and Computer Vision With Tensorflow
No ratings yet
03 Convolution Neural Networks and Computer Vision With Tensorflow
21 pages
Designing Convolutional Neural Network Architecture Using Genetic Algorithms
No ratings yet
Designing Convolutional Neural Network Architecture Using Genetic Algorithms
7 pages
Ch-3 Convolutional Neural Networks (CNNS)
No ratings yet
Ch-3 Convolutional Neural Networks (CNNS)
11 pages
1.convolutional Neural Networks For Image Classification
No ratings yet
1.convolutional Neural Networks For Image Classification
11 pages
Convolution Neural Network
No ratings yet
Convolution Neural Network
74 pages
Convolutional Neural Network
No ratings yet
Convolutional Neural Network
35 pages
Department of Information Science and Engineering Technical Seminar (18Css84) Convolutional Neural Networks
No ratings yet
Department of Information Science and Engineering Technical Seminar (18Css84) Convolutional Neural Networks
15 pages
Anarock India Data Center Report 1742961368
No ratings yet
Anarock India Data Center Report 1742961368
15 pages
Tutorial On DNN 1 of 9 Background of DNNs
No ratings yet
Tutorial On DNN 1 of 9 Background of DNNs
65 pages
Do Technological Devices Bring More Good Than Bad To People
100% (6)
Do Technological Devices Bring More Good Than Bad To People
4 pages
Artificial Intelligence: Dr. Sheraz Naseer Irfan Malik
No ratings yet
Artificial Intelligence: Dr. Sheraz Naseer Irfan Malik
23 pages
ALL LIST 2025 PYTHON PROJECTS LIST Final 290724
No ratings yet
ALL LIST 2025 PYTHON PROJECTS LIST Final 290724
25 pages
Harnessinggenerativeai 1
No ratings yet
Harnessinggenerativeai 1
22 pages
Ai Danger To Humanity
No ratings yet
Ai Danger To Humanity
10 pages
SVM Presentation
No ratings yet
SVM Presentation
27 pages
GenSpark Tracker For - AI Architect Curriculum
No ratings yet
GenSpark Tracker For - AI Architect Curriculum
4 pages
Value-Based Reinforcement Learning: Shusen Wang
No ratings yet
Value-Based Reinforcement Learning: Shusen Wang
53 pages
News 20220608162255
No ratings yet
News 20220608162255
59 pages
2022 Streaming Summit Netflix
No ratings yet
2022 Streaming Summit Netflix
100 pages
AI in Cybersecurity
No ratings yet
AI in Cybersecurity
11 pages
Nasscom Mlops Playbook 2022
No ratings yet
Nasscom Mlops Playbook 2022
55 pages
The Afterlife of Data: What Happens To Your Information When You Die and Why You Should Care 1st Edition Carl Öhman
No ratings yet
The Afterlife of Data: What Happens To Your Information When You Die and Why You Should Care 1st Edition Carl Öhman
58 pages
AI Art in Architecture
No ratings yet
AI Art in Architecture
11 pages
Few-Shot Learning: Shusen Wang
No ratings yet
Few-Shot Learning: Shusen Wang
42 pages
The Impact of Artifcial Intelligence On Human Sexuality
No ratings yet
The Impact of Artifcial Intelligence On Human Sexuality
40 pages
Wp-Contentuploads2023062022 Summit Report - PDF 2
No ratings yet
Wp-Contentuploads2023062022 Summit Report - PDF 2
42 pages
Module 8
No ratings yet
Module 8
4 pages
Convolutional Neural Networks: Shusen Wang
No ratings yet
Convolutional Neural Networks: Shusen Wang
75 pages
Common CNN Architectures: Shusen Wang
No ratings yet
Common CNN Architectures: Shusen Wang
67 pages
RNN + RL: Shusen Wang
No ratings yet
RNN + RL: Shusen Wang
51 pages
Neural Machine Translation: Shusen Wang
No ratings yet
Neural Machine Translation: Shusen Wang
57 pages
Stanford AI Education Summit I-1
No ratings yet
Stanford AI Education Summit I-1
27 pages
Text Generation: Shusen Wang
No ratings yet
Text Generation: Shusen Wang
49 pages
Recurrent Neural Networks (RNNS) : Shusen Wang
No ratings yet
Recurrent Neural Networks (RNNS) : Shusen Wang
33 pages
Lecture 13
No ratings yet
Lecture 13
29 pages
Siamese Network: Shusen Wang
No ratings yet
Siamese Network: Shusen Wang
51 pages
IEEE Project Titles 2023 V1
No ratings yet
IEEE Project Titles 2023 V1
20 pages
Policy-Based Reinforcement Learning: Shusen Wang
No ratings yet
Policy-Based Reinforcement Learning: Shusen Wang
46 pages
Technical Program - GM Link - Online
No ratings yet
Technical Program - GM Link - Online
14 pages
Quality 4.0
No ratings yet
Quality 4.0
21 pages
Convex Function vs. Nonconvex Function: A Little Bit Theory: Shusen Wang
No ratings yet
Convex Function vs. Nonconvex Function: A Little Bit Theory: Shusen Wang
23 pages
15A05602 Data Warehousing & Mining
No ratings yet
15A05602 Data Warehousing & Mining
1 page
Data Poisoning Attacks: Shusen Wang
No ratings yet
Data Poisoning Attacks: Shusen Wang
17 pages
P02 DecisionTrees SolutionNotes
No ratings yet
P02 DecisionTrees SolutionNotes
3 pages
4th International Conference On Artificial Intelligence Advances (AIAD 2025)
No ratings yet
4th International Conference On Artificial Intelligence Advances (AIAD 2025)
2 pages
AI Smart Mirror
No ratings yet
AI Smart Mirror
10 pages
Physical Cyber Social Computing For Human Experience: Amit Sheth Pramod Anantharam
No ratings yet
Physical Cyber Social Computing For Human Experience: Amit Sheth Pramod Anantharam
7 pages
Machine Learning-Based Cloud Security
No ratings yet
Machine Learning-Based Cloud Security
2 pages
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet

Neural Architecture Search: Basics

Uploaded by

Neural Architecture Search: Basics

Uploaded by

Neural Architecture Search Basics

Parameters (aka weights)

Parameters (aka weights)

Parameters (aka weights)

Parameters (aka weights)

• Architectural hyper-parameters of a CNN include

• Architectural hyper-parameters of a CNN include

• Popular CNN architectures are manually designed.

• # of filters • # of filters • # of filters

Conv Layer 1 Conv Layer 2 Conv Layer 20

Definition: Neural Architecture Search (NAS).

• Example: ResNet has better accuracy than VGG.

# of filters ∈ { 10, 11, 12, 13, ..., 98, 99, 100 }

Search space: The set containing all the possible architectures.

Search space: The set containing all the possible architectures.

Search space: The set containing all the possible architectures.

• For example, this is an outcome of NAS:

Layer 1 Layer 2 ⋯ Layer 20

Challenge 1: Each trial is expensive.

Challenge 2: The search space is too big.

You might also like