0% found this document useful (0 votes)

99 views40 pages

Multi-Task Learning in Computer Vision

The document discusses multi-task learning in computer vision. It introduces different multi-task learning architectures, including encoder-focused approaches that share features in the encoding stage like hard parameter sharing, soft parameter sharing, and cross-stitch networks.

Uploaded by

vu.le.bui.quoc

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

99 views40 pages

Multi-Task Learning in Computer Vision

Uploaded by

vu.le.bui.quoc

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

AI VIETNAM

All-in-One Course

Module 10 - Project

Multi-Task Learning

AI VIET NAM
Nguyen Quoc Thai

1
Year 2023
Objectives
! Multi-task Learning for Computer Vision

Task 1 Training Data Model

Generalization

Feature-based MTL
Task 2 Training Data Model
Parameter-based MTL Generalization

Task 3 Training Data Model

Generalization
2
Outline
Ø Introduction
Ø Deep Multi-Task Architectures
Ø Optimization Strategy
Ø Experiment

3
Introduction
! Single-Task Learning

Ø Image Classification

MODEL Class: CAT

(LeNet, ResNet,…)

4
Introduction
! Single-Task Learning

Ø Image Segmentation

0 0 0 0 0 0 0 0
0 1 1 0 0 0 0 0
0 1 1 1 0 2 2 0

MODEL 0 1 1 1 0 2 2 0

(UNet) 0 1 1 1 2 2 2 0
0 1 1 1 1 2 2 0
1 1 1 1 1 2 2 0
0 0 0 0 0 0 0 0

DOG CAT
5
Introduction
! Single-Task Learning

Ø Object Detection

DOG – 0.98 CAT – 0.87

MODEL
(UNet)

Assign labels, bounding boxes

to objects in the image
6
Introduction
! Single-Task Learning

Task 1 Training Data Model

Training Generalization

Task 2 Training Data Model

Training Generalization

Task 3 Training Data Model

Training Generalization
7
Introduction
! Multi-Task Learning

Task 1 Training Data Model

Generalization

Task 2 Training Data Model

Training Generalization

Task 3 Training Data Model

Generalization
8
Introduction
! Motivation

Ø Learning multiple tasks jointly with the aim of mutual benefit

Ø Improves generalization on other tasks
Caused by the inductive bias provided by the auxiliary task

9
Introduction
! Multi-Task Learning

Task 1 Training Data Model

Generalization

What to Share?
Task 2 Training Data Model
Generalization
How to Share?

Task 3 Training Data Model

Generalization
10
Introduction
! MTL Methods (based on what to share?)

Ø Feature-based MTL
o Aims to learn common features among different tasks
Ø Parameter-based MTL
o Learns model parameters to help learn parameters for other tasks
Ø Instance-based MTL
o Identify useful data instances in a task for other task

11
Introduction
! MTL Methods (based on how to share?)

Ø Feature-based MTL
o Feature learning approach
o Deep learning approach
Ø Parameter-based MTL
o Low-Rank approach

12
Introduction
! Feature Learning Approach

Ø Why need to learn common feature representations?

o Original features may not have enough expressive power
Ø Two sub-categories
o Feature transformation approach
o Feature selection approach

13
Introduction
! Feature Learning Approach

Ø Feature transformation approach

o The learned features are a linear or nonlinear transformation of the original
feature representation
o Multi-task feedforward NN

Input 1 Output for task 1

Input d Output for task 2

14
Introduction
! Feature Learning Approach

Ø Feature selection approach

o Select a subset of the original features as the learned representation
o Eliminates useless features based on different criteria

15
Introduction
! Low-Rank Approach

Ø Assumes the model parameters of different

tasks share a low-rank subspace

16
Introduction
! Deep Learning Approach

Ø Deep Multi-Task Architectures

o Encoder-Focused
o Decoder-Focused
Ø Optimization Strategy Methods
o Task Balancing
o Other: Heuristics, Gradient Sign Dropout

17
Outline
Ø Introduction
Ø Deep Multi-Task Architectures
Ø Optimization Strategy
Ø Experiment

18
Deep Multi-Task Architectures
! Deep Multi-Task Architectures used in Computer Vision

Deep Multi-Task
Architectures

Encoder-Focused Decoder-Focused Other

MTL Baseline PAD-Net

Cross-Stitch Networks ASTMT
PAP-Net
NDDR-CNN MTI-Net
MTAN

19
Deep Multi-Task Architectures
! Encoder-Focused

Ø Share the task features in the encoding stage

Task A Task B Task C

Task specific

Shared Encoder
(Soft/Hard)

20
Deep Multi-Task Architectures
! Encoder-Focused

Ø Hard Parameter Sharing

o Generally applied by sharing the hidden layers between all tasks
o Keep several task-specific output layers

Task A Task B Task C

Task specific

21
Deep Multi-Task Architectures
! Encoder-Focused

Ø Soft Parameter Sharing

o Each task has its own model with its own parameters
o Uses a linear combination in every layer of the task-specific networks

Task A Task B Task C

Task specific

22
Deep Multi-Task Architectures
! Encoder-Focused

Ø Cross-Stitch Networks
o Shared the activations amongst all single-task networks in the encoder

Task A Task B Task A Task B

+ 𝛼 𝛼 +

Share Parameters

23
Deep Multi-Task Architectures
! Encoder-Focused

Ø Cross-Stitch Networks
o Shared the activations amongst all single-task networks in the encoder
o Cross connection

Task A Task B Task A Task B

+ 𝛼 𝛼 + + Conv Conv +

Conv Conv Conv Conv

24
Deep Multi-Task Architectures
! Encoder-Focused

Ø Multi-Task Attention Networks

o Used a shared backbone network in conjunction with task-specific attention
modules in the encoder
Task B Task C

Task specific

Shared Encoder Attention Module Attention Module

Attention Module Attention Module

25
Deep Multi-Task Architectures
! Decoder-Focused

Task A Task B Task C

Task A Task B Task C Task specific

Shared Encoder
(Soft/Hard)

26
Deep Multi-Task Architectures
! Decoder-Focused

Ø PAD-Net
o Multi-Tasks Guided Prediction-and-Distillation Network for Simultaneous
Depth Estimation and Scene Parsing

27
Deep Multi-Task Architectures
! Decoder-Focused

Ø PAD-Net
o Deep Multimodal Distillation

28
Outline
Ø Introduction
Ø Deep Multi-Task Architectures
Ø Optimization Strategy
Ø Experiment

29
Optimization Strategy
! Task Balancing Approaches

Ø Set a unique weight for each task

ℒ!"# = # 𝑤$ . ℒ$
$

Ø Use SGD to minimize the objective

𝜕ℒ$
𝑊%&'()* = 𝑊%&'()* − 𝛾 # 𝑤$
𝜕𝑊%&'()*
$

30
Optimization Strategy
! Uncertainty Weighting

Ø Use the homoscedastic uncertainty to balance the single-task losses

Ø Optimize the model weights W and noise parameters

1 1
ℒ W, σ+ , 𝜎, = , ℒ+ 𝑊 + , ℒ, 𝑊 + log 𝜎+ 𝜎,
2𝜎+ 2𝜎,

31
Optimization Strategy
! Dynamic Weight Averaging (DWA)

Ø Learns to average task weighting over time by considering the rate of change of loss
for each task
Training Time Relative Loss Change

r- t − 1
N exp T L.(t − 1)
w- t = , r. t − 1 =
r t−1 L.(t − 2)
∑. exp .
T

Temperature
(Softness of Task Weighting)

32
Optimization Strategy
! Other methods

Ø Gradient Normalization
Ø Dynamic Task Prioritization

33
Quiz

34
Outline
Ø Introduction
Ø Deep Multi-Task Architectures
Ø Optimization Strategy
Ø Experiment

35
Experiment
! NYUD-v2 Dataset

36
Experiment
! Model

Task A Task B Task C Task A Task B Task C

Hard Parameter Sharing Soft Parameter Sharing

37
Experiment
! Code

38
Summary

Deep Multi-Task
Optimization Strategy
Architectures

Encoder-Focused Decoder-Focused Other Task Balancing

MTL Baseline PAD-Net Uncertainty Weighting

Cross-Stitch Networks ASTMT Gradient Normalization
PAP-Net
NDDR-CNN MTI-Net DWA
MTAN DTP

39
Thanks!
Any questions?

2022 - Multi-Task Learning For Dense Prediction Tasks - A Survey - Vandenhende Et Al - IEEE Transactions On Pattern Analysis and Machine Intelligence
No ratings yet
2022 - Multi-Task Learning For Dense Prediction Tasks - A Survey - Vandenhende Et Al - IEEE Transactions On Pattern Analysis and Machine Intelligence
20 pages
11 Deep Transfer Learning and Multi Task Learning
No ratings yet
11 Deep Transfer Learning and Multi Task Learning
24 pages
2019 - End-To-End Multi-Task Learning With Attention - Liu Et Al
No ratings yet
2019 - End-To-End Multi-Task Learning With Attention - Liu Et Al
10 pages
Multi Task
No ratings yet
Multi Task
11 pages
Multitask Transfer
No ratings yet
Multitask Transfer
36 pages
Cross-Stitch Networks For Multi-Task Learning
No ratings yet
Cross-Stitch Networks For Multi-Task Learning
10 pages
MmAP Multi-Modal Alignment Prompt For Cross-Domain Multi-Task Learning
No ratings yet
MmAP Multi-Modal Alignment Prompt For Cross-Domain Multi-Task Learning
9 pages
2022 - MTFormer - Multi-Task Learning Via Transformer and Cross-Task Reasoning - Xu Et Al - Springer Nature Switzerland
No ratings yet
2022 - MTFormer - Multi-Task Learning Via Transformer and Cross-Task Reasoning - Xu Et Al - Springer Nature Switzerland
18 pages
Task Switching Networks for MTL
No ratings yet
Task Switching Networks for MTL
10 pages
Misra Et Al. - 2016 - Cross-Stitch Networks For Multi-Task Learning
No ratings yet
Misra Et Al. - 2016 - Cross-Stitch Networks For Multi-Task Learning
10 pages
Multi Task Learning (MTL)
No ratings yet
Multi Task Learning (MTL)
15 pages
MODULE 6 - 3 Multi-Task Deep Learning
No ratings yet
MODULE 6 - 3 Multi-Task Deep Learning
16 pages
Gradnorm: Gradient Normalization For Adaptive Loss Balancing in Deep Multitask Networks
No ratings yet
Gradnorm: Gradient Normalization For Adaptive Loss Balancing in Deep Multitask Networks
12 pages
Cross Training
No ratings yet
Cross Training
11 pages
Multi-Task Learning On Mnist Image Datasets
No ratings yet
Multi-Task Learning On Mnist Image Datasets
4 pages
Efficient Multi-Task Learning Strategies
No ratings yet
Efficient Multi-Task Learning Strategies
10 pages
6 Transformers
No ratings yet
6 Transformers
77 pages
LLM
No ratings yet
LLM
28 pages
Introduction To Multitasking Notes Unit-5
No ratings yet
Introduction To Multitasking Notes Unit-5
23 pages
One Model To Learn Them All: Work Performed While at Google Brain
No ratings yet
One Model To Learn Them All: Work Performed While at Google Brain
10 pages
Research Notes
No ratings yet
Research Notes
9 pages
2020 - Which Tasks Should Be Learned Together in Multi-Task Learning - Standley Et Al - PMLR
No ratings yet
2020 - Which Tasks Should Be Learned Together in Multi-Task Learning - Standley Et Al - PMLR
13 pages
A Single-Stream Segmentation and Depth Prediction CNN For Autonomous Driving
No ratings yet
A Single-Stream Segmentation and Depth Prediction CNN For Autonomous Driving
7 pages
A Survey of Deep Learning - From Activations To Transformers
No ratings yet
A Survey of Deep Learning - From Activations To Transformers
12 pages
Vision Transformers for Autonomous Cars
No ratings yet
Vision Transformers for Autonomous Cars
9 pages
Singh Training Strategies For Vision Transformers For Object Detection CVPRW 2023 Paper
No ratings yet
Singh Training Strategies For Vision Transformers For Object Detection CVPRW 2023 Paper
9 pages
Deep Learning for Visual Experts
No ratings yet
Deep Learning for Visual Experts
58 pages
Efficient Task Grouping in Multi-Task Learning
No ratings yet
Efficient Task Grouping in Multi-Task Learning
14 pages
Adaptive Weight Assignment Scheme For Multi-Task Learning
No ratings yet
Adaptive Weight Assignment Scheme For Multi-Task Learning
6 pages
2021 NeurIPS VAAT Akbari, Yuan, Qian, Chuang, Chang, Cui, Gong
No ratings yet
2021 NeurIPS VAAT Akbari, Yuan, Qian, Chuang, Chang, Cui, Gong
16 pages
Detailed Notes On ML Models and Architectures
No ratings yet
Detailed Notes On ML Models and Architectures
11 pages
Context-Aware Multi-Task Learning For Traffic Scene Recognition in Autonomous Vehicles
No ratings yet
Context-Aware Multi-Task Learning For Traffic Scene Recognition in Autonomous Vehicles
8 pages
Yolor Based Multi Task Learning
No ratings yet
Yolor Based Multi Task Learning
17 pages
Taskonomy: Disentangling Task Transfer Learning
No ratings yet
Taskonomy: Disentangling Task Transfer Learning
11 pages
DL Unit-5
No ratings yet
DL Unit-5
7 pages
Transformers for CAP6412 Students
No ratings yet
Transformers for CAP6412 Students
69 pages
Lecture 1a - Introduction
No ratings yet
Lecture 1a - Introduction
38 pages
6 - Multi - Task - Learning
No ratings yet
6 - Multi - Task - Learning
1 page
ViT Explained
No ratings yet
ViT Explained
15 pages
Introduction To Deep Learning 17th January 2025
No ratings yet
Introduction To Deep Learning 17th January 2025
60 pages
Transformers in Computational Visual Media A Surve
No ratings yet
Transformers in Computational Visual Media A Surve
30 pages
Paper 2
No ratings yet
Paper 2
8 pages
Research On Learning Representations in Computer Vision
No ratings yet
Research On Learning Representations in Computer Vision
52 pages
Conditional Positional Encodings For Vision Transformers
No ratings yet
Conditional Positional Encodings For Vision Transformers
13 pages
Deep Learning Examples in MATLAB
No ratings yet
Deep Learning Examples in MATLAB
36 pages
ASM MotionPlanning Part 3
No ratings yet
ASM MotionPlanning Part 3
115 pages
Unit: Multimodal Multitask Learning With A Unified Transformer
No ratings yet
Unit: Multimodal Multitask Learning With A Unified Transformer
16 pages
Computer Vision 11 Transformers
No ratings yet
Computer Vision 11 Transformers
63 pages
Lec25 Architectures
No ratings yet
Lec25 Architectures
52 pages
Daily Dose of Data Science Full Archive
No ratings yet
Daily Dose of Data Science Full Archive
53 pages
Deep Learning for Image Segmentation
No ratings yet
Deep Learning for Image Segmentation
92 pages
Atelier 2
No ratings yet
Atelier 2
2 pages
Auxiliary Tasks in Multi-Task Learning: Lukas Liebel Marco Körner
No ratings yet
Auxiliary Tasks in Multi-Task Learning: Lukas Liebel Marco Körner
8 pages
869 When Vision Transformers Outpe
No ratings yet
869 When Vision Transformers Outpe
20 pages
Simple Vision Transformer for Localization
No ratings yet
Simple Vision Transformer for Localization
12 pages
Rec03 - Deep Architectures
No ratings yet
Rec03 - Deep Architectures
65 pages
Universal Vision Transformer for Detection
No ratings yet
Universal Vision Transformer for Detection
23 pages
Table of Content: (Page Numbers in PDF File)
No ratings yet
Table of Content: (Page Numbers in PDF File)
223 pages
Module 5
No ratings yet
Module 5
78 pages
Evacuation Efficiency at HCCC
100% (1)
Evacuation Efficiency at HCCC
107 pages
Steel Logistics Conference Feedback Form
No ratings yet
Steel Logistics Conference Feedback Form
2 pages
Thermodyanamics Mergede 11 Physics DPP - 250111 - 161951
No ratings yet
Thermodyanamics Mergede 11 Physics DPP - 250111 - 161951
8 pages
Mrcog
100% (5)
Mrcog
286 pages
SP-1131 - Handover and As-Built Documentation
100% (1)
SP-1131 - Handover and As-Built Documentation
21 pages
Geomatics Model Question Paper
No ratings yet
Geomatics Model Question Paper
3 pages
03 CB - Routine Tests-New
No ratings yet
03 CB - Routine Tests-New
15 pages
AP Human Geography: Thinking Geographically
100% (2)
AP Human Geography: Thinking Geographically
3 pages
Uk Urban Fieldwork Generic
No ratings yet
Uk Urban Fieldwork Generic
3 pages
Larry Williams Special Report 2017
100% (3)
Larry Williams Special Report 2017
15 pages
NSD 22 Questions
No ratings yet
NSD 22 Questions
2 pages
Sahu Et Al., 2021 - Improving Financial and Environmental Performance Through MFCA A SME Case Study
No ratings yet
Sahu Et Al., 2021 - Improving Financial and Environmental Performance Through MFCA A SME Case Study
19 pages
The Effect of Academic Stress On The Depression Levels of HUMSS Senior High School Students
No ratings yet
The Effect of Academic Stress On The Depression Levels of HUMSS Senior High School Students
30 pages
DX Mail Address Booklet Government Directory 2015
No ratings yet
DX Mail Address Booklet Government Directory 2015
36 pages
English Xi - Half Yearly Syllabus - 2023-24
No ratings yet
English Xi - Half Yearly Syllabus - 2023-24
2 pages
U500X Digital Microscope User Manual
No ratings yet
U500X Digital Microscope User Manual
22 pages
Conservation of Architectural Heritage
No ratings yet
Conservation of Architectural Heritage
313 pages
Authority To Lease - Template
100% (3)
Authority To Lease - Template
4 pages
111-Reinforced Concrete Designers Handbook 10th Edition - Reynolds Steedman - No PW
No ratings yet
111-Reinforced Concrete Designers Handbook 10th Edition - Reynolds Steedman - No PW
1 page
Carbon Intensity
No ratings yet
Carbon Intensity
10 pages
Electronic Service Tools: Troubleshooting
No ratings yet
Electronic Service Tools: Troubleshooting
6 pages
Millicent Atkins School of Education: Common Lesson Plan Template
No ratings yet
Millicent Atkins School of Education: Common Lesson Plan Template
6 pages
The Benefits of Veeam Over Acronis
No ratings yet
The Benefits of Veeam Over Acronis
2 pages
MoonAstro - GeM
No ratings yet
MoonAstro - GeM
1 page
JSS2 2ND Maths
No ratings yet
JSS2 2ND Maths
2 pages
Managerial Economics Notes 1st SEM
No ratings yet
Managerial Economics Notes 1st SEM
11 pages
Cowboy Life and Cattle Culture
100% (1)
Cowboy Life and Cattle Culture
10 pages
Google Warsaw: EMEA Cloud Innovation Hub
No ratings yet
Google Warsaw: EMEA Cloud Innovation Hub
5 pages
Spanish City Ban Holiday Rentals1
No ratings yet
Spanish City Ban Holiday Rentals1
1 page

Multi-Task Learning in Computer Vision

Uploaded by

Multi-Task Learning in Computer Vision

Uploaded by

AI VIETNAM

Task 1 Training Data Model

Task 3 Training Data Model

MODEL Class: CAT

DOG – 0.98 CAT – 0.87

Assign labels, bounding boxes

Task 1 Training Data Model

Task 2 Training Data Model

Task 3 Training Data Model

Task 1 Training Data Model

Task 2 Training Data Model

Task 3 Training Data Model

Ø Learning multiple tasks jointly with the aim of mutual benefit

Task 1 Training Data Model

Task 3 Training Data Model

Ø Why need to learn common feature representations?

Ø Feature transformation approach

Input 1 Output for task 1

Input d Output for task 2

Ø Feature selection approach

Ø Assumes the model parameters of different

Ø Deep Multi-Task Architectures

Encoder-Focused Decoder-Focused Other

MTL Baseline PAD-Net

Ø Share the task features in the encoding stage

Task A Task B Task C

Ø Hard Parameter Sharing

Task A Task B Task C

Ø Soft Parameter Sharing

Task A Task B Task C

Task A Task B Task A Task B

Task A Task B Task A Task B

Conv Conv Conv Conv

Ø Multi-Task Attention Networks

Shared Encoder Attention Module Attention Module

Attention Module Attention Module

Task A Task B Task C

Task A Task B Task C Task specific

Ø Set a unique weight for each task

Ø Use SGD to minimize the objective

Ø Use the homoscedastic uncertainty to balance the single-task losses

Task A Task B Task C Task A Task B Task C

Hard Parameter Sharing Soft Parameter Sharing

Encoder-Focused Decoder-Focused Other Task Balancing

MTL Baseline PAD-Net Uncertainty Weighting

You might also like