0% found this document useful (0 votes)

13 views13 pages

MLP Mixer

MLP_Mixer

Uploaded by

fish cant talk

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views13 pages

MLP Mixer

MLP_Mixer

Uploaded by

fish cant talk

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 13

new

  VI   Đăng nhập/Đăng ký

Đã đăng vào thg 5 7, 2021 4:02

CH trong
Trần Đức Trung @niits Theo dõi
Sun* AI Research Team - 15
 2.6K  96  65
phút đọc

 2.4K  1  4

MLP-Mixer - Hướng giải quyết các bài

toán Computer Vision mới bên cạnh
CNN và Transformer

 Bài đăng này đã không được cập nhật trong 3 năm 

Có thể nói rằng Convolutional Neural Network hay CNN đã

và đang được cho là mô hình vô cùng phù hợp cho thị giác
máy tính. Bên cạnh đó các mạng dựa trên cơ chế attention,
chẳng hạn như Vision Transformer, cũng dần được quan tâm
và sử dụng nhiều hơn. Tuy vậy trong paper mới được publish
của mình với tên gọi MLP-Mixer: An all-MLP Architecture for
Vision, nhóm Google Brain ở Zurich và Berlin đã tuyên bố
rằng năm 2021 rồi ai cùng dùng mấy cái đấy nữa mặc dù các
Hãytrên
kiến trúc đăng kýmang
đều một tài
lại khoản Viblo
hiệu xuất đểnhư
cũng nhận
độđược
chínhnhiều
xác

bài sử
cao, việc viếtdụng
thú vị hơn.đôi khi là không cần thiết. Vậy nên
chúng
trong bài viết này, chúng ta sẽ cùng tìm hiểu cách thức hoạt
Đăng nhập Đăng kí
động của kiến trúc này cũng như sự khác biệt của nó với các
kiến
 +28  trúc mạng khác.  •  •  •  • 
Tổng quan kiến trúc của MLP-Mixer
Như có thể dễ dàng nhận thấy, sự xuất hiện của các bộ dữ
liệu với kích thước ngày càng lớn và cùng với đó là khả năng
tính toán của máy móc càng ngày càng được cải thiện dẫn
đến nhiều kiến trúc mô hình được ra đời cũng như dần được
cải tiến. Trong khi Convolutional Neural Network đã và đang
là tiêu chuẩn thực tế cho thị giác máy tính, gần đây Vision
Transformers (ViT), một giải pháp thay thế dựa trên các lớp
self-attention đã đạt được hiệu suất của các mô hình hiện đại
được công bố trước đó. ViT tiếp tục xu hướng lâu dài là loại
bỏ các đặc trưng "hand-crafted" và "inductive biases" khỏi
các mô hình và dựa vào việc học hỏi nhiều hơn từ dữ liệu
thô.

Tiếp nối truyền thống tre chưa già mà măng đã mọc, kiến
trúc MLP-Mixer được nhóm tác giả đề xuất và được cho là
đơn giản hơn các mô hình trước đây nhưng không hề thua
kém về hiệu xuất khi không sử dụng đến các lớp convolution
hay cơ chế self-attention. Thay vào đó kiến trúc của Mixer
hoàn toàn dựa trên perceptron nhiều lớp, thứ được áp dụng
nhiều lần trên thông tin không gian cũng như các đặc trưng
theo channel.
Dữ liệu đầu vào
Hình minh họa trên được trích từ paper mô tả tổng quan
kiến trúc của Mixer. Kiến trúc này nhận đầu vào là một chuỗi
các phần của hình ảnh được chiếu tuyến tính (được đề cập
trong paper với khái niệm token) như một bảng có kích
thước là (sˊo^tokenxsˊo^channel). Như trong hình minh họa
trên đang thể hiện kiến trúc của một mô hình phân lớp, hình
ảnh đầu vào được chia thành 9 phần tương ứng với 9 token
là đầu vào cho mạng. Để hình dung rõ hơn, ta hãy cùng quan
sát phần mã Pytorch được cài đặt cho phần PatchEmbed ở
repo pytorch-image-models được thể hiện ở hình dưới đây.

Có thể thấy rằng qua module này, ảnh đầu vào với kích thước
(224, 224) được chia thành từng phần với kích thước
(16, 16) sau đó được từng phần nhỏ kia được chuyển đổi
thành một vector có kích thước 16 ∗ 16 ∗ 3 = 768 do ảnh
đầu vào có 3 channel lần lượt là R, G, B như thông thường.
Khi đó bảng giá trị đầu vào sẽ có kích thước là (196 ∗ 768)
do ta có tổng cộng (224/16) ∗ (224/16) token tương ứng
với từng đó phần của ảnh đầu vào.

Cấu trúc của MixerLayer

Mixer lấy ý tưởng từ việc sử dụng convolution với các kernel
nhỏ đến cực điểm: bằng cách giảm kích thước kernel xuống 1
× 1 và việc này biến các phép convolution thành phép nhân
ma trận dense tiêu chuẩn được áp dụng độc lập cho từng vị
trí không gian. Tuy vậy chỉ riêng sửa đổi này không cho phép
tổng hợp thông tin không gian và để bù lại, nhóm tác giả áp
dụng phép nhân ma trận dense được áp dụng cho mọi đối
tượng trên tất cả các vị trí không gian.

Điểm này khiến cho MLP-Mixer khác với các loại kiến trúc
mạng khác khi thay vì dùng các thành phần convolution hay
cơ chế self-attention, Mixer sử dụng MixerLayer được tạo
nên bằng cách sử dụng hai loại MLP như sau:

Channel-mixing MLP: cho phép giao tiếp giữa các

channel khác nhau; chúng hoạt động trên từng token
một cách độc lập và lấy các hàng riêng lẻ của bảng làm
đầu vào. T
Token-mixing MLP: cho phép giao tiếp giữa các vị trí
không gian khác nhau (token); chúng hoạt động trên
từng channel độc lập và lấy các cột riêng lẻ của bảng
làm đầu vào.

Hai loại lớp này được xen kẽ để cho phép tương tác của cả
hai thứ nguyên đầu vào là theo từng token và theo từng
channel và tạo nên một MixerLayer .
Quay trở lại với hình minh họa, ta có thể thấy rằng trong mỗi
MixerLayer , bảng dữ liệu đầu vào sau khi qua một
LayerNorm sẽ được chuyển vị và truyền qua các token-mixing

MLP với theo từng channel sau đó tiếp tục được chuyển vị về
kích thước cũ và truyền qua các channel-mixing MLP sau khi
đã truyền qua một LayerNorm thứ hai. Bên cạnh đó, trước
mỗi LayerNorm luôn có skip-connections , là một kĩ thuật
được đã giới thiệu tại paper Deep Residual Learning for
Image Recognition, cho phép đào tạo các mạng thần kinh rất
sâu với hàng trăm lớp và được cải thiện hơn nữa hiệu suất.

Phần mã dưới đây thể hiện cách thức cài đặt của MixerLayer .
Có thể thấy rằng cấu trúc của MixerLayer được cài đặt đầy
đủ trong class MixerBlock (không giống như repo nào đấy
của Yolov4 treo đầu dê bán thịt chó, trong paper có PAN mà
tìm không thấy đâu) khi mà mỗi MixerBlock có hai
LayerNorm trước mỗi lớp MLP cũng như cài đặt mã phục vụ
cho quá trình skip-connections .

Cuối cùng, thành phần nhỏ nhấn được thể hiện trong hình
minh họa là các khối MLP. Chúng được cấu tạo bởi hai lớp
fully-connected và một hàm kích hoạt phi tuyến tính được áp
dụng độc lập cho mỗi hàng của tensor dữ liệu đầu vào cụ thể
là hàm GELU có công thức là GELU (x) = xP (X ≤ x) =
xΦ (x) = x ⋅ 12 [1 + erf(x/ 2)]. Mã cài đặt của chúng
được thể hiện trong hình dưới đây:

So sánh với các kiến trúc khác

Do ý tưởng thiết kế được bắt nguồn từ ý tưởng từ các tài liệu
trên Convolutional Neural Network và Transformers, MLP-
Mixer có một số điểm tương đồng cũng như khác biệt với hai
kiểu kiến trúc trên.

Đầu tiên, các token-mixing MLP hoạt động trên từng channel
độc lập và lấy các cột riêng lẻ của bảng làm đầu vào. Ràng
buộc các tham số của channel-mixing MLP (trong mỗi lớp) là
một lựa chọn tự nhiên — nó cung cấp bất biến vị trí (nguyên
văn là positional invariance, thể hiện việc ta có thể phát hiện
và phân lớp các đối tượng kể cả khi vị trí chúng được thay
đổi) vốn là một tính năng nổi bật của việc sử dụng
convolution.

Tuy vậy, việc ràng buộc các thông số trên các channel ít được
sử dụng hơn. Ví dụ như việc lấy separable convolution, được
sử dụng trong một số kiến trúc CNN, thường được thực hiện
bằng cách áp dụng áp dụng convolution cho từng channel
độc lập, sử dụng một kernel khác nhau để áp dụng cho mỗi
channel. Điều này không giống như các token-mixing MLP
trong Mixer khi chúng chia sẻ cùng một kernel (của receptive
fied) cho tất cả các channel. Do đó như được trình bày trong
paper, điều này dẫn đến việc ràng buộc tham số đã ngăn
không cho kiến trúc không phát triển quá nhanh khi tăng
kích thước bảng dữ liệu và giúp đến tiết kiệm bộ nhớ đáng
kể.

Cuối cùng, mỗi lớp trong Mixer (ngoại trừ lớp chiếu các phần
ảnh đầu vào ban đầu) nhận một đầu vào có cùng kích thước.
Thiết kế "đẳng hướng" này gần giống với Transformer hoặc
các kiến trúc RNN sâu khác. Điều này không giống như hầu
hết các kiến trúc mạng tích chập khi các kiến trúc mạng này
có cấu trúc hình chóp: các lớp sâu hơn có đầu vào độ phân
giải thấp hơn, nhưng nhiều channel hơn. Và hơn nữa, không
giống như kiến trúc ViT, Mixer không sử dụng embedding
cho thông tin vị trí bởi các token-mixing MLP có thông tin về
thứ tự các token đầu vào và do đó nó có thể học thể hiện
thông tin vị trí.

Kết quả thực nghiệm

Để chứng minh hiệu năng của kiến trúc mô hình này, nhóm
tác giả đã thực nghiệm trên các một số bộ dữ liệu lớn. Kết
quả thu được như sau được thể hiện ở hình được trích từ
paper dưới đây thể hiện các thông tin về độ chính xác và tài
nguyên được sử dụng khi so sánh Mixer với các mô hình hiện
đại khác. Các cột “ImNet” và “ReaL” đề cập đến các nhãn xác
thực ImageNet ban đầu và các nhãn ReaL đã được làm sạch
trong khi đó “Avg 5 ”là viết tắt của hiệu suất trung bình trên
tất cả năm tác vụ ImageNet, CIFAR-10, CIFAR-100, Pets,
Flowers.
Mặc dù hoạt động không tốt khi train từ đầu trên mageNet-
1k, Mixer đạt được hiệu suất tổng thể khá cao (84,15% top-1
trên ImageNet) khi được pre-trained trên ImageNet-21k với
Regularization bổ sung, mặc dù hơi kém so với các mô hình
khác. Regularization trong trường hợp này là cần thiết và
Mixer sẽ bị overfit nếu không sử dụng nó, và theo nhóm tác
giả, điều này phù hợp với các quan sát tương tự đối với ViT.

Khi kích thước của tập dữ liệu tăng lên, hiệu suất của Mixer
sẽ cải thiện đáng kể. Đặc biệt, Mixer-H/14 đạt độ chính xác
top-1 là 87,94% trên ImageNet, tốt hơn 0,5% so với
BiTResNet152x4 và chỉ thấp hơn 0,5% so với ViT-H/14. Đáng
chú ý, Mixer-H/14 chạy nhanh hơn 2,5 lần so với ViT-H/14 và
gần như gấp đôi BiT.
Tuy được tuyên bố như vậy trong paper, có một số ý kiến
khác được đưa ra khi thảo luận về về MLP-Mixer. BeatLeJuce
trên Reddit cho rằng MLP-Mixer sẽ không hoạt động hiệu
quả trên các tập dữ liệu với kích thước nhỏ hơn. Thậm chí,
kardeng trên Reddit cho rằng việc sử dụng MLP trong MLP-
Mixer không phải quá độc đáo và kiến trúc này không có
tiềm năng đáng kể vì các lớp được kết nối đầy đủ đã là một
phần của kiến trúc CNN ngay từ đầu (LeNet) nhưng đã dần bị
loại bỏ theo thời gian. Bằng cách giới hạn các tương tác đến
"chỉ giữa các vị trí không gian", các bậc tự do được giảm
xuống mức mà bây giờ MLP-Mixer chỉ cần 100 triệu hình
ảnh tiền đào tạo hoặc 1 triệu hình ảnh tiền đào tạo và
Regularization để đạt được kết quả gần như SOTA. Một số
khác cũng cho rằng bên cạnh việc đòi hỏi quá nhiều dữ liệu,
đi kèm với độ lớn của model và dữ liệu là đòi hỏi năng lực
tính toán rất lớn.

Kết luận
Do là miếng gạch đầu tiên đặt vào một hướng đi mới nhằm
giải quyết các bài toán thị giác máy, MLP-Mixer có kiến trúc
khá đơn giản và bên cạnh đó còn khá nhiều vấn đề cần được
giải quyết như việc cần quá nhiều dữ liệu để huấn luyện cũng
như cần có khả năng tính toán tương xứng với kích thước của
mô hình, vốn được cho rằng khá lớn so với các kiến trúc
mạng khác. Trên hết, theo nhóm tác giả đề cập trong paper,
họ hy vọng rằng kết quả nghiên cứu này sẽ thúc đẩy các
nghiên cứu sâu hơn, vượt ra ngoài lĩnh vực của các mô hình
đã được thiết lập dựa trên convolution và self-attention và sẽ
đặc biệt thú vị khi xem liệu một thiết kế như vậy có hoạt
động trong NLP hay các miền khác hay không. Bài viết đến
đây là kết thúc cảm ơn mọi người đã giành thời gian đọc.

Tài liệu tham khảo

MLP-Mixer: An all-MLP Architecture for Vision
Gaussian Linear Error Units
[R] MLP-Mixer: An all-MLP Architecture for Vision

MLP 2021_roi_ai_con_dung_convolution

All rights reserved

  

Tìm hiểu về kiến trúc Transformer

Do Dang Hung
8 phút đọc
 6.5K 7 2 
 12

Receptive field là gì? Tại sao nó lại quan trọng đối với CNN?

Trinh Quang Huy

12 phút đọc
 2.5K 4 0 
 17
Scene Text Recognition sử dụng mô hình Transformer

Nguyen Viet Hoai

7 phút đọc
 2.3K 4 5 
9

Giải quyết vấn đề lập trình cho người mới?.

Phạm Anh Tuấn

9 phút đọc
 1.4K 4 2 
 12

Bài viết khác từ Trần Đức Trung

Một chút dbt

Trần Đức Trung

10 phút đọc
 913 7 0 
 14

[Paper Explain] IAG: Induction-Augmented Generation

Framework for Answering Reasoning
Trần Đức Trung
16 phút đọc
 185 0 0 
8

 Deep Learning for Computer Vision: Bài 4 - Bài toán

Image classification
Trần Đức Trung
1 phút đọc
 383 0 0 
1

 Deep Learning for Computer Vision: Bài 3 - Convolution

Neural Network
Trần Đức Trung
1 phút đọc
 215 0 0 
0

Bình luận

 Đăng nhập để bình luận

Mỹ Linh Nguyễn Thị @linh_army

thg 5 8, 2023 12:46 SA

hayyy quá anh ạ

 0  | Trả lời Chia sẻ 

TÀI NGUYÊN

Bài viết Tổ chức

Câu hỏi Tags

Videos Tác giả

Thảo luận Đề xuất hệ thống

Công cụ Machine Learning

Trạng thái hệ thống

DỊCH VỤ

Viblo Viblo Code Viblo CTF Viblo CV

Viblo Viblo Viblo Battle Viblo

Learning Partner Interview

ỨNG DỤNG DI ĐỘNG

LIÊN KẾT

  

PG DBDA Evaluation Guidelines and Daywise Breakup Sept 2021
No ratings yet
PG DBDA Evaluation Guidelines and Daywise Breakup Sept 2021
59 pages
Mamba Code
No ratings yet
Mamba Code
12 pages
Ghichu
No ratings yet
Ghichu
2,936 pages
DSA Project
No ratings yet
DSA Project
7 pages
Thesis Book 2
No ratings yet
Thesis Book 2
57 pages
Các Mô Hình
No ratings yet
Các Mô Hình
5 pages
Project Report ON Calculator by C++: Computer Science of Engineering of Ikg Punjab Technical University, Jalandhar
No ratings yet
Project Report ON Calculator by C++: Computer Science of Engineering of Ikg Punjab Technical University, Jalandhar
8 pages
PNR Training pdf12
No ratings yet
PNR Training pdf12
82 pages
MLP Mixer
No ratings yet
MLP Mixer
12 pages
Weather Prediction Big Data
No ratings yet
Weather Prediction Big Data
29 pages
Fuzz On The Beach: Fuzzing Solana Smart Contracts: Sven Smolka Jens-Rene Giesen Pascal Winkler
No ratings yet
Fuzz On The Beach: Fuzzing Solana Smart Contracts: Sven Smolka Jens-Rene Giesen Pascal Winkler
17 pages
MLP Mixer Report
No ratings yet
MLP Mixer Report
3 pages
CDT Phan2
No ratings yet
CDT Phan2
93 pages
Alexnet
No ratings yet
Alexnet
20 pages
DLP VIVA Questions and Answers
No ratings yet
DLP VIVA Questions and Answers
5 pages
55276-Article Text-159945-1-10-20210427
No ratings yet
55276-Article Text-159945-1-10-20210427
5 pages
4 Static Dynamic Scope
No ratings yet
4 Static Dynamic Scope
3 pages
Assignment 1 2
No ratings yet
Assignment 1 2
2 pages
Comp Programming Ii
No ratings yet
Comp Programming Ii
7 pages
OOPCGL
No ratings yet
OOPCGL
29 pages
I Pu Cs Chapter 4 Q&A-1
No ratings yet
I Pu Cs Chapter 4 Q&A-1
49 pages
ML Ch-2 Supervised Learning
No ratings yet
ML Ch-2 Supervised Learning
23 pages
JAVA Ass1
No ratings yet
JAVA Ass1
22 pages
Cailaiwwin
No ratings yet
Cailaiwwin
5 pages
Visual Programming 2
No ratings yet
Visual Programming 2
6 pages
Bản Công Bố Lab Thiết Kế Vi Mạch HKII 2022 2023 - Ver4 - Release
No ratings yet
Bản Công Bố Lab Thiết Kế Vi Mạch HKII 2022 2023 - Ver4 - Release
84 pages
Report
No ratings yet
Report
4 pages
Deep Learning Computer Vision NLP
No ratings yet
Deep Learning Computer Vision NLP
140 pages
Stock Price Prediction
No ratings yet
Stock Price Prediction
12 pages
MLP-Mixer An All-MLP Architecture For Vision
No ratings yet
MLP-Mixer An All-MLP Architecture For Vision
16 pages
CS3251 - Programming in C Important Questions R 2021
No ratings yet
CS3251 - Programming in C Important Questions R 2021
2 pages
ĐSTT
No ratings yet
ĐSTT
16 pages
Talking Avatar Application
No ratings yet
Talking Avatar Application
9 pages
Slide AI-ML-DL
No ratings yet
Slide AI-ML-DL
124 pages
JS Codes
No ratings yet
JS Codes
4 pages
Video and Image Processing Using DSP and Pfga
No ratings yet
Video and Image Processing Using DSP and Pfga
11 pages
Critical Path Method Examples
No ratings yet
Critical Path Method Examples
3 pages
H265Encoder ME Micro-Architecture Spec v0.01
No ratings yet
H265Encoder ME Micro-Architecture Spec v0.01
26 pages
Machine Learning Co Ban
No ratings yet
Machine Learning Co Ban
41 pages
End CS205 - 2018
No ratings yet
End CS205 - 2018
2 pages
In The Fig Given Below, The Number of Zeroes of The Polynomial F (X) Is
No ratings yet
In The Fig Given Below, The Number of Zeroes of The Polynomial F (X) Is
4 pages
CAIE-IGCSE-Computer Science - Practical
No ratings yet
CAIE-IGCSE-Computer Science - Practical
18 pages
Desain Kaos Baru
No ratings yet
Desain Kaos Baru
9 pages
Ai 4
No ratings yet
Ai 4
68 pages
Ite6102 Computer Programming 1 Updated
No ratings yet
Ite6102 Computer Programming 1 Updated
23 pages
Computer Vision Report1
No ratings yet
Computer Vision Report1
29 pages
Blabla
No ratings yet
Blabla
32 pages
Sequence: Bsit F17
No ratings yet
Sequence: Bsit F17
14 pages
Vyom Final Ass
No ratings yet
Vyom Final Ass
22 pages
CT-2 QP - Set A - Answer
No ratings yet
CT-2 QP - Set A - Answer
10 pages
Solutions To Selected Exercises: Section 1.1
No ratings yet
Solutions To Selected Exercises: Section 1.1
214 pages
Graphics Distant Phuluc
No ratings yet
Graphics Distant Phuluc
16 pages
Tim Hieu Ve Deep Learning
100% (1)
Tim Hieu Ve Deep Learning
78 pages
Java For Beginners Get From Zero To Object Oriented Programming
100% (1)
Java For Beginners Get From Zero To Object Oriented Programming
162 pages
NX 12-102 Working With Parts
No ratings yet
NX 12-102 Working With Parts
583 pages
18CS653 - NOTES Module 1
No ratings yet
18CS653 - NOTES Module 1
24 pages
Microsoft 365 Excel For Dummies
From Everand
Microsoft 365 Excel For Dummies
David H. Ringstrom
No ratings yet
Introduction to Deep Learning
From Everand
Introduction to Deep Learning
Eugene Charniak
No ratings yet
Getting started with programming: Professional Training
From Everand
Getting started with programming: Professional Training
Rémy Lentzer
No ratings yet
Building Transformer Models with PyTorch 2.0: NLP, computer vision, and speech processing with PyTorch and Hugging Face (English Edition)
From Everand
Building Transformer Models with PyTorch 2.0: NLP, computer vision, and speech processing with PyTorch and Hugging Face (English Edition)
Prem Timsina
No ratings yet
Lessons in Bioinformatics - Dot Plots: Lessons in Bioinformatics, #1
From Everand
Lessons in Bioinformatics - Dot Plots: Lessons in Bioinformatics, #1
Björn Olsson
No ratings yet
Quantum Computing for Programmers and Investors: with full implementation of algorithms in C
From Everand
Quantum Computing for Programmers and Investors: with full implementation of algorithms in C
Alberto Palazzi
5/5 (1)
MATLAB for Beginners: A Gentle Approach - Revised Edition
From Everand
MATLAB for Beginners: A Gentle Approach - Revised Edition
Peter I. Kattan
3.5/5 (11)
PlayStation 3 Architecture: Architecture of Consoles: A Practical Analysis, #19
From Everand
PlayStation 3 Architecture: Architecture of Consoles: A Practical Analysis, #19
Rodrigo Copetti
No ratings yet
Continuous Machine Learning with Kubeflow: Performing Reliable MLOps with Capabilities of TFX, Sagemaker and Kubernetes (English Edition)
From Everand
Continuous Machine Learning with Kubeflow: Performing Reliable MLOps with Capabilities of TFX, Sagemaker and Kubernetes (English Edition)
Aniruddha Choudhury
No ratings yet
GETTING STARTED WITH SQL: Exercises with PhpMyAdmin and MySQL
From Everand
GETTING STARTED WITH SQL: Exercises with PhpMyAdmin and MySQL
Remy Lentzner
No ratings yet
Advanced JavaScript Design Patterns
From Everand
Advanced JavaScript Design Patterns
Hernando Abella
No ratings yet
The Beginner’s Guide to Unreal Engine Building Complete Games: The Beginner’s Guide to Unreal Engine, #3
From Everand
The Beginner’s Guide to Unreal Engine Building Complete Games: The Beginner’s Guide to Unreal Engine, #3
Steven Mcananey
No ratings yet
Machine Learning for iOS Developers
From Everand
Machine Learning for iOS Developers
Abhishek Mishra
No ratings yet
Guide for Dummies: from MATLAB to C++ through the MATLAB Coder: English and Italian Book
From Everand
Guide for Dummies: from MATLAB to C++ through the MATLAB Coder: English and Italian Book
Filippo Piccinini
No ratings yet
Master Builder Power Up! Level 2: Minecraft® Redstone for Intermediate Players
From Everand
Master Builder Power Up! Level 2: Minecraft® Redstone for Intermediate Players
Triumph Books
3/5 (4)
Essential Algorithms: A Practical Approach to Computer Algorithms Using Python and C#
From Everand
Essential Algorithms: A Practical Approach to Computer Algorithms Using Python and C#
Rod Stephens
4.5/5 (2)
The Kubeflow Handbook: Streamlining Machine Learning on Kubernetes
From Everand
The Kubeflow Handbook: Streamlining Machine Learning on Kubernetes
Robert Johnson
No ratings yet
More on C# in Front Office
From Everand
More on C# in Front Office
Xing Zhou
No ratings yet
Natural Computing with Python: Learn to implement genetic and evolutionary algorithms to solve problems in a pythonic way
From Everand
Natural Computing with Python: Learn to implement genetic and evolutionary algorithms to solve problems in a pythonic way
Giancarlo Zaccone
No ratings yet
The Tech Interview Playbook: From DSA to System Design
From Everand
The Tech Interview Playbook: From DSA to System Design
Chinmoy Mukherjee
No ratings yet
Digital Engineering: Complex System Design
From Everand
Digital Engineering: Complex System Design
S Mathioudakis
No ratings yet
Petri Nets: Fundamental Models, Verification and Applications
From Everand
Petri Nets: Fundamental Models, Verification and Applications
Michel Diaz
No ratings yet
Keras to Kubernetes: The Journey of a Machine Learning Model to Production
From Everand
Keras to Kubernetes: The Journey of a Machine Learning Model to Production
Dattaraj Rao
No ratings yet
Practical Monte Carlo Simulation with Excel - Part 2 of 2: Applications and Distributions
From Everand
Practical Monte Carlo Simulation with Excel - Part 2 of 2: Applications and Distributions
Akram Najjar
2/5 (1)
Esp-r Easy
From Everand
Esp-r Easy
Roman Rabenseifer
No ratings yet
A Friendly Introduction to MATLAB Programming
From Everand
A Friendly Introduction to MATLAB Programming
Orhan Gazi
No ratings yet
Convolutional Neural Networks: Fundamentals and Applications for Analyzing Visual Imagery
From Everand
Convolutional Neural Networks: Fundamentals and Applications for Analyzing Visual Imagery
Fouad Sabry
No ratings yet
MATLAB for Beginners: A Gentle Approach - Revised Edition
From Everand
MATLAB for Beginners: A Gentle Approach - Revised Edition
Peter Kattan
No ratings yet
MATLAB for Beginners: A Gentle Approach
From Everand
MATLAB for Beginners: A Gentle Approach
Peter I. Kattan
No ratings yet
Design And Analysis Of Algorithm
From Everand
Design And Analysis Of Algorithm
Bhupendra Mandloi
No ratings yet
Mastering Kubernetes
From Everand
Mastering Kubernetes
Manish Soni
No ratings yet
Flood Fill: Flood Fill: Exploring Computer Vision's Dynamic Terrain
From Everand
Flood Fill: Flood Fill: Exploring Computer Vision's Dynamic Terrain
Fouad Sabry
No ratings yet
Machine Learning - Advanced Concepts
From Everand
Machine Learning - Advanced Concepts
Derrick Mwiti
No ratings yet
Mesh Generation: Advances and Applications in Computer Vision Mesh Generation
From Everand
Mesh Generation: Advances and Applications in Computer Vision Mesh Generation
Fouad Sabry
No ratings yet

MLP Mixer

Uploaded by

MLP Mixer

Uploaded by

new

Đã đăng vào thg 5 7, 2021 4:02

MLP-Mixer - Hướng giải quyết các bài

Có thể nói rằng Convolutional Neural Network hay CNN đã

Cấu trúc của MixerLayer

Channel-mixing MLP: cho phép giao tiếp giữa các

So sánh với các kiến trúc khác

Kết quả thực nghiệm

Tài liệu tham khảo

All rights reserved

Bài viết liên quan

Tìm hiểu về kiến trúc Transformer

Trinh Quang Huy

Nguyen Viet Hoai

Giải quyết vấn đề lập trình cho người mới?.

Phạm Anh Tuấn

Bài viết khác từ Trần Đức Trung

Một chút dbt

Trần Đức Trung

[Paper Explain] IAG: Induction-Augmented Generation

 Deep Learning for Computer Vision: Bài 4 - Bài toán

 Deep Learning for Computer Vision: Bài 3 - Convolution

 Đăng nhập để bình luận

Mỹ Linh Nguyễn Thị @linh_army

hayyy quá anh ạ

Bài viết Tổ chức

Câu hỏi Tags

Videos Tác giả

Thảo luận Đề xuất hệ thống

Công cụ Machine Learning

Trạng thái hệ thống

Viblo Viblo Code Viblo CTF Viblo CV

Viblo Viblo Viblo Battle Viblo

ỨNG DỤNG DI ĐỘNG

You might also like