0% found this document useful (0 votes)

6 views3 pages

lab(localization and detection )

Deep learning

Uploaded by

enssifan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views3 pages

lab(localization and detection )

Deep learning

Uploaded by

enssifan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

11/27/24, 8:13 AM Untitled5.

ipynb - Colab

Lab 1: Object Localization with Bounding Box Prediction

1. Import Required Libraries

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import numpy as np

2. Prepare the Dataset with Bounding Boxes

class MNISTWithBoundingBoxes:
def __init__(self, train=True):
self.dataset = datasets.MNIST(
root='./data',
train=train,
download=True,
transform=transforms.ToTensor()
)

def getitem(self, idx):

img, label = self.dataset[idx]
img_np = img.squeeze(0).numpy() # Convert to numpy for bounding box calculation

# Find the non-zero region (digit) in the image

rows, cols = np.where(img_np > 0)
y_min, x_min = rows.min(), cols.min()
y_max, x_max = rows.max(), cols.max()

# Normalize bounding box coordinates to [0, 1]

bbox = torch.tensor([x_min / 28, y_min / 28, x_max / 28, y_max / 28], dtype=torch.float32)

return img, label, bbox

def __len__(self):
return len(self.dataset)

# Create DataLoader for batch processing

train_dataset = MNISTWithBoundingBoxes(train=True)
test_dataset = MNISTWithBoundingBoxes(train=False)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)

What’s happening?

We load the MNIST dataset and compute bounding boxes based on non-zero pixels.

Bounding boxes are normalized to [ 0 , 1 ] [0,1] relative to the image size. bold text

3. Define the Localization Model

class LocalizationModel(nn.Module):
def __init__(self):
super(LocalizationModel, self).__init__()
self.backbone = nn.Sequential(
nn.Conv2d(1, 16, kernel_size=3, stride=1, padding=1),
nn.ReLU(),
nn.MaxPool2d(2, 2),
nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1),
nn.ReLU(),
nn.MaxPool2d(2, 2)
)
self.fc = nn.Sequential(
nn.Flatten(),
nn.Linear(32 * 7 * 7, 128),
nn.ReLU(),
nn.Linear(128, 4) # 4 outputs: [x_min, y_min, x_max, y_max]
)

def forward(self, x):

features = self.backbone(x)

https://colab.research.google.com/drive/1bctWzlVrcVlhhHqOU9PH8yYSJBuzMpU7#scrollTo=u9fZNMbFkYhT&printMode=true 1/3
11/27/24, 8:13 AM Untitled5.ipynb - Colab
bbox = self.fc(features)
return bbox

# Initialize model
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = LocalizationModel().to(device)

4. Define Loss Function and Optimizer

criterion = nn.MSELoss() # Mean Squared Error for bounding box regression

optimizer = optim.Adam(model.parameters(), lr=0.001)

Loss Function: Compares predicted bounding box coordinates to ground truth.

Optimizer: Adam optimizer updates model weights.

5. Train the Model

epochs = 5
for epoch in range(epochs):
model.train()
total_loss = 0
for imgs, _, bboxes in train_loader:
imgs, bboxes = imgs.to(device), bboxes.to(device)

optimizer.zero_grad()
pred_bboxes = model(imgs)
loss = criterion(pred_bboxes, bboxes)
loss.backward()
optimizer.step()

total_loss += loss.item()

print(f"Epoch [{epoch+1}/{epochs}], Loss: {total_loss / len(train_loader):.4f}")

Explanation:

For each batch:

Forward pass to predict bounding boxes.

Compute loss between predictions and ground truth.

Backpropagate gradients to update model weights.

6. Test the Model

model.eval()
with torch.no_grad():
for imgs, _, bboxes in test_loader:
imgs, bboxes = imgs.to(device), bboxes.to(device)
pred_bboxes = model(imgs)
print("Predicted BBox:", pred_bboxes[0].cpu().numpy())
print("Ground Truth BBox:", bboxes[0].cpu().numpy())
break

Explanation:

Use the trained model to predict bounding boxes for unseen test data.

Compare predictions with ground truth bounding boxes.

Double-click (or enter) to edit

https://colab.research.google.com/drive/1bctWzlVrcVlhhHqOU9PH8yYSJBuzMpU7#scrollTo=u9fZNMbFkYhT&printMode=true 2/3
11/27/24, 8:13 AM Untitled5.ipynb - Colab

https://colab.research.google.com/drive/1bctWzlVrcVlhhHqOU9PH8yYSJBuzMpU7#scrollTo=u9fZNMbFkYhT&printMode=true 3/3

Build an AI_ML Tennis Analysis system with YOLO, PyTorch, and Key Point Extraction (English (auto-generated))
No ratings yet
Build an AI_ML Tennis Analysis system with YOLO, PyTorch, and Key Point Extraction (English (auto-generated))
165 pages
Activated Carbon Filter-1 PDF
100% (2)
Activated Carbon Filter-1 PDF
204 pages
01_mnist.ipynb (4) - JupyterLab
No ratings yet
01_mnist.ipynb (4) - JupyterLab
23 pages
Lab(Bounding box)
No ratings yet
Lab(Bounding box)
3 pages
Chen Occlusion-Robust Object Pose Estimation With Holistic Representation WACV 2022 Paper
No ratings yet
Chen Occlusion-Robust Object Pose Estimation With Holistic Representation WACV 2022 Paper
11 pages
Unlike Classification Networks Such As ResNets or VGG Net
No ratings yet
Unlike Classification Networks Such As ResNets or VGG Net
3 pages
GST Questionnaire For Grade 8
No ratings yet
GST Questionnaire For Grade 8
12 pages
Human Face Detection Using CNN 1682855909
No ratings yet
Human Face Detection Using CNN 1682855909
131 pages
Bounding Box Regression With Uncertainty For Accurate Object Detection
No ratings yet
Bounding Box Regression With Uncertainty For Accurate Object Detection
10 pages
Task1_Lakshya.ipynb_-_Colab[1]
No ratings yet
Task1_Lakshya.ipynb_-_Colab[1]
33 pages
Info4604 Final Kylegragnola 1
No ratings yet
Info4604 Final Kylegragnola 1
20 pages
CITIZENS REGISTRATION MANAGEMENT SYSTEM-Chapter Three
100% (4)
CITIZENS REGISTRATION MANAGEMENT SYSTEM-Chapter Three
13 pages
Object Detection
No ratings yet
Object Detection
76 pages
bounding-box
No ratings yet
bounding-box
8 pages
Templates Face Auth
No ratings yet
Templates Face Auth
84 pages
Convolutional Autoencoder in Pytorch On MNIST Dataset - by Eugenia Anello - DataSeries - Medium
No ratings yet
Convolutional Autoencoder in Pytorch On MNIST Dataset - by Eugenia Anello - DataSeries - Medium
18 pages
Week_7_-mnist-mlp
No ratings yet
Week_7_-mnist-mlp
7 pages
Fast Unsupervised Object Localization: Dwaraknath, Anjan Menghani, Deepak Mongia, Mihir
No ratings yet
Fast Unsupervised Object Localization: Dwaraknath, Anjan Menghani, Deepak Mongia, Mihir
8 pages
Faster R-CNN
No ratings yet
Faster R-CNN
20 pages
Task 9 Implementation of Object Detection and Localization
No ratings yet
Task 9 Implementation of Object Detection and Localization
7 pages
Student Circular April 24
No ratings yet
Student Circular April 24
10 pages
Video_20_-_Image_Embeddings
No ratings yet
Video_20_-_Image_Embeddings
18 pages
Week 05
No ratings yet
Week 05
38 pages
Gao, Packer, Koller - Unknown - A Segmentation-aware Object Detection Model with Occlusion Handling-annotated
No ratings yet
Gao, Packer, Koller - Unknown - A Segmentation-aware Object Detection Model with Occlusion Handling-annotated
8 pages
Chapter02 Mathematical-Building-Blocks
No ratings yet
Chapter02 Mathematical-Building-Blocks
9 pages
Auxiliary_Bounding_Box_Regression_for_Object_Detec
No ratings yet
Auxiliary_Bounding_Box_Regression_for_Object_Detec
11 pages
Sample Code-structure for Anomaly Detection
No ratings yet
Sample Code-structure for Anomaly Detection
8 pages
CV Lab Final AwaisKhan EE A
No ratings yet
CV Lab Final AwaisKhan EE A
7 pages
CV
No ratings yet
CV
5 pages
Chap 3.1 Embedding in Tensorflow
No ratings yet
Chap 3.1 Embedding in Tensorflow
23 pages
Important Pytorch Stuff
No ratings yet
Important Pytorch Stuff
20 pages
Understanding and Implementing Faster R-CNN _ by Rishabh Singh _ Medium
No ratings yet
Understanding and Implementing Faster R-CNN _ by Rishabh Singh _ Medium
14 pages
Hyper Parameteres: Dataset
No ratings yet
Hyper Parameteres: Dataset
13 pages
PyTorch_CrashCourse
No ratings yet
PyTorch_CrashCourse
17 pages
Ejemplo 1 Chapas
No ratings yet
Ejemplo 1 Chapas
3 pages
02_asl.ipynb (4) - JupyterLab
No ratings yet
02_asl.ipynb (4) - JupyterLab
15 pages
ex no 7
No ratings yet
ex no 7
5 pages
Presentation
No ratings yet
Presentation
31 pages
CSE4261 Lecture-12
No ratings yet
CSE4261 Lecture-12
24 pages
CAPSTONE_PROJECT
No ratings yet
CAPSTONE_PROJECT
47 pages
Scalable Object Detection
No ratings yet
Scalable Object Detection
8 pages
PR Project Ankit
No ratings yet
PR Project Ankit
9 pages
CEP-DIP
No ratings yet
CEP-DIP
9 pages
Talking Avatar Application
No ratings yet
Talking Avatar Application
9 pages
Applied Machine and Deep Learning
No ratings yet
Applied Machine and Deep Learning
34 pages
Business Data Communications & Networking: Application Layer
No ratings yet
Business Data Communications & Networking: Application Layer
35 pages
CV Task
No ratings yet
CV Task
6 pages
(Deep Learning Using PyTorch) (Cheatsheet)
No ratings yet
(Deep Learning Using PyTorch) (Cheatsheet)
7 pages
vertopal.com_PyTorch_CrashCourse
No ratings yet
vertopal.com_PyTorch_CrashCourse
16 pages
Untitled document
No ratings yet
Untitled document
4 pages
Examples Part 6
No ratings yet
Examples Part 6
2 pages
DISS Pre-Final Examination
81% (16)
DISS Pre-Final Examination
2 pages
Python Deep Learning Lab Programs (2)
No ratings yet
Python Deep Learning Lab Programs (2)
35 pages
Intro To Pytorch
No ratings yet
Intro To Pytorch
12 pages
Farmasi Sosial: Niken N. Widyakusuma
No ratings yet
Farmasi Sosial: Niken N. Widyakusuma
14 pages
Document 2
No ratings yet
Document 2
8 pages
Dinushasan Courseproject04: Sign in
No ratings yet
Dinushasan Courseproject04: Sign in
19 pages
Assignment3 AL
No ratings yet
Assignment3 AL
23 pages
Softmax Regression Mnist
No ratings yet
Softmax Regression Mnist
3 pages
Code
No ratings yet
Code
4 pages
CIFAR_10_ Dataset_Using_CNN_Aniiiii_HTML
No ratings yet
CIFAR_10_ Dataset_Using_CNN_Aniiiii_HTML
8 pages
ECE_685D_HW3_2024
No ratings yet
ECE_685D_HW3_2024
3 pages
The Road Not Taken - Analysis
100% (1)
The Road Not Taken - Analysis
4 pages
Module 3 DLC Arq
No ratings yet
Module 3 DLC Arq
81 pages
How To Take Care of An Egg Baby Project
0% (1)
How To Take Care of An Egg Baby Project
3 pages
DETECTCAMERA
No ratings yet
DETECTCAMERA
3 pages
PyTorch Crash Course 1713016363
No ratings yet
PyTorch Crash Course 1713016363
15 pages
Philips Slim Full HD Led TV 55pfs6609 55pfs6609 12 User Manual PDF
No ratings yet
Philips Slim Full HD Led TV 55pfs6609 55pfs6609 12 User Manual PDF
106 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Hooi 2006 PDF
No ratings yet
Hooi 2006 PDF
22 pages
05 1200-1 - Structural Steel - Erection Drawings - Bog
No ratings yet
05 1200-1 - Structural Steel - Erection Drawings - Bog
6 pages
English (Mod 5-6)
No ratings yet
English (Mod 5-6)
10 pages
Skyscrapers and Economic Strategy and Development: The Case of Bahrain S Proposed Murjan Tower
No ratings yet
Skyscrapers and Economic Strategy and Development: The Case of Bahrain S Proposed Murjan Tower
5 pages
Module 6 Activities
No ratings yet
Module 6 Activities
4 pages
Mid-Term Exam Attendance - CS224
No ratings yet
Mid-Term Exam Attendance - CS224
7 pages
Legends and Lies
No ratings yet
Legends and Lies
18 pages
NLP Practitioner Workbook Business NLP Training - Uk
100% (3)
NLP Practitioner Workbook Business NLP Training - Uk
68 pages
Asset Management Presentation
No ratings yet
Asset Management Presentation
20 pages
Pricelist Reilee Group of Services Rizal Bookhouse 1
No ratings yet
Pricelist Reilee Group of Services Rizal Bookhouse 1
8 pages
CV - Ajay Kumar Srivastava Librarian BHU PDF
No ratings yet
CV - Ajay Kumar Srivastava Librarian BHU PDF
8 pages
English Xi
No ratings yet
English Xi
2 pages
Digital Sat Takers
No ratings yet
Digital Sat Takers
2 pages
Example of Classroom Parent-Teacher Association Minutes
No ratings yet
Example of Classroom Parent-Teacher Association Minutes
3 pages
Australia Awards Sri-Lanka
No ratings yet
Australia Awards Sri-Lanka
4 pages
Fourtubingduplexerusingband-Pass and Reject
No ratings yet
Fourtubingduplexerusingband-Pass and Reject
4 pages
Fourth Floor Plan
No ratings yet
Fourth Floor Plan
1 page
Name Saskia Meaning, Origin Etc. - Girl Names - B
No ratings yet
Name Saskia Meaning, Origin Etc. - Girl Names - B
1 page
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet