0% found this document useful (0 votes)

10 views9 pages

Debugging

This document contains code for training a siamese neural network model for audio-visual matching. It loads audio and image embeddings, creates training/test/validation datasets, defines the siamese network architecture, trains the model using triplet loss, and evaluates the trained model on a validation set.

Uploaded by

heat mass

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views9 pages

Debugging

Uploaded by

heat mass

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 9

# %%

from classes import *

from functions import *
import pickle
import pandas as pd
import numpy as np
import os
from sklearn.model_selection import train_test_split
import random
from torch.utils.data import Dataset, DataLoader
import matplotlib.pyplot as plt

# %%
from unidecode import unidecode

# %%
audio_files = os.listdir('datasets/audio')

with open('datasets/audio_embeddings.pickle', 'rb') as file:

audio_embeddings = pickle.load(file)

audio_names = [key.split('/')[0] for key in audio_embeddings.keys()]

audio_df = pd.DataFrame([{'name': key.split('/')[0], 'audio_embedding': value} for

key, value in audio_embeddings.items()])

audio_df['name'] = audio_df['name'].apply(unidecode)

audio_df['audio_embedding'] = audio_df['audio_embedding'].apply(lambda x:
x/np.linalg.norm(x))

# %%
with open('datasets/image_embeddings.pickle', 'rb') as file:
image_embeddings = pickle.load(file)

image_df = pd.DataFrame([{'name': key.split('/')[0], 'image_embedding': value} for

key, value in image_embeddings.items()])

image_df['name'] = image_df['name'].apply(unidecode)

# %%
matches_df = pd.merge(image_df, audio_df, on='name', how='outer')

matches_df.columns = ['name', 'anchor', 'positive']

# %%
coincidences = 0
negatives = []
for i, row in matches_df.iterrows():
while True:
sample = matches_df.sample(n=1)
sample.reset_index(inplace=True, drop=True)
if sample['name'][0] != row['name']:
negatives.append(sample['positive'][0])
break
else:
coincidences += 1

matches_df['negative'] = negatives

# %%
train_set, test_set , _, _2 = train_test_split(matches_df, matches_df['name'],
test_size=0.2)
test_set, validation_set, _, _2 = train_test_split(test_set, test_set['name'],
test_size=0.5)

# %%

# %% [markdown]
# ### Siamese Network Model With Triplet Loss Training

# %%
siamese_model = SiameseNetwork([512, 192], [[256, 512, 256], [256, 512, 256]], 256)

# %%
training_triplet_dataset = TripletDataset(train_set)
testing_triplet_dataset = TripletDataset(test_set)
validation_triplet_dataset = TripletDataset(validation_set)

# %%
train_triplet_dataloader = DataLoader(training_triplet_dataset, batch_size=32,
shuffle=True)
test_triplet_dataloader = DataLoader(testing_triplet_dataset, batch_size=32,
shuffle=True)
validation_triplet_dataloader = DataLoader(validation_triplet_dataset,
batch_size=32, shuffle=True)

# %% [markdown]
# ##### Training with Early Stopping

# %%
optimizer = optim.SGD(siamese_model.parameters(), lr=0.1)
# optimizer = optim.Adam(siamese_model.parameters(), lr=0.001)
epochs = 150

# %%
training_losses = []
testing_losses = []
early_stopping_indicators = 0
for epoch in range(epochs):

total_loss = 0.0
total_testing_loss = 0.0
training_batches = 0
testing_batches = 0
for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:
training_batches += 1
optimizer.zero_grad()
loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
loss.backward()
optimizer.step()
total_loss += loss.item()

# validation_losses.append(validation_loss)

for anchor_batch, positive_batch, negative_batch in test_triplet_dataloader:

testing_batches += 1
testing_loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
total_testing_loss += testing_loss.item()

total_training_loss_per_batch = total_loss/training_batches
training_losses.append(total_training_loss_per_batch)
total_testing_loss_per_batch = total_testing_loss/testing_batches
testing_losses.append(total_testing_loss_per_batch)
print(f"epoch: {epoch + 1} Training Loss per batch:
{total_training_loss_per_batch}, Testing Loss per batch:
{total_testing_loss_per_batch}\n")
if (epoch > 20) and (np.mean(testing_losses[-20:-10] < np.mean(testing_losses[-
10:]))):
print('Early stopping')
break

# %% [markdown]
# ##### A little extra training

# %%
# for epoch in range(epochs):
# for epoch in range(50, 100):
# total_loss = 0.0
# total_testing_loss = 0.0
# training_batches = 0
# testing_batches = 0
# for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:
# training_batches += 1
# optimizer.zero_grad()
# loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
# loss.backward()
# optimizer.step()
# total_loss += loss.item()

# # validation_losses.append(validation_loss)

# for anchor_batch, positive_batch, negative_batch in test_triplet_dataloader:

# testing_batches += 1
# testing_loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
# total_testing_loss += testing_loss.item()

# total_training_loss_per_batch = total_loss/training_batches
# training_losses.append(total_training_loss_per_batch)
# total_testing_loss_per_batch = total_testing_loss/testing_batches
# testing_losses.append(total_testing_loss_per_batch)
# print(f"epoch: {epoch + 1} Training Loss per batch:
{total_training_loss_per_batch}, Testing Loss per batch:
{total_testing_loss_per_batch}\n")
# if (epoch > 20) and (np.mean(testing_losses[-20:-10] <
np.mean(testing_losses[-10:]))):
# print('Early stopping')
# break

# # %%

# %%

epoch_list = [i+1 for i in range(epoch + 1)]

# %%
plt.plot(epoch_list, training_losses, label='Training Loss')
plt.plot(epoch_list, testing_losses, label='Testing Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.show()

ia = identification_accuracy(siamese_model, validation_triplet_dataloader)
# %%
print()
# %% [markdown]
# ### 1:2 Identification Accuracy

# %%
# i = 0
# for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:

# ab = anchor_batch
# break

# %%
# ab

# %%
# siamese_model(anchor_batch, )

# # %%

# # %% [markdown]
# # ### Building A Classifier On Top Of The Siamese Network

# # %%
# class SimpleBinaryClassifier(nn.Module):
# def __init__(self):
# super(BinaryClassifier, self).__init__()
# self.fc = nn.Linear(1, 1) # Input size and output size are both 1 for a
single number input

# def forward(self, x):

# x = self.fc(x)
# return x

# # %%
# binary_classifier = SimpleBinaryClassifier(input_size=256, hidden_size=64)

# # %%
# optimizer = optim.Adam(binary_classifier.parameters(), lr=0.001)

# # %%
# criterion = nn.BCEWithLogitsLoss()

# # %%

# # %%
# # %%

# # %%

# # %%
# # %%

# # %%

# # %%
# # freezing the trained siamese model
# for param in siamese_model.parameters():
# param.requires_grad = False

# # %%
# binary_classifier = SiameseBinaryClassifier(siamese_model)

# # %%
# total_params = sum([param.numel() for param in binary_classifier.parameters()])

# # %%
# total_params

# # %%
# trainable_params = sum([param.numel() for param in binary_classifier.parameters()
if param.requires_grad])

# # %%
# trainable_params

# # %% [markdown]
# # ### Training The Classifier

# # %%
# optimizer = optim.Adam(binary_classifier.parameters(), lr=0.001)
# criterion = nn.BCEWithLogitsLoss()
# epochs = 50

# # %%

# for epoch in range(epochs):

# total_loss = 0.0
# total_correct = 0
# total_samples = 0

# for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:

# optimizer.zero_grad()

# # anchor_positive_pairs = torch.cat((anchor_batch, positive_batch),

dim=0)
# # anchor_negative_pairs = torch.cat((anchor_batch, negative_batch),
dim=0)
# # positive_outputs = siamese_model(anchor_batch, positive_batch)
# # negative_outputs = siamese_model(anchor_batch, negative_batch)
# # outputs = torch.cat((positive_outputs, negative_outputs), dim=0)
# # outputs = outputs.detach()
# # positive_labels = torch.ones(anchor_batch.size(0), 1)
# # negative_labels = torch.zeros(anchor_batch.size(0), 1)
# # labels = torch.cat((positive_labels, negative_labels), dim=0)
# anchor_positive_outputs = siamese_model(anchor_batch, positive_batch)

# # Forward pass for anchor and negative pairs

# anchor_negative_outputs = siamese_model(anchor_batch, negative_batch)

# # Combine outputs
# inputs = torch.cat((anchor_positive_outputs, anchor_negative_outputs),
dim=0)

# # Create labels
# positive_labels = torch.ones(anchor_batch.size(0), 1) # Labels for
positive pairs
# negative_labels = torch.zeros(anchor_batch.size(0), 1) # Labels for
negative pairs
# labels = torch.cat((positive_labels, negative_labels), dim=0)

# # Detach anchor-positive and anchor-negative outputs

# anchor_positive_outputs_detached = anchor_positive_outputs.detach()
# anchor_negative_outputs_detached = anchor_negative_outputs.detach()

# # Combine detached outputs

# outputs = torch.cat((anchor_positive_outputs_detached,
anchor_negative_outputs_detached), dim=0)

# # Compute loss
# loss = criterion(outputs.squeeze(), labels.squeeze())
# # loss = criterion(outputs.squeeze(), labels.squeeze())
# loss.backward()

# optimizer.step()

# total_loss += loss.item()

# predicted_labels = (outputs > 0.5).float()

# total_correct += (predicted_labels == labels).sum().item()
# total_samples += labels.size(0)

# print(f"Epoch [{epoch+1}/{epochs}], Loss: {total_loss /

len(train_triplet_dataloader)}, Accuracy: {total_correct / total_samples}")

# # %%

Deep Learning With PyTorch 1
No ratings yet
Deep Learning With PyTorch 1
1 page
LSTM From Scratch in Python
No ratings yet
LSTM From Scratch in Python
11 pages
Docker Django Development
100% (1)
Docker Django Development
22 pages
C2 W2ok
No ratings yet
C2 W2ok
109 pages
IBest DeepLearning
No ratings yet
IBest DeepLearning
123 pages
BLDD VIT ResNet50v2 CustomCNN
No ratings yet
BLDD VIT ResNet50v2 CustomCNN
38 pages
Lab Manual DL (New)
No ratings yet
Lab Manual DL (New)
89 pages
AWS Certified Solutions Architect Associate SAA-C03 Slides Tutorials Dojo
No ratings yet
AWS Certified Solutions Architect Associate SAA-C03 Slides Tutorials Dojo
1,031 pages
Effects of Batches - Jupyter Notebook
No ratings yet
Effects of Batches - Jupyter Notebook
73 pages
Mdobook
No ratings yet
Mdobook
642 pages
PyTorch Made Easy A Quick Overview
No ratings yet
PyTorch Made Easy A Quick Overview
55 pages
Nibedita Dehury J 123CE0079 J ASSIGNMENT 8
No ratings yet
Nibedita Dehury J 123CE0079 J ASSIGNMENT 8
20 pages
ECC Foreign Trade Vs - Sap GTS
100% (1)
ECC Foreign Trade Vs - Sap GTS
8 pages
STE - Computer Programming - Q4 MODULE 7
No ratings yet
STE - Computer Programming - Q4 MODULE 7
24 pages
Bananini Chimpanzini
No ratings yet
Bananini Chimpanzini
8 pages
MLP Pytorch Softmax Crossentr
No ratings yet
MLP Pytorch Softmax Crossentr
20 pages
Fritzing
100% (1)
Fritzing
20 pages
PINN 1DBurgers
No ratings yet
PINN 1DBurgers
19 pages
Project Progress Control
50% (2)
Project Progress Control
2 pages
Null 0
No ratings yet
Null 0
6 pages
Lab 9
No ratings yet
Lab 9
29 pages
PES1PG24CS018 Debjit DLTP Assignment-2 BERT Report
No ratings yet
PES1PG24CS018 Debjit DLTP Assignment-2 BERT Report
10 pages
Changes
No ratings yet
Changes
12 pages
Deep Learning
No ratings yet
Deep Learning
46 pages
Skill 7
No ratings yet
Skill 7
11 pages
MLP Pytorch Sigmoid Mse
No ratings yet
MLP Pytorch Sigmoid Mse
20 pages
Experiment No 13 Final
No ratings yet
Experiment No 13 Final
9 pages
Autoencoder From Scratch
No ratings yet
Autoencoder From Scratch
21 pages
新建文本文档
No ratings yet
新建文本文档
6 pages
Kolmogorov-Arnold-Networks in Python
No ratings yet
Kolmogorov-Arnold-Networks in Python
8 pages
Notebook - Deep Neural Networks
No ratings yet
Notebook - Deep Neural Networks
28 pages
Deep Learning Assignments
No ratings yet
Deep Learning Assignments
5 pages
Fibercablelength Understanding
No ratings yet
Fibercablelength Understanding
5 pages
HW4ML Project Code
No ratings yet
HW4ML Project Code
24 pages
Deep Learning Assignments
No ratings yet
Deep Learning Assignments
6 pages
Adaline SGD
No ratings yet
Adaline SGD
4 pages
Deep Learning
No ratings yet
Deep Learning
30 pages
Train
No ratings yet
Train
13 pages
Credit Card Clustering Autoencoder
No ratings yet
Credit Card Clustering Autoencoder
6 pages
Logistic Regression
No ratings yet
Logistic Regression
4 pages
Mlp-Fromscratch Sigmoid-Mse
No ratings yet
Mlp-Fromscratch Sigmoid-Mse
13 pages
Big Data Assignment - 7
No ratings yet
Big Data Assignment - 7
7 pages
DL 5 Excuted
No ratings yet
DL 5 Excuted
13 pages
SC Lab File Fayiz PDF
No ratings yet
SC Lab File Fayiz PDF
29 pages
Assignment 1: Q1. Task Description
No ratings yet
Assignment 1: Q1. Task Description
12 pages
Lab Report 03
No ratings yet
Lab Report 03
14 pages
Training Code
No ratings yet
Training Code
27 pages
CV Lab Final AwaisKhan EE A
No ratings yet
CV Lab Final AwaisKhan EE A
7 pages
CIFAR - 10 - Dataset - Using - CNN - Aniiiii - HTML
No ratings yet
CIFAR - 10 - Dataset - Using - CNN - Aniiiii - HTML
8 pages
Softmax Regression Mnist
No ratings yet
Softmax Regression Mnist
3 pages
EncoderDecoderSeq2Seq DeepLSTM
No ratings yet
EncoderDecoderSeq2Seq DeepLSTM
7 pages
C1 W1 Lab 3 Siamese-Network
No ratings yet
C1 W1 Lab 3 Siamese-Network
13 pages
Model
No ratings yet
Model
3 pages
Siamese Network Assignment
No ratings yet
Siamese Network Assignment
3 pages
AI Medical Diagnosis Week 02
No ratings yet
AI Medical Diagnosis Week 02
3 pages
Creativity and Innovation BM006-3-2-CRI Individual Assignment
No ratings yet
Creativity and Innovation BM006-3-2-CRI Individual Assignment
24 pages
Recurrent Neural Networks: Pytorch
No ratings yet
Recurrent Neural Networks: Pytorch
6 pages
Deeplg 3
No ratings yet
Deeplg 3
8 pages
Train Py
No ratings yet
Train Py
4 pages
Autoencoder - MPL - Basic - Ipynb - Colaboratory PDF
No ratings yet
Autoencoder - MPL - Basic - Ipynb - Colaboratory PDF
21 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
10 pages
VHDL Coding Syntax PDF
No ratings yet
VHDL Coding Syntax PDF
36 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Bert
No ratings yet
Bert
2 pages
Linear Regr GD
No ratings yet
Linear Regr GD
3 pages
Experiment 2.4 DL
No ratings yet
Experiment 2.4 DL
4 pages
CLF-C02 Exam Guide Slides
No ratings yet
CLF-C02 Exam Guide Slides
30 pages
Keras
No ratings yet
Keras
4 pages
CCBoot Manual - Update Image and Game
No ratings yet
CCBoot Manual - Update Image and Game
65 pages
A Survey of Generative AI Applications
No ratings yet
A Survey of Generative AI Applications
36 pages
QML Animations
No ratings yet
QML Animations
30 pages
Erp-Commandbatch Interface Setup Guide
No ratings yet
Erp-Commandbatch Interface Setup Guide
13 pages
7 Optimum Design With MATLAB PDF
No ratings yet
7 Optimum Design With MATLAB PDF
13 pages
QUINN Edition 6 Chapter 5
No ratings yet
QUINN Edition 6 Chapter 5
53 pages
Bab - La Phrases Resume CV English Arabic
No ratings yet
Bab - La Phrases Resume CV English Arabic
4 pages
FOSS Application Fields and Installation of FOSS
No ratings yet
FOSS Application Fields and Installation of FOSS
23 pages
Emasters in Data Science Data Analytics
No ratings yet
Emasters in Data Science Data Analytics
12 pages
Robo 7
No ratings yet
Robo 7
5 pages
Lucena Civil Engineers 052017 Room Assignment PDF
No ratings yet
Lucena Civil Engineers 052017 Room Assignment PDF
8 pages
iDTech Brochure2019 PDF
No ratings yet
iDTech Brochure2019 PDF
32 pages
Ajju-Smart Money Concept
No ratings yet
Ajju-Smart Money Concept
32 pages
By127, By133
No ratings yet
By127, By133
1 page
BrixNGN Solution Overview
No ratings yet
BrixNGN Solution Overview
31 pages
Algorithm For Page Replacement
No ratings yet
Algorithm For Page Replacement
9 pages
Seclore Overview Dec2014 PDF
No ratings yet
Seclore Overview Dec2014 PDF
30 pages
GameRanger Launch Log
No ratings yet
GameRanger Launch Log
2 pages
Python Flashcards V2
No ratings yet
Python Flashcards V2
13 pages
Training Guide SAP Business One
No ratings yet
Training Guide SAP Business One
14 pages