0% found this document useful (0 votes)

8 views3 pages

Siamese Network Assignment

This document discusses training a siamese neural network model for audio-visual matching using triplet loss. It loads audio and image embeddings, creates training/test/validation datasets, trains the model over 500 epochs with early stopping, and calculates the identification accuracy on the validation set.

Uploaded by

heat mass

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views3 pages

Siamese Network Assignment

Uploaded by

heat mass

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

# %%

! pip install scikit-learn

# %%
! pip install unidecode matplotlib

# %%
from classes import *
from functions import *
import pickle
import pandas as pd
import numpy as np
import os
from sklearn.model_selection import train_test_split
import random
from torch.utils.data import Dataset, DataLoader
import matplotlib.pyplot as plt

# %%
from unidecode import unidecode

# %%
audio_files = os.listdir('datasets/audio')

with open('datasets/audio_embeddings.pickle', 'rb') as file:

audio_embeddings = pickle.load(file)

audio_names = [key.split('/')[0] for key in audio_embeddings.keys()]

audio_df = pd.DataFrame([{'name': key.split('/')[0], 'audio_embedding': value} for

key, value in audio_embeddings.items()])

audio_df['name'] = audio_df['name'].apply(unidecode)

audio_df['audio_embedding'] = audio_df['audio_embedding'].apply(lambda x:
x/np.linalg.norm(x))

# %%
with open('datasets/image_embeddings.pickle', 'rb') as file:
image_embeddings = pickle.load(file)

image_df = pd.DataFrame([{'name': key.split('/')[0], 'image_embedding': value} for

key, value in image_embeddings.items()])

image_df['name'] = image_df['name'].apply(unidecode)

# %%
matches_df = pd.merge(image_df, audio_df, on='name', how='outer')

matches_df.columns = ['name', 'anchor', 'positive']

# %%
coincidences = 0
negatives = []
for i, row in matches_df.iterrows():
while True:
sample = matches_df.sample(n=1)
sample.reset_index(inplace=True, drop=True)
if sample['name'][0] != row['name']:
negatives.append(sample['positive'][0])
break
else:
coincidences += 1

matches_df['negative'] = negatives

# %%
train_set, test_set , _, _2 = train_test_split(matches_df, matches_df['name'],
test_size=0.2)
test_set, validation_set, _, _2 = train_test_split(test_set, test_set['name'],
test_size=0.5)

# %%

# %% [markdown]
# ### Siamese Network Model With Triplet Loss Training

# %%
siamese_model = SiameseNetwork([512, 192], [[256, 512, 256], [256, 512, 256]], 256)

# %%
training_triplet_dataset = TripletDataset(train_set)
testing_triplet_dataset = TripletDataset(test_set)
validation_triplet_dataset = TripletDataset(validation_set)

# %%
train_triplet_dataloader = DataLoader(training_triplet_dataset, batch_size=32,
shuffle=True)
test_triplet_dataloader = DataLoader(testing_triplet_dataset, batch_size=32,
shuffle=True)
validation_triplet_dataloader = DataLoader(validation_triplet_dataset,
batch_size=32, shuffle=True)

# %% [markdown]
# ##### Training with Early Stopping

# %%
# optimizer = optim.SGD(siamese_model.parameters(), lr=0.1)
optimizer = optim.Adam(siamese_model.parameters(), lr=0.0005)
epochs = 500

# %%
training_losses = []
testing_losses = []
early_stopping_indicators = 0
for epoch in range(epochs):

total_loss = 0.0
total_testing_loss = 0.0
training_batches = 0
testing_batches = 0
for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:
training_batches += 1
optimizer.zero_grad()
loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
loss.backward()
optimizer.step()
total_loss += loss.item()

# validation_losses.append(validation_loss)

for anchor_batch, positive_batch, negative_batch in test_triplet_dataloader:

testing_batches += 1
testing_loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
total_testing_loss += testing_loss.item()

total_training_loss_per_batch = total_loss/training_batches
training_losses.append(total_training_loss_per_batch)
total_testing_loss_per_batch = total_testing_loss/testing_batches
testing_losses.append(total_testing_loss_per_batch)
print(f"epoch: {epoch + 1} Training Loss per batch:
{total_training_loss_per_batch}, Testing Loss per batch:
{total_testing_loss_per_batch}\n")
if (epoch > 8) and (np.mean(testing_losses[-6:-3] < np.mean(testing_losses[-
3:]))):
print('Early stopping')
break

# %%
epoch_list = [i+1 for i in range(epoch + 1)]

# %%
plt.plot(epoch_list, training_losses, label='Training Loss')
plt.plot(epoch_list, testing_losses, label='Testing Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.show()

# %%
from classes import *

# %% [markdown]
# ### 1:2 Identification Accuracy

# %%
ia = identification_accuracy(siamese_model, validation_triplet_dataloader)

# %%
print(f"1:2 Identification Accuracy for validation set is {ia*100}%")

C2 W2ok
No ratings yet
C2 W2ok
109 pages
BLDD VIT ResNet50v2 CustomCNN
No ratings yet
BLDD VIT ResNet50v2 CustomCNN
38 pages
KR23 DL Lab Record
No ratings yet
KR23 DL Lab Record
59 pages
Lab Manual DL (New)
No ratings yet
Lab Manual DL (New)
89 pages
Deep Learning: Experiment-1
No ratings yet
Deep Learning: Experiment-1
32 pages
LSTM From Scratch in Python
No ratings yet
LSTM From Scratch in Python
11 pages
AM19 ADL U-Net-Model
No ratings yet
AM19 ADL U-Net-Model
37 pages
Assignment 3
No ratings yet
Assignment 3
25 pages
DL Lab - Merged
No ratings yet
DL Lab - Merged
60 pages
Nibedita Dehury J 123CE0079 J ASSIGNMENT 8
No ratings yet
Nibedita Dehury J 123CE0079 J ASSIGNMENT 8
20 pages
Autoencoder From Scratch
No ratings yet
Autoencoder From Scratch
21 pages
Null 0
No ratings yet
Null 0
6 pages
Debugging
No ratings yet
Debugging
9 pages
MLP Pytorch Sigmoid Mse
No ratings yet
MLP Pytorch Sigmoid Mse
20 pages
Autoencoder - MPL - Basic - Ipynb - Colaboratory PDF
No ratings yet
Autoencoder - MPL - Basic - Ipynb - Colaboratory PDF
21 pages
Ann Experiential Learning
No ratings yet
Ann Experiential Learning
43 pages
Skill 7
No ratings yet
Skill 7
11 pages
Big Data Assignment - 7
No ratings yet
Big Data Assignment - 7
7 pages
Import As From Import From Import From Import From Import: # Load The IMDB Dataset
No ratings yet
Import As From Import From Import From Import From Import: # Load The IMDB Dataset
6 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
Changes
No ratings yet
Changes
12 pages
Deep Learning Program
No ratings yet
Deep Learning Program
5 pages
Cdi 8 Midterms
No ratings yet
Cdi 8 Midterms
82 pages
新建文本文档
No ratings yet
新建文本文档
6 pages
SC Lab File Fayiz PDF
No ratings yet
SC Lab File Fayiz PDF
29 pages
Assignment 1: Q1. Task Description
No ratings yet
Assignment 1: Q1. Task Description
12 pages
PES1PG24CS018 Debjit DLTP Assignment-2 BERT Report
No ratings yet
PES1PG24CS018 Debjit DLTP Assignment-2 BERT Report
10 pages
Deep Learning Assignments
No ratings yet
Deep Learning Assignments
5 pages
DL Exps
No ratings yet
DL Exps
9 pages
DL 5 Excuted
No ratings yet
DL 5 Excuted
13 pages
LLM Fine Tune
No ratings yet
LLM Fine Tune
11 pages
Deep Learning
No ratings yet
Deep Learning
30 pages
Nibedita Dehury, 123CE0079, Assignment 7
No ratings yet
Nibedita Dehury, 123CE0079, Assignment 7
15 pages
Train Py
No ratings yet
Train Py
4 pages
Notebook - Agave Plant Maturation Model Inference and Testing
No ratings yet
Notebook - Agave Plant Maturation Model Inference and Testing
7 pages
Twins Code
No ratings yet
Twins Code
4 pages
Mlp-Fromscratch Sigmoid-Mse
No ratings yet
Mlp-Fromscratch Sigmoid-Mse
13 pages
DeepLearningLab2.Ipynb - Colab
No ratings yet
DeepLearningLab2.Ipynb - Colab
7 pages
EncoderDecoderSeq2Seq DeepLSTM
No ratings yet
EncoderDecoderSeq2Seq DeepLSTM
7 pages
Kolmogorov-Arnold-Networks in Python
No ratings yet
Kolmogorov-Arnold-Networks in Python
8 pages
Lab 5
No ratings yet
Lab 5
7 pages
RNN - Urban - Jupyter Notebook
No ratings yet
RNN - Urban - Jupyter Notebook
3 pages
Neural Network
No ratings yet
Neural Network
10 pages
AI Medical Diagnosis Week 02
No ratings yet
AI Medical Diagnosis Week 02
3 pages
CV Lab Final AwaisKhan EE A
No ratings yet
CV Lab Final AwaisKhan EE A
7 pages
Credit Card Clustering Autoencoder
No ratings yet
Credit Card Clustering Autoencoder
6 pages
Ex 7
No ratings yet
Ex 7
2 pages
24CS4505 ML Assignment
No ratings yet
24CS4505 ML Assignment
3 pages
CIFAR - 10 - Dataset - Using - CNN - Aniiiii - HTML
No ratings yet
CIFAR - 10 - Dataset - Using - CNN - Aniiiii - HTML
8 pages
Vit32 GPTMD
No ratings yet
Vit32 GPTMD
6 pages
Deeplg 3
No ratings yet
Deeplg 3
8 pages
Program 5
No ratings yet
Program 5
3 pages
DL 6
No ratings yet
DL 6
5 pages
Practical 2: Amtics Enrollment No: 202203103510493
No ratings yet
Practical 2: Amtics Enrollment No: 202203103510493
6 pages
Bert
No ratings yet
Bert
2 pages
MobileNetV2 Code
No ratings yet
MobileNetV2 Code
3 pages
Train Edu Bert
No ratings yet
Train Edu Bert
3 pages
HW4ML Project Code
No ratings yet
HW4ML Project Code
24 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
10 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Clearing and Posting Specific To Ledger Groups
No ratings yet
Clearing and Posting Specific To Ledger Groups
5 pages
Qbit+command+List - V2.0 (Español, Autotradución)
No ratings yet
Qbit+command+List - V2.0 (Español, Autotradución)
10 pages
2.0. Mathematical Language and Symbols Including Sets and Functions
No ratings yet
2.0. Mathematical Language and Symbols Including Sets and Functions
69 pages
The Praying Parent Challenge
No ratings yet
The Praying Parent Challenge
59 pages
Presentation 1
No ratings yet
Presentation 1
9 pages
TMJC H2 Mathematics Prelims Paper 2 (Q)
No ratings yet
TMJC H2 Mathematics Prelims Paper 2 (Q)
25 pages
Surah Ar-Rum Ayat 21 (30 - 21 Quran) With Tafsir - My Islam
No ratings yet
Surah Ar-Rum Ayat 21 (30 - 21 Quran) With Tafsir - My Islam
9 pages
Comptency Map 21ST Literature of The Philippines and The World
No ratings yet
Comptency Map 21ST Literature of The Philippines and The World
6 pages
54 TH Nfa Brochure
No ratings yet
54 TH Nfa Brochure
200 pages
Theocritus' Idyll 13 Love and The Hero
No ratings yet
Theocritus' Idyll 13 Love and The Hero
19 pages
C Program To Implement A Stack: Problem Description
No ratings yet
C Program To Implement A Stack: Problem Description
9 pages
CEE A1 ECCT ListeningTest
No ratings yet
CEE A1 ECCT ListeningTest
6 pages
Ldica Unit IV
No ratings yet
Ldica Unit IV
72 pages
EditDistance
No ratings yet
EditDistance
28 pages
Roman Numerals
No ratings yet
Roman Numerals
12 pages
Patrick Mullaney: All Credit To Jesus Christ!!!
0% (1)
Patrick Mullaney: All Credit To Jesus Christ!!!
3 pages
Individual Workplan
No ratings yet
Individual Workplan
1 page
What Is Coaching?: in This Chapter We Will Look at
No ratings yet
What Is Coaching?: in This Chapter We Will Look at
7 pages
PR2 Printer Driver W2k-WXp
No ratings yet
PR2 Printer Driver W2k-WXp
9 pages
C Programming Language - Repetition
No ratings yet
C Programming Language - Repetition
65 pages
Online Food Ordering System in ASP Net S
No ratings yet
Online Food Ordering System in ASP Net S
5 pages
Ode To West Wind
No ratings yet
Ode To West Wind
4 pages
Diorama On Angle of Elevation
No ratings yet
Diorama On Angle of Elevation
1 page
Catechist Quiz
No ratings yet
Catechist Quiz
1 page
Introduction Course
No ratings yet
Introduction Course
6 pages
Ten Promised Paradise Suhaba
No ratings yet
Ten Promised Paradise Suhaba
2 pages
TestOut LabSim
No ratings yet
TestOut LabSim
2 pages
Language Teaching Beliefs Questionnaire
No ratings yet
Language Teaching Beliefs Questionnaire
2 pages
Julio Cesar Rendon & Luis Ángel de La Cruz
No ratings yet
Julio Cesar Rendon & Luis Ángel de La Cruz
2 pages
Amazing Java: Learn Java Quickly
From Everand
Amazing Java: Learn Java Quickly
Andrei Besedin
No ratings yet