0% found this document useful (0 votes)

7 views4 pages

Assignment 9

Uploaded by

nihalthangallapally123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views4 pages

Assignment 9

Uploaded by

nihalthangallapally123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

assignment-9

November 12, 2024

[2]: import torch

import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
from collections import Counter
from itertools import chain

# Sample parallel sentences for demonstration (replace with actual data)

source_sentences = ["hello", "how are you", "good morning"]
target_sentences = ["hola", "cómo estás", "buenos días"]

# Vocabulary building function

def build_vocab(sentences):
counter = Counter(chain.from_iterable(s.split() for s in sentences))
vocab = {word: idx + 3 for idx, (word, _) in enumerate(counter.
↪most_common())}

vocab["<pad>"] = 0
vocab["<sos>"] = 1
vocab["<eos>"] = 2
return vocab

# Build vocabulary for source and target languages

source_vocab = build_vocab(source_sentences)
target_vocab = build_vocab(target_sentences)

# Tokenize function
def tokenize(sentence, vocab):
tokens = ["<sos>"] + sentence.split() + ["<eos>"]
return [vocab[token] if token in vocab else vocab["<pad>"] for token in␣
↪tokens]

# Prepare data for training

train_data = [(torch.tensor(tokenize(src, source_vocab)), torch.
↪tensor(tokenize(tgt, target_vocab)))

for src, tgt in zip(source_sentences, target_sentences)]

# Define Dataset and DataLoader

1
class TranslationDataset(Dataset):
def __init__(self, data):
self.data = data

def __len__(self):
return len(self.data)

def getitem(self, idx):

return self.data[idx]

dataset = TranslationDataset(train_data)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True, collate_fn=lambda␣
↪x: x)

# Encoder model
class Encoder(nn.Module):
def __init__(self, input_dim, emb_dim, hidden_dim, n_layers):
super(Encoder, self).__init__()
self.embedding = nn.Embedding(input_dim, emb_dim)
self.lstm = nn.LSTM(emb_dim, hidden_dim, n_layers, batch_first=True)

def forward(self, src):

embedded = self.embedding(src)
outputs, (hidden, cell) = self.lstm(embedded)
return outputs, hidden, cell

# Attention model
class Attention(nn.Module):
def __init__(self, hidden_dim):
super(Attention, self).__init__()
self.attn = nn.Linear(hidden_dim * 2, hidden_dim)
self.v = nn.Linear(hidden_dim, 1, bias=False)

def forward(self, hidden, encoder_outputs):

src_len = encoder_outputs.shape[1]
hidden = hidden[-1].unsqueeze(1).repeat(1, src_len, 1)
energy = torch.tanh(self.attn(torch.cat((hidden, encoder_outputs),␣
↪dim=2)))

attention = self.v(energy).squeeze(2)
return torch.softmax(attention, dim=1)

# Decoder model with attention

class Decoder(nn.Module):
def __init__(self, output_dim, emb_dim, hidden_dim, n_layers, attention):
super(Decoder, self).__init__()
self.output_dim = output_dim
self.embedding = nn.Embedding(output_dim, emb_dim)

2
self.lstm = nn.LSTM(emb_dim + hidden_dim, hidden_dim, n_layers,␣
↪batch_first=True)
self.fc_out = nn.Linear(hidden_dim * 2, output_dim)
self.attention = attention

def forward(self, tgt, hidden, cell, encoder_outputs):

tgt = tgt.unsqueeze(1)
embedded = self.embedding(tgt)
attn_weights = self.attention(hidden, encoder_outputs)
context = torch.bmm(attn_weights.unsqueeze(1), encoder_outputs)
lstm_input = torch.cat((embedded, context), dim=2)
output, (hidden, cell) = self.lstm(lstm_input, (hidden, cell))
prediction = self.fc_out(torch.cat((output, context), dim=2).squeeze(1))
return prediction, hidden, cell

# Seq2Seq model combining encoder and decoder

class Seq2Seq(nn.Module):
def __init__(self, encoder, decoder, device):
super(Seq2Seq, self).__init__()
self.encoder = encoder
self.decoder = decoder
self.device = device

def forward(self, src, tgt):

encoder_outputs, hidden, cell = self.encoder(src)
outputs = torch.zeros(tgt.shape[0], tgt.shape[1], self.decoder.
↪output_dim).to(self.device)

input = tgt[:, 0]
for t in range(1, tgt.shape[1]):
output, hidden, cell = self.decoder(input, hidden, cell,␣
↪encoder_outputs)

outputs[:, t] = output
input = output.argmax(1)
return outputs

# Hyperparameters and model initialization

INPUT_DIM = len(source_vocab)
OUTPUT_DIM = len(target_vocab)
EMB_DIM = 256
HIDDEN_DIM = 512
N_LAYERS = 2

encoder = Encoder(INPUT_DIM, EMB_DIM, HIDDEN_DIM, N_LAYERS)

attention = Attention(HIDDEN_DIM)
decoder = Decoder(OUTPUT_DIM, EMB_DIM, HIDDEN_DIM, N_LAYERS, attention)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = Seq2Seq(encoder, decoder, device).to(device)

3
# Training setup
optimizer = optim.Adam(model.parameters(), lr=0.001)
criterion = nn.CrossEntropyLoss(ignore_index=target_vocab["<pad>"])

# Training loop
def train(model, dataloader, optimizer, criterion):
model.train()
epoch_loss = 0
for batch in dataloader:
src, tgt = zip(*batch)
src, tgt = torch.nn.utils.rnn.pad_sequence(src,␣
↪padding_value=source_vocab["<pad>"], batch_first=True), \

torch.nn.utils.rnn.pad_sequence(tgt,␣
↪padding_value=target_vocab["<pad>"], batch_first=True)

src, tgt = src.to(device), tgt.to(device)

optimizer.zero_grad()
output = model(src, tgt)

output_dim = output.shape[-1]
output = output[:, 1:].reshape(-1, output_dim)
tgt = tgt[:, 1:].reshape(-1)

loss = criterion(output, tgt)

loss.backward()
optimizer.step()
epoch_loss += loss.item()
return epoch_loss / len(dataloader)

# Training epochs
for epoch in range(10):
loss = train(model, dataloader, optimizer, criterion)
print(f'Epoch {epoch+1}, Loss: {loss:.4f}')

Epoch 1, Loss: 2.0400

Epoch 2, Loss: 1.8393
Epoch 3, Loss: 1.5252
Epoch 4, Loss: 1.2470
Epoch 5, Loss: 0.8623
Epoch 6, Loss: 0.5609
Epoch 7, Loss: 0.4295
Epoch 8, Loss: 0.1870
Epoch 9, Loss: 0.2638
Epoch 10, Loss: 0.1014

Solutions
No ratings yet
Solutions
11 pages
NLP Assignment 2
No ratings yet
NLP Assignment 2
3 pages
The Illustrated Transformer - Jay Alammar - Visualizing Machine Learning One Concept at A Time - .Booklet
No ratings yet
The Illustrated Transformer - Jay Alammar - Visualizing Machine Learning One Concept at A Time - .Booklet
14 pages
AuditScripts Critical Security Control Executive Assessment Tool V6.1a
No ratings yet
AuditScripts Critical Security Control Executive Assessment Tool V6.1a
4 pages
RNN Text Generation
No ratings yet
RNN Text Generation
3 pages
Cs 224N: Assignment #4: 1. Neural Machine Translation With Rnns (45 Points)
No ratings yet
Cs 224N: Assignment #4: 1. Neural Machine Translation With Rnns (45 Points)
10 pages
EncoderDecoderSeq2Seq DeepLSTM
No ratings yet
EncoderDecoderSeq2Seq DeepLSTM
7 pages
NLP 4
No ratings yet
NLP 4
10 pages
GPT2 From Scratch in PyTorch
No ratings yet
GPT2 From Scratch in PyTorch
13 pages
Project Source
No ratings yet
Project Source
21 pages
A4
No ratings yet
A4
8 pages
NLP
No ratings yet
NLP
15 pages
Cs 224N: Assignment #4: 1. Neural Machine Translation With Rnns (45 Points)
No ratings yet
Cs 224N: Assignment #4: 1. Neural Machine Translation With Rnns (45 Points)
7 pages
Transformers Torch
No ratings yet
Transformers Torch
38 pages
AI Lab6
No ratings yet
AI Lab6
22 pages
Language Translation With NN - Transformer and Torchtext - PyTorch Tutorials 2.3.0+cu121 Documentation
No ratings yet
Language Translation With NN - Transformer and Torchtext - PyTorch Tutorials 2.3.0+cu121 Documentation
8 pages
Medical Text Classifier GabrieldeOlaguibel
No ratings yet
Medical Text Classifier GabrieldeOlaguibel
12 pages
Transformers Implementations 1731410319
No ratings yet
Transformers Implementations 1731410319
10 pages
Assignment 7
No ratings yet
Assignment 7
10 pages
Natural Language Processing Lab 9
No ratings yet
Natural Language Processing Lab 9
13 pages
DL 7
No ratings yet
DL 7
6 pages
Lab 5
No ratings yet
Lab 5
7 pages
Assingment-3 NLP
No ratings yet
Assingment-3 NLP
5 pages
Assignment 1
No ratings yet
Assignment 1
7 pages
LLM Code Ref
No ratings yet
LLM Code Ref
10 pages
Exp 8 Machine Translation
No ratings yet
Exp 8 Machine Translation
11 pages
DAA FinalReport
No ratings yet
DAA FinalReport
14 pages
Neural Machine Translation: Shusen Wang
No ratings yet
Neural Machine Translation: Shusen Wang
57 pages
DL Notations
No ratings yet
DL Notations
5 pages
Report
No ratings yet
Report
13 pages
XCS224N Assignment 4 Neural Machine Translation With Rnns
No ratings yet
XCS224N Assignment 4 Neural Machine Translation With Rnns
10 pages
RNN LSTM From Scratch - Ipynb
No ratings yet
RNN LSTM From Scratch - Ipynb
55 pages
Chap 7.1 Sequence Analysis Using FFN
No ratings yet
Chap 7.1 Sequence Analysis Using FFN
47 pages
Lab 8
No ratings yet
Lab 8
2 pages
M5 Topic 1 - Encoder Decoder
No ratings yet
M5 Topic 1 - Encoder Decoder
21 pages
Assignment 8
No ratings yet
Assignment 8
2 pages
Bahdanau Attention Mechanism (Also Known As Additive Attention)
No ratings yet
Bahdanau Attention Mechanism (Also Known As Additive Attention)
41 pages
Cse425 Assignement - 20101257
No ratings yet
Cse425 Assignement - 20101257
12 pages
CM-Sentence Generation Proposal
No ratings yet
CM-Sentence Generation Proposal
8 pages
Chatbot Agri
No ratings yet
Chatbot Agri
7 pages
Summaries of The Chapters
No ratings yet
Summaries of The Chapters
29 pages
Lecture Notes - Advanced Language Model - BERT, GPT
No ratings yet
Lecture Notes - Advanced Language Model - BERT, GPT
24 pages
Bert
No ratings yet
Bert
2 pages
Astro AI
No ratings yet
Astro AI
20 pages
AE556 2024 Topic7 Transformer
No ratings yet
AE556 2024 Topic7 Transformer
49 pages
Python Scripts
No ratings yet
Python Scripts
5 pages
LLM Fine Tune
No ratings yet
LLM Fine Tune
11 pages
Polynomial Expansion Paper
No ratings yet
Polynomial Expansion Paper
4 pages
Chapter 3
No ratings yet
Chapter 3
14 pages
DL Programs
No ratings yet
DL Programs
13 pages
Lesson 14 - Transformer
No ratings yet
Lesson 14 - Transformer
124 pages
Tutorial Pytorch Best Commands
No ratings yet
Tutorial Pytorch Best Commands
8 pages
Attention Mechanism
No ratings yet
Attention Mechanism
11 pages
Transformer
No ratings yet
Transformer
5 pages
Research Paper Summarization
No ratings yet
Research Paper Summarization
13 pages
CS 224n Assignment #3: Dependency Parsing: 1. Machine Learning & Neural Networks (8 Points)
No ratings yet
CS 224n Assignment #3: Dependency Parsing: 1. Machine Learning & Neural Networks (8 Points)
7 pages
Simple Neural Network - Ipynb
No ratings yet
Simple Neural Network - Ipynb
4 pages
CS4740/5740 Introduction To NLP Fall 2017 Neural Language Models and Classifiers
No ratings yet
CS4740/5740 Introduction To NLP Fall 2017 Neural Language Models and Classifiers
7 pages
Mark
No ratings yet
Mark
3 pages
Pertemuan 11 - Sequence To Sequence
No ratings yet
Pertemuan 11 - Sequence To Sequence
21 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Section 5 Lubrication: Rt540E Operator'S Manual Lubrication
No ratings yet
Section 5 Lubrication: Rt540E Operator'S Manual Lubrication
13 pages
Elie Saab Assignment
No ratings yet
Elie Saab Assignment
2 pages
Barc
0% (1)
Barc
15 pages
Instruction Manual of Equipment Installation, Use and Maintenance
No ratings yet
Instruction Manual of Equipment Installation, Use and Maintenance
3 pages
Role of Radio in Society
100% (1)
Role of Radio in Society
2 pages
NEW Tekla Advanced Module 2pp Brochure - Low Res
No ratings yet
NEW Tekla Advanced Module 2pp Brochure - Low Res
2 pages
Hollow Bricks Manufacturing Steps
No ratings yet
Hollow Bricks Manufacturing Steps
3 pages
Bill Updated
No ratings yet
Bill Updated
1 page
Felix Momanyi Bank Statement3
No ratings yet
Felix Momanyi Bank Statement3
3 pages
Trojan Horse
No ratings yet
Trojan Horse
2 pages
Form P-4 Manufacturer'S Partial Data Report As Required by The Provisions of The ASME Code Rules, Section I
No ratings yet
Form P-4 Manufacturer'S Partial Data Report As Required by The Provisions of The ASME Code Rules, Section I
2 pages
Outlook How-To Meeting Setup
No ratings yet
Outlook How-To Meeting Setup
4 pages
Saurabh Jain Resume
No ratings yet
Saurabh Jain Resume
5 pages
Section C Operation Final
No ratings yet
Section C Operation Final
38 pages
Vesa Platform SPR18
No ratings yet
Vesa Platform SPR18
2 pages
Development of Cold-Hot Water Dispenser With Therm
No ratings yet
Development of Cold-Hot Water Dispenser With Therm
10 pages
Steam Generators 1
No ratings yet
Steam Generators 1
85 pages
Question Bank AVERAGE
No ratings yet
Question Bank AVERAGE
4 pages
Mapua Institute of Technolog1
No ratings yet
Mapua Institute of Technolog1
15 pages
Conductive Pen
No ratings yet
Conductive Pen
2 pages
Personal Data:: Course University/Boards Marks Obtained Year of Passing
No ratings yet
Personal Data:: Course University/Boards Marks Obtained Year of Passing
3 pages
BOQ Establishment Plant Balikpapan BP Drymix
No ratings yet
BOQ Establishment Plant Balikpapan BP Drymix
5 pages
PCR V4 P4C Commissioning
No ratings yet
PCR V4 P4C Commissioning
55 pages
Retail Audit
No ratings yet
Retail Audit
14 pages
Nuclear Power Plant Engineering - BUET
100% (6)
Nuclear Power Plant Engineering - BUET
79 pages
Booklet For Regions Transport
No ratings yet
Booklet For Regions Transport
6 pages
Building Over or Near A Public Sewer (09.2012)
No ratings yet
Building Over or Near A Public Sewer (09.2012)
10 pages
2.3 Worksheet
No ratings yet
2.3 Worksheet
5 pages
HP/WA: 0812-6178-6886 (Tsel), Jasa Maintenance Panel LVMDP
No ratings yet
HP/WA: 0812-6178-6886 (Tsel), Jasa Maintenance Panel LVMDP
2 pages

Assignment 9

Uploaded by

Assignment 9

Uploaded by

assignment-9

November 12, 2024

[2]: import torch

# Sample parallel sentences for demonstration (replace with actual data)

# Vocabulary building function

# Build vocabulary for source and target languages

# Prepare data for training

for src, tgt in zip(source_sentences, target_sentences)]

# Define Dataset and DataLoader

def __getitem__(self, idx):

def forward(self, src):

def forward(self, hidden, encoder_outputs):

# Decoder model with attention

def forward(self, tgt, hidden, cell, encoder_outputs):

# Seq2Seq model combining encoder and decoder

def forward(self, src, tgt):

# Hyperparameters and model initialization

encoder = Encoder(INPUT_DIM, EMB_DIM, HIDDEN_DIM, N_LAYERS)

src, tgt = src.to(device), tgt.to(device)

loss = criterion(output, tgt)

Epoch 1, Loss: 2.0400

You might also like

def getitem(self, idx):