0% found this document useful (0 votes)

2 views10 pages

Code

The document contains a PyTorch-based implementation of a training routine for a model that processes visual and textual data. It includes various modes for training such as 'q_debias', 'v_debias', and 'q_v_debias', each with specific techniques for adjusting the model's focus on different data types. The training process involves calculating losses, gradients, and updating model parameters while handling potential issues like NaN losses.

Uploaded by

kangja1530

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views10 pages

Code

Uploaded by

kangja1530

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 10

import json

import os
import pickle
import time
from os.path import join

import torch
import torch.nn as nn
from torch.nn import functional as F
import utils
from torch.autograd import Variable
import numpy as np
from tqdm import tqdm
import random
import copy
from base_model import FindCntfImages
from itertools import cycle

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

def compute_score_with_logits(logits, labels): # 정확도 계산
logits = torch.argmax(logits, 1)
one_hots = torch.zeros(*labels.size()).cuda()
one_hots.scatter_(1, logits.view(-1, 1), 1)
scores = (one_hots * labels)
return scores

def train(model, train_loader, eval_loader, ext_loader, args,qid2type):

dataset=args.dataset
num_epochs=args.epochs
mode=args.mode
run_eval=args.eval_each_epoch
output=args.output
optim = torch.optim.Adamax(model.parameters())
logger = utils.Logger(os.path.join(output, 'log.txt'))
total_step = 0
best_eval_score = 0

img_loader = cycle(ext_loader)

if mode=='q_debias':
topq=args.topq
keep_qtype=args.keep_qtype
elif mode=='v_debias':
topv=args.topv
top_hint=args.top_hint
elif mode=='q_v_debias':
topv=args.topv
top_hint=args.top_hint
topq=args.topq
keep_qtype=args.keep_qtype
qvp=args.qvp

for epoch in range(num_epochs):

total_loss = 0
train_score = 0

t = time.time()
# for i, (data1, data2) in tqdm(enumerate(zip(train_loader, ext_loader)),
ncols=100,
# desc="Epoch %d" % (epoch + 1),
total=len(train_loader)):

for i, (v, q, a, b, hintscore,type_mask,notype_mask,q_mask) in

tqdm(enumerate(train_loader), ncols=100,
desc="Epoch %d" % (epoch + 1),
total=len(train_loader)):

# v, q, a, b, hintscore,type_mask,notype_mask,q_mask = data1
# img_batch, _ = data2

total_step += 1

#########################################
v = Variable(v).cuda().requires_grad_()
q = Variable(q).cuda()
q_mask=Variable(q_mask).cuda()
a = Variable(a).cuda()
b = Variable(b).cuda()
hintscore = Variable(hintscore).cuda()
type_mask=Variable(type_mask).float().cuda()
notype_mask=Variable(notype_mask).float().cuda()
#########################################

if mode=='updn':
pred, loss,_ = model(v, q, a, b, None)
if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

batch_score = compute_score_with_logits(pred, a.data).sum()
train_score += batch_score

elif mode=='q_debias':
if keep_qtype==True:
sen_mask=type_mask
else:
sen_mask=notype_mask
## first train
pred, loss,word_emb = model(v, q, a, b, None)

word_grad = torch.autograd.grad((pred * (a > 0).float()).sum(),

word_emb, create_graph=True)[0]

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

batch_score = compute_score_with_logits(pred, a.data).sum()
train_score += batch_score

## second train

word_grad_cam = word_grad.sum(2)
# word_grad_cam_sigmoid = torch.sigmoid(word_grad_cam * 1000)
word_grad_cam_sigmoid = torch.exp(word_grad_cam * sen_mask)
word_grad_cam_sigmoid = word_grad_cam_sigmoid * sen_mask

w_ind = word_grad_cam_sigmoid.sort(1, descending=True)[1][:, :topq]

q2 = copy.deepcopy(q_mask)

m1 = copy.deepcopy(sen_mask) ##[0,0,0...0,1,1,1,1]
m1.scatter_(1, w_ind, 0) ##[0,0,0...0,0,1,1,0]
m2 = 1 - m1 ##[1,1,1...1,1,0,0,1]
if dataset=='cpv1':
m3=m1*18330
else:
m3 = m1 * 18455 ##[0,0,0...0,0,18455,18455,0]
q2 = q2 * m2.long() + m3.long()

pred, _, _ = model(v, q2, None, b, None)

pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]

false_ans = torch.ones(pred.shape[0], pred.shape[1]).cuda()
false_ans.scatter_(1, pred_ind, 0)
a2 = a * false_ans
q3 = copy.deepcopy(q)
if dataset=='cpv1':
q3.scatter_(1, w_ind, 18330)
else:
q3.scatter_(1, w_ind, 18455)

## third train

pred, loss, _ = model(v, q3, a2, b, None)

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

elif mode=='v_debias':
## first train
pred, loss, _ = model(v, q, a, b, None)
visual_grad=torch.autograd.grad((pred * (a > 0).float()).sum(), v,
create_graph=True)[0]

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

batch_score = compute_score_with_logits(pred, a.data).sum()
train_score += batch_score

##second train
v_mask = torch.zeros(v.shape[0], 36).cuda()
visual_grad_cam = visual_grad.sum(2)
hint_sort, hint_ind = hintscore.sort(1, descending=True)
v_ind = hint_ind[:, :top_hint]
v_grad = visual_grad_cam.gather(1, v_ind)

if topv==-1:
v_grad_score,v_grad_ind=v_grad.sort(1,descending=True)
v_grad_score=nn.functional.softmax(v_grad_score*10,dim=1)
v_grad_sum=torch.cumsum(v_grad_score,dim=1)
v_grad_mask=(v_grad_sum<=0.65).long()
v_grad_mask[:,0] = 1
v_mask_ind=v_grad_mask*v_ind
for x in range(a.shape[0]):
num=len(torch.nonzero(v_grad_mask[x]))
v_mask[x].scatter_(0,v_mask_ind[x,:num],1)
else:
v_grad_ind = v_grad.sort(1, descending=True)[1][:, :topv]
v_star = v_ind.gather(1, v_grad_ind)
v_mask.scatter_(1, v_star, 1)

pred, _, _ = model(v, q, None, b, v_mask)

pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]

false_ans = torch.ones(pred.shape[0], pred.shape[1]).cuda()
false_ans.scatter_(1, pred_ind, 0)
a2 = a * false_ans

v_mask = 1 - v_mask

pred, loss, _ = model(v, q, a2, b, v_mask)

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

elif mode=='q_v_debias':
random_num = random.randint(1, 10)
if keep_qtype == True:
sen_mask = type_mask
else:
sen_mask = notype_mask
if random_num<=qvp:
## first train
pred, loss, word_emb = model(v, q, a, b, None)
word_grad = torch.autograd.grad((pred * (a > 0).float()).sum(),
word_emb, create_graph=True)[0]

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

batch_score = compute_score_with_logits(pred, a.data).sum()
train_score += batch_score

## second train

q2 = copy.deepcopy(q_mask)

pred, _, _ = model(v, q2, None, b, None)

pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]

## third train

pred, loss, _ = model(v, q3, a2, b, None)

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()
total_loss += loss.item() * q.size(0)

else: # 여기에서 실험해보자

## first train
pred, loss, _ = model(v, q, a, b, None)
# 오리지날 샘플
visual_grad = torch.autograd.grad((pred * (a >
0).float()).sum(), v, create_graph=True)[0]

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

batch_score = compute_score_with_logits(pred, a.data).sum()
train_score += batch_score

## second train( couterfactual sample)

v_mask = torch.zeros(v.shape[0], 36).cuda()
# 초기마스크 전부 0 (마스킹되면 1 로바뀜)
visual_grad_cam = visual_grad.sum(2)
hint_sort, hint_ind = hintscore.sort(1, descending=True)
v_ind = hint_ind[:, :top_hint]
# 중요 객체의 인덱스 가져옴
v_grad = visual_grad_cam.gather(1, v_ind)
#

if topv == -1:
v_grad_score, v_grad_ind = v_grad.sort(1, descending=True)
v_grad_score = nn.functional.softmax(v_grad_score * 10,
dim=1) # 객체 중요도 분포만듬
v_grad_sum = torch.cumsum(v_grad_score, dim=1)
# 상위 객체 중요도 누적
v_grad_mask = (v_grad_sum <= 0.65).long()
# 65%이하를 바꿈
v_grad_mask[:,0] = 1
# 마스킹할 객체가 하나도 없는 상황을 방지
v_mask_ind = v_grad_mask * v_ind
# 중요 객체의 인덱스
for x in range(a.shape[0]):
num = len(torch.nonzero(v_grad_mask[x]))
# 객체 위치찾음 -> 개수
v_mask[x].scatter_(0, v_mask_ind[x,:num], 1)
# num 개만큼의 인덱스를 1 로 바꿈( 마스킹)
else:
v_grad_ind = v_grad.sort(1, descending=True)[1][:, :topv]
v_star = v_ind.gather(1, v_grad_ind)
v_mask.scatter_(1, v_star, 1)

pred, _, _ = model(v, q, None, b, v_mask)

pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]
false_ans = torch.ones(pred.shape[0], pred.shape[1]).cuda()
false_ans.scatter_(1, pred_ind, 0)
a2 = a * false_ans
v_mask = 1 - v_mask
# 마스킹반전 1-> 0, 0 ->1
pred, loss, _ = model(v, q, a2, b, v_mask)

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

## third train ( proposal method)

v_mask = 1 - v_mask
# 원상복구

while True:
img, _ = next(img_loader)

if img.size(0) != 512:
img = img.reshape(512, 36, 2048).to(device)
break

v_mask_expanded = v_mask.unsqueeze(2).expand(-1, -1,

2048).to(device) # [batch, 36, 2048]
v_masked = v * (1 - v_mask_expanded).to(device) # masking
v_new = v_masked + img * v_mask_expanded

# pred, _, _ = model(v_new, q, None, b, None)

# pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]
# false_ans = torch.ones(pred.shape[0], pred.shape[1]).cuda()
# false_ans.scatter_(1, pred_ind, 0)
# a2 = a * false_ans

pred, loss, _ = model(v_new, q, a2, b, None)

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

## last train
counterfactual_generator = FindCntfImages(model,
v,
q,
a,
b,
pred,
v_mask,
visual_grad_cam,
v_new
)
counterfacter_img, _ = counterfactual_generator()

pred, _, _ = model(counterfacter_img, q, None, b, None)

pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]
false_ans = torch.ones(pred.shape[0], pred.shape[1]).cuda()
false_ans.scatter_(1, pred_ind, 0)
a2 = a * false_ans

pred, loss, _ = model(counterfacter_img, q, a2, b, None)

if (loss != loss).any():
raise ValueError("NaN loss")
loss.backward()
nn.utils.clip_grad_norm_(model.parameters(), 0.25)
optim.step()
optim.zero_grad()

total_loss += loss.item() * q.size(0)

if mode=='updn':
total_loss /= len(train_loader.dataset)
else:
total_loss /= len(train_loader.dataset) * 2
train_score = 100 * train_score / len(train_loader.dataset)

if run_eval:
model.train(False)
results = evaluate(model, eval_loader, qid2type)
results["epoch"] = epoch + 1
results["step"] = total_step
results["train_loss"] = total_loss
results["train_score"] = train_score

model.train(True)

eval_score = results["score"]
bound = results["upper_bound"]
yn = results['score_yesno']
other = results['score_other']
num = results['score_number']

logger.write('epoch %d, time: %.2f' % (epoch, time.time() - t))

logger.write('\ttrain_loss: %.2f, score: %.2f' % (total_loss, train_score))
if run_eval:
logger.write('\teval score: %.2f (%.2f)' % (100 * eval_score, 100 *
bound))
logger.write('\tyn score: %.2f other score: %.2f num score: %.2f' %
(100 * yn, 100 * other, 100 * num))

if eval_score > best_eval_score:

model_path = os.path.join(output, 'model.pth')
torch.save(model.state_dict(), model_path)
best_eval_score = eval_score

def evaluate(model, dataloader, qid2type):

score = 0
upper_bound = 0
score_yesno = 0
score_number = 0
score_other = 0
total_yesno = 0
total_number = 0
total_other = 0

for v, q, a, b, qids, _ in tqdm(dataloader, ncols=100, total=len(dataloader),

desc="eval"):
v = Variable(v, requires_grad=False).cuda()
q = Variable(q, requires_grad=False).cuda()
pred, _,_ = model(v, q, None, None, None)
batch_score = compute_score_with_logits(pred,
a.cuda()).cpu().numpy().sum(1)
score += batch_score.sum()
upper_bound += (a.max(1)[0]).sum()
qids = qids.detach().cpu().int().numpy()
for j in range(len(qids)):
qid = qids[j]
typ = qid2type[str(qid)]
if typ == 'yes/no':
score_yesno += batch_score[j]
total_yesno += 1
elif typ == 'other':
score_other += batch_score[j]
total_other += 1
elif typ == 'number':
score_number += batch_score[j]
total_number += 1
else:
print('Hahahahahahahahahahaha')

score = score / len(dataloader.dataset)

upper_bound = upper_bound / len(dataloader.dataset)
score_yesno /= total_yesno
score_other /= total_other
score_number /= total_number

results = dict(
score=score,
upper_bound=upper_bound,
score_yesno=score_yesno,
score_other=score_other,
score_number=score_number,
)
return results

LSTM From Scratch in Python
No ratings yet
LSTM From Scratch in Python
11 pages
Learning Python Design Patterns - Second Edition - Sample Chapter
No ratings yet
Learning Python Design Patterns - Second Edition - Sample Chapter
16 pages
Kolmogorov-Arnold-Networks in Python
No ratings yet
Kolmogorov-Arnold-Networks in Python
8 pages
The Google Story PDF - Full Document
0% (1)
The Google Story PDF - Full Document
9 pages
ccs355 Lab Manual
No ratings yet
ccs355 Lab Manual
24 pages
Chapter5-DATA AND KNOWLEDGE MANAGEMENT
No ratings yet
Chapter5-DATA AND KNOWLEDGE MANAGEMENT
39 pages
Question Bank 16ee415 - PLC & Automation
100% (3)
Question Bank 16ee415 - PLC & Automation
12 pages
Cross Entropy
No ratings yet
Cross Entropy
1 page
Handwriting Free Practice Makes Perfect Lowercase Letters
92% (13)
Handwriting Free Practice Makes Perfect Lowercase Letters
58 pages
MAMBA
No ratings yet
MAMBA
5 pages
Pytorch 101: Deep Learning PHD Course 2017/2018
No ratings yet
Pytorch 101: Deep Learning PHD Course 2017/2018
19 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
HW4ML Project Code
No ratings yet
HW4ML Project Code
24 pages
Bananini Chimpanzini
No ratings yet
Bananini Chimpanzini
8 pages
Theorem Proving in Lean
100% (1)
Theorem Proving in Lean
173 pages
Neural Net Python Sleep Study
No ratings yet
Neural Net Python Sleep Study
3 pages
Variational AutoEncoders (VAE) With PyTorch - Alexander Van de Kleut
No ratings yet
Variational AutoEncoders (VAE) With PyTorch - Alexander Van de Kleut
17 pages
Debugging
No ratings yet
Debugging
9 pages
CV Lab Final AwaisKhan EE A
No ratings yet
CV Lab Final AwaisKhan EE A
7 pages
Homework IntroToDL
No ratings yet
Homework IntroToDL
3 pages
Autoencoder From Scratch
No ratings yet
Autoencoder From Scratch
21 pages
Debugging Tensorflow Guide
No ratings yet
Debugging Tensorflow Guide
28 pages
Autoencoder - MPL - Basic - Ipynb - Colaboratory PDF
No ratings yet
Autoencoder - MPL - Basic - Ipynb - Colaboratory PDF
21 pages
C2 W2ok
No ratings yet
C2 W2ok
109 pages
Train Py
No ratings yet
Train Py
4 pages
Sota Image Classification Models With Pytorch Api
No ratings yet
Sota Image Classification Models With Pytorch Api
10 pages
PyTorch Crash Course 1713016363
No ratings yet
PyTorch Crash Course 1713016363
15 pages
Project Source
No ratings yet
Project Source
21 pages
Big Data Assignment - 7
No ratings yet
Big Data Assignment - 7
7 pages
Linear Regr GD
No ratings yet
Linear Regr GD
3 pages
MLP Pytorch Sigmoid Mse
No ratings yet
MLP Pytorch Sigmoid Mse
20 pages
Decoder-Only Transformer (LLM) For Question Asking: Notebook Structure
No ratings yet
Decoder-Only Transformer (LLM) For Question Asking: Notebook Structure
9 pages
A 3
No ratings yet
A 3
5 pages
Import Gym
No ratings yet
Import Gym
4 pages
IBest DeepLearning
No ratings yet
IBest DeepLearning
123 pages
PINN 1DBurgers
No ratings yet
PINN 1DBurgers
19 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
10 pages
1155 CS F425 20230524120823 Mid Semester Question Paper DL
No ratings yet
1155 CS F425 20230524120823 Mid Semester Question Paper DL
5 pages
Effects of Batches - Jupyter Notebook
No ratings yet
Effects of Batches - Jupyter Notebook
73 pages
Logistic Regression
No ratings yet
Logistic Regression
4 pages
Assignment No. 3: 1. Plot of Loss Function J Vs Number of Iterations
No ratings yet
Assignment No. 3: 1. Plot of Loss Function J Vs Number of Iterations
6 pages
Softmax Regression Scratch
No ratings yet
Softmax Regression Scratch
5 pages
MLP Pytorch Softmax Crossentr
No ratings yet
MLP Pytorch Softmax Crossentr
20 pages
AM19 ADL U-Net-Model
No ratings yet
AM19 ADL U-Net-Model
37 pages
Deep Learning Lectures - 2
No ratings yet
Deep Learning Lectures - 2
73 pages
BLDD VIT ResNet50v2 CustomCNN
No ratings yet
BLDD VIT ResNet50v2 CustomCNN
38 pages
Experiment 6
No ratings yet
Experiment 6
3 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Conv Net
No ratings yet
Conv Net
7 pages
Convex Report
No ratings yet
Convex Report
9 pages
Change Management Process
No ratings yet
Change Management Process
24 pages
Softmax Regression Mnist
No ratings yet
Softmax Regression Mnist
3 pages
Adaline SGD
No ratings yet
Adaline SGD
4 pages
Pytorch Demo 1749471354
No ratings yet
Pytorch Demo 1749471354
10 pages
Ccnet Only
No ratings yet
Ccnet Only
6 pages
AI Coding - Ipynb - Colab
No ratings yet
AI Coding - Ipynb - Colab
6 pages
Mlp-Fromscratch Sigmoid-Mse
No ratings yet
Mlp-Fromscratch Sigmoid-Mse
13 pages
Lab 9
No ratings yet
Lab 9
29 pages
TXT
No ratings yet
TXT
7 pages
Lesson 2
No ratings yet
Lesson 2
8 pages
PES1PG24CS018 Debjit DLTP Assignment-2 BERT Report
No ratings yet
PES1PG24CS018 Debjit DLTP Assignment-2 BERT Report
10 pages
Gadla Bestawros Text and Translation PDF
No ratings yet
Gadla Bestawros Text and Translation PDF
40 pages
EasyScopeX Install Guide
No ratings yet
EasyScopeX Install Guide
12 pages
Grammy Awards Emmy Awards Tony Awards: Page 1 of 3 Deus-0755405492
No ratings yet
Grammy Awards Emmy Awards Tony Awards: Page 1 of 3 Deus-0755405492
3 pages
Skill 7
No ratings yet
Skill 7
11 pages
Deep Learning Programs Updated
No ratings yet
Deep Learning Programs Updated
24 pages
Credit Card Clustering Autoencoder
No ratings yet
Credit Card Clustering Autoencoder
6 pages
Predicting Stock Prices With Deep Neural Networks 1723509410
No ratings yet
Predicting Stock Prices With Deep Neural Networks 1723509410
5 pages
Minas A4 Prospekt
No ratings yet
Minas A4 Prospekt
32 pages
Lab - Develop Cybersecurity Policies and Procedures
No ratings yet
Lab - Develop Cybersecurity Policies and Procedures
4 pages
RESUME Mark Reardon PHD PDF
No ratings yet
RESUME Mark Reardon PHD PDF
2 pages
Sage ERP X3 Technology Demo Script: Patchset 19 November 2012
No ratings yet
Sage ERP X3 Technology Demo Script: Patchset 19 November 2012
117 pages
How-Computers-Work 20231118 231813 0000
No ratings yet
How-Computers-Work 20231118 231813 0000
28 pages
BSB Remote
No ratings yet
BSB Remote
9 pages
Irfan Jalal Bhat
No ratings yet
Irfan Jalal Bhat
19 pages
CSCI213 Spring2013 Lectures Multithreading
No ratings yet
CSCI213 Spring2013 Lectures Multithreading
16 pages
Readme
No ratings yet
Readme
6 pages
Conky
No ratings yet
Conky
4 pages
CPE 313 Database Management Systems: Fall 2021/2022
No ratings yet
CPE 313 Database Management Systems: Fall 2021/2022
24 pages
Simulation and Analysis Environment: Author
No ratings yet
Simulation and Analysis Environment: Author
5 pages
Simple C++ Programs: ELEC 206 Computer Applications For Electrical Engineers Dr. Ron Hayne
No ratings yet
Simple C++ Programs: ELEC 206 Computer Applications For Electrical Engineers Dr. Ron Hayne
51 pages
Lesson 2: Written Communication
No ratings yet
Lesson 2: Written Communication
3 pages
Proyek Akhir
No ratings yet
Proyek Akhir
13 pages
ACTIVITY 9 Important Shortcuts
No ratings yet
ACTIVITY 9 Important Shortcuts
5 pages
India States in Alphabetical Order - Google Search
No ratings yet
India States in Alphabetical Order - Google Search
1 page
Chapter01 en
No ratings yet
Chapter01 en
24 pages
Sedes Ip
No ratings yet
Sedes Ip
11 pages
Urdu Language Project Requirement - 20230504
No ratings yet
Urdu Language Project Requirement - 20230504
3 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet

Code

Uploaded by

Code

Uploaded by

import json

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

def train(model, train_loader, eval_loader, ext_loader, args,qid2type):

for epoch in range(num_epochs):

for i, (v, q, a, b, hintscore,type_mask,notype_mask,q_mask) in

total_loss += loss.item() * q.size(0)

word_grad = torch.autograd.grad((pred * (a > 0).float()).sum(),

total_loss += loss.item() * q.size(0)

w_ind = word_grad_cam_sigmoid.sort(1, descending=True)[1][:, :topq]

pred, _, _ = model(v, q2, None, b, None)

pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]

pred, loss, _ = model(v, q3, a2, b, None)

total_loss += loss.item() * q.size(0)

total_loss += loss.item() * q.size(0)

pred, _, _ = model(v, q, None, b, v_mask)

pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]

pred, loss, _ = model(v, q, a2, b, v_mask)

total_loss += loss.item() * q.size(0)

total_loss += loss.item() * q.size(0)

pred, _, _ = model(v, q2, None, b, None)

pred_ind = torch.argsort(pred, 1, descending=True)[:, :5]

pred, loss, _ = model(v, q3, a2, b, None)

else: # 여기에서 실험해보자

total_loss += loss.item() * q.size(0)

## second train( couterfactual sample)

pred, _, _ = model(v, q, None, b, v_mask)

total_loss += loss.item() * q.size(0)

## third train ( proposal method)

v_mask_expanded = v_mask.unsqueeze(2).expand(-1, -1,

# pred, _, _ = model(v_new, q, None, b, None)

pred, loss, _ = model(v_new, q, a2, b, None)

total_loss += loss.item() * q.size(0)

pred, _, _ = model(counterfacter_img, q, None, b, None)

pred, loss, _ = model(counterfacter_img, q, a2, b, None)

total_loss += loss.item() * q.size(0)

logger.write('epoch %d, time: %.2f' % (epoch, time.time() - t))

if eval_score > best_eval_score:

def evaluate(model, dataloader, qid2type):

for v, q, a, b, qids, _ in tqdm(dataloader, ncols=100, total=len(dataloader),

score = score / len(dataloader.dataset)

You might also like