0% found this document useful (0 votes)

6 views

Code File

The document outlines a Vision Transformer-based system for copy-move forgery detection (CMFD) using synthetic dataset generation and a multi-modal attention model. It includes classes for generating synthetic images, a dataset class, model architecture, training utilities, and a Gradio interface for predictions. The system is designed to train on generated data and evaluate performance using metrics like F1 score and AUC.

Uploaded by

Praful Yadav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views

Code File

Uploaded by

Praful Yadav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

"""

Vision Transformer-Based CMFD System

Author: AI Assistant (2023)
License: MIT
"""

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import cv2
import albumentations as A
from torch.utils.data import Dataset, DataLoader
from sklearn.metrics import f1_score, roc_auc_score
import timm
import gradio as gr

# --- Synthetic Dataset Generation ---

class SyntheticCMFDGenerator:
def __init__(self, img_size=224):
self.img_size = img_size
self.backgrounds = [np.random.rand(224,224,3) for _ in range(100)] # Mock data

def create_forgery(self):
# 1. Random background
bg = self.backgrounds[np.random.randint(0,100)]

# 2. Copy-move operation
obj = bg[50:150, 50:150].copy()

# 3. Apply transformations
transform = A.Compose([
A.Rotate(limit=45, p=0.7),
A.RandomScale(scale_limit=0.2, p=0.5),
A.GaussianBlur(p=0.3)
])
transformed = transform(image=obj)['image']

# 4. Paste back
mask = np.zeros((224,224), dtype=np.float32)
x, y = np.random.randint(0,100), np.random.randint(0,100)
bg[y:y+100, x:x+100] = transformed
mask[y:y+100, x:x+100] = 1.0

return (bg*255).astype(np.uint8), mask

# --- Dataset Class ---

class CMFDDataset(Dataset):
def __init__(self, generator, num_samples=1000, transform=None):
self.generator = generator
self.num_samples = num_samples
self.transform = transform

def __len__(self):
return self.num_samples

def getitem(self, idx):

# Generate synthetic sample
img, mask = self.generator.create_forgery()

# Augmentations
if self.transform:
augmented = self.transform(image=img, mask=mask)
img, mask = augmented['image'], augmented['mask']

# Convert to tensors
img_rgb = torch.FloatTensor(img).permute(2,0,1)/255.0
img_lab = torch.FloatTensor(cv2.cvtColor(img,
cv2.COLOR_RGB2LAB)).permute(2,0,1)/255.0
edges = torch.FloatTensor(cv2.Canny(img, 100, 200))[None,:,:]/255.0
mask = torch.FloatTensor(mask)[None,:,:]

return {'rgb': img_rgb, 'lab': img_lab, 'edges': edges, 'mask': mask}

# --- Model Architecture ---

class MultiModalAttentionCMFD(nn.Module):
def __init__(self):
super().__init__()

# Vision Transformer Branches

self.vit_rgb = timm.create_model('vit_base_patch16_224', pretrained=True,
num_classes=0)
self.vit_lab = timm.create_model('vit_base_patch16_224', pretrained=True,
num_classes=0)
# Edge Feature Extractor
self.edge_net = nn.Sequential(
nn.Conv2d(1, 64, 3, padding=1),
nn.ReLU(),
nn.MaxPool2d(2),
nn.Conv2d(64, 128, 3, padding=1),
nn.ReLU(),
nn.MaxPool2d(2)
)

# Cross-Modal Attention
self.cross_attn = nn.MultiheadAttention(embed_dim=768, num_heads=8, batch_first=True)

# Decoder
self.decoder = nn.Sequential(
nn.ConvTranspose2d(768, 256, 4, stride=2),
nn.ReLU(),
nn.ConvTranspose2d(256, 128, 4, stride=2),
nn.ReLU(),
nn.Conv2d(128, 1, 1),
nn.Sigmoid()
)

def forward(self, rgb, lab, edges):

# Extract features
rgb_feats = self.vit_rgb(rgb)
lab_feats = self.vit_lab(lab)
edge_feats = self.edge_net(edges)

# Reshape for attention (B, N, C)

edge_feats = edge_feats.flatten(2).permute(0,2,1)

# Cross-modal attention
attn_out, _ = self.cross_attn(
query=rgb_feats,
key=lab_feats,
value=edge_feats
)

# Decode
B, N, C = attn_out.shape
h = w = int(N**0.5)
attn_out = attn_out.permute(0,2,1).view(B, C, h, w)
return self.decoder(attn_out)
# --- Training Utilities ---
class CMFDTrainer:
def __init__(self):
# Initialize components
self.generator = SyntheticCMFDGenerator()
self.transform = A.Compose([
A.HorizontalFlip(p=0.5),
A.VerticalFlip(p=0.5),
A.RandomBrightnessContrast(p=0.3)
])

# Dataset & Loaders

self.train_set = CMFDDataset(self.generator, 1000, self.transform)
self.val_set = CMFDDataset(self.generator, 200)
self.train_loader = DataLoader(self.train_set, batch_size=8, shuffle=True)
self.val_loader = DataLoader(self.val_set, batch_size=8)

# Model & Optimizer

self.model = MultiModalAttentionCMFD()
self.optimizer = optim.AdamW(self.model.parameters(), lr=3e-5)
self.criterion = nn.BCELoss()

def dice_loss(self, pred, target):

smooth = 1e-5
intersection = (pred * target).sum()
return 1 - (2. * intersection + smooth) / (pred.sum() + target.sum() + smooth)

def train_epoch(self):
self.model.train()
total_loss = 0.0

for batch in self.train_loader:

self.optimizer.zero_grad()

outputs = self.model(
batch['rgb'],
batch['lab'],
batch['edges']
)

loss = 0.7self.dice_loss(outputs, batch['mask']) + 0.3self.criterion(outputs,

batch['mask'])
loss.backward()
self.optimizer.step()

total_loss += loss.item()

return total_loss/len(self.train_loader)

def validate(self):
self.model.eval()
preds, targets = [], []

with torch.no_grad():
for batch in self.val_loader:
outputs = self.model(
batch['rgb'],
batch['lab'],
batch['edges']
)
preds.extend(outputs.cpu().numpy().flatten())
targets.extend(batch['mask'].cpu().numpy().flatten())

return {
'f1': f1_score(targets, np.round(preds)),
'auc': roc_auc_score(targets, preds)
}

# --- Gradio Interface ---

def create_demo(model):
def predict(image):
# Preprocess
image = cv2.resize(image, (224, 224))
lab = cv2.cvtColor(image, cv2.COLOR_RGB2LAB)
edges = cv2.Canny(image, 100, 200)

# To tensor
rgb_tensor = torch.FloatTensor(image).permute(2,0,1)[None]/255.0
lab_tensor = torch.FloatTensor(lab).permute(2,0,1)[None]/255.0
edges_tensor = torch.FloatTensor(edges)[None,None]/255.0

# Predict
with torch.no_grad():
mask = model(rgb_tensor, lab_tensor, edges_tensor)

return (mask[0,0].numpy() > 0.5).astype(np.uint8)*255

return gr.Interface(
fn=predict,
inputs=gr.Image(label="Input Image"),
outputs=gr.Image(label="Forgery Mask"),
title="CMFD Detection Demo",
examples=[["sample1.jpg"], ["sample2.jpg"]] # Add real examples
)

# --- Main Execution ---

if __name__ == "__main__":
# Initialize system
trainer = CMFDTrainer()

# Training loop
for epoch in range(10):
train_loss = trainer.train_epoch()
val_metrics = trainer.validate()
print(f"Epoch {epoch+1}:")
print(f" Train Loss: {train_loss:.4f}")
print(f" Val F1: {val_metrics['f1']:.4f}, AUC: {val_metrics['auc']:.4f}")

# Launch demo
demo = create_demo(trainer.model)
demo.launch()

Mini Project: Network Packet Sniffer
100% (2)
Mini Project: Network Packet Sniffer
22 pages
UTAS-0082 Automatic Marshall Compactor
No ratings yet
UTAS-0082 Automatic Marshall Compactor
8 pages
Script Optimizare Windows 10
100% (1)
Script Optimizare Windows 10
6 pages
Star Wars Age of Rebellion RPG Core Rulebook - Cff7tro PDF
No ratings yet
Star Wars Age of Rebellion RPG Core Rulebook - Cff7tro PDF
2 pages
Font Transfer 2 Autoencoders
No ratings yet
Font Transfer 2 Autoencoders
78 pages
Ccnet Only
No ratings yet
Ccnet Only
6 pages
Applied Machine and Deep Learning
No ratings yet
Applied Machine and Deep Learning
34 pages
Document 2
No ratings yet
Document 2
8 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Csc413 Project Semantic Segmentation
No ratings yet
Csc413 Project Semantic Segmentation
84 pages
Fake Image Detection Report
No ratings yet
Fake Image Detection Report
21 pages
Deep Learning Practical
No ratings yet
Deep Learning Practical
12 pages
Lab 1_harshil_parmar (1)
No ratings yet
Lab 1_harshil_parmar (1)
2 pages
Deep Learning
No ratings yet
Deep Learning
30 pages
DL_8
No ratings yet
DL_8
4 pages
Skill7
No ratings yet
Skill7
11 pages
Deep Learning
No ratings yet
Deep Learning
46 pages
Hyper Parameteres: Dataset
No ratings yet
Hyper Parameteres: Dataset
13 pages
LLM CODE REF
No ratings yet
LLM CODE REF
10 pages
CEP-DIP
No ratings yet
CEP-DIP
9 pages
Assignment3 AL
No ratings yet
Assignment3 AL
23 pages
ANN Detection Technique
No ratings yet
ANN Detection Technique
20 pages
AM19_ADL_u-net-model
No ratings yet
AM19_ADL_u-net-model
37 pages
Raw Nitex
No ratings yet
Raw Nitex
5 pages
CVDL TAE 63 (1)
No ratings yet
CVDL TAE 63 (1)
9 pages
DEEP LEARNING LAB MANUAL
No ratings yet
DEEP LEARNING LAB MANUAL
11 pages
202203103510493
No ratings yet
202203103510493
6 pages
vertopal.com_HW4ML project starter code template
No ratings yet
vertopal.com_HW4ML project starter code template
6 pages
keras
No ratings yet
keras
4 pages
Variational AutoEncoders (VAE) With PyTorch - Alexander Van de Kleut
No ratings yet
Variational AutoEncoders (VAE) With PyTorch - Alexander Van de Kleut
17 pages
Practical 02
No ratings yet
Practical 02
5 pages
Vertopal.com HW4ML Project Code
No ratings yet
Vertopal.com HW4ML Project Code
24 pages
BIA9
No ratings yet
BIA9
5 pages
Final Code
No ratings yet
Final Code
16 pages
vit32_gptMD
No ratings yet
vit32_gptMD
6 pages
CGAN_FULL_CODE
No ratings yet
CGAN_FULL_CODE
9 pages
Transformer Flux
No ratings yet
Transformer Flux
11 pages
DL Practical 6,7 Outputs
No ratings yet
DL Practical 6,7 Outputs
9 pages
PROGRAM 8-1
No ratings yet
PROGRAM 8-1
9 pages
AIML Lab 3
No ratings yet
AIML Lab 3
17 pages
Deep Learning Lab With Output
No ratings yet
Deep Learning Lab With Output
12 pages
Homework IntroToDL
No ratings yet
Homework IntroToDL
3 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
Neural_DEEP
No ratings yet
Neural_DEEP
39 pages
TLM for CNN
No ratings yet
TLM for CNN
32 pages
CV Lab Final AwaisKhan EE A
No ratings yet
CV Lab Final AwaisKhan EE A
7 pages
nndl2 (2)
No ratings yet
nndl2 (2)
67 pages
val
No ratings yet
val
9 pages
Apex For Bres 1
No ratings yet
Apex For Bres 1
6 pages
Exp 6,7,8
No ratings yet
Exp 6,7,8
17 pages
新建文本文档
No ratings yet
新建文本文档
6 pages
Appix
No ratings yet
Appix
15 pages
Dlv Lab Manual Print
No ratings yet
Dlv Lab Manual Print
29 pages
Deep Learning Practical File
No ratings yet
Deep Learning Practical File
36 pages
Face - Emotion Recog - Implementation
No ratings yet
Face - Emotion Recog - Implementation
11 pages
nndlmac
No ratings yet
nndlmac
9 pages
facene
No ratings yet
facene
3 pages
nndlrepo2
No ratings yet
nndlrepo2
3 pages
PyTorch Cheat Sheet & Quick Reference
No ratings yet
PyTorch Cheat Sheet & Quick Reference
6 pages
Code
No ratings yet
Code
4 pages
DL Programs
No ratings yet
DL Programs
12 pages
Lab Manual
No ratings yet
Lab Manual
45 pages
Chinese Character Recognition BN
No ratings yet
Chinese Character Recognition BN
7 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Naked Policy Wording - Individual Things
No ratings yet
Naked Policy Wording - Individual Things
26 pages
Use of Computer For A Geologist
No ratings yet
Use of Computer For A Geologist
15 pages
Setup and Operator Guide: IBM TS3310 Tape Library
No ratings yet
Setup and Operator Guide: IBM TS3310 Tape Library
517 pages
AL-800 AL-840: Parts Guide
No ratings yet
AL-800 AL-840: Parts Guide
22 pages
Multi Power Monitor: Operating Manual
No ratings yet
Multi Power Monitor: Operating Manual
53 pages
Aspects Related To The Criminal Investigation of The Signature's Modifications
100% (1)
Aspects Related To The Criminal Investigation of The Signature's Modifications
16 pages
Orclgoogcode
No ratings yet
Orclgoogcode
7 pages
FALLSEM2024-25 BEEE102L TH VL2024250106653 2024-09-24 Reference-Material-I
No ratings yet
FALLSEM2024-25 BEEE102L TH VL2024250106653 2024-09-24 Reference-Material-I
102 pages
EEE1024 Fundamentals of Electrical and Electronics Engineering
No ratings yet
EEE1024 Fundamentals of Electrical and Electronics Engineering
14 pages
I2C-to-RS485_1620-17485-0004-E-1021
No ratings yet
I2C-to-RS485_1620-17485-0004-E-1021
6 pages
Cocoa Programming For OS X The Big Nerd Ranch Guide 5 e Fifth Edition (Online-Ausg.) Chandler All Chapter Instant Download
100% (1)
Cocoa Programming For OS X The Big Nerd Ranch Guide 5 e Fifth Edition (Online-Ausg.) Chandler All Chapter Instant Download
53 pages
Freestyle Chess Mauboussin
No ratings yet
Freestyle Chess Mauboussin
10 pages
Energy Stored in a Magnetic Field
No ratings yet
Energy Stored in a Magnetic Field
5 pages
500 Words Abstract
No ratings yet
500 Words Abstract
2 pages
50 technical C++ Interview Questions with Answers
No ratings yet
50 technical C++ Interview Questions with Answers
13 pages
HR Security Policy 2023
No ratings yet
HR Security Policy 2023
6 pages
NetworkCamera APIGuideV4
No ratings yet
NetworkCamera APIGuideV4
108 pages
Brilliance CT: 6/10/16-Slice Configuration (Air)
No ratings yet
Brilliance CT: 6/10/16-Slice Configuration (Air)
136 pages
Process Monitor Tutorial Handout
No ratings yet
Process Monitor Tutorial Handout
13 pages
Vickers Copy
No ratings yet
Vickers Copy
5 pages
10-701/15-781 Machine Learning - Midterm Exam, Fall 2010: Aarti Singh Carnegie Mellon University
No ratings yet
10-701/15-781 Machine Learning - Midterm Exam, Fall 2010: Aarti Singh Carnegie Mellon University
16 pages
Frequêncimetro Dgital (7226B)
No ratings yet
Frequêncimetro Dgital (7226B)
2 pages
Drive Unit Guide Complete
No ratings yet
Drive Unit Guide Complete
46 pages
Penetration Testing Tutorial PDF
0% (2)
Penetration Testing Tutorial PDF
9 pages
Design Methods in Nanotechnology Using Quantum Dot Cellular Automata QCA
No ratings yet
Design Methods in Nanotechnology Using Quantum Dot Cellular Automata QCA
5 pages
GIS and RS Brochure CST
No ratings yet
GIS and RS Brochure CST
1 page