0% found this document useful (0 votes)

7 views6 pages

Bioinfo

The document outlines the Needleman-Wunsch algorithm for sequence alignment, detailing the steps to create a scoring matrix and traceback for optimal alignment. It includes a Python implementation of the algorithm, which takes two sequences and scoring parameters as input, and produces aligned sequences. An example with sequences 'CGTATT' and 'GACTTT' is provided, along with the resulting scoring matrix and alignment score.

Uploaded by

Annaya Ch

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views6 pages

Bioinfo

Uploaded by

Annaya Ch

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

Question

Write a code, algorithm for Needleman-wunch and compare

these two sequences?

Algorithm:
The algorithm for Needleman wunch in python is as follow.

1st Step
 Define function with seq1 and seq2, and scoring parameters
match score, mismatch penalty, and gap penalty as
parameters.

2nd Step
 Initialize rows and column.
 rows = len(seq1) + 1
 cols = len(seq2) + 1

3rd Step
 Initialize the first row and column of the scoring matrix with
gap penalties:
 For i from 1 to len(seq1):
 score_matrix[i][0] = gap_penalty * i
 For j from 1 to len(seq2):
 score_matrix[0][j] = gap_penalty * j

4th Step
 Now fill remaining matrix
 For i from 1 to rows:
 For j from 1 to coloumn):
 Calculate the scores for match/mismatch and gap:
 If seq1[i-1] equals seq2[j-1]:
 match = score_matrix[i-1] [j-1] + match_score
 Else:
 match = score_matrix[i-1][j-1] + mismatch_penalty
 delete = score_matrix[i-1][j] + gap_penalty
 insert = score_matrix[i][j-1] + gap_penalty
 Consider the maximum among them using maximum pre-
defined function.
5th Step
 Print the matrix.
 for row in score_matrix:
 print(row)

6th Step
 1. Initialize two empty strings, align1 and align2, to store
the aligned sequences.
 2. Set i to the row index of the bottom-right corner of the
scoring matrix.
 3. Set j to the column index of the bottom-right corner of
the scoring matrix.
 4. While i > 0 and j > 0:
 a. If seq1[i - 1] is equal to seq2[j - 1]:
 - Prepend seq1[i - 1] to align1.
 - Prepend seq2[j - 1] to align2.
 - Decrement i and j by 1.
 b. Else if the current score at score_matrix[i][j] is equal
to score_matrix[i - 1][j - 1] + mismatch_penalty:
 - Prepend seq1[i - 1] to align1.
 - Prepend seq2[j - 1] to align2.
 - Decrement i and j by 1.
 c. Else if the current score at score_matrix[i][j] is equal
to score_matrix[i - 1][j] + gap_penalty:
 - Prepend seq1[i - 1] to align1.
 - Prepend a gap symbol "-" to align2.
 - Decrement i by 1.
 d. Else:
 - Prepend a gap symbol "-" to align1.
 - Prepend seq2[j - 1] to align2.
 - Decrement j by 1.
 5. While i > 0:
 - Prepend seq1[i - 1] to align1.
 - Prepend a gap symbol "-" to align2.
 - Decrement i by 1.
 6. While j > 0:
 - Prepend a gap symbol "-" to align1.
 - Prepend seq2[j - 1] to align2.
 - Decrement j by 1.
 7. Return align1 and align2 as the aligned sequences..

Code
def needleman_wunsch(seq1, seq2, match_score=1, mismatch_penalty=-1, gap_penalty=-2):

# Create the scoring matrix

rows = len(seq1) + 1

cols = len(seq2) + 1

score_matrix = [[0] * cols for _ in range(rows)]

# Initialize the first row and column with gap penalties

for i in range(1, rows):

score_matrix[i][0] = gap_penalty * i

for j in range(1, cols):

score_matrix[0][j] = gap_penalty * j

# Fill in the rest of the scoring matrix

for i in range(1, rows):

for j in range(1, cols):

# Calculate the scores for match/mismatch and gap

if seq1[i - 1] == seq2[j - 1]:

match = score_matrix[i - 1][j - 1] + match_score

else:

match = score_matrix[i - 1][j - 1] + mismatch_penalty

delete = score_matrix[i - 1][j] + gap_penalty

insert = score_matrix[i][j - 1] + gap_penalty

# Choose the maximum score

score_matrix[i][j] = max(match, delete, insert)

for row in score_matrix:

print(row)
# Traceback to find the optimal alignment

align1 = ""

align2 = ""

i, j = rows - 1, cols - 1

while i > 0 and j > 0:

if seq1[i - 1] == seq2[j - 1]:

align1 = seq1[i - 1] + align1

align2 = seq2[j - 1] + align2

i -= 1

j -= 1

elif score_matrix[i][j] == score_matrix[i - 1][j - 1] + mismatch_penalty:

align1 = seq1[i - 1] + align1

align2 = seq2[j - 1] + align2

i -= 1

j -= 1

elif score_matrix[i][j] == score_matrix[i - 1][j] + gap_penalty:

align1 = seq1[i - 1] + align1

align2 = "-" + align2

i -= 1

else:

align1 = "-" + align1

align2 = seq2[j - 1] + align2

j -= 1

while i > 0:

align1 = seq1[i - 1] + align1

align2 = "-" + align2

i -= 1

while j > 0:
align1 = "-" + align1

align2 = seq2[j - 1] + align2

j -= 1

return align1, align2

# Example usage

sequence1 = "CGTATT"

sequence2 = "GACTTT"

alignment1, alignment2 = needleman_wunsch(sequence1, sequence2)

print("Alignment 1:", alignment1)

print("Alignment 2:", alignment2)

Matrix
We have two sequences.
Sequence1=CGTATT
Sequence2=GACTTT
Match score=1
Mismatch=-1
Gap=-2
G A C T T T
0 -2 -4 -6 -8 -10 -12
C -2 -1 -3 -3 -5 -7 -9
G -4 -1 -2 -4 -4 -6 -8
T -6 -3 -2 -3 -3 -3 -5
A -8 -5 -2 -3 -4 -4 -4
T -10 -7 -4 -3 -2 -3 -3
T -12 -9 -6 -5 -2 -1 -2

Sequence1= G A C T T T
Sequence 2= C G T AT T
Score = -2

Bio Ass
No ratings yet
Bio Ass
3 pages
Sol Assignment 4 - Edit Distance & Sequence Alignment
No ratings yet
Sol Assignment 4 - Edit Distance & Sequence Alignment
4 pages
423f11 Lec4 Gaps
No ratings yet
423f11 Lec4 Gaps
17 pages
Early Sequence Aligment
No ratings yet
Early Sequence Aligment
14 pages
Needleman Algo
No ratings yet
Needleman Algo
4 pages
Sequence Comparison Part 3
No ratings yet
Sequence Comparison Part 3
22 pages
Sequence Comparison: Motivation: Finding Similarity Between Sequences Is Important For Many Biological Questions
No ratings yet
Sequence Comparison: Motivation: Finding Similarity Between Sequences Is Important For Many Biological Questions
47 pages
Algorithm
No ratings yet
Algorithm
2 pages
Bioinfo Generic Skill
No ratings yet
Bioinfo Generic Skill
10 pages
Ex 7
No ratings yet
Ex 7
7 pages
Ada 1
No ratings yet
Ada 1
9 pages
Laboratorio #4: Alineamiento Global
No ratings yet
Laboratorio #4: Alineamiento Global
4 pages
Quiz 2 Fall 2021
No ratings yet
Quiz 2 Fall 2021
5 pages
Coding Questions
No ratings yet
Coding Questions
59 pages
Practical V - PYTHON
No ratings yet
Practical V - PYTHON
50 pages
Week 9N
No ratings yet
Week 9N
9 pages
Lecture5 Newest
No ratings yet
Lecture5 Newest
124 pages
Day 11
No ratings yet
Day 11
7 pages
TCS NQT 2023 Coding Questions With Codes Hiringhus
No ratings yet
TCS NQT 2023 Coding Questions With Codes Hiringhus
18 pages
DSP Lab Experiment 4 UET Lahore.
No ratings yet
DSP Lab Experiment 4 UET Lahore.
14 pages
Global Alignment
100% (1)
Global Alignment
40 pages
AI Lab1
No ratings yet
AI Lab1
10 pages
L09 DynamicProgramming - Part03
No ratings yet
L09 DynamicProgramming - Part03
14 pages
Mathematical Lab PDF
No ratings yet
Mathematical Lab PDF
29 pages
Lecture-7-Dynamic Programming Global-Sequence Alignment
No ratings yet
Lecture-7-Dynamic Programming Global-Sequence Alignment
31 pages
Gap Penalty
No ratings yet
Gap Penalty
5 pages
Algoritmo Número (Valor 5 Puntos) : Recursivedet
No ratings yet
Algoritmo Número (Valor 5 Puntos) : Recursivedet
6 pages
Dynamic Programming
No ratings yet
Dynamic Programming
28 pages
HA6 Graf Meinerding Pahl Friedrich
No ratings yet
HA6 Graf Meinerding Pahl Friedrich
5 pages
Ee 342 2024 Midterm Solutions
No ratings yet
Ee 342 2024 Midterm Solutions
3 pages
Taller 1
100% (1)
Taller 1
8 pages
Aoa Codes
No ratings yet
Aoa Codes
15 pages
AI Lab File
No ratings yet
AI Lab File
24 pages
Design and Analysis of Algorithm Lab Manual - Answers
No ratings yet
Design and Analysis of Algorithm Lab Manual - Answers
13 pages
Swapnil. S. Desai Student ID: 1001418334 Email: Assignment 2: Golomb Coding
100% (1)
Swapnil. S. Desai Student ID: 1001418334 Email: Assignment 2: Golomb Coding
5 pages
L-8 Global Alignment
No ratings yet
L-8 Global Alignment
19 pages
DAA Lab File
No ratings yet
DAA Lab File
13 pages
Lec 06
No ratings yet
Lec 06
41 pages
Daa 6,8,10,11
No ratings yet
Daa 6,8,10,11
8 pages
Case StudyAI
No ratings yet
Case StudyAI
9 pages
L9 DynamicProgramming Part02 LCS ED
No ratings yet
L9 DynamicProgramming Part02 LCS ED
31 pages
Dynamic Programming Approach
No ratings yet
Dynamic Programming Approach
32 pages
Lecture1 2
No ratings yet
Lecture1 2
44 pages
Algorithm
No ratings yet
Algorithm
36 pages
Needleman Wunsch
100% (1)
Needleman Wunsch
6 pages
Automata Theory Questions and Answers
No ratings yet
Automata Theory Questions and Answers
10 pages
Artificial Intelligence Lab
No ratings yet
Artificial Intelligence Lab
11 pages
Module 4 AOA
No ratings yet
Module 4 AOA
97 pages
Prathamesh CP
No ratings yet
Prathamesh CP
10 pages
Grpa Week 4 Solutions
No ratings yet
Grpa Week 4 Solutions
3 pages
AI Program Codes 2023
No ratings yet
AI Program Codes 2023
9 pages
Ada Lab File
No ratings yet
Ada Lab File
25 pages
Asymptotic Notation, Review of Functions & Summations
100% (1)
Asymptotic Notation, Review of Functions & Summations
45 pages
Assignment 2
No ratings yet
Assignment 2
2 pages
AI and ML Lab Program
No ratings yet
AI and ML Lab Program
24 pages
Shiv Nadar University CSD101: Introduction To Computing and Programming Lab #4 Expressions, Loops, Functions, 1D Arrays - 1
No ratings yet
Shiv Nadar University CSD101: Introduction To Computing and Programming Lab #4 Expressions, Loops, Functions, 1D Arrays - 1
2 pages
Lecture 5 Introduction Dynamic Programming
No ratings yet
Lecture 5 Introduction Dynamic Programming
52 pages
Python Question
No ratings yet
Python Question
13 pages
Method and Application of Hidden Markov's Model, SVM and Deep Learning Algorithm in Secondary Structure of Protein?
No ratings yet
Method and Application of Hidden Markov's Model, SVM and Deep Learning Algorithm in Secondary Structure of Protein?
4 pages
Data 3
No ratings yet
Data 3
3 pages
Climate Change Biodiversity
No ratings yet
Climate Change Biodiversity
2 pages
Islamiyat 2
No ratings yet
Islamiyat 2
3 pages
Quiz
No ratings yet
Quiz
3 pages
Computer
No ratings yet
Computer
1 page
Communication e Mail
No ratings yet
Communication e Mail
4 pages
Communication in Global
No ratings yet
Communication in Global
4 pages
Biochemistry Assignment
No ratings yet
Biochemistry Assignment
5 pages
Logic Questions'
No ratings yet
Logic Questions'
5 pages
Biostatics Assignment 1-1
No ratings yet
Biostatics Assignment 1-1
3 pages
Data For Final Paper - Ir
No ratings yet
Data For Final Paper - Ir
16 pages
DMDW 4th Module
No ratings yet
DMDW 4th Module
50 pages
ODSExams Merged
No ratings yet
ODSExams Merged
103 pages
Exam Data Structure2
No ratings yet
Exam Data Structure2
2 pages
Engineering 670 Final Exam
No ratings yet
Engineering 670 Final Exam
3 pages
4 Chapter 21 Non Linear Programming
No ratings yet
4 Chapter 21 Non Linear Programming
37 pages
Analysis of Algorithms Slides of Pseudo Code
No ratings yet
Analysis of Algorithms Slides of Pseudo Code
10 pages
Functional - Programming - LISP - Part 2
No ratings yet
Functional - Programming - LISP - Part 2
16 pages
Stable Matching Problem: Gale-Shapley Algorithm Hospital Optimality Context
No ratings yet
Stable Matching Problem: Gale-Shapley Algorithm Hospital Optimality Context
36 pages
##Greedy Algorithms Jump Game Ii - Leetcode
No ratings yet
##Greedy Algorithms Jump Game Ii - Leetcode
5 pages
Module 06. String Algorithms Lecture 3-6
No ratings yet
Module 06. String Algorithms Lecture 3-6
48 pages
Berlekamp-Massey Algorithm Revisited PDF
No ratings yet
Berlekamp-Massey Algorithm Revisited PDF
7 pages
Quantum Networking and Internet
No ratings yet
Quantum Networking and Internet
4 pages
Striver SDE Sheet
No ratings yet
Striver SDE Sheet
8 pages
Number Representation
No ratings yet
Number Representation
7 pages
MCQ On Numerical Methods (50 Q) Part 1
100% (1)
MCQ On Numerical Methods (50 Q) Part 1
23 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
35 pages
Assignment 2 1. Solve by Simplex Method
No ratings yet
Assignment 2 1. Solve by Simplex Method
3 pages
Course Blow Up: Optimization Techniques (UMA 031) : Sanjeev Kumar, Dr. Isha Dhiman
No ratings yet
Course Blow Up: Optimization Techniques (UMA 031) : Sanjeev Kumar, Dr. Isha Dhiman
1 page
CFG To PDA Conversion
No ratings yet
CFG To PDA Conversion
4 pages
Himanshu PPT Transportaion 1212
No ratings yet
Himanshu PPT Transportaion 1212
91 pages
Lecture 13
No ratings yet
Lecture 13
45 pages
Python Updated
No ratings yet
Python Updated
42 pages
VISA Online Assessment Practice Sheet
No ratings yet
VISA Online Assessment Practice Sheet
5 pages
Cade MY: Vineet Loomba Unacademy
100% (1)
Cade MY: Vineet Loomba Unacademy
2 pages
Vidyanidhi Info Tech Academy: PG DAC Question Bank
No ratings yet
Vidyanidhi Info Tech Academy: PG DAC Question Bank
23 pages
Deadlock Prevention, Avoidance, and Detection
No ratings yet
Deadlock Prevention, Avoidance, and Detection
29 pages
Handbooks in Operations Research and Management Science - Vol 12 Discrete Optimization - (Elsevier) - 2005
No ratings yet
Handbooks in Operations Research and Management Science - Vol 12 Discrete Optimization - (Elsevier) - 2005
606 pages
Dsa 2022
No ratings yet
Dsa 2022
3 pages
Pohon
No ratings yet
Pohon
25 pages
Sea130 DS Exp 4
No ratings yet
Sea130 DS Exp 4
5 pages

Bioinfo

Uploaded by

Bioinfo

Uploaded by

Question

Write a code, algorithm for Needleman-wunch and compare

# Create the scoring matrix

score_matrix = [[0] * cols for _ in range(rows)]

# Initialize the first row and column with gap penalties

for i in range(1, rows):

for j in range(1, cols):

# Fill in the rest of the scoring matrix

for i in range(1, rows):

for j in range(1, cols):

# Calculate the scores for match/mismatch and gap

if seq1[i - 1] == seq2[j - 1]:

match = score_matrix[i - 1][j - 1] + match_score

match = score_matrix[i - 1][j - 1] + mismatch_penalty

delete = score_matrix[i - 1][j] + gap_penalty

insert = score_matrix[i][j - 1] + gap_penalty

# Choose the maximum score

score_matrix[i][j] = max(match, delete, insert)

for row in score_matrix:

while i > 0 and j > 0:

if seq1[i - 1] == seq2[j - 1]:

align1 = seq1[i - 1] + align1

align2 = seq2[j - 1] + align2

elif score_matrix[i][j] == score_matrix[i - 1][j - 1] + mismatch_penalty:

align1 = seq1[i - 1] + align1

align2 = seq2[j - 1] + align2

elif score_matrix[i][j] == score_matrix[i - 1][j] + gap_penalty:

align1 = seq1[i - 1] + align1

align2 = "-" + align2

align1 = "-" + align1

align2 = seq2[j - 1] + align2

align1 = seq1[i - 1] + align1

align2 = "-" + align2

align2 = seq2[j - 1] + align2

return align1, align2

alignment1, alignment2 = needleman_wunsch(sequence1, sequence2)

print("Alignment 1:", alignment1)

print("Alignment 2:", alignment2)

You might also like