0% found this document useful (0 votes)

36 views18 pages

Alignments & Phylogenetic Trees: Lesk, A. 2 Ed

This document discusses sequence alignment and phylogenetic trees. It introduces sequence alignment as a tool to measure similarity between sequences, determine residue correspondences, and infer evolutionary relationships. It describes pairwise and multiple sequence alignments, and measures of sequence similarity including Hamming distance, Levenshtein distance, and scoring schemes like PAM matrices and BLOSUM matrices. Dot plots are described as a way to visualize pairwise sequence similarity.

Uploaded by

Sevs Lorilla

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

36 views18 pages

Alignments & Phylogenetic Trees: Lesk, A. 2 Ed

Uploaded by

Sevs Lorilla

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

You are on page 1/ 18

Alignments & Phylogenetic Trees

Chapter 4
Lesk, A. 2nd Ed.
Introduction to Sequence Alignment

 Given 2 or more sequences, we initially wish

to
– Measure their similarity
– Determine residue-residue correspondences
– Observe patterns of conservation and variability
– Infer evolutionary relationships
 Major application is annotation of genomes,
involving alignment of structure and function
to as many genes as possible
Sequence Alignment

 Compare nucleotides and amino acids that

appear in corresponding positions in two or
more sequences – identification of residue-
residue correspondences
– Any assignment of correspondences that
preserves order of residues within sequences is
alignment
– Gaps may be introduced
 Basic tool of bioinformatics
Example

 Given two text strings:

– First string =abcde
– Second string = a c d e f
 Reasonable alignment would be
abcde–
a- cdef
Pairwise Sequence Alignments

 For sequences “gctgaacg” and “ctataatc”

Pairwise Sequence Alignments

 Optimal alignment may not be unique

– Several different alignments may give the same
best score
– Minor variations in scoring scheme may change
ranking of alignments, causing different one to
emerge as best
Multiple Sequence Alignment

 Mutual alignment of more than two

sequences
 Much more informative than pairwise
sequence alignments, in terms of revealing
patterns of conservation
Visual Alignment - Dotplot

 Simple picture that gives an overview of pairwise

sequence similarity
– Less obvious is its close relationship to alignments
 Table or matrix
– Rows correspond to residues of one sequence and columns
to residues of other sequence
– Positions in dotplot are left blank if residues are different,
and filled if they match
– Stretches of similar residues show up as diagonals in upper
left-lower right direction
Example
Continued … Dotplot

 Advantage
– Gives quick pictorial statement of the relationship between
two sequences
 Disadvantage
– Its ‘reach’ into the realm of distantly related sequences is
poor
 In analyzing sequences, one should always look at
dotplot to be sure of not missing anything obvious,
but be prepared to apply more subtle tools
Some Typical Dotplot
Comparisons

 Divergent sequences where only a segment is

homologous
 Long insertions and deletions
 Tandem repeats
– Square shape of pattern is characteristic of these repeats
Using Dotlet

 Dotlet is one of handiest tools for making dot

plots
 Dotlet is a Java applet
 Open and download applet at the following
site:
– www.isrec.isb-sib.ch/java/dotlet
 Use Firefox or IE (if one doesn’t work, use
the other)
Measures of Sequence Similarity

 Hamming distance
– Number of positions with mismatching characters
defined between two strings of equal length
 Levenshtein, or edit distance
– Minimal number of ‘edit operations’ required to
change one string into another between two
strings of not necessarily equal length
 Edit operation is deletion, insertion or alteration of single
character in either sequence
Examples

 agtc Hamming distance = 2

cgta
 ag-tcc Levenshtein distance = 3
cgctca

 Hamming and Levenshtein distances

measure dissimilarity of two sequences
– Similar sequences give small distances and
dissimilar sequences give large distances
Scoring Schemes

 A scoring system must account for residue

substitutions, and insertions or deletions
– An insertion, from one sequence’s point of view, is
a deletion as seen by the other
 Deletions, or gaps in a sequence, will have
scores that depend on their lengths
 Algorithms for optimal alignment can seek
either to minimize a dissimilarity measure, or
to maximize a scoring function
Scoring Schemes

 For nucleic acid sequences

– Common use of simple scheme for substitutions:
+1 for a match, -1 for a mismatch, or
– More complicated scheme based on higher
frequency of transition mutations (purine 
purine and pyrimidine  pyriimidine, a  g
and t  c) than transversion mutations
(purine  pyrimidine, (a or g)  (t or c))
Scoring Schemes

 For proteins
– A variety of scoring schemes have been proposed
 Dayhoff matrices or PAM (Percent Accepted Mutation) –
a measure of sequence divergence

– PAM 0 30 80 110 200 250

% identity 100 75 50 60 25 20

– PAM250 is appropriate level for practical work

Scoring Schemes

 BLOSUM matrices
– Developed by S. Henikoff and J.G. Henikof for scoring
substitutions in amino acid sequence comparison
– Goal was to replace Dayhoff matrix with one that would
perform best in identifying distant relationships by making
use of much larger amount of data that had become
available since Dayhoff’s work
– Based on BLOCKS database of aligned protein sequences,
hence the name BLOcks SUbstition Matrix
– BLOSUM62 commonly-used substitution matrix

04 Nursing Process of MHN
100% (1)
04 Nursing Process of MHN
13 pages
Lecture1 Loi
No ratings yet
Lecture1 Loi
52 pages
Unit 3 Sequence Alignment and Phylogenetic Tree
No ratings yet
Unit 3 Sequence Alignment and Phylogenetic Tree
70 pages
Sequence Alignment and Searching
No ratings yet
Sequence Alignment and Searching
37 pages
Sequence Alignment Methods Final
No ratings yet
Sequence Alignment Methods Final
69 pages
Computational Biology (3) Alignment Algorithms: by Dr. Safynaz Abdel-Fattah Computer Science Department
No ratings yet
Computational Biology (3) Alignment Algorithms: by Dr. Safynaz Abdel-Fattah Computer Science Department
107 pages
Unit 2.1
No ratings yet
Unit 2.1
77 pages
Sequence Alignment Presentation
No ratings yet
Sequence Alignment Presentation
27 pages
B.I Sec 4.
No ratings yet
B.I Sec 4.
18 pages
Lec 02
No ratings yet
Lec 02
103 pages
Genomics and Similarity Search
No ratings yet
Genomics and Similarity Search
43 pages
Bioinfo Ders 7 ALLIGNMENT - 1
No ratings yet
Bioinfo Ders 7 ALLIGNMENT - 1
55 pages
Unit Ii
No ratings yet
Unit Ii
14 pages
Sequence Alignment Methods and Algorithms
75% (4)
Sequence Alignment Methods and Algorithms
37 pages
Sequence Alignment Methods and Algorithms
No ratings yet
Sequence Alignment Methods and Algorithms
37 pages
Pairwise Alignment Prelab PDF
No ratings yet
Pairwise Alignment Prelab PDF
87 pages
Sequence Analysis in Bioinformatics
No ratings yet
Sequence Analysis in Bioinformatics
18 pages
Importance and Significance of Sequence Alignment - pptx12
No ratings yet
Importance and Significance of Sequence Alignment - pptx12
15 pages
Sequence Analysis - Pairwise Alignment
No ratings yet
Sequence Analysis - Pairwise Alignment
26 pages
AsBioinfo Ders 7 ALLIGNMENT - 1
No ratings yet
AsBioinfo Ders 7 ALLIGNMENT - 1
9 pages
Sequence Alignment
No ratings yet
Sequence Alignment
27 pages
Alignment Methods
No ratings yet
Alignment Methods
33 pages
L6-Pairwise Seq Alignment
No ratings yet
L6-Pairwise Seq Alignment
70 pages
Unit - Ii Sequence Analysis: Pair-Wise Sequence Comparison
No ratings yet
Unit - Ii Sequence Analysis: Pair-Wise Sequence Comparison
17 pages
Sequence Alignment
No ratings yet
Sequence Alignment
36 pages
Bio Medical Tics - Sequence Analysis - Alignment - 2011
No ratings yet
Bio Medical Tics - Sequence Analysis - Alignment - 2011
96 pages
Sequence Alignment
No ratings yet
Sequence Alignment
7 pages
Sequence Alingment
No ratings yet
Sequence Alingment
10 pages
Lecture 4
No ratings yet
Lecture 4
22 pages
Module II
No ratings yet
Module II
51 pages
Msa MTech
No ratings yet
Msa MTech
17 pages
W03 Pairwise
No ratings yet
W03 Pairwise
55 pages
Sequence Alignment
No ratings yet
Sequence Alignment
24 pages
Chap 03 BioInfo
No ratings yet
Chap 03 BioInfo
15 pages
Sequence Comparison
No ratings yet
Sequence Comparison
39 pages
Sequence Analysis - Alignment
No ratings yet
Sequence Analysis - Alignment
57 pages
Sequence Alignment
No ratings yet
Sequence Alignment
25 pages
Lecture 6 - Sequence Analysis
No ratings yet
Lecture 6 - Sequence Analysis
28 pages
Introduction To Bioinformatics Lecture 3
No ratings yet
Introduction To Bioinformatics Lecture 3
20 pages
Need & Emergence of The Field: Speaker Shashi Shekhar Head of Computational Section Biowits Life Sciences
No ratings yet
Need & Emergence of The Field: Speaker Shashi Shekhar Head of Computational Section Biowits Life Sciences
59 pages
Lecture 6 Evolutionary Sequence Alignment Algorithms
No ratings yet
Lecture 6 Evolutionary Sequence Alignment Algorithms
26 pages
Bioinformatics I
No ratings yet
Bioinformatics I
39 pages
Lecture 5: Multiple Sequence Alignment: Introduction To Computational Biology
No ratings yet
Lecture 5: Multiple Sequence Alignment: Introduction To Computational Biology
34 pages
Pairwise Sequence Alignment
No ratings yet
Pairwise Sequence Alignment
12 pages
PCB Lect02 Pairwise Allign
No ratings yet
PCB Lect02 Pairwise Allign
51 pages
Bioinformatics Pairwise Alignment
No ratings yet
Bioinformatics Pairwise Alignment
128 pages
BT302 L3 Psa
No ratings yet
BT302 L3 Psa
47 pages
Dr. Zoya Khalid Zoya - Khalid@nu - Edu.pk
No ratings yet
Dr. Zoya Khalid Zoya - Khalid@nu - Edu.pk
51 pages
Sequence Alignment: "Continuing.." (5th Week)
No ratings yet
Sequence Alignment: "Continuing.." (5th Week)
61 pages
5.pairwise Alignment
No ratings yet
5.pairwise Alignment
85 pages
BLAST and Sequence Alignment
No ratings yet
BLAST and Sequence Alignment
36 pages
Bioinformatics Alignment
No ratings yet
Bioinformatics Alignment
128 pages
L3.4 Alignment
No ratings yet
L3.4 Alignment
90 pages
5 Sequence Alignment
No ratings yet
5 Sequence Alignment
21 pages
LO5 Pairwise Sequence Alignment
No ratings yet
LO5 Pairwise Sequence Alignment
11 pages
Lecture 3 and 4 LSM2241
No ratings yet
Lecture 3 and 4 LSM2241
6 pages
Sequencing Alignment & Its Methods Group II
No ratings yet
Sequencing Alignment & Its Methods Group II
12 pages
Sequence Alignment and Searching
No ratings yet
Sequence Alignment and Searching
54 pages
Bioinformatics Seminar3rdOct18
No ratings yet
Bioinformatics Seminar3rdOct18
25 pages
Random Sample Consensus: Robust Estimation in Computer Vision
From Everand
Random Sample Consensus: Robust Estimation in Computer Vision
Fouad Sabry
No ratings yet
Exercises of Numerical Analysis
From Everand
Exercises of Numerical Analysis
Simone Malacrida
No ratings yet
Prof Ed 7 Rating Scale
No ratings yet
Prof Ed 7 Rating Scale
3 pages
Topic 3 Me111 PDF
No ratings yet
Topic 3 Me111 PDF
25 pages
Engineering Interview Questions
No ratings yet
Engineering Interview Questions
66 pages
Test CAE
No ratings yet
Test CAE
10 pages
00 MCB BC-L Series Leaflet
No ratings yet
00 MCB BC-L Series Leaflet
2 pages
Installation Art: New Media Art
No ratings yet
Installation Art: New Media Art
16 pages
After Effects Reference (006-050)
No ratings yet
After Effects Reference (006-050)
45 pages
Futo Digital Bootcamp 2024 Timetable
No ratings yet
Futo Digital Bootcamp 2024 Timetable
3 pages
VAC Choke Multivariadores sandCoresDatasheet
No ratings yet
VAC Choke Multivariadores sandCoresDatasheet
16 pages
Franck Hertz
No ratings yet
Franck Hertz
6 pages
Using The TI-73:: A Guide For Teachers
No ratings yet
Using The TI-73:: A Guide For Teachers
86 pages
Spesifikasi Rig 450 HP (BMA#06)
No ratings yet
Spesifikasi Rig 450 HP (BMA#06)
21 pages
GE 7 - STS Module 5
No ratings yet
GE 7 - STS Module 5
16 pages
Uuuu U U U U: Registers (16-Bit)
No ratings yet
Uuuu U U U U: Registers (16-Bit)
3 pages
Teaching Early Numeracy Skills Hands-On Learning in Times of The Covid-19 Pandemic
No ratings yet
Teaching Early Numeracy Skills Hands-On Learning in Times of The Covid-19 Pandemic
17 pages
16 - The New Public Service Serving Rather Than Steering
No ratings yet
16 - The New Public Service Serving Rather Than Steering
11 pages
A Review of Daylighting Design and Implementation in Buildings 2018
No ratings yet
A Review of Daylighting Design and Implementation in Buildings 2018
10 pages
Apple Supplier List 2013
No ratings yet
Apple Supplier List 2013
33 pages
20 Things To Do After Installing Elementary OS Freya
No ratings yet
20 Things To Do After Installing Elementary OS Freya
2 pages
Hard Work, Determination, and Persistence: 3 Keywords in Life
No ratings yet
Hard Work, Determination, and Persistence: 3 Keywords in Life
2 pages
Eyongand Akpa Publication 2
No ratings yet
Eyongand Akpa Publication 2
13 pages
List of Some Implementation Based Problems On Spoj
No ratings yet
List of Some Implementation Based Problems On Spoj
2 pages
READINGS On The Road
100% (1)
READINGS On The Road
80 pages
Class 6 History Worksheet
No ratings yet
Class 6 History Worksheet
5 pages
Harrogate International Application Form
No ratings yet
Harrogate International Application Form
4 pages
Section 7 Gravitational Fields
No ratings yet
Section 7 Gravitational Fields
39 pages
Xu2020 Social MEDIA
No ratings yet
Xu2020 Social MEDIA
14 pages
Semi Finals Examination: Multiple Choice
No ratings yet
Semi Finals Examination: Multiple Choice
6 pages
Recruitment and Selection
No ratings yet
Recruitment and Selection
2 pages

Alignments & Phylogenetic Trees: Lesk, A. 2 Ed

Uploaded by

Alignments & Phylogenetic Trees: Lesk, A. 2 Ed

Uploaded by

Alignments & Phylogenetic Trees

 Given 2 or more sequences, we initially wish

 Compare nucleotides and amino acids that

 Given two text strings:

 For sequences “gctgaacg” and “ctataatc”

 Optimal alignment may not be unique

 Mutual alignment of more than two

 Simple picture that gives an overview of pairwise

 Divergent sequences where only a segment is

 Dotlet is one of handiest tools for making dot

 agtc Hamming distance = 2

 Hamming and Levenshtein distances

 A scoring system must account for residue

 For nucleic acid sequences

– PAM 0 30 80 110 200 250

– PAM250 is appropriate level for practical work

You might also like