0% found this document useful (0 votes)

3 views4 pages

???-101 ?????????? ??.2

The document is an assignment on bioinformatics, specifically focusing on differentiating between key concepts such as Pairwise and Multiple Sequence Alignment, Identity and Similarity, BLAST and FASTA, and Database and Data Warehouse. Each section provides definitions, purposes, complexities, and use cases for the terms discussed. The assignment is due on July 7, 2025, and includes links to join relevant expert groups for further collaboration.

Uploaded by

Hijab Queen41

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views4 pages

???-101 ?????????? ??.2

Uploaded by

Hijab Queen41

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Assignment No.

By Yasin Abbas Chaudhary

BIF-101 Introduction to Bioinformatics

Total Marks: 8

Due Date: 07-07-2025

Questions:
Differentiate between following:
a) Pairwise and Multiple Sequence Alignment
b)Identity and Similarity
c) BLAST and FASTA
d)Database and Data warehouse

Solution:
a. Pairwise vs. Multiple Sequence Alignment
1. Definition:
• Pairwise Sequence Alignment compares two sequences (DNA, RNA, or proteins) to find regions
of similarity.
• Multiple Sequence Alignment (MSA) aligns three or more sequences simultaneously to identify
conserved regions.

2. Purpose:
• Pairwise Alignment is primarily used to compare two sequences for similarity or evolutionary
relationships.
• MSA helps analyze conserved domains, motifs, and evolutionary trends among a group of
sequences.

3. Complexity:
• Pairwise is computationally simple and faster, using algorithms like Needleman-Wunsch or
Smith-Waterman.
• MSA is computationally intensive and requires complex algorithms like ClustalW or MUSCLE.

4. Output Information:
• Pairwise Alignment gives information on similarity, identity, and possible homology between just
two sequences.
• MSA shows alignment across many sequences, revealing conserved residues and structural or
functional motifs.

5. Use Cases:
• Pairwise is used in tasks like checking a new gene sequence against a known sequence.
• MSA is used for building phylogenetic trees, identifying conserved sequence patterns, and
understanding protein families.

b. Identity vs. Similarity

1. Definition:
• Identity refers to the exact match of characters (nucleotides or amino acids) at corresponding
positions in aligned sequences.
• Similarity refers to the degree to which sequences are alike based on both identical matches and
conservative substitutions.

2. Measurement:
• Identity is expressed as a percentage of exact matches over the alignment length.
• Similarity includes both exact matches and functionally similar (but not identical) residues using
substitution matrices like PAM or BLOSUM.
3. Implication:
• High Identity indicates strong evolutionary relationship or conserved function.
• High Similarity can still suggest functional or structural relation even if identity is low.

4. Tools Used:
• Identity can be calculated using tools like BLAST or EMBOSS pairwise alignment.
• Similarity considers evolutionary models and is assessed through scoring matrices in tools like
Clustal, BLAST, etc.

5. Use in Bioinformatics:
• Identity is often used in threshold-based sequence filtering (e.g., 90% identity cutoffs).
• Similarity helps in detecting distant homologs and understanding structural/functional
relationships.

c. BLAST vs. FASTA

1. Definition:
• BLAST (Basic Local Alignment Search Tool) finds regions of local similarity between
sequences using a heuristic approach.
• FASTA is an older algorithm that also performs local sequence alignments but uses different
scoring and searching methods.

2. Speed and Accuracy:

• BLAST is faster and more efficient for large database searches due to optimized heuristics.
• FASTA is slightly slower but may be more sensitive in some cases, especially for shorter
sequences.

3. Algorithm Design:
• BLAST breaks query into short words (k-mers), finds matches, then extends them.
• FASTA searches for exact matches (k-tuples), builds diagonals, and then scores the alignments.

4. Output Format:
• BLAST provides a more interactive and detailed output, including graphical displays, scores, e-
values, and alignment segments.
• FASTA gives a textual output showing alignments, scores, and statistical significance.

5. Use in Bioinformatics:
• BLAST is more commonly used today due to its speed and NCBI integration. It’s widely used for
gene annotation, database searching, and homology detection.
• FASTA is still used for teaching, smaller searches, and specific tasks where its sensitivity is
beneficial.

d. Database vs. Data Warehouse

1. Definition:
• Database is a collection of data organized for quick search, retrieval, and updating, typically used
in real-time applications.
• Data Warehouse is a centralized repository that stores historical and current data from multiple
sources for analysis and reporting.

2. Data Nature:
• Database contains real-time, operational data such as daily transactions, user activities, etc.
• Data Warehouse contains historical, integrated, and often large-scale data optimized for query
and analysis.

3. Usage Purpose:
• Database is used for everyday operations, e.g., booking systems, hospital management, bank
transactions.
• Data Warehouse is used for business intelligence, trend analysis, and decision-making processes.

4. Structure and Design:

• Database is designed for high-speed inserts, updates, and deletions. It follows ER models and
normalization rules.
• Data Warehouse is designed for reading and analyzing large datasets. It follows star or snowflake
schemas and may be denormalized.

5. Tools and Examples:

• Databases use systems like MySQL, Oracle, or PostgreSQL for transactional tasks.
• Data Warehouses use tools like Amazon Redshift, Google BigQuery, or Snowflake for analytical
queries.

For upcoming activities join

VU Expert B.S Zoologists (Solution Group)

https://chat.whatsapp.com/LF8UFWqhEzxJHJzQ9bpn46

VU Expert B.S Zoologists (All semester)

https://chat.whatsapp.com/IOBrX1fPvjMLRyi64DP6XW

BIF-101 Expert Zoologists

https://chat.whatsapp.com/JHYW7fjvJRI2J62WpVk2UG

Regards:
VU Expert Zoologists

BIOINFORMATICS
No ratings yet
BIOINFORMATICS
85 pages
Blast & Fasta
No ratings yet
Blast & Fasta
47 pages
Bio506t by Kainat Alvi Arshia Ashfaq-1
No ratings yet
Bio506t by Kainat Alvi Arshia Ashfaq-1
10 pages
Mean Centre - A Statistical Tool in Geography
No ratings yet
Mean Centre - A Statistical Tool in Geography
10 pages
5 Database Similarity Search BLAST
No ratings yet
5 Database Similarity Search BLAST
47 pages
Bio506t Final Temr Mcqs 2023
No ratings yet
Bio506t Final Temr Mcqs 2023
11 pages
Unit 6
No ratings yet
Unit 6
5 pages
Che201 Subjective Midterm Guess Paper 2024 by Sulman Ali-1
No ratings yet
Che201 Subjective Midterm Guess Paper 2024 by Sulman Ali-1
6 pages
IBB - MB.501 Database Search and Sequence Alignment
No ratings yet
IBB - MB.501 Database Search and Sequence Alignment
51 pages
Bioinformatics, Basics To Advance
No ratings yet
Bioinformatics, Basics To Advance
57 pages
Application in Establishing Epidemiology and Variability: Genome & Protein " Sequence Analysis Programs"
100% (3)
Application in Establishing Epidemiology and Variability: Genome & Protein " Sequence Analysis Programs"
23 pages
DIVYA Bioinformatics
No ratings yet
DIVYA Bioinformatics
20 pages
Retrieval of Data
No ratings yet
Retrieval of Data
22 pages
CHE201 M.Q.S File by Amaan Khan - PDF Version 1
No ratings yet
CHE201 M.Q.S File by Amaan Khan - PDF Version 1
25 pages
Bioinformatics Database and Applications
100% (3)
Bioinformatics Database and Applications
82 pages
Unit IV V and VI
No ratings yet
Unit IV V and VI
57 pages
Bioinformatics Intern
No ratings yet
Bioinformatics Intern
8 pages
Project1 Report
No ratings yet
Project1 Report
21 pages
Bio in For Matics
No ratings yet
Bio in For Matics
18 pages
Intro To Bioinformatics Semester 6 Botany
No ratings yet
Intro To Bioinformatics Semester 6 Botany
15 pages
Module 5
No ratings yet
Module 5
23 pages
Module 2 (Bioinformatics)
No ratings yet
Module 2 (Bioinformatics)
81 pages
Database Similarity Searching
No ratings yet
Database Similarity Searching
4 pages
Module - 4 - Reference Course Content
No ratings yet
Module - 4 - Reference Course Content
25 pages
Basics of Bioinformatics
100% (7)
Basics of Bioinformatics
99 pages
Bioinformatics Database Systems (Kevin Byron, Katherine G. Herbert Etc.) (Z-Library)
No ratings yet
Bioinformatics Database Systems (Kevin Byron, Katherine G. Herbert Etc.) (Z-Library)
49 pages
Bioinformatics Lab Assignment Group 3
No ratings yet
Bioinformatics Lab Assignment Group 3
7 pages
Algorithm Design and Scoring Matrices PDF
No ratings yet
Algorithm Design and Scoring Matrices PDF
31 pages
Latthika
No ratings yet
Latthika
21 pages
Blast
100% (1)
Blast
21 pages
BLAST Topic
No ratings yet
BLAST Topic
13 pages
Bioinformatics:: Guide To Bio-Computing and The Internet
No ratings yet
Bioinformatics:: Guide To Bio-Computing and The Internet
34 pages
Human-Machine Interaction Personalization A Review On Gender and Emotion Recognition Through Speech Analysis
No ratings yet
Human-Machine Interaction Personalization A Review On Gender and Emotion Recognition Through Speech Analysis
10 pages
MSC - Bioinformatics - Year1 Detailing by Bioinformatics Centre SPPU - 03082023
No ratings yet
MSC - Bioinformatics - Year1 Detailing by Bioinformatics Centre SPPU - 03082023
33 pages
Computer (Unit2 Notes)
No ratings yet
Computer (Unit2 Notes)
7 pages
Unit 1
No ratings yet
Unit 1
24 pages
Introduction To Different Resources of Bioinformatics and Application PDF
No ratings yet
Introduction To Different Resources of Bioinformatics and Application PDF
55 pages
Bioinfo Course Notes M1 2020 DR Mbulli
No ratings yet
Bioinfo Course Notes M1 2020 DR Mbulli
56 pages
What Gravity Mediated Entanglement Can Really Tell Us About Quantum Gravity
No ratings yet
What Gravity Mediated Entanglement Can Really Tell Us About Quantum Gravity
11 pages
Bioinformatics Tutorial
No ratings yet
Bioinformatics Tutorial
12 pages
Bio Informatics
No ratings yet
Bio Informatics
46 pages
Toolsofbioinforformatics 200511063020
No ratings yet
Toolsofbioinforformatics 200511063020
18 pages
Bioinformatics Questions Based On The Exit Exam
No ratings yet
Bioinformatics Questions Based On The Exit Exam
7 pages
Comprehensive Guide to BLAST: Definitive Reference for Developers and Engineers
From Everand
Comprehensive Guide to BLAST: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
Quick Charging of A Quantum Battery With Superposed Trajecotries
No ratings yet
Quick Charging of A Quantum Battery With Superposed Trajecotries
19 pages
Population Forecasting Methods - Formulas - Example Problems - Practice Problem
No ratings yet
Population Forecasting Methods - Formulas - Example Problems - Practice Problem
10 pages
Lab 1 - Introduction and Protocol
No ratings yet
Lab 1 - Introduction and Protocol
28 pages
ModelQuestions MID Spring2024
No ratings yet
ModelQuestions MID Spring2024
5 pages
Bioinformatics
No ratings yet
Bioinformatics
22 pages
Bioinformatics Learning Framework
No ratings yet
Bioinformatics Learning Framework
7 pages
Need & Emergence of The Field: Speaker Shashi Shekhar Head of Computational Section Biowits Life Sciences
No ratings yet
Need & Emergence of The Field: Speaker Shashi Shekhar Head of Computational Section Biowits Life Sciences
59 pages
SW Project Managment Chapter 3
No ratings yet
SW Project Managment Chapter 3
33 pages
Designing Combinational Logic Circuits in Verilog - 2: Discussion 7.3
No ratings yet
Designing Combinational Logic Circuits in Verilog - 2: Discussion 7.3
32 pages
Elasticsearch Engineering in Practice: Definitive Reference for Developers and Engineers
From Everand
Elasticsearch Engineering in Practice: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
AVL Trees: Algorithms and Balanced Data Structures
From Everand
AVL Trees: Algorithms and Balanced Data Structures
Richard Johnson
No ratings yet
Functions of Several Variables, Partial Derivatives
No ratings yet
Functions of Several Variables, Partial Derivatives
26 pages
PAM Blosum: Assignment 1 Bioinformatics (DSE 1)
100% (3)
PAM Blosum: Assignment 1 Bioinformatics (DSE 1)
9 pages
Efficient String Processing with Trie Structures: Definitive Reference for Developers and Engineers
From Everand
Efficient String Processing with Trie Structures: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
Exploring Database and Analyzing Protein Sequence
No ratings yet
Exploring Database and Analyzing Protein Sequence
70 pages
Bioinformatics Cheat Sheet
No ratings yet
Bioinformatics Cheat Sheet
4 pages
Bioinformatics: ABE 2007 Kent Koster Group 3
No ratings yet
Bioinformatics: ABE 2007 Kent Koster Group 3
43 pages
Introduction To Bioinformatics: Tolga Can
No ratings yet
Introduction To Bioinformatics: Tolga Can
21 pages
Spectral Density
No ratings yet
Spectral Density
27 pages
Unit I Dbms
0% (1)
Unit I Dbms
45 pages
8024 Bio Info
No ratings yet
8024 Bio Info
28 pages
Introduction To Bioinformatics Presentation
No ratings yet
Introduction To Bioinformatics Presentation
13 pages
Bioinformatics Is The Inter-Disciplinary Branch of Biology Which Merges Computer Science, Mathematics and Engineering To Study The Biological Data
No ratings yet
Bioinformatics Is The Inter-Disciplinary Branch of Biology Which Merges Computer Science, Mathematics and Engineering To Study The Biological Data
26 pages
Must Solve 100 Programs Part 2 - 10
No ratings yet
Must Solve 100 Programs Part 2 - 10
11 pages
ML0101EN Clas K Nearest Neighbors CustCat Py v1
100% (1)
ML0101EN Clas K Nearest Neighbors CustCat Py v1
11 pages
WWW Gradplus Pro Lessons Elective IV Digital Image Processing Nagpur University Summer 2019
No ratings yet
WWW Gradplus Pro Lessons Elective IV Digital Image Processing Nagpur University Summer 2019
2 pages
DSP W5 Handouts
No ratings yet
DSP W5 Handouts
10 pages
CR Micro
No ratings yet
CR Micro
2 pages
CR Micro
No ratings yet
CR Micro
2 pages
Bio in For Matics
No ratings yet
Bio in For Matics
17 pages
BI205 Prac 5&6
No ratings yet
BI205 Prac 5&6
11 pages
Module6 Formula
No ratings yet
Module6 Formula
3 pages
Bio Tics
No ratings yet
Bio Tics
7 pages
Bing Qian Montecarlo
No ratings yet
Bing Qian Montecarlo
20 pages
Bioinformatics: Arushi Dinesh Kasi Shruthi
No ratings yet
Bioinformatics: Arushi Dinesh Kasi Shruthi
28 pages
PH/PH/1 Bulk Arrival and Bulk Service Queue With Randomly Varying Environment
No ratings yet
PH/PH/1 Bulk Arrival and Bulk Service Queue With Randomly Varying Environment
12 pages
BTH 403-BTG407 Lecture 1
No ratings yet
BTH 403-BTG407 Lecture 1
6 pages
What Is Bioinformatics
No ratings yet
What Is Bioinformatics
10 pages
A Branch and Bound Algorithm For The Traveling Purchaser Problem
No ratings yet
A Branch and Bound Algorithm For The Traveling Purchaser Problem
9 pages
Basic Tutorial (Part 2 of 8) : Solving Equations
No ratings yet
Basic Tutorial (Part 2 of 8) : Solving Equations
16 pages
Taming The Waves Sine As Activation Function in Deep Neural - Networks PDF
No ratings yet
Taming The Waves Sine As Activation Function in Deep Neural - Networks PDF
12 pages
Fasta and Blast
No ratings yet
Fasta and Blast
3 pages
Math489/889 Stochastic Processes and Advanced Mathematical Finance Homework 7
No ratings yet
Math489/889 Stochastic Processes and Advanced Mathematical Finance Homework 7
3 pages
Bioinformatics: Intended Learning Outcomes
No ratings yet
Bioinformatics: Intended Learning Outcomes
9 pages
Drilling Exercise - Fall21
No ratings yet
Drilling Exercise - Fall21
2 pages
Newton's Divided Difference Polynomial Method of Interpolation
No ratings yet
Newton's Divided Difference Polynomial Method of Interpolation
25 pages
Regular Expressions Cheat Sheet PDF
No ratings yet
Regular Expressions Cheat Sheet PDF
1 page
Summative 1 - Polynomials
No ratings yet
Summative 1 - Polynomials
5 pages
DSA Question Bank
No ratings yet
DSA Question Bank
6 pages
Data Structures & Algorithms Interview Questions You'll Most Likely Be Asked
From Everand
Data Structures & Algorithms Interview Questions You'll Most Likely Be Asked
Vibrant Publishers
1/5 (1)

???-101 ?????????? ??.2

Uploaded by

???-101 ?????????? ??.2

Uploaded by

Assignment No.

By Yasin Abbas Chaudhary

BIF-101 Introduction to Bioinformatics

Due Date: 07-07-2025

b. Identity vs. Similarity

c. BLAST vs. FASTA

2. Speed and Accuracy:

d. Database vs. Data Warehouse

4. Structure and Design:

5. Tools and Examples:

For upcoming activities join

VU Expert B.S Zoologists (All semester)

BIF-101 Expert Zoologists

You might also like