Tutorial Week 05 Data Exploration

The document discusses calculating similarity measures on frequency data and ranking data points based on similarity to a query point using different distance measures. It also discusses normalizing data and comparing different visualization techniques.

Uploaded by

SHABIT MAHMUD

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views2 pages

Tutorial Week 05 Data Exploration

Uploaded by

SHABIT MAHMUD

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

বঙ্গবন্ধু শেখ মুজিবুর রহমান জিজিটাল ইউজনভাজসিজট, বাাংলাদেে

কাজলয়াককর, গাজীপুর

Week 05 Tutorial: Data Exploration

1 Given data:

p=1000000000
q=0000001001

The frequency table is:

q=1 q=0
p=1 0 1
p=0 2 7

Calculate the Simple matching coefficient and the Jaccard coefficient.

2 It is important to define or select similarity measures in data analysis. However, there is no commonly
accepted subjective similarity measure. Results can vary depending on the similarity measures used.
Nonetheless, seemingly different similarity measures may be equivalent after some transformation.
Suppose we have the following two-dimensional data set:

A1 A2
x1 1.5 1.7
x2 2 1.9
x3 1.6 1.8
x4 1.2 1.5
x5 1.5 1.0

(a) Consider the data as two-dimensional data points. Given a new data point, x = (1.4, 1.6) as a
query, rank the database points based on similarity with the query using Euclidean distance,
Manhattan distance, supremum distance, and cosine similarity.

(b) Normalize the data set to make the norm of each data point equal to 1. Use Euclidean distance on
the transformed data to rank the data points.

Prepared by: Nurjahan Nipa, Lecturer, Department of Internet of Things & Robotics Engineering (IRE), BDU Page 1|2
বঙ্গবন্ধু শেখ মুজিবুর রহমান জিজিটাল ইউজনভাজসিজট, বাাংলাদেে
কাজলয়াককর, গাজীপুর

5 Compare between following visualization techniques i) Pixel-oriented visualization techniques ii)

Geometric projection visualization techniques iii) Icon-based visualization techniques iv) Hierarchical
visualization techniques v) Visualizing complex data and relations.

Prepared by: Nurjahan Nipa, Lecturer, Department of Internet of Things & Robotics Engineering (IRE), BDU Page 2|2

2.8 DataMining
100% (2)
2.8 DataMining
4 pages
Machine Learning Machine Learning Data
No ratings yet
Machine Learning Machine Learning Data
43 pages
Data Similarity
0% (1)
Data Similarity
18 pages
Titas Gas Sub Question Solution
No ratings yet
Titas Gas Sub Question Solution
10 pages
Lecture 3 Annotated
No ratings yet
Lecture 3 Annotated
44 pages
Data Mining: Characterization: Jimma University, Faculty of Computing Arranged By: Dessalegn Y
No ratings yet
Data Mining: Characterization: Jimma University, Faculty of Computing Arranged By: Dessalegn Y
79 pages
Slides of Lecture 2 of CS3319 SJTU
No ratings yet
Slides of Lecture 2 of CS3319 SJTU
35 pages
Efficient Similarity Search On Vector Sets
No ratings yet
Efficient Similarity Search On Vector Sets
19 pages
Chapter - 2 Data Mining
No ratings yet
Chapter - 2 Data Mining
21 pages
Cluster Analysis Introduction
No ratings yet
Cluster Analysis Introduction
23 pages
Lecture 2. Similarity Measures For Cluster Analysis
No ratings yet
Lecture 2. Similarity Measures For Cluster Analysis
31 pages
Ict 25
No ratings yet
Ict 25
20 pages
Bangladesh Informatics Olympiad 2013 (Divisional)
0% (1)
Bangladesh Informatics Olympiad 2013 (Divisional)
10 pages
Tutorial Week 02 Data Science Process
No ratings yet
Tutorial Week 02 Data Science Process
3 pages
Tutorial Week 01 Introduction To Data Science
No ratings yet
Tutorial Week 01 Introduction To Data Science
3 pages
Class-Data Preprocessing-IV
No ratings yet
Class-Data Preprocessing-IV
28 pages
Data Mining Homework 1
100% (1)
Data Mining Homework 1
2 pages
DS5 Statistics
No ratings yet
DS5 Statistics
67 pages
02data Part4
No ratings yet
02data Part4
28 pages
Similarity
No ratings yet
Similarity
19 pages
Poly 1
No ratings yet
Poly 1
53 pages
TE IT DMBI Module2 Data Preprocessing L8-L11
No ratings yet
TE IT DMBI Module2 Data Preprocessing L8-L11
73 pages
Machile Learning Mid Note
No ratings yet
Machile Learning Mid Note
7 pages
29.measuring Data Similarity and Dissimilarity Introduction
No ratings yet
29.measuring Data Similarity and Dissimilarity Introduction
43 pages
UNIT V DWM Notes
No ratings yet
UNIT V DWM Notes
18 pages
Lec-3. Datamining-Similarity-Distance-Ext
No ratings yet
Lec-3. Datamining-Similarity-Distance-Ext
104 pages
Quiz2 Source
No ratings yet
Quiz2 Source
8 pages
Wa0001.
No ratings yet
Wa0001.
14 pages
RL3.2 Data Similarity 1
No ratings yet
RL3.2 Data Similarity 1
17 pages
DM&DW Individual Assignment (50%)
No ratings yet
DM&DW Individual Assignment (50%)
4 pages
Lec2 Activities
No ratings yet
Lec2 Activities
2 pages
Tut 7
No ratings yet
Tut 7
1 page
Recommender Systems Assignment
No ratings yet
Recommender Systems Assignment
10 pages
Important Questions Related To Module-1 & Module-2
No ratings yet
Important Questions Related To Module-1 & Module-2
2 pages
Tut 8
No ratings yet
Tut 8
1 page
02 Data
No ratings yet
02 Data
35 pages
2 Similarity Disimilarity Measure
No ratings yet
2 Similarity Disimilarity Measure
35 pages
Document 1 3
No ratings yet
Document 1 3
11 pages
Assignment 2
No ratings yet
Assignment 2
4 pages
IDS4
No ratings yet
IDS4
50 pages
Assignment 2
No ratings yet
Assignment 2
6 pages
Mobile Computing
No ratings yet
Mobile Computing
3 pages
Data Mining Paer 2 Oct 12, 2024 - 241012 - 224522
No ratings yet
Data Mining Paer 2 Oct 12, 2024 - 241012 - 224522
13 pages
Lec 3
No ratings yet
Lec 3
60 pages
To Students Data Mining Part-2 Sept 13 - 240913 - 160930
No ratings yet
To Students Data Mining Part-2 Sept 13 - 240913 - 160930
5 pages
Khanpur Nirmala Bala Sarkar Girls
No ratings yet
Khanpur Nirmala Bala Sarkar Girls
4 pages
Part A Assignment - No - 8
No ratings yet
Part A Assignment - No - 8
19 pages
Similarity Based Learning (Part 2)
No ratings yet
Similarity Based Learning (Part 2)
15 pages
Module 4 - Chapter 2
No ratings yet
Module 4 - Chapter 2
14 pages
Rsfinal
No ratings yet
Rsfinal
30 pages
CSC 522 Lecture10
No ratings yet
CSC 522 Lecture10
30 pages
Data Mining and Predictive Modeling: Lecture 13: Measuring Data Similarity
No ratings yet
Data Mining and Predictive Modeling: Lecture 13: Measuring Data Similarity
19 pages
CSE 1 PPT MiniTest 12feb24 Similarity
No ratings yet
CSE 1 PPT MiniTest 12feb24 Similarity
11 pages
Class 1c - DataFundamentals
No ratings yet
Class 1c - DataFundamentals
27 pages
9-2 Data Analysis and Pre-Processing Part 2 PDF
No ratings yet
9-2 Data Analysis and Pre-Processing Part 2 PDF
27 pages
2 2 Data
No ratings yet
2 2 Data
27 pages
Similarity Measures Le 512
No ratings yet
Similarity Measures Le 512
14 pages
Module 2 Notes Bcs602
No ratings yet
Module 2 Notes Bcs602
19 pages
Module-2 Notes-Bcs602
No ratings yet
Module-2 Notes-Bcs602
18 pages

Tutorial Week 05 Data Exploration

Uploaded by

Tutorial Week 05 Data Exploration

Uploaded by

বঙ্গবন্ধু শেখ মুজিবুর রহমান জিজিটাল ইউজনভাজসিজট, বাাংলাদেে

Week 05 Tutorial: Data Exploration

The frequency table is:

Calculate the Simple matching coefficient and the Jaccard coefficient.

5 Compare between following visualization techniques i) Pixel-oriented visualization techniques ii)

You might also like