0% found this document useful (0 votes)

91 views

Machine Learning Introduction Presentation

This document provides an introduction to machine learning research on time series data. It discusses common machine learning tasks like classification, clustering, and anomaly detection applied to time series. It also covers challenges of time series data like high dimensionality and volume. The document summarizes techniques for speeding up similarity search on time series like dimensionality reduction, indexing, segmentation, and discretization. It discusses alternatives to Euclidean distance for measuring time series similarity, such as cross correlation and dynamic time warping. The document concludes by mentioning other areas of time series research like anomaly detection and change point detection.

Uploaded by

Dino Mandic

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

91 views

Machine Learning Introduction Presentation

Uploaded by

Dino Mandic

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 35

Introduction to Machine Learning Research on Time Series

Umaa Rebbapragada Tufts University Advisor: Carla Brodley 1/29/07

Machine Learning (ML)

Originally a subeld of AI Extraction of rules and patterns from data sets Focused on:
Computational complexity Memory

Machine Learning Tasks for Time Series

Classication Clustering Semi-supervised learning Anomaly Detection

Assumptions
Univariate time series Time series databases

Single Time Series

A single long time series can be converted into a set of smaller time series by sliding a window incrementally across the time series :

Window length is usually a user-specied parameter.

Challenges of Times Series Data

High dimensional Voluminous Requires fast technique

Brute Force Similarity Search

Given query time series Q, the best match by sequential scanning is found by:

O(nd) Finding the nearest neighbor for each time series in the database is prohibitive.

Similarity Search
Clustering and classication methods perform many similarity calculations Some require storage of the k nearest neighbors of each data instance Critical that these calculations be fast

Speeding up Similarity Search

Alternate time series representations Search databases faster New similarity metrics

Data Mining Time Series Toolbox

Indexing Dimensionality Reduction Segmentation Discretization Similarity metric

Indexing
Faster than a sequential scan Insertions and deletions do not require rebuilding the entire index Partition the data into regions Search regions that contain a likely match Requires a similarity metric that obeys triangle inequality

Indexing
R-trees kd-trees linear quad-trees grid-les

Indexing on Times Series Data

High dimensionality slows down speed of computation Curse of dimensionality inhibits efciency of of indexing

Dimensionality Reduction
Reduces the size of the time series Distance on transformed data should lower bound the original distance

This guarantees no false dismissals (false negatives)

Dimensionality Reduction: DFT, DWT, SVD

Represent time series using subsets of
Fourier coefcients Wavelet coefcients eigenvalue/vectors

Euclidean-distance is lower-bounded on DFT1, DWT2, SVD3

[1] C. Faloutsos et al.: Fast Subsequence Matching in Time-Series Databases. SIGMOD Conference 1994: 419-429 [2] K. Chan and A. Fu: Efcient Time Series Matching by Wavelets. ICDE 1999: 126-133 [3] F. Korn et al.: Efciently Supporting Ad Hoc Queries in Large Datasets of Time Sequences. SIGMOD Conference 1997: 289-300

Gemini Framework
Faloutsos et al., 1994 Map each time series to a lower dimension Store in multi-dimensional indexing structure

C. Faloutsos et al.: Fast Subsequence Matching in Time-Series Databases. SIGMOD Conference 1994: 419-429

Piecewise Aggregate Approximation (PAA)

Eamonn J. Keogh, et al.: Dimensionality Reduction for Fast Similarity Search in Large Time Series Databases. Knowl. Inf. Syst. 3(3): 263-286 (2001) Fig: Eamonn J. Keogh, et al.: HOT SAX: Efciently Finding the Most Unusual Time Series Subsequence. ICDM 2005: 226-233

Segmentation
Represent the time series in smaller, less complex segments.
Piecewise Linear Approximation (PLA) Minimum Bounding Rectangles (MBR)

Piecewise Linear Approximation (PLA)

Minimum-Bounding Rectangles (MBR)

Fig: A. Anagnostopoulos et al: Global distance-based segmentation of trajectories. SIGKDD Conference 2006: 34-43

Discretization
Transforms a real-valued time series into a sequence of characters from a discrete alphabet Dimensionality reduction implicit Allows use of string functions on time series

SAX

Jessica Lin et al. A symbolic representation of time series, with implications for streaming algorithms. DMKD 2003: 2-11 Fig: Eamonn J. Keogh, et al.: HOT SAX: Efciently Finding the Most Unusual Time Series Subsequence. ICDM 2005: 226-233

Is Euclidean Distance Best Metric?

Everything discussed so far used ED as similarity metric Is it the best similarity metric for time series?

Drawbacks of Euclidean Distance

Requires two time series to have same dimensionality 1-to-1 alignment of the time axis

Cross Correlation
Cross correlation with convolution can nd optimal phase shift to maximize similarity

Fig: P. Protopapas et al.: Finding outlier light-curves in catalogs of periodic variable stars. Mon. Not. Roy. Astron. Soc. 369 (2006) 677-696

Cross Correlation
Optimal phase shift (to left) of solid line is 0.3

Fig: P. Protopapas et al.: Finding outlier light-curves in catalogs of periodic variable stars. Mon. Not. Roy. Astron. Soc. 369 (2006) 677-696

Dynamic Time Warping (DTW)

DTW allows many-to-one alignment Time series need not be same size

Warped

Time Axis

Fig: Y. Sakurai, et al.: FTW: fast similarity search under the time warping distance. PODS 2005: 326-337 D. J. Berndt, and J. Clifford: Finding Patterns in Time Series: A Dynamic Programming Approach. Advances in Knowledge Discovery and Data Mining 1996: 229-248

DTW Algorithm

Fig: Y. Sakurai, et al.: FTW: fast similarity search under the time warping distance. PODS 2005: 326-337

Drawbacks of DTW
Computationally expensive Does not adhere to triangle inequality => cannot use it for indexing

Making DTW Faster

Global constraints:

Sakoe-Chiba Band

Itakura Parallelogram

Y. Sakurai, et al.: FTW: fast similarity search under the time warping distance. PODS 2005: 326-337

Making DTW Faster

Y. Sakurai et al.: FTW: fast similarity search under the time warping distance. PODS 2005: 326-337 E. Keogh and C. Ratanamahatana: Exact indexing of dynamic time warping. Knowl. Inf. Syst. 7(3): 358-386 (2005) Y. Zhu and D. Shasha: Warping Indexes with Envelope Transforms for Query by Humming. SIGMOD Conference 2003: 181-192 E. Keogh and M. Pazzani: Scaling up dynamic time warping for datamining applications. KDD 2000: 285-289 B.-K. Yi et al.: Efcient Retrieval of Similar Time Sequences Under Time Warping. ICDE 1998: 201-208

Other Areas of Research

Anomaly Detection Change Point Detection

Thesis Research
Anomaly detection methods
fast preserve interesting features

Thank You

Marine Fuel Oil RMG 380 (Ifo 380)
No ratings yet
Marine Fuel Oil RMG 380 (Ifo 380)
1 page
TPMC Offer 20190920
No ratings yet
TPMC Offer 20190920
2 pages
TSIndexing
No ratings yet
TSIndexing
64 pages
Pattern Matching With Acceleration Data: Pramod Vemulapalli
No ratings yet
Pattern Matching With Acceleration Data: Pramod Vemulapalli
29 pages
Exact Indexing of Dynamic Time warping
No ratings yet
Exact Indexing of Dynamic Time warping
29 pages
Audio Signa
No ratings yet
Audio Signa
23 pages
Exact Indexing of Dynamic Time Warping
No ratings yet
Exact Indexing of Dynamic Time Warping
30 pages
Data Mining
No ratings yet
Data Mining
22 pages
Multimedia 3
No ratings yet
Multimedia 3
16 pages
SIGKDD Trillion PDF
No ratings yet
SIGKDD Trillion PDF
9 pages
Faster retrieval with a two-pass dynamic-time-warping lower bound
No ratings yet
Faster retrieval with a two-pass dynamic-time-warping lower bound
12 pages
Fast Exact Dynamic Time Warping On Run-Length Encoded Time Series
No ratings yet
Fast Exact Dynamic Time Warping On Run-Length Encoded Time Series
8 pages
Data Mining-Mining Time Series Data
0% (1)
Data Mining-Mining Time Series Data
7 pages
Scaling Up Dynamic Time Warping For Datamining Applications: Eamonn J. Keogh Michael J. Pazzani
No ratings yet
Scaling Up Dynamic Time Warping For Datamining Applications: Eamonn J. Keogh Michael J. Pazzani
5 pages
l8 Signal Extraction
No ratings yet
l8 Signal Extraction
80 pages
Correlation Based Dynamic Time Warping of Multivariate Time Series
No ratings yet
Correlation Based Dynamic Time Warping of Multivariate Time Series
28 pages
Searching and Mining Trillions of Time Series Subsequences Under Dynamic Time Warping
No ratings yet
Searching and Mining Trillions of Time Series Subsequences Under Dynamic Time Warping
9 pages
Similarity Search On Time Series Data
No ratings yet
Similarity Search On Time Series Data
37 pages
Distance Measures For Effective Clustering of ARIMA Time-Series
No ratings yet
Distance Measures For Effective Clustering of ARIMA Time-Series
8 pages
Engineering Applications of Artificial Intelligence: Tak-Chung Fu
No ratings yet
Engineering Applications of Artificial Intelligence: Tak-Chung Fu
18 pages
A Review On Time Series Data Mining
100% (1)
A Review On Time Series Data Mining
18 pages
2017, Nguyen - Ranked_time_series_matching_by_interleaving_similarity_distances
No ratings yet
2017, Nguyen - Ranked_time_series_matching_by_interleaving_similarity_distances
10 pages
Faster Retrieval With A Two-Pass Dynamic-Time-Warping Lower Bound
100% (1)
Faster Retrieval With A Two-Pass Dynamic-Time-Warping Lower Bound
26 pages
T25. Forecasting Big Time Series - Theory and Practice
No ratings yet
T25. Forecasting Big Time Series - Theory and Practice
166 pages
DTW Features
No ratings yet
DTW Features
29 pages
Toward Accurate Dynamic Time Warping in Linear Tim
No ratings yet
Toward Accurate Dynamic Time Warping in Linear Tim
12 pages
Making The Dynamic Time Warping Distance Warping-Invariant: Pattern Recognition May 2019
No ratings yet
Making The Dynamic Time Warping Distance Warping-Invariant: Pattern Recognition May 2019
32 pages
Temporal Data Mining: Time Series Analysis and Time-Lag Detection
No ratings yet
Temporal Data Mining: Time Series Analysis and Time-Lag Detection
11 pages
A Review On Distance Based Time Series Classification
No ratings yet
A Review On Distance Based Time Series Classification
28 pages
Extensions and Relationships of Some Existing Lower-Bound Functions For Dynamic Time Warping
No ratings yet
Extensions and Relationships of Some Existing Lower-Bound Functions For Dynamic Time Warping
24 pages
SM2524
No ratings yet
SM2524
17 pages
Time Alignment Measurement For Time Series
No ratings yet
Time Alignment Measurement For Time Series
12 pages
Kshape
No ratings yet
Kshape
49 pages
LinesDAMI2015
No ratings yet
LinesDAMI2015
31 pages
1512.04349v1
No ratings yet
1512.04349v1
53 pages
Clustering Time Series Online in A Transformed Space
No ratings yet
Clustering Time Series Online in A Transformed Space
7 pages
Time Series Utcn
No ratings yet
Time Series Utcn
39 pages
Research
No ratings yet
Research
2 pages
Evaluation of Time Series
No ratings yet
Evaluation of Time Series
12 pages
Electrical Engineering and Computer Science Department
No ratings yet
Electrical Engineering and Computer Science Department
27 pages
03 Learning Optimal Warping Window Size of DTW
No ratings yet
03 Learning Optimal Warping Window Size of DTW
6 pages
DTW Dynamic Time Warping
No ratings yet
DTW Dynamic Time Warping
123 pages
Time Series
No ratings yet
Time Series
29 pages
2010 23 Jumping
No ratings yet
2010 23 Jumping
6 pages
Petitjean2011 PR
No ratings yet
Petitjean2011 PR
16 pages
Bag of Features
No ratings yet
Bag of Features
7 pages
Zhao Xiaojian
No ratings yet
Zhao Xiaojian
114 pages
Download
No ratings yet
Download
25 pages
Dynamic Time Warping
No ratings yet
Dynamic Time Warping
5 pages
Adaptive Feature Based Dynamic Time Warping
No ratings yet
Adaptive Feature Based Dynamic Time Warping
11 pages
.... Using Dynamic Time Warping To Findpatterns in Time Series
No ratings yet
.... Using Dynamic Time Warping To Findpatterns in Time Series
12 pages
Inp Parmezan ICMLA 2015 Study
No ratings yet
Inp Parmezan ICMLA 2015 Study
8 pages
Information Geometry Univariate Time Series
No ratings yet
Information Geometry Univariate Time Series
12 pages
Clustering of Time-Series Data
No ratings yet
Clustering of Time-Series Data
20 pages
Gemini Algorithm
No ratings yet
Gemini Algorithm
28 pages
Dynamic Time Warping Algorithm Review PDF
No ratings yet
Dynamic Time Warping Algorithm Review PDF
23 pages
A Global Averaging Method For Dynamictime Warping, With Applications To Clustering
No ratings yet
A Global Averaging Method For Dynamictime Warping, With Applications To Clustering
16 pages
SAX-VSM: Interpretable Time Series Classification Using SAX and Vector Space Model
No ratings yet
SAX-VSM: Interpretable Time Series Classification Using SAX and Vector Space Model
11 pages
Dtwclust - Comparing Time Series Clustering Algorithms
No ratings yet
Dtwclust - Comparing Time Series Clustering Algorithms
46 pages
A SECURE DATA AGGREGATION TECHNIQUE IN WIRELESS SENSOR NETWORK
From Everand
A SECURE DATA AGGREGATION TECHNIQUE IN WIRELESS SENSOR NETWORK
Dr Chaitra HV
No ratings yet
Advanced Backend Code Optimization
From Everand
Advanced Backend Code Optimization
Sid Touati
No ratings yet
Field Computation for Accelerator Magnets: Analytical and Numerical Methods for Electromagnetic Design and Optimization
From Everand
Field Computation for Accelerator Magnets: Analytical and Numerical Methods for Electromagnetic Design and Optimization
Stephan Russenschuck
No ratings yet
Boat Trim System
No ratings yet
Boat Trim System
4 pages
Volatility Forecasting I - GARCH Models - Reider
No ratings yet
Volatility Forecasting I - GARCH Models - Reider
16 pages
Flask Docs
No ratings yet
Flask Docs
306 pages
Optimal Ship Routing
No ratings yet
Optimal Ship Routing
9 pages
4 Albert Embankment London Se1 7Sr Telephone: 020 7735 7611 Fax: 020 7587 3210
No ratings yet
4 Albert Embankment London Se1 7Sr Telephone: 020 7735 7611 Fax: 020 7587 3210
13 pages
Grib API Ref
No ratings yet
Grib API Ref
209 pages
VPE - 3rd Year - Assignment - 2024 - 022543
No ratings yet
VPE - 3rd Year - Assignment - 2024 - 022543
8 pages
Satapatha Brahmana Part 1
100% (5)
Satapatha Brahmana Part 1
540 pages
A Project Report Submitted By: NSS College of Engineering
No ratings yet
A Project Report Submitted By: NSS College of Engineering
54 pages
Felis Catus Mitochondrion, Complete Genome
No ratings yet
Felis Catus Mitochondrion, Complete Genome
9 pages
Dge Cience: Beyond Neuroscience
No ratings yet
Dge Cience: Beyond Neuroscience
20 pages
Finance Agreement
No ratings yet
Finance Agreement
12 pages
Atmel PPT 100718104611 Phpapp01
No ratings yet
Atmel PPT 100718104611 Phpapp01
31 pages
E by M Thomson Method PDF
No ratings yet
E by M Thomson Method PDF
21 pages
Wa0006.
No ratings yet
Wa0006.
19 pages
Realizing Room Temperature Catalytic Hydrogenation of Sodium Phenoxide by Ru TiO2 For Hydrogen Storage
No ratings yet
Realizing Room Temperature Catalytic Hydrogenation of Sodium Phenoxide by Ru TiO2 For Hydrogen Storage
4 pages
(Chapter Four - Color Images Formats (RGB, HSV and YCbCr
No ratings yet
(Chapter Four - Color Images Formats (RGB, HSV and YCbCr
14 pages
Gen Bio - Q2 - M2 Final
No ratings yet
Gen Bio - Q2 - M2 Final
16 pages
Module 5 - Art Movement
No ratings yet
Module 5 - Art Movement
100 pages
Unit 2 - Energy & Environmental Engineering - WWW - Rgpvnotes.in
No ratings yet
Unit 2 - Energy & Environmental Engineering - WWW - Rgpvnotes.in
24 pages
Module - 1
No ratings yet
Module - 1
25 pages
Operating Gear For Valve and Fuel Injection Pumps: Roller Guides
No ratings yet
Operating Gear For Valve and Fuel Injection Pumps: Roller Guides
1 page
Grammar Practice Articles Worksheet
No ratings yet
Grammar Practice Articles Worksheet
2 pages
TU20
No ratings yet
TU20
6 pages
Aceites Trane
100% (1)
Aceites Trane
12 pages
CS2336 Discrete Mathematics: Exam 3: January 10, 2022
No ratings yet
CS2336 Discrete Mathematics: Exam 3: January 10, 2022
3 pages
Project Report of Supply Chain Nirma, Pranesh
83% (6)
Project Report of Supply Chain Nirma, Pranesh
26 pages
(FREE PDF Sample) How Do I Un-Remember This?: Unfortunately True Stories Danny Pellegrino Ebooks
No ratings yet
(FREE PDF Sample) How Do I Un-Remember This?: Unfortunately True Stories Danny Pellegrino Ebooks
54 pages
Bitumen Price List W.E.F 16 07 2010
No ratings yet
Bitumen Price List W.E.F 16 07 2010
1 page
M5CIA2 Dela Pena BSN1L 1
No ratings yet
M5CIA2 Dela Pena BSN1L 1
2 pages
Sample Payment Certificate
No ratings yet
Sample Payment Certificate
5 pages
Economy of The Tamil Sangam Age
No ratings yet
Economy of The Tamil Sangam Age
18 pages
Index of Refraction Worksheet
No ratings yet
Index of Refraction Worksheet
2 pages
2.1 Simple Kinetic Molecular Model of Matter
No ratings yet
2.1 Simple Kinetic Molecular Model of Matter
5 pages
Analysis Output From Staad Two Storey
No ratings yet
Analysis Output From Staad Two Storey
9 pages