0% found this document useful (0 votes)

67 views15 pages

What Are Outliers272

Outliers are data objects that do not comply with the general behavior or model of the data. They can be caused by errors and may be of interest. There are several methods to detect outliers including statistical distribution-based, distance-based, density-based, and deviation-based approaches. Statistical distribution-based outlier detection assumes a distribution for the data and identifies outliers with respect to the model using discordancy testing.

Uploaded by

niyati25

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

67 views15 pages

What Are Outliers272

Uploaded by

niyati25

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 15

WHAT ARE OUTLIERS?

A database may contain data objects that do not comply with the general behavior or model of the data. These data objects are outliers. Outliers can be caused by measurement or execution error. the outliers may be of particular interest

Applications:
Fraud detection
Medicine Public health

Sports statistics Detecting measurement errors

OUTLIER DETECTION METHODS

Statistical Distribution-Based Outlier Detection Distance-Based Outlier Detection Density-Based Local Outlier Detection Deviation-Based Outlier Detection

Statistical Distribution-Based Outlier Detection

assumes a distribution for the given data set identifies outliers with respect to the model using a discordancy test requires knowledge of the data set parameters knowledge of distribution parameters expected number of outliers.

How does the discordancy testing work?

This test examines two hypotheses: working hypothesis alternative hypothesis

A working hypothesis, H, is a statement that the entire data set of n objects comes from an initial distribution model, F, that is, H : oi E F, where i = 1, 2, , n. Verifies whether oi is <> in relation to F Assume T is some statistic used as discordancy test Assume value of the statistic for object oi is vi Then distribution T is constructed SP(vi)=Prob(T > vi), is evaluated If SP(vi) is small H is rejected

An alternative hypothesis, H, which states that oi comes from another distribution model, G, is adopted. The result is very much dependent on which model F is chosen because oi may be an outlier under one model and a perfectly valid value under another.

kinds of alternative distributions. Inherent alternative distribution H : oi E G, where i = 1, 2, : : : , n Mixture alternative distribution G. H : oi E (1-mu)F +muG, where i = 1, 2, : : : , n. Slippage alternative distribution

Distance-Based Outlier Detection

An object, o, in a data set, D, is a distancebased (DB) outlier with parameters pct and dmin,11 that is, a DB(pct;dmin)-outlier, if at least a fraction, pct, of the objects in D lie at a distance greater than dmin from o.

algorithms for mining distance-based outliers

Index-based algorithm Nested-loop algorithm Cell-based algorithm

Density-Based Local Outlier Detection

Distance-based outlier detection is based on global distance distribution It encounters difficulties to identify outliers if data is not uniformly distributed.

Deviation-Based Outlier Detection

it identifies outliers by examining the main characteristics of objects in a group

two techniques for deviation-based outlier detection Sequential Exception Technique OLAP Data Cube Technique

Sequential Exception Technique

OLAP Data Cube Technique

Grady Klein, Alan Dabney - The Cartoon Introduction To Statistics-Hill and Wang (2013)
100% (1)
Grady Klein, Alan Dabney - The Cartoon Introduction To Statistics-Hill and Wang (2013)
248 pages
Forecasting: Industrial Management & Engineering Economy (Ieng 5241)
No ratings yet
Forecasting: Industrial Management & Engineering Economy (Ieng 5241)
43 pages
Introduction To Statistics
No ratings yet
Introduction To Statistics
23 pages
What Are Outliers111
No ratings yet
What Are Outliers111
15 pages
What Are Outliers86
No ratings yet
What Are Outliers86
15 pages
What Are Outliers44
No ratings yet
What Are Outliers44
15 pages
What Are Outliers71
No ratings yet
What Are Outliers71
15 pages
What Are Outliers202
No ratings yet
What Are Outliers202
15 pages
What Are Outliers245
No ratings yet
What Are Outliers245
15 pages
What Are Outliers171
No ratings yet
What Are Outliers171
15 pages
What Are Outliers196
No ratings yet
What Are Outliers196
15 pages
What Are Outliers162
No ratings yet
What Are Outliers162
15 pages
What Are Outliers35
No ratings yet
What Are Outliers35
15 pages
What Are Outliers225
No ratings yet
What Are Outliers225
15 pages
What Are Outliers127
No ratings yet
What Are Outliers127
15 pages
What Are Outliers166
No ratings yet
What Are Outliers166
15 pages
What Are Outliers78
No ratings yet
What Are Outliers78
15 pages
What Are Outliers54
No ratings yet
What Are Outliers54
15 pages
What Are Outliers70
No ratings yet
What Are Outliers70
15 pages
What Are Outliers128
No ratings yet
What Are Outliers128
15 pages
What Are Outliers240
No ratings yet
What Are Outliers240
15 pages
What Are Outliers109
No ratings yet
What Are Outliers109
15 pages
What Are Outliers206
No ratings yet
What Are Outliers206
15 pages
What Are Outliers59
No ratings yet
What Are Outliers59
15 pages
What Are Outliers31
No ratings yet
What Are Outliers31
15 pages
What Are Outliers56
No ratings yet
What Are Outliers56
15 pages
What Are Outliers13
No ratings yet
What Are Outliers13
15 pages
What Are Outliers269
No ratings yet
What Are Outliers269
15 pages
What Are Outliers64
No ratings yet
What Are Outliers64
15 pages
What Are Outliers47
No ratings yet
What Are Outliers47
15 pages
What Are Outliers52
No ratings yet
What Are Outliers52
15 pages
What Are Outliers18
No ratings yet
What Are Outliers18
15 pages
What Are Outliers119
No ratings yet
What Are Outliers119
15 pages
What Are Outliers134
No ratings yet
What Are Outliers134
15 pages
What Are Outliers143
No ratings yet
What Are Outliers143
15 pages
What Are Outliers24
No ratings yet
What Are Outliers24
15 pages
What Are Outliers106
No ratings yet
What Are Outliers106
15 pages
What Are Outliers25
No ratings yet
What Are Outliers25
15 pages
What Are Outliers248
No ratings yet
What Are Outliers248
15 pages
What Are Outliers33
No ratings yet
What Are Outliers33
15 pages
What Are Outliers172
No ratings yet
What Are Outliers172
15 pages
What Are Outliers224
No ratings yet
What Are Outliers224
15 pages
What Are Outliers8
No ratings yet
What Are Outliers8
15 pages
What Are Outliers14
No ratings yet
What Are Outliers14
15 pages
What Are Outliers121
No ratings yet
What Are Outliers121
15 pages
What Are Outliers141
No ratings yet
What Are Outliers141
15 pages
What Are Outliers58
No ratings yet
What Are Outliers58
15 pages
What Are Outliers233
No ratings yet
What Are Outliers233
15 pages
What Are Outliers125
No ratings yet
What Are Outliers125
15 pages
What Are Outliers99
No ratings yet
What Are Outliers99
15 pages
What Are Outliers16
No ratings yet
What Are Outliers16
15 pages
What Are Outliers135
No ratings yet
What Are Outliers135
15 pages
What Are Outliers153
No ratings yet
What Are Outliers153
15 pages
What Are Outliers270
No ratings yet
What Are Outliers270
15 pages
What Are Outliers97
No ratings yet
What Are Outliers97
15 pages
What Are Outliers17
No ratings yet
What Are Outliers17
15 pages
What Are Outliers263
No ratings yet
What Are Outliers263
15 pages
What Are Outliers4
No ratings yet
What Are Outliers4
15 pages
What Are Outliers151
No ratings yet
What Are Outliers151
15 pages
What Are Outliers108
No ratings yet
What Are Outliers108
15 pages
What Are Outliers200
No ratings yet
What Are Outliers200
15 pages
What Are Outliers231
No ratings yet
What Are Outliers231
15 pages
What Are Outliers165
No ratings yet
What Are Outliers165
15 pages
CEH v8 Labs Module 13 Hacking Web Applications PDF
No ratings yet
CEH v8 Labs Module 13 Hacking Web Applications PDF
20 pages
Cs453 D HTML Javascript 1
No ratings yet
Cs453 D HTML Javascript 1
66 pages
What Are Outliers271
No ratings yet
What Are Outliers271
15 pages
What Are Outliers268
No ratings yet
What Are Outliers268
15 pages
What Are Outliers267
No ratings yet
What Are Outliers267
15 pages
What Are Outliers257
No ratings yet
What Are Outliers257
15 pages
What Are Outliers266
No ratings yet
What Are Outliers266
15 pages
What Are Outliers262
No ratings yet
What Are Outliers262
15 pages
What Are Outliers260
No ratings yet
What Are Outliers260
15 pages
What Are Outliers264
No ratings yet
What Are Outliers264
15 pages
What Are Outliers259
No ratings yet
What Are Outliers259
15 pages
What Are Outliers258
No ratings yet
What Are Outliers258
15 pages
What Are Outliers255
No ratings yet
What Are Outliers255
15 pages
What Are Outliers256
No ratings yet
What Are Outliers256
15 pages
What Are Outliers254
No ratings yet
What Are Outliers254
15 pages
What Are Outliers252
No ratings yet
What Are Outliers252
15 pages
What Are Outliers253
No ratings yet
What Are Outliers253
15 pages
What Are Outliers250
No ratings yet
What Are Outliers250
15 pages
What Are Outliers249
No ratings yet
What Are Outliers249
15 pages
What Are Outliers235
No ratings yet
What Are Outliers235
15 pages
What Are Outliers246
No ratings yet
What Are Outliers246
15 pages
What Are Outliers244
No ratings yet
What Are Outliers244
15 pages
What Are Outliers237
No ratings yet
What Are Outliers237
15 pages
What Are Outliers236
No ratings yet
What Are Outliers236
15 pages
What Are Outliers247
No ratings yet
What Are Outliers247
15 pages
Guidance For Conducting Systematic Scoping Reviews.5
No ratings yet
Guidance For Conducting Systematic Scoping Reviews.5
7 pages
2.1 Sampling Methods: Unit-Ii
No ratings yet
2.1 Sampling Methods: Unit-Ii
16 pages
Unit 1 - Nature of Psychology
50% (2)
Unit 1 - Nature of Psychology
6 pages
Residential Medical Officer
No ratings yet
Residential Medical Officer
86 pages
SENIOR HIGH SCHOOL-Practical Research 1: A. Most Essential Learning Competency (MELC)
No ratings yet
SENIOR HIGH SCHOOL-Practical Research 1: A. Most Essential Learning Competency (MELC)
7 pages
Computational Bayesian Statistics. An Introduction - Amaral, Paulino, Muller PDF
100% (4)
Computational Bayesian Statistics. An Introduction - Amaral, Paulino, Muller PDF
257 pages
Spectrophotometer
100% (3)
Spectrophotometer
30 pages
Distinction Between Quantitative and Qualitative Data in Law
No ratings yet
Distinction Between Quantitative and Qualitative Data in Law
7 pages
Research7 Lesson 2
No ratings yet
Research7 Lesson 2
27 pages
Inferential Test - Location
No ratings yet
Inferential Test - Location
18 pages
Owen Barfield - Worlds Apart
92% (12)
Owen Barfield - Worlds Apart
210 pages
Synopsis HRM Britannia
No ratings yet
Synopsis HRM Britannia
10 pages
Report
No ratings yet
Report
6 pages
Concept of Statistics
No ratings yet
Concept of Statistics
17 pages
Final Exam Statistics
No ratings yet
Final Exam Statistics
1 page
Scientific Project Guidelines PDF
No ratings yet
Scientific Project Guidelines PDF
113 pages
Sociology and Other Social Sciences
100% (7)
Sociology and Other Social Sciences
20 pages
Fixed Effects Regression Methods For Longitudinal Data: Paul D. Allison
No ratings yet
Fixed Effects Regression Methods For Longitudinal Data: Paul D. Allison
45 pages
BT 406 M.C.Q File by Amaan Khan
No ratings yet
BT 406 M.C.Q File by Amaan Khan
37 pages
Module 7 - Predictive Analytics
No ratings yet
Module 7 - Predictive Analytics
71 pages
Collection of Data
No ratings yet
Collection of Data
4 pages
BRM Chapter 1-4 - Nrs
No ratings yet
BRM Chapter 1-4 - Nrs
4 pages
Module 2
No ratings yet
Module 2
15 pages
Impact of Confounder
No ratings yet
Impact of Confounder
13 pages
© Ncert Not To Be Republished: Collection of Data
No ratings yet
© Ncert Not To Be Republished: Collection of Data
13 pages
OIM 6 Software PDF
No ratings yet
OIM 6 Software PDF
2 pages
6 Confounding
No ratings yet
6 Confounding
14 pages

What Are Outliers272

Uploaded by

What Are Outliers272

Uploaded by

WHAT ARE OUTLIERS?

Sports statistics Detecting measurement errors

OUTLIER DETECTION METHODS

Statistical Distribution-Based Outlier Detection

How does the discordancy testing work?

Distance-Based Outlier Detection

algorithms for mining distance-based outliers

Density-Based Local Outlier Detection

Deviation-Based Outlier Detection

Sequential Exception Technique

OLAP Data Cube Technique

You might also like