0% found this document useful (0 votes)

5 views10 pages

Ads Exp 7

This document discusses anomaly and outlier detection techniques, categorizing outliers into global, contextual, and collective types. It emphasizes the importance of detecting outliers for data integrity, model accuracy, and identifying business insights, while also outlining various statistical and machine learning methods for detection. Additionally, it describes strategies for handling outliers, including removal, transformation, imputation, and separate analysis.

Uploaded by

sakshipssb

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views10 pages

Ads Exp 7

Uploaded by

sakshipssb

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 10

EXPERIMENT NO.

AIM: Anomaly / Outlier detection techniques

THEORY

Outliers are data points that significantly differ from the rest of the dataset. They can
arise due to measurement errors, natural variability, or external factors. Detecting and
handling outliers is essential for ensuring data quality and improving model accuracy.

1. Types of Outliers

Outliers can be categorized into three main types:

A) Global Outliers

Global outliers, also known as point anomalies, are individual data points that deviate
significantly from the rest of the dataset.

Example:

● A student's test score of 10 in a class where all other scores range between 70
and 100.
● A house priced at $10 million in a neighborhood where the average price is
$300,000.

B) Contextual Outliers

Contextual outliers depend on the specific context of the data. A value may be an outlier
in one scenario but not in another.

Example:

● A temperature of 35°C in winter is an outlier, but the same temperature in

summer is normal.
● A monthly sales spike during a festival season, which would not be an outlier if
occurring in that period but would be unusual otherwise.
C) Collective Outliers

Collective outliers occur when a group of data points deviates from the expected
pattern, even though individual points may not appear anomalous.

Example:

● A sudden drop in website traffic for a week due to a server failure.

● A group of fraudulent transactions made by multiple accounts over a short
period.

2. Importance of Outlier Detection

Outlier detection is crucial because:

A) Ensuring Data Integrity

Outliers can arise due to errors in data collection or recording. Identifying and correcting
these errors improves data reliability.

B) Improving Model Accuracy

Machine learning models can be highly sensitive to outliers. Removing or handling

outliers prevents skewed predictions and improves model performance.

C) Identifying Business Insights

Outliers often represent unusual events that may have business significance, such as
sudden demand surges, equipment failures, or fraudulent activities.

D) Preventing Fraudulent Attacks

Detecting anomalous transactions in financial data can help identify fraudulent activities
and prevent financial losses.
3. Methods of Detecting Outliers

Several statistical and machine learning techniques can be used for outlier detection:

A) Statistical Methods

1. Z-Score Analysis: Identifies data points that are a certain number of standard
deviations away from the mean.
2. Interquartile Range (IQR): Detects outliers using the 1.5 * IQR rule beyond the
first and third quartiles.
3. Box Plot Analysis: Visual representation of data distribution highlighting potential
outliers.

B) Machine Learning Approaches

1. Isolation Forest: Detects outliers by randomly partitioning the dataset and
identifying points that require fewer splits.
2. DBSCAN (Density-Based Spatial Clustering of Applications with Noise): Identifies
dense regions and marks low-density points as outliers.
3. Autoencoders: Neural network-based method that reconstructs normal data well
but struggles with anomalies.

4. Handling Outliers

Once detected, outliers can be managed through different techniques:

A) Removing Outliers

● Suitable when the outlier is due to errors or irrelevant noise.

● Example: Incorrect sensor readings in industrial monitoring.

B) Transforming Data

● Applying log transformations or normalization to reduce the impact of extreme

values.
● Example: Converting salary data into log scale for regression models.

C) Imputation

● Replacing outliers with the median, mean, or nearest neighbor values.

● Example: Replacing extreme temperatures with the average of neighboring days.

D) Treating Separately

● In cases where outliers represent rare but important occurrences (e.g., fraud
detection), they should be analyzed separately rather than removed.
CONCLUSION

In this experiment we learn about outlier detection.

Outlier detection is a fundamental step in data analysis that ensures data quality and
improves decision-making.

Feature Engineering
No ratings yet
Feature Engineering
63 pages
Lecture Notes - Anomaly Detection in Time Series
No ratings yet
Lecture Notes - Anomaly Detection in Time Series
43 pages
741 Outlier Detection
No ratings yet
741 Outlier Detection
55 pages
Solarwinds Platform 2.0 - Ai Powered
No ratings yet
Solarwinds Platform 2.0 - Ai Powered
43 pages
Unit-5 Outlier Analysis
No ratings yet
Unit-5 Outlier Analysis
32 pages
- مشروع تخرج
No ratings yet
- مشروع تخرج
34 pages
Concepts of EDA, Outliers-Detection and Treatment
No ratings yet
Concepts of EDA, Outliers-Detection and Treatment
99 pages
Lecture 12
No ratings yet
Lecture 12
54 pages
12outlier 1
No ratings yet
12outlier 1
45 pages
Lec3. Outlier Analysis
No ratings yet
Lec3. Outlier Analysis
54 pages
07 Outlier Detection
No ratings yet
07 Outlier Detection
54 pages
Statistical Test Methods For Hypothesis Testing
No ratings yet
Statistical Test Methods For Hypothesis Testing
6 pages
Unit 5
No ratings yet
Unit 5
47 pages
Datamining Seminar
No ratings yet
Datamining Seminar
19 pages
Be A 65 Ads Exp 7
No ratings yet
Be A 65 Ads Exp 7
7 pages
Introduction To Spatial Data Mining
No ratings yet
Introduction To Spatial Data Mining
63 pages
Unit 5 - Lecture 1 - Outlier Detection
No ratings yet
Unit 5 - Lecture 1 - Outlier Detection
30 pages
Ads 7
No ratings yet
Ads 7
6 pages
Outlier Detection
No ratings yet
Outlier Detection
45 pages
Fraud Detection in Financial Transactions
No ratings yet
Fraud Detection in Financial Transactions
5 pages
WINSEM2024-25 CBS3006 ETH VL2024250505168 2025-01-09 Reference-Material-III
No ratings yet
WINSEM2024-25 CBS3006 ETH VL2024250505168 2025-01-09 Reference-Material-III
4 pages
12 Outlier
No ratings yet
12 Outlier
16 pages
Guide On Outlier Detection Methods
No ratings yet
Guide On Outlier Detection Methods
11 pages
17 dm2 Anomaly Detection 2022 23
No ratings yet
17 dm2 Anomaly Detection 2022 23
113 pages
Anomaly or Outlier Detection
No ratings yet
Anomaly or Outlier Detection
14 pages
Data Cleaning
No ratings yet
Data Cleaning
4 pages
Outlier Treatment
No ratings yet
Outlier Treatment
16 pages
Outliers ML
No ratings yet
Outliers ML
14 pages
Lecture 8 Data Prepration Techniques
No ratings yet
Lecture 8 Data Prepration Techniques
4 pages
Outlier Analysis
No ratings yet
Outlier Analysis
28 pages
Anomaly Detection Techniques in Smart Grid Systems A Review
No ratings yet
Anomaly Detection Techniques in Smart Grid Systems A Review
7 pages
Unit 5
No ratings yet
Unit 5
70 pages
The Secret Of Machine Learning
From Everand
The Secret Of Machine Learning
Mhd Arjunanta
No ratings yet
Lecture 12 Outliers and Guidelines For Exercises
No ratings yet
Lecture 12 Outliers and Guidelines For Exercises
6 pages
Unit 4
No ratings yet
Unit 4
17 pages
What Is Outlier
No ratings yet
What Is Outlier
3 pages
Identifying and Handling Outliers in Pandas - A Step-By-Step Guide - by Arvid Eichner - Python in Plain English
No ratings yet
Identifying and Handling Outliers in Pandas - A Step-By-Step Guide - by Arvid Eichner - Python in Plain English
19 pages
NetBackup Flex Appliance AirGap Solution
No ratings yet
NetBackup Flex Appliance AirGap Solution
10 pages
ADII10 Analisa Outlier
No ratings yet
ADII10 Analisa Outlier
37 pages
4 - Outliers - +transformaations ML
No ratings yet
4 - Outliers - +transformaations ML
28 pages
PublishedPaper 2020-APCSM MachineLearning
No ratings yet
PublishedPaper 2020-APCSM MachineLearning
8 pages
12 Outlier
No ratings yet
12 Outlier
18 pages
Anomaly Detection and Outlier Analysis
No ratings yet
Anomaly Detection and Outlier Analysis
25 pages
Feature Engineering
No ratings yet
Feature Engineering
66 pages
AnIntrusion Detection System Over The IoT Data Streams Using Explainable Artificial Intelligence (XAI)
No ratings yet
AnIntrusion Detection System Over The IoT Data Streams Using Explainable Artificial Intelligence (XAI)
30 pages
A Survey On Outlier Detection Methods
No ratings yet
A Survey On Outlier Detection Methods
4 pages
Outlier Detection Techniques
100% (2)
Outlier Detection Techniques
56 pages
Acs 24 012
No ratings yet
Acs 24 012
10 pages
Outliers
No ratings yet
Outliers
3 pages
SMBL Merged
No ratings yet
SMBL Merged
28 pages
Handling Ouliers
No ratings yet
Handling Ouliers
5 pages
ISAT 600 Progress Report 3
No ratings yet
ISAT 600 Progress Report 3
4 pages
Anomaly Detection in Cybersecurity With Graph Based Approaches
No ratings yet
Anomaly Detection in Cybersecurity With Graph Based Approaches
9 pages
Outlier Detection
No ratings yet
Outlier Detection
41 pages
Second
No ratings yet
Second
11 pages
11 Different Ways For Outlier Detection in Python
No ratings yet
11 Different Ways For Outlier Detection in Python
11 pages
Outlier Detection
No ratings yet
Outlier Detection
22 pages
Distance-Based Outlier Detection: Consolidation and Renewed Bearing
No ratings yet
Distance-Based Outlier Detection: Consolidation and Renewed Bearing
12 pages
Data Mining:: Concepts and Techniques
No ratings yet
Data Mining:: Concepts and Techniques
44 pages
Handling Outliers
No ratings yet
Handling Outliers
6 pages
IT Specialist: Data Analytics Certification Prep - 500 Exam Questions and Explanations
From Everand
IT Specialist: Data Analytics Certification Prep - 500 Exam Questions and Explanations
Steve Brown
No ratings yet
Intelligent Video Surve I Llance System: Ajay Kumar Garg Engineering College, Ghaziabad
No ratings yet
Intelligent Video Surve I Llance System: Ajay Kumar Garg Engineering College, Ghaziabad
22 pages
Picture
No ratings yet
Picture
19 pages
Data Minning Unit 4-1
No ratings yet
Data Minning Unit 4-1
10 pages
New Synopsis
No ratings yet
New Synopsis
18 pages
Module 11 (C)
No ratings yet
Module 11 (C)
4 pages
ms160400843 - Synopsis v2.4
No ratings yet
ms160400843 - Synopsis v2.4
11 pages
Cloud Env
No ratings yet
Cloud Env
15 pages
Nidhi Paper
No ratings yet
Nidhi Paper
5 pages
Outlier Detection and Removal
No ratings yet
Outlier Detection and Removal
2 pages
12 Outlier
No ratings yet
12 Outlier
55 pages
Data Mining:: Concepts and Techniques
No ratings yet
Data Mining:: Concepts and Techniques
13 pages
Detecting Data Outliers
No ratings yet
Detecting Data Outliers
7 pages
Krishnendu PCB-IT602B
No ratings yet
Krishnendu PCB-IT602B
11 pages
Propounding First Artificial Intelligence Approach
No ratings yet
Propounding First Artificial Intelligence Approach
21 pages
Vignesh Final Mini Project
No ratings yet
Vignesh Final Mini Project
39 pages
Nozomi Networks Guardian Data
No ratings yet
Nozomi Networks Guardian Data
16 pages
Video-Based Abnormal Human Behavior Recognition-A Review
No ratings yet
Video-Based Abnormal Human Behavior Recognition-A Review
14 pages
473-499 Ijmlrcai 2024
No ratings yet
473-499 Ijmlrcai 2024
27 pages
4.3.2.4 Lab - Internet Meter Anomaly Detection
No ratings yet
4.3.2.4 Lab - Internet Meter Anomaly Detection
8 pages
Bildiri INISTA2011-AnomalyDetectioninTemperatureDataUsingDBSCANAlgorithm
No ratings yet
Bildiri INISTA2011-AnomalyDetectioninTemperatureDataUsingDBSCANAlgorithm
7 pages
Detection of Cyber Physical Attacks On Water Distribution Systems Via Principal Component Analysis and Artificial Neural Networks
No ratings yet
Detection of Cyber Physical Attacks On Water Distribution Systems Via Principal Component Analysis and Artificial Neural Networks
16 pages
Methods To Detect Different Types of Outliers: March 2016
No ratings yet
Methods To Detect Different Types of Outliers: March 2016
7 pages
Detecting Data Outliers
No ratings yet
Detecting Data Outliers
7 pages
Uji Data Pertanian Dan Analisis Datanya
No ratings yet
Uji Data Pertanian Dan Analisis Datanya
9 pages
Published Paper
No ratings yet
Published Paper
9 pages
MD AIOps Datasheet 02feb2024
No ratings yet
MD AIOps Datasheet 02feb2024
4 pages
Emotion Aware Surveillance System IEEE
No ratings yet
Emotion Aware Surveillance System IEEE
4 pages
Outlier Mining Techniques For Uncertain Data
No ratings yet
Outlier Mining Techniques For Uncertain Data
7 pages
Chapter 12. Outlier Analysis
No ratings yet
Chapter 12. Outlier Analysis
4 pages