0% found this document useful (0 votes)

19 views5 pages

ML Normalization Techniques - Overview & Practical Guide

The document discusses various normalization techniques in machine learning, including Min-Max, Z-Score, Max Absolute, Robust Scaling, Logarithmic, and L2 normalization. Each technique is explained with its formula, description, use cases, and Python implementation examples. The document also provides a comparison of recommended normalization methods for different algorithms.

Uploaded by

plasticintheair

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

19 views5 pages

ML Normalization Techniques - Overview & Practical Guide

Uploaded by

plasticintheair

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

Normalization Techniques in Machine Learning

Normalization is a preprocessing step where data is rescaled to fit within a specific range or
distribution, improving model performance and convergence. Below is a detailed explanation of
each type, along with Python examples.

1. Min-Max Normalization

Formula:

𝐗−𝐗𝐦𝐢𝐧
𝐗′ =
𝐗𝐦𝐚𝐱−𝐗𝐦𝐢𝐧

Description:

 Rescales data to a range of [0,1][0, 1][0,1] or [a,b][a, b][a,b].

 Preserves relationships between values and does not handle outliers well.

Use Cases:

 When features have different ranges.

 For algorithms sensitive to magnitudes, such as KNN, SVM, and Neural Networks.
 Suitable for image data (e.g., pixel values).

Python Implementation:

from sklearn.preprocessing import MinMaxScaler

import numpy as np

data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

scaler = MinMaxScaler()
min_max_data = scaler.fit_transform(data)
print("Min-Max Normalized Data:\n", min_max_data)

2. Z-Score Normalization (Standardization)

Formula:

′
𝐗−𝛍
𝐗 =
𝝈
Where:
 μ: Mean of the feature.
 σ: Standard deviation.

Description:

 Centers data around a mean of 000 and standard deviation of 1.

 Effective for algorithms assuming normally distributed data.

Use Cases:

 Features with differing scales.

 Algorithms like Logistic Regression, Linear Regression, and PCA.

Python Implementation:

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
z_score_data = scaler.fit_transform(data)
print("Z-Score Normalized Data:\n", z_score_data)

3. Max Absolute Normalization

Formula:

𝑿
𝐗′ =
∣ 𝐗𝐦𝐚𝐱 ∣
Description:

 Scales data by the maximum absolute value of the feature.

 Retains sparsity of data.

Use Cases:

 Sparse datasets like text data or recommendation systems.

 Models such as Lasso Regression.

Python Implementation:

from sklearn.preprocessing import MaxAbsScaler

scaler = MaxAbsScaler()
max_abs_data = scaler.fit_transform(data)
print("Max Absolute Normalized Data:\n", max_abs_data)
4. Robust Scaling

Formula:

𝐗 − 𝐦𝐞𝐝𝐢𝐚𝐧
𝐗′ =
𝑰𝑸𝑹
Where:

 IQR = Q3−Q1 (Interquartile Range).

Description:

 Centers data using the median and scales by the IQR.

 Handles outliers effectively.

Use Cases:

 Datasets with significant outliers.

 Algorithms like Gradient Boosting or Tree-based models.

Python Implementation:

from sklearn.preprocessing import RobustScaler

scaler = RobustScaler()
robust_data = scaler.fit_transform(data)
print("Robust Scaled Data:\n", robust_data)

5. Logarithmic Normalization

Formula:

𝐗′ = 𝐥𝐨𝐠(𝐗 + 𝐜)
Where:

 c: A constant to handle zero or negative values.

Description:

 Reduces the impact of large values by compressing the range.

 Helps in reducing skewness.
Use Cases:

 Features with exponential growth or large ranges.

 Financial and population data.

Python Implementation:

import numpy as np

data = np.array([[1, 10, 100], [2, 20, 200], [3, 30, 300]])
log_data = np.log1p(data) # log1p is log(X + 1)
print("Logarithmic Normalized Data:\n", log_data)

6. L2 Normalization

Formula:

𝑿
𝐗′ =
∥𝐗∥𝟐
Where:

∥ 𝐗 ∥ 𝟐 = √∑𝐗𝟐
Description:

 Scales each data point so its Euclidean norm is 1.

 Commonly used for feature vectors.

Use Cases:

 Similarity-based algorithms like KNN or clustering.

 Text processing and recommendation systems.

Python Implementation:

from sklearn.preprocessing import Normalizer

scaler = Normalizer(norm='l2')
l2_data = scaler.fit_transform(data)
print("L2 Normalized Data:\n", l2_data)

Comparison and When to Use

Algorithm Recommended Normalization Reason

KNN, SVM, Neural Networks Min-Max or Z-Score Sensitive to scale.

Linear/Logistic Regression Z-Score or Robust Scaling Assumes normal distribution.

Tree-Based Models None or Robust Scaling Less sensitive to scaling.

PCA, Clustering (K-Means) Min-Max or Z-Score Distance metric dependent.

Text or Sparse Data Models Max Absolute or L2 Maintains sparsity.

Data Normalization in Data Mining
No ratings yet
Data Normalization in Data Mining
8 pages
02DEC2022 Progress Measurement
100% (1)
02DEC2022 Progress Measurement
83 pages
Well Posed Learning Problem
100% (1)
Well Posed Learning Problem
4 pages
Feature Engineering PDF
100% (1)
Feature Engineering PDF
75 pages
ML Unit 2
No ratings yet
ML Unit 2
90 pages
02 Acs Check in Ia
100% (3)
02 Acs Check in Ia
203 pages
Lecture 7 Data Transformation and Dimensionality Reduction
No ratings yet
Lecture 7 Data Transformation and Dimensionality Reduction
22 pages
Supply Chain Management Assignment
No ratings yet
Supply Chain Management Assignment
11 pages
Data Normalization
No ratings yet
Data Normalization
7 pages
EE2211 CheatSheet
No ratings yet
EE2211 CheatSheet
15 pages
Chapter 6: Data Preprocessing, Parameter Selection, and Inductive Conformal Prediction
No ratings yet
Chapter 6: Data Preprocessing, Parameter Selection, and Inductive Conformal Prediction
56 pages
100 Days of Machine Learning
No ratings yet
100 Days of Machine Learning
14 pages
It9 Progress Test3
100% (8)
It9 Progress Test3
18 pages
1115
No ratings yet
1115
26 pages
Mini 4
No ratings yet
Mini 4
9 pages
Data Scaling
No ratings yet
Data Scaling
5 pages
Data Preparation
No ratings yet
Data Preparation
11 pages
EN3150 Homework 01
No ratings yet
EN3150 Homework 01
2 pages
Preprocessing
No ratings yet
Preprocessing
5 pages
Preprocessing
No ratings yet
Preprocessing
9 pages
Standar Ization
No ratings yet
Standar Ization
7 pages
Data Preprocessing
No ratings yet
Data Preprocessing
11 pages
8 Normalization Methods
No ratings yet
8 Normalization Methods
10 pages
Lecture Material 3
No ratings yet
Lecture Material 3
7 pages
Feature Scaling Techniques: Machine Learning
No ratings yet
Feature Scaling Techniques: Machine Learning
27 pages
ML Lab Exam Document
No ratings yet
ML Lab Exam Document
14 pages
Standardization & Normalization In: ML With Python Example
No ratings yet
Standardization & Normalization In: ML With Python Example
8 pages
PMA Unit-2 PDF
No ratings yet
PMA Unit-2 PDF
19 pages
Feature Scaling
No ratings yet
Feature Scaling
6 pages
How To Use Water Flow Sensor Arduino Tutorial
No ratings yet
How To Use Water Flow Sensor Arduino Tutorial
4 pages
Uklanjanje I Normalizacija Karakteristika
No ratings yet
Uklanjanje I Normalizacija Karakteristika
2 pages
Seven Lab Instruction
No ratings yet
Seven Lab Instruction
38 pages
Summary Chap 1 & 2
No ratings yet
Summary Chap 1 & 2
5 pages
Week 10
No ratings yet
Week 10
50 pages
04 - Data Normalization in Python - en
No ratings yet
04 - Data Normalization in Python - en
1 page
3 1 Chapter 3 Normalization
No ratings yet
3 1 Chapter 3 Normalization
22 pages
Scaling Techniques
No ratings yet
Scaling Techniques
30 pages
Data Minig Lab Manual
No ratings yet
Data Minig Lab Manual
58 pages
25 PDF
No ratings yet
25 PDF
10 pages
Unit 3-2
No ratings yet
Unit 3-2
15 pages
3 - AML - Lecture 3 - Feature Engg
No ratings yet
3 - AML - Lecture 3 - Feature Engg
39 pages
Lab 06
No ratings yet
Lab 06
12 pages
ML - Week 04
No ratings yet
ML - Week 04
33 pages
TM 90 21 PDF
No ratings yet
TM 90 21 PDF
22 pages
Feature Scaling (Standardization & Normalization)
No ratings yet
Feature Scaling (Standardization & Normalization)
35 pages
Data Processing
No ratings yet
Data Processing
19 pages
Unit 2 ML 2019
No ratings yet
Unit 2 ML 2019
91 pages
Summery of Feature Eng
No ratings yet
Summery of Feature Eng
4 pages
Data Preprocessing: Essential Steps For Preparing Data Before Modeling
No ratings yet
Data Preprocessing: Essential Steps For Preparing Data Before Modeling
111 pages
Data Mining
No ratings yet
Data Mining
33 pages
AI With Python-Data Preprocessing: Student Name Student Roll # Program Section
No ratings yet
AI With Python-Data Preprocessing: Student Name Student Roll # Program Section
7 pages
Feature Engineering
No ratings yet
Feature Engineering
50 pages
Practical 6
No ratings yet
Practical 6
6 pages
Session 7 Feature Selection & Dimensionality Reduction
No ratings yet
Session 7 Feature Selection & Dimensionality Reduction
20 pages
Normalization Vs Standardization
No ratings yet
Normalization Vs Standardization
2 pages
Data Preprocessing
No ratings yet
Data Preprocessing
49 pages
Normalization and Standardization: Methods To Preprocess Data To Have Consistent Scales and Distributions
No ratings yet
Normalization and Standardization: Methods To Preprocess Data To Have Consistent Scales and Distributions
10 pages
Feature Scaling in Machine Learning
No ratings yet
Feature Scaling in Machine Learning
4 pages
Normalization: Normalization Techniques at A Glance
No ratings yet
Normalization: Normalization Techniques at A Glance
5 pages
ML - Lab Manual
No ratings yet
ML - Lab Manual
54 pages
Feature Engineering: Getting The Most Out of Data For Predictive Models
No ratings yet
Feature Engineering: Getting The Most Out of Data For Predictive Models
75 pages
Feature Engineering
No ratings yet
Feature Engineering
18 pages
Conversation Normalization
No ratings yet
Conversation Normalization
2 pages
Standardization Vs Normalization in Pattern Recognition
No ratings yet
Standardization Vs Normalization in Pattern Recognition
1 page
dmdw2 2
No ratings yet
dmdw2 2
24 pages
21BDS0357 VL2024250504577 Ast02
No ratings yet
21BDS0357 VL2024250504577 Ast02
5 pages
Data Preprocessing PT 2
No ratings yet
Data Preprocessing PT 2
7 pages
Appium Mobile Test Automation Tutorial
No ratings yet
Appium Mobile Test Automation Tutorial
10 pages
Edgerton White Heat (Uk, 1996)
No ratings yet
Edgerton White Heat (Uk, 1996)
30 pages
Model Ship Security Plan
No ratings yet
Model Ship Security Plan
21 pages
RTOS - Real Time Operating Systems
No ratings yet
RTOS - Real Time Operating Systems
36 pages
Research Talk 101: Lucia Dettori
No ratings yet
Research Talk 101: Lucia Dettori
34 pages
RPC Asynchronous Communication
No ratings yet
RPC Asynchronous Communication
8 pages
ECS ARINC600连接器
No ratings yet
ECS ARINC600连接器
4 pages
Robert Darnton
No ratings yet
Robert Darnton
21 pages
74LS374
No ratings yet
74LS374
8 pages
IITA Bulletin 2239
No ratings yet
IITA Bulletin 2239
4 pages
Modulos Capacitacion API
No ratings yet
Modulos Capacitacion API
18 pages
TGF2977-SM Data Sheet
No ratings yet
TGF2977-SM Data Sheet
26 pages
100 Wwith 2 SC3281
No ratings yet
100 Wwith 2 SC3281
1 page
CIS 231 Router Lab Report Team Sample
No ratings yet
CIS 231 Router Lab Report Team Sample
6 pages
"Press-n-Peel" PCB Design Method: Henrique Miranda April 19, 2007
No ratings yet
"Press-n-Peel" PCB Design Method: Henrique Miranda April 19, 2007
2 pages
Testing Procedure Rev.04
No ratings yet
Testing Procedure Rev.04
21 pages
Apxvaa4l24 - 43 U Na20
No ratings yet
Apxvaa4l24 - 43 U Na20
6 pages
Vokaal - Content License Agreement PDF
No ratings yet
Vokaal - Content License Agreement PDF
2 pages
Catalogue 2022 SVAMC Electroménager-1
No ratings yet
Catalogue 2022 SVAMC Electroménager-1
14 pages
Virtual - Doctor - Robot - Using - Iot - PPT Literature Survey
No ratings yet
Virtual - Doctor - Robot - Using - Iot - PPT Literature Survey
29 pages
Social Sales Study: How Social Media Activity Connects To Concert Ticket Sales
No ratings yet
Social Sales Study: How Social Media Activity Connects To Concert Ticket Sales
17 pages
Taifun Gsii Manual
No ratings yet
Taifun Gsii Manual
22 pages
K Nearest Neighbor Algorithm: Fundamentals and Applications
From Everand
K Nearest Neighbor Algorithm: Fundamentals and Applications
Fouad Sabry
No ratings yet

ML Normalization Techniques - Overview & Practical Guide

Uploaded by

ML Normalization Techniques - Overview & Practical Guide

Uploaded by

Normalization Techniques in Machine Learning

 Rescales data to a range of [0,1][0, 1][0,1] or [a,b][a, b][a,b].

 When features have different ranges.

from sklearn.preprocessing import MinMaxScaler

data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

2. Z-Score Normalization (Standardization)

 Centers data around a mean of 000 and standard deviation of 1.

 Features with differing scales.

from sklearn.preprocessing import StandardScaler

3. Max Absolute Normalization

 Scales data by the maximum absolute value of the feature.

 Sparse datasets like text data or recommendation systems.

from sklearn.preprocessing import MaxAbsScaler

 IQR = Q3−Q1 (Interquartile Range).

 Centers data using the median and scales by the IQR.

 Datasets with significant outliers.

from sklearn.preprocessing import RobustScaler

 c: A constant to handle zero or negative values.

 Reduces the impact of large values by compressing the range.

 Features with exponential growth or large ranges.

 Scales each data point so its Euclidean norm is 1.

 Similarity-based algorithms like KNN or clustering.

from sklearn.preprocessing import Normalizer

Comparison and When to Use

KNN, SVM, Neural Networks Min-Max or Z-Score Sensitive to scale.

Linear/Logistic Regression Z-Score or Robust Scaling Assumes normal distribution.

Tree-Based Models None or Robust Scaling Less sensitive to scaling.

PCA, Clustering (K-Means) Min-Max or Z-Score Distance metric dependent.

Text or Sparse Data Models Max Absolute or L2 Maintains sparsity.

You might also like