Statistical Distance

Statistical distance quantifies the difference between two statistical objects like random variables or probability distributions. It measures the distance between probability distributions and how dependent or independent random variables are. Statistical distances are not always metrics as they may not satisfy properties like symmetry or the triangle inequality. Common statistical distances include total variation distance, Hellinger distance, and Kullback-Leibler divergence.

Uploaded by

watson191

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

151 views3 pages

Statistical Distance

Uploaded by

watson191

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Statistical distance

In statistics, probability theory, and information theory, a statistical distance quantifies the distance
between two statistical objects, which can be two random variables, or two probability distributions or
samples, or the distance can be between an individual sample point and a population or a wider sample of
points.

A distance between populations can be interpreted as measuring the distance between two probability
distributions and hence they are essentially measures of distances between probability measures. Where
statistical distance measures relate to the differences between random variables, these may have statistical
dependence,[1] and hence these distances are not directly related to measures of distances between
probability measures. Again, a measure of distance between random variables may relate to the extent of
dependence between them, rather than to their individual values.

Statistical distance measures are not typically metrics, and they need not be symmetric. Some types of
distance measures, which generalize squared distance, are referred to as (statistical) divergences.

Terminology
Many terms are used to refer to various notions of distance; these are often confusingly similar, and may be
used inconsistently between authors and over time, either loosely or with precise technical meaning. In
addition to "distance", similar terms include deviance, deviation, discrepancy, discrimination, and
divergence, as well as others such as contrast function and metric. Terms from information theory include
cross entropy, relative entropy, discrimination information, and information gain.

Distances as metrics

Metrics

A metric on a set X is a function (called the distance function or simply distance) d : X × X → R+ (where
R+ is the set of non-negative real numbers). For all x, y, z in X, this function is required to satisfy the
following conditions:

1. d(x, y) ≥ 0 (non-negativity)

2. d(x, y) = 0 if and only if x = y     (identity of indiscernibles. Note that condition 1 and 2
together produce positive definiteness)
3. d(x, y) = d(y, x)     (symmetry)
4. d(x, z) ≤ d(x, y) + d(y, z)     (subadditivity / triangle inequality).

Generalized metrics
Many statistical distances are not metrics, because they lack one or more properties of proper metrics. For
example, pseudometrics violate property (2), identity of indiscernibles; quasimetrics violate property (3),
symmetry; and semimetrics violate property (4), the triangle inequality. Statistical distances that satisfy (1)
and (2) are referred to as divergences.

Statistically close
The variation distance of two distributions and over a finite domain , (often referred to as statistical
difference[2] or statistical distance[3] in cryptography) is defined as

We say that two probability ensembles and are statistically close if is a

negligible function in .

Examples

Metrics
Total variation distance (sometimes just called "the" statistical distance)
Hellinger distance
Lévy–Prokhorov metric
Wasserstein metric: also known as the Kantorovich metric, or earth mover's distance
Mahalanobis distance

Divergences
Kullback–Leibler divergence
Rényi divergence
Jensen–Shannon divergence
Bhattacharyya distance (despite its name it is not a distance, as it violates the triangle
inequality)
f-divergence: generalizes several distances and divergences
Discriminability index, specifically the Bayes discriminability index, is a positive-definite
symmetric measure of the overlap of two distributions.

See also
Probabilistic metric space
Randomness extractor
Similarity measure
Zero-knowledge proof

Notes
1. Dodge, Y. (2003)—entry for distance
2. Goldreich, Oded (2001). Foundations of Cryptography: Basic Tools (1st ed.). Berlin:
Cambridge University Press. p. 106. ISBN 0-521-79172-3.
3. Reyzin, Leo. (Lecture Notes) Extractors and the Leftover Hash Lemma (http://www.cs.bu.ed
u/~reyzin/teaching/s11cs937/notes-leo-1.pdf)

External links
Distance and Similarity Measures (Wolfram Alpha) (http://reference.wolfram.com/mathematic
a/guide/DistanceAndSimilarityMeasures.html)

References
Dodge, Y. (2003) Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9

Retrieved from "https://en.wikipedia.org/w/index.php?title=Statistical_distance&oldid=1164800311"

Kullback-Leibler Divergence
No ratings yet
Kullback-Leibler Divergence
22 pages
Newbold, P. (2019) - Statistics For Business and Economics. 9thed, Pearson
No ratings yet
Newbold, P. (2019) - Statistics For Business and Economics. 9thed, Pearson
20 pages
Book
No ratings yet
Book
106 pages
Basic Statistics
No ratings yet
Basic Statistics
95 pages
Statistics Notes
No ratings yet
Statistics Notes
32 pages
Book
No ratings yet
Book
113 pages
Basic Stat
No ratings yet
Basic Stat
132 pages
Descriptive and Inferential Statistics Course Pack
No ratings yet
Descriptive and Inferential Statistics Course Pack
42 pages
Regression
No ratings yet
Regression
36 pages
Basics Final
No ratings yet
Basics Final
54 pages
Basics of ML
No ratings yet
Basics of ML
28 pages
Unit 2 ML
No ratings yet
Unit 2 ML
89 pages
Last Minute Statistics Revision Sscjsosi Abhishek
No ratings yet
Last Minute Statistics Revision Sscjsosi Abhishek
31 pages
Introduction To Statistics
94% (47)
Introduction To Statistics
134 pages
SEMINAR
No ratings yet
SEMINAR
19 pages
Mosconi W1
No ratings yet
Mosconi W1
14 pages
Kullback-Leibler Divergence - Wikipedia
No ratings yet
Kullback-Leibler Divergence - Wikipedia
23 pages
Lecture 7 - Distance Measures
No ratings yet
Lecture 7 - Distance Measures
38 pages
DSAI514 Lec1 Background in Prob Part3
No ratings yet
DSAI514 Lec1 Background in Prob Part3
25 pages
Distance
No ratings yet
Distance
18 pages
On Divergences and Informations in Statistics and Information Theory
No ratings yet
On Divergences and Informations in Statistics and Information Theory
19 pages
L2 - Mathematical Preliminaries
No ratings yet
L2 - Mathematical Preliminaries
24 pages
Reachable Distance Function For KNN Classification
No ratings yet
Reachable Distance Function For KNN Classification
152 pages
STA301StatisticsandProbabilityGlossaryBywww Virtualians PK PDF
No ratings yet
STA301StatisticsandProbabilityGlossaryBywww Virtualians PK PDF
16 pages
ECON 10192 20192 Week2-Lecture2-Notes-5
No ratings yet
ECON 10192 20192 Week2-Lecture2-Notes-5
16 pages
Lesson 3 - Statistics Refresher
No ratings yet
Lesson 3 - Statistics Refresher
56 pages
Module 1 - Descriptive Stats
No ratings yet
Module 1 - Descriptive Stats
9 pages
Lecture 2 Slides With Q&A 20242025
No ratings yet
Lecture 2 Slides With Q&A 20242025
38 pages
Measures of Dispersion
No ratings yet
Measures of Dispersion
8 pages
Chapter 1
No ratings yet
Chapter 1
23 pages
Introduction To Statistics and Probability
No ratings yet
Introduction To Statistics and Probability
134 pages
002 Probability-and-Statistics-Part-1-Data
No ratings yet
002 Probability-and-Statistics-Part-1-Data
84 pages
Machine Learning Notes
No ratings yet
Machine Learning Notes
15 pages
Basic Statistics
No ratings yet
Basic Statistics
23 pages
STA301 Statistics and Probability FAQS AND GLOSSARY
No ratings yet
STA301 Statistics and Probability FAQS AND GLOSSARY
33 pages
Divergences
No ratings yet
Divergences
8 pages
Sketching Information Divergence
No ratings yet
Sketching Information Divergence
15 pages
Statistical Uncertainty and Error Propagation: Martin Vermeer March 27, 2014
No ratings yet
Statistical Uncertainty and Error Propagation: Martin Vermeer March 27, 2014
34 pages
Describing Distributions With Numbers
No ratings yet
Describing Distributions With Numbers
21 pages
Mod 1 Stats
No ratings yet
Mod 1 Stats
7 pages
On Measures of Entropy and Information
No ratings yet
On Measures of Entropy and Information
18 pages
Econ Review Stat W2 2025
No ratings yet
Econ Review Stat W2 2025
49 pages
Prob. & Stat Note (Chs 1 & 2)
No ratings yet
Prob. & Stat Note (Chs 1 & 2)
39 pages
On Using These Lecture Notes
No ratings yet
On Using These Lecture Notes
6 pages
$RELC031
No ratings yet
$RELC031
43 pages
Introduction To Statistics
No ratings yet
Introduction To Statistics
24 pages
Statistics Firstfive
No ratings yet
Statistics Firstfive
43 pages
Multivariate Analysis: Descriptive Statistics Is The Discipline of Quantitatively Describing The Main Features of A
No ratings yet
Multivariate Analysis: Descriptive Statistics Is The Discipline of Quantitatively Describing The Main Features of A
5 pages
STA301 IMP Notes Headings and Some Questions Answers Prepared by
No ratings yet
STA301 IMP Notes Headings and Some Questions Answers Prepared by
32 pages
ML Unit 2
No ratings yet
ML Unit 2
11 pages
Basics For Understanding
No ratings yet
Basics For Understanding
8 pages
Basic - Statistics 30 Sep 2013 PDF
100% (1)
Basic - Statistics 30 Sep 2013 PDF
20 pages
Measures of Central Tendency: Mean
No ratings yet
Measures of Central Tendency: Mean
7 pages
Data Mining Lecture 1 - Summary
No ratings yet
Data Mining Lecture 1 - Summary
3 pages
Yunshu InformationGeometry
No ratings yet
Yunshu InformationGeometry
79 pages
Chapter 1
No ratings yet
Chapter 1
9 pages
College Algebra Dictionary
No ratings yet
College Algebra Dictionary
12 pages
Tabla Kolmogorov
No ratings yet
Tabla Kolmogorov
4 pages
Mba Statistics Midterm Review Sheet
No ratings yet
Mba Statistics Midterm Review Sheet
1 page
Proteomics
No ratings yet
Proteomics
24 pages
Computational Biology
No ratings yet
Computational Biology
11 pages
Tabla de Kolmogorov-Smirno
No ratings yet
Tabla de Kolmogorov-Smirno
2 pages
Information Geometry in Optimization Machine Learn
No ratings yet
Information Geometry in Optimization Machine Learn
3 pages
Tabla de Kolmogorov Smirnov
No ratings yet
Tabla de Kolmogorov Smirnov
1 page
Singular Value Decomposition
No ratings yet
Singular Value Decomposition
15 pages
03 Similarity Dissimilarity
No ratings yet
03 Similarity Dissimilarity
34 pages
Modelling Biological Systems
No ratings yet
Modelling Biological Systems
7 pages
MATLAB
No ratings yet
MATLAB
11 pages
Fourier Analysis
No ratings yet
Fourier Analysis
10 pages
Linear Least Squares
No ratings yet
Linear Least Squares
10 pages
Sparse Distributed Memory
No ratings yet
Sparse Distributed Memory
15 pages
Poly Analyst
No ratings yet
Poly Analyst
4 pages
Data Mining
No ratings yet
Data Mining
32 pages
Metabolomics
No ratings yet
Metabolomics
12 pages
IBM Watson Studio
No ratings yet
IBM Watson Studio
2 pages
Wolfram Mathematica
No ratings yet
Wolfram Mathematica
7 pages
Splunk
No ratings yet
Splunk
11 pages
Cram Er-Rao Lower Bound and Information Geometry: 1 Introduction and Historical Background
No ratings yet
Cram Er-Rao Lower Bound and Information Geometry: 1 Introduction and Historical Background
27 pages
Information Geometry
No ratings yet
Information Geometry
6 pages
Biodiversity Informatics
No ratings yet
Biodiversity Informatics
9 pages
Gene Disease Database
No ratings yet
Gene Disease Database
16 pages
Jumping Library
No ratings yet
Jumping Library
8 pages
Nucleic Acid Sequence
No ratings yet
Nucleic Acid Sequence
8 pages
RCASE
No ratings yet
RCASE
3 pages
Statistical Distance
No ratings yet
Statistical Distance
3 pages
LIONsolver
No ratings yet
LIONsolver
2 pages
List of Bioinformatics Institutions
No ratings yet
List of Bioinformatics Institutions
1 page
Attribute Selection Measure
No ratings yet
Attribute Selection Measure
3 pages
Cyberbiosecurity
No ratings yet
Cyberbiosecurity
3 pages
Nearest-Neighbor Interpolation
No ratings yet
Nearest-Neighbor Interpolation
2 pages
Neural Designer
No ratings yet
Neural Designer
2 pages
Caffe (Software)
No ratings yet
Caffe (Software)
2 pages
Excercise Chapter 7 - Khairunnisa Dias P
No ratings yet
Excercise Chapter 7 - Khairunnisa Dias P
4 pages
DEVIATION Welcome Center (3-July-2024)
No ratings yet
DEVIATION Welcome Center (3-July-2024)
1 page
Multidimensional Analysis
No ratings yet
Multidimensional Analysis
2 pages
Instance-Based Learning
No ratings yet
Instance-Based Learning
1 page
List of Bioinformatics Companies
No ratings yet
List of Bioinformatics Companies
1 page
Co-Clustering: Models, Algorithms and Applications
From Everand
Co-Clustering: Models, Algorithms and Applications
Gérard Govaert
No ratings yet
Learn Statistics Fast: A Simplified Detailed Version for Students
From Everand
Learn Statistics Fast: A Simplified Detailed Version for Students
Hesbon R.M
No ratings yet
Two Dimensional Geometric Model: Understanding and Applications in Computer Vision
From Everand
Two Dimensional Geometric Model: Understanding and Applications in Computer Vision
Fouad Sabry
No ratings yet

Statistical Distance

Uploaded by

Statistical Distance

Uploaded by

Statistical distance

1. d(x, y) ≥ 0 (non-negativity)

We say that two probability ensembles and are statistically close if is a

Retrieved from "https://en.wikipedia.org/w/index.php?title=Statistical_distance&oldid=1164800311"

You might also like