0% found this document useful (0 votes)

7 views8 pages

Bias Variance

Uploaded by

abcdwfghijk

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views8 pages

Bias Variance

Uploaded by

abcdwfghijk

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

Machine Learning ! ! ! ! !

Srihari

Bias-Variance Decomposition
• Choosing λ in maximum likelihood/least
squares estimation
• Five part discussion:
1. On-line regression demo
2. Point estimate
Chinese Emperor’s Height
3. Formulation for regression
4. Example
5. Choice of optimal λ

1
Machine Learning ! ! ! ! !Srihari

Bias-Variance in Regression

• Interactive demo at

http://www.aiaccess.net/English/Glossaries/
GlosMod/e_gm_bias_variance.htm
Low degree polynomial has high bias (fits poorly)
but has low variance with different data sets
High degree polynomial has low bias (fits well) but
has high variance with different data sets

2
Machine Learning ! ! ! ! !Srihari

Bias-Variance in Point Estimate

True height of Chinese emperor: 200cm, about 6’6”
Poll a random American: ask “How tall is the emperor?”
We want to determine how wrong they are, on average
Each scenario has expected value of 180 (or bias error = 20), but increasing
variance in estimate
200 200 200
Bias Bias Bias
180 No variance Some variance 180 More variance 180

• Scenario 3
• Scenario 2 • Normally distributed
• Scenario 1 • Normally distributed beliefs with beliefs with mean 180 and
mean 180 and std dev 10 std dev 20 (variance=400)
• Everyone believes it is
180 (variance=0) (variance 100) • Poll two: One says 200
• Answer is always 180 • Poll two: One says 190, other 170 and other 160
• The error is always -20 • Bias Errors are -10 and -30 • Errors: 0 and -40
– Average bias error is -20 – Ave error is -20
• Ave squared error is 400
• Average bias error is 20 • Squared errors: 100 and 900 • Sq. errors: 0 and 1600
– Ave squared error: 500
• 400=400+0 – Ave squared error: 800
• 500 = 400 + 100
• 800 = 400 + 400

Squared error = Square of bias error + Variance

As variance increases, error increases
Machine Learning ! ! ! ! !Srihari

Bias -Variance in Regression

• y(x): estimate of the value of t for input x
• h(x): optimal prediction
h(x) = E[t | x] = ∫ tp(t | x)dt
• If we assume loss function L(t,y(x))={y(x)-t}2
• E[L] can be written as
expected loss = (bias)2 + variance + noise
• where
Difference between expected value
(bias) =
2
∫ {E [y(x;D)] − h(x)} p(x)dx
D
2
and optimal

variance = ∫ E [{y(x;D)] − E [y(x;D)]} ] p(x)dx

D D
2

noise = ∫ {h(x) − t} p(x,t)dxdt

2
4
Machine Learning ! ! ! ! !Srihari

Dependence of Bias-Variance on Model Complexity

20 Fits for Red: Average of Fits
• h(x)=sin(2px) 25 data Green: Sinusoid from which
data was generated
• Regularization parameter l
points each Low
• L=100 data sets Variance
• Each with N=25 High bias
• 24 Gaussian Basis
functions High l

– No of parameters M=25
• Total Error function:
1
N
λ T
∑{ n n }
2
t − w T
φ (x ) + w w
2 n=1 2
where f is a vector of basis functions

Result of averaging multiple

solutions with complex model gives good fit High
Weighted averaging of multiple Variance
solutions is at heart of Bayesian Low bias
approach: not wrt multiple data
sets but wrt posterior distribution
Low l
5
of parameters
Machine Learning ! ! ! ! !Srihari

Determining optimal λ
• Average Prediction
1 L (l )
y(x) = ∑ y (x)
L l=1

• Squared Bias
N 2
1
(bias) 2 = ∑
N n=1
{ y(x n ) − h(x n )}

• Variance
1 N 1 L (l )
variance = ∑ ∑{ y (x n ) − y(x n )}
2

N n=1 L l=1 6
Machine Learning ! ! ! ! !Srihari

Squared Bias and Variance vs λ

Test error minimum

occurs close to minimum
of (bias2+variance)

ln l=-0.31

Small values of λ allow model to Large values of λ pull weight

become finely tuned to noise parameters to zero leading
leading to large variance to large bias 7
Machine Learning ! ! ! ! !Srihari

Bias-Variance vs Bayesian
• Bias-Variance decomposition provides insight
into model complexity issue
• Limited practical value since it is based on
ensembles of data sets
– In practice there is only a single observed data set
– If there are many training samples then combine them
• which would reduce over-fitting for a given model complexity
• Bayesian approach gives useful insights into
over-fitting and is also practical

Statistical Inference 2e 2nd Edition George Casella Instant Download
100% (3)
Statistical Inference 2e 2nd Edition George Casella Instant Download
61 pages
AIML - Module 5 - Updated
No ratings yet
AIML - Module 5 - Updated
40 pages
CS7015 (Deep Learning) : Lecture 8
No ratings yet
CS7015 (Deep Learning) : Lecture 8
86 pages
Overfitting: Extracting Too Much
No ratings yet
Overfitting: Extracting Too Much
17 pages
6.estimators (C)
No ratings yet
6.estimators (C)
5 pages
Bias Variance Annotated
No ratings yet
Bias Variance Annotated
73 pages
Lec21 BiasVarianceDecomposition
No ratings yet
Lec21 BiasVarianceDecomposition
15 pages
226 Lecture5 Prediction
No ratings yet
226 Lecture5 Prediction
45 pages
Inference For The Generalization Error
No ratings yet
Inference For The Generalization Error
43 pages
ML - Mod 2 - Part 2
No ratings yet
ML - Mod 2 - Part 2
60 pages
Lec-01-Introduction To Statistical Learning
No ratings yet
Lec-01-Introduction To Statistical Learning
38 pages
Slides 1 Handout
No ratings yet
Slides 1 Handout
23 pages
PA DL Consolidated
No ratings yet
PA DL Consolidated
94 pages
Linear Regression, Active Learning
No ratings yet
Linear Regression, Active Learning
10 pages
ESGB Evaluation Methods
No ratings yet
ESGB Evaluation Methods
84 pages
BA501 Week5 Linear Regression
No ratings yet
BA501 Week5 Linear Regression
45 pages
Desingn of Experiments ch10
No ratings yet
Desingn of Experiments ch10
5 pages
Capability Indices For Non Normal Data
No ratings yet
Capability Indices For Non Normal Data
8 pages
P&AD Lect 17 1 Unit2
No ratings yet
P&AD Lect 17 1 Unit2
14 pages
3.3 Bias Variance
No ratings yet
3.3 Bias Variance
14 pages
Lecture Notes For Mathematical Statistics
No ratings yet
Lecture Notes For Mathematical Statistics
184 pages
Week2-Day 1-Introduction To Data Mining
No ratings yet
Week2-Day 1-Introduction To Data Mining
30 pages
Lecture16 Crossvalidation
No ratings yet
Lecture16 Crossvalidation
32 pages
Statistical Learning
No ratings yet
Statistical Learning
31 pages
Ghojogh, Benyamin, and Mark Crowley
No ratings yet
Ghojogh, Benyamin, and Mark Crowley
23 pages
ZG512 L1 Introduction, Bias-Variance 270724
No ratings yet
ZG512 L1 Introduction, Bias-Variance 270724
19 pages
Machine Learning Using Matlab: Lecture 8 Advice On ML Application
No ratings yet
Machine Learning Using Matlab: Lecture 8 Advice On ML Application
30 pages
Pengantar Analisis Real I
No ratings yet
Pengantar Analisis Real I
177 pages
Learning Theory
No ratings yet
Learning Theory
19 pages
Weatherwax Epstein Hastie Solution Manual
No ratings yet
Weatherwax Epstein Hastie Solution Manual
147 pages
T04 Soln
No ratings yet
T04 Soln
4 pages
Lec3 Estimatorproperties
No ratings yet
Lec3 Estimatorproperties
23 pages
4.4 Parametric and Non-Parametric Estimator
No ratings yet
4.4 Parametric and Non-Parametric Estimator
47 pages
Unit 1-Week2: Linear Regression, Bias, Variance, Under and Over Fitting, Curse of Dimensionality and ROC
No ratings yet
Unit 1-Week2: Linear Regression, Bias, Variance, Under and Over Fitting, Curse of Dimensionality and ROC
53 pages
ML - Bias Vs Variance - GeeksforGeeks
No ratings yet
ML - Bias Vs Variance - GeeksforGeeks
11 pages
HW 1
No ratings yet
HW 1
11 pages
Formula Help Sheet
No ratings yet
Formula Help Sheet
6 pages
Biasvariancetradeoff 210313075413
No ratings yet
Biasvariancetradeoff 210313075413
13 pages
Solutions To The Exercises On The Bias-Variance Dilemma
No ratings yet
Solutions To The Exercises On The Bias-Variance Dilemma
8 pages
Bias Variance Tradeoff
No ratings yet
Bias Variance Tradeoff
71 pages
M1 - Evaluating Predictive Performance
No ratings yet
M1 - Evaluating Predictive Performance
58 pages
Weatherwax Epstein Hastie Solution Manual
No ratings yet
Weatherwax Epstein Hastie Solution Manual
147 pages
Theory in Machine Learning
No ratings yet
Theory in Machine Learning
60 pages
5.4 MLBasics Estimators
No ratings yet
5.4 MLBasics Estimators
23 pages
Dis2 Sol
No ratings yet
Dis2 Sol
12 pages
MIT15 097S12 Lec04
No ratings yet
MIT15 097S12 Lec04
6 pages
HW 5
100% (1)
HW 5
11 pages
TSNotes 1
No ratings yet
TSNotes 1
29 pages
1 5 Bias Variance Trade Off
No ratings yet
1 5 Bias Variance Trade Off
34 pages
EconometricsII Exercises
100% (1)
EconometricsII Exercises
27 pages
Gauss Markov Theorem
No ratings yet
Gauss Markov Theorem
16 pages
Statistics Model Exam
No ratings yet
Statistics Model Exam
15 pages
CSCE 970 Lecture 6: System Evaluation and Combining Classifiers
No ratings yet
CSCE 970 Lecture 6: System Evaluation and Combining Classifiers
9 pages
Agricultural Statistics and Biometry (Agr 304) - 2021.2022
No ratings yet
Agricultural Statistics and Biometry (Agr 304) - 2021.2022
11 pages
Lecturenote - COL341 - 2010
No ratings yet
Lecturenote - COL341 - 2010
116 pages
Uzielli Et Al. NS2006 Overview - Final
No ratings yet
Uzielli Et Al. NS2006 Overview - Final
104 pages
Statistics
No ratings yet
Statistics
53 pages
ECON 1630 Problem Set #2 Fall 2021: Bias Variance
No ratings yet
ECON 1630 Problem Set #2 Fall 2021: Bias Variance
9 pages
IPS (Points and Interval Estimate)
No ratings yet
IPS (Points and Interval Estimate)
23 pages
Bias Variance Tradeoff
No ratings yet
Bias Variance Tradeoff
6 pages
Stat PDF
No ratings yet
Stat PDF
132 pages
Machine Learning Lecture Notes Undergrad
No ratings yet
Machine Learning Lecture Notes Undergrad
19 pages
(Textbook) (Solution) The Elements of Statistical Learning
No ratings yet
(Textbook) (Solution) The Elements of Statistical Learning
147 pages
Diagnosing Bias Vs Variance
No ratings yet
Diagnosing Bias Vs Variance
11 pages
Classification of Control Charts: Submitted To
No ratings yet
Classification of Control Charts: Submitted To
34 pages
Bayesian Methods in Applied Econometrics, Or, Why Econometrics Should Always and Everywhere Be Bayesian
No ratings yet
Bayesian Methods in Applied Econometrics, Or, Why Econometrics Should Always and Everywhere Be Bayesian
14 pages
Ecofmet
No ratings yet
Ecofmet
2 pages
Fault Diagnosis of Gas Turbine Engines From Transient Data: G. L. Merrington
No ratings yet
Fault Diagnosis of Gas Turbine Engines From Transient Data: G. L. Merrington
7 pages
Fully Modified Ols For Heterogeneous Cointegrated Panels: Peter Pedroni
No ratings yet
Fully Modified Ols For Heterogeneous Cointegrated Panels: Peter Pedroni
38 pages
02 Inference
No ratings yet
02 Inference
53 pages
Statistics
No ratings yet
Statistics
4 pages
Simple Linear Regression: Parameters
No ratings yet
Simple Linear Regression: Parameters
34 pages
ECON6001: Applied Econometrics S&W: Chapter 4: Linear Regression With One Regressor, An Introduction Dr. Gedeon Lim
No ratings yet
ECON6001: Applied Econometrics S&W: Chapter 4: Linear Regression With One Regressor, An Introduction Dr. Gedeon Lim
59 pages
Advanced Regression With JMP PRO Handout
No ratings yet
Advanced Regression With JMP PRO Handout
46 pages
Median: This Article Is About The Statistical Concept. For Other Uses, See Median (Disambiguation)
No ratings yet
Median: This Article Is About The Statistical Concept. For Other Uses, See Median (Disambiguation)
14 pages
Examination SIPE 2008
No ratings yet
Examination SIPE 2008
4 pages
House Price - Prediction
No ratings yet
House Price - Prediction
4 pages
Computing Unit 4
No ratings yet
Computing Unit 4
37 pages
Sampling and Sampling Distributions: ASW, Chapter 7
No ratings yet
Sampling and Sampling Distributions: ASW, Chapter 7
25 pages
Q2 Stats
No ratings yet
Q2 Stats
38 pages
AignerLovellSchmidtJE1977 (1) Inglés
No ratings yet
AignerLovellSchmidtJE1977 (1) Inglés
18 pages
Stats and Maths For Data Analyst
No ratings yet
Stats and Maths For Data Analyst
23 pages
FCDS - RA ch3 Sp21
No ratings yet
FCDS - RA ch3 Sp21
20 pages
IISc DL Detailed Curriculum
No ratings yet
IISc DL Detailed Curriculum
7 pages
A Model of Washing On Dense Medium Recovery Screens
No ratings yet
A Model of Washing On Dense Medium Recovery Screens
25 pages
Lecture 15
No ratings yet
Lecture 15
14 pages
Bayesian Methods For The Analysis of Small Sample Multilevel Data With A Complex Variance Structure
No ratings yet
Bayesian Methods For The Analysis of Small Sample Multilevel Data With A Complex Variance Structure
14 pages
Testing of Hypothesis: Ypothesis Testing. This Is One of The Most Useful Aspects of Statistical Inference
No ratings yet
Testing of Hypothesis: Ypothesis Testing. This Is One of The Most Useful Aspects of Statistical Inference
9 pages
Lecture Note 4
No ratings yet
Lecture Note 4
6 pages
Shortcuts to College Calculus Refreshment Kit
From Everand
Shortcuts to College Calculus Refreshment Kit
Juan Acevedo
No ratings yet

Bias Variance

Uploaded by

Bias Variance

Uploaded by

Machine Learning ! ! ! ! !

Bias-Variance in Point Estimate

Squared error = Square of bias error + Variance

Bias -Variance in Regression

variance = ∫ E [{y(x;D)] − E [y(x;D)]} ] p(x)dx

noise = ∫ {h(x) − t} p(x,t)dxdt

Dependence of Bias-Variance on Model Complexity

Result of averaging multiple

Squared Bias and Variance vs λ

Test error minimum

Small values of λ allow model to Large values of λ pull weight

You might also like