training_intro_learning

Uploaded by

anh thu Tran

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views

training_intro_learning

Uploaded by

anh thu Tran

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Machine learning ISUP - Sorbonne Université

Introduction to machine learning

1 Warm-up: Bayes classier for scalar Gaussian mixtures

Let (Xi , Yi )1⩽i⩽n be independent variables in R × {0, 1}. Assume that P(Y1 = 0) = 1/2. Assume
also that the distribution of X1 given {Y1 = 0} (resp. {Y1 = 1}) is Gaussian with mean µ0 (resp.
µ1 ) and variance 1. The probability density function of X1 is written g . Write

g0 : x 7→ (2π)−1/2 exp(−(x − µ0 )2 /2) and g1 : x 7→ (2π)−1/2 exp(−(x − µ1 )2 /2) .

Figure 1: Samples and density when µ0 = −2 et µ1 = 0 (left) and µ0 = −2 and µ1 = 2 (right).

1. Provide an expression of a classier h∗ minimizing h 7→ P(h(X) ̸= Y ).

2. Using Bayes rule, show that h∗ depends only on g1 /g0 .
3. Show that the Bayes classier uses the mean between µ0 and µ1 to classify samples.

2 Bayes classier
2.1 Uniform distributions
Assume that (X, Y ) ∈ R × {0, 1} is dened on (Ω, F, P) with P(Y = 1) = π ∈ (0, 1). Assume that
conditionally on {Y = 0} (resp. {Y = 1}) X has a uniform distribution on [0, θ] with θ ∈ (0, 1)
(resp. on [0, 1]). Compute η(X) = P(Y = 1|X).

2.2 Weighted risk

Assume that (X, Y ) ∈ R × {0, 1} is dened on (Ω, F, P). Using ω0 , ω1 > 0, with ω0 + ω1 = 1, we
consider the weighted risk:
R(h) = E[2ωY 1Y ̸=h(X) ] .
Compute a classier h∗ minimizing h 7→ R(h) and R(h∗ ).

1
3 Additional exercises
3.1 Bayes classier: excess risk
Let (X, Y ) ∈ Rd × {0, 1} be random variables dened on the same probability space (Ω, F, P). For
any classier h : X → {0, 1}, dene its classication error by
R(h) = P(Y ̸= h(X)) .

The classier h∗ dened by:

h∗ (x) = sign(η(x) − 1/2) ,
where
η(X) = P(Y = 1|X) ,
minimizes h 7→ R(h).
1. Prove that
1
R(h∗ ) = E [η(X) ∧ (1 − η(X))] ⩽ .
2
2. Prove that for all classiers h, the excess risk is given by
R(h) − R(h∗ ) = E [|1 − 2η(X)| |h(X) − h∗ (X)|] .

3.2 Plug-in classier

Let (X, Y ) ∈ Rd × {−1, 1} be random variables dened on the same probability space (Ω, F, P).
For any classier h : X → {−1, 1}, dene its classication error by
R(h) = P(Y ̸= h(X)) .

The classier h∗ dened by:

h∗ (x) = sign(η(x) − 1/2) ,
where
η(X) = P(Y = 1|X) ,
minimizes h 7→ R(h). Given n independent couples {(Xi , Yi )}1⩽i⩽n with the same distribution as
(X, Y ), an empirical surrogate for h∗ is obtained from a possibly nonparametric estimator ηbn of
η:
hn : x 7→ sign(b
b ηn (x) − 1/2) .

1. Prove that for any classier h : X → {−1, 1},

P(Y ̸= h(X)|X) = (2η(X) − 1)1h(X)=−1 + 1 − η(X)

and
1
R(h) − R(h∗ ) = 2E η(X) − 1h(X)̸=h∗ (X) .
2

All Tasks
No ratings yet
All Tasks
7 pages
Evans PDE Solution Chapter 3 Nonlinear First-Order PDE
No ratings yet
Evans PDE Solution Chapter 3 Nonlinear First-Order PDE
6 pages
Tuo Zhao Notes
No ratings yet
Tuo Zhao Notes
47 pages
Solved Problems
No ratings yet
Solved Problems
7 pages
OpenMind Starter Unit 4 Student's Book Answer Key
0% (5)
OpenMind Starter Unit 4 Student's Book Answer Key
2 pages
3.1 Binary Classification
No ratings yet
3.1 Binary Classification
4 pages
Ee5143 Pset1 PDF
No ratings yet
Ee5143 Pset1 PDF
4 pages
Statistical Learning Theory: 18.657: Mathematics of Machine Learning
No ratings yet
Statistical Learning Theory: 18.657: Mathematics of Machine Learning
9 pages
Linear Classification: 1 1 N N I D I
No ratings yet
Linear Classification: 1 1 N N I D I
33 pages
Linearclassification
No ratings yet
Linearclassification
31 pages
The Exponential Family
No ratings yet
The Exponential Family
7 pages
Classification
No ratings yet
Classification
19 pages
Lecture 14. HGR Maximal Correlation (After-Class)
No ratings yet
Lecture 14. HGR Maximal Correlation (After-Class)
4 pages
Essentiel_proba_stat_en
No ratings yet
Essentiel_proba_stat_en
2 pages
Elements of Information Theory.2nd Ex 2.4
No ratings yet
Elements of Information Theory.2nd Ex 2.4
4 pages
Lec38 - 210108071 - AKSHAY KUMAR JHA
No ratings yet
Lec38 - 210108071 - AKSHAY KUMAR JHA
12 pages
ETN642-lec9_CH9 Differential Entropy
No ratings yet
ETN642-lec9_CH9 Differential Entropy
6 pages
Lecture 3 - Fall 2023
No ratings yet
Lecture 3 - Fall 2023
12 pages
Lecture 11
No ratings yet
Lecture 11
6 pages
jmi-09-08 (1)
No ratings yet
jmi-09-08 (1)
15 pages
Lecture 3 - Fall 2023
No ratings yet
Lecture 3 - Fall 2023
13 pages
Sol Advriskmin 2
No ratings yet
Sol Advriskmin 2
3 pages
2021 Spring Nonlinear Techniques For Nonlinear Dispersive PDEs 4
No ratings yet
2021 Spring Nonlinear Techniques For Nonlinear Dispersive PDEs 4
10 pages
midit10
No ratings yet
midit10
5 pages
2effff4d-7784-43aa-9e2e-936f23b2f0cb
No ratings yet
2effff4d-7784-43aa-9e2e-936f23b2f0cb
18 pages
Notes
No ratings yet
Notes
39 pages
training_LDA
No ratings yet
training_LDA
2 pages
Information Theory Differential Entropy
No ratings yet
Information Theory Differential Entropy
29 pages
Statisticsyear 1 Distributions
No ratings yet
Statisticsyear 1 Distributions
3 pages
Harnack and Mean Value Inequalities On Graphs: 1 Introduction and Main Results
No ratings yet
Harnack and Mean Value Inequalities On Graphs: 1 Introduction and Main Results
8 pages
Tutorial1 20
No ratings yet
Tutorial1 20
2 pages
230 Final
No ratings yet
230 Final
38 pages
(Some) Solutions For HW Set # 2
No ratings yet
(Some) Solutions For HW Set # 2
3 pages
Lecture Notes 1: Brief Review of Basic Probability (Casella and Berger Chapters 1-4)
100% (1)
Lecture Notes 1: Brief Review of Basic Probability (Casella and Berger Chapters 1-4)
14 pages
Discussion Notes 2-6
No ratings yet
Discussion Notes 2-6
3 pages
Mathematical Problems and Solutions On Information Theory
No ratings yet
Mathematical Problems and Solutions On Information Theory
28 pages
hw2_sol
No ratings yet
hw2_sol
5 pages
Tutorial 1
No ratings yet
Tutorial 1
2 pages
Modern Crypto 18 Homework 2 Solution
No ratings yet
Modern Crypto 18 Homework 2 Solution
5 pages
Ejercicios Munkres Resueltos
No ratings yet
Ejercicios Munkres Resueltos
28 pages
2018.proceedings Cmmse 7
No ratings yet
2018.proceedings Cmmse 7
4 pages
Random Variables Cheatsheet
No ratings yet
Random Variables Cheatsheet
3 pages
Paper DCRE
No ratings yet
Paper DCRE
13 pages
CH605 23 24 Tutorial2
No ratings yet
CH605 23 24 Tutorial2
3 pages
Beamer Rodiak
No ratings yet
Beamer Rodiak
35 pages
Nonparametric Classification 10/36-702: 1 1 N N N I I
No ratings yet
Nonparametric Classification 10/36-702: 1 1 N N N I I
20 pages
info
No ratings yet
info
79 pages
Stat Risk
No ratings yet
Stat Risk
6 pages
Solutions To Assignment-3
No ratings yet
Solutions To Assignment-3
10 pages
Probc 1
No ratings yet
Probc 1
4 pages
1 What Is A Random Variable (R.V.) ?
No ratings yet
1 What Is A Random Variable (R.V.) ?
6 pages
No of Flips For First Head
No ratings yet
No of Flips For First Head
8 pages
Week01 Workshop
No ratings yet
Week01 Workshop
2 pages
hw3_red
No ratings yet
hw3_red
4 pages
Story Sheet
No ratings yet
Story Sheet
2 pages
Homework Assignment 8: Solutions
No ratings yet
Homework Assignment 8: Solutions
7 pages
10.1515 - Rose 2022 2092
No ratings yet
10.1515 - Rose 2022 2092
8 pages
Tutorial5 Solutions
No ratings yet
Tutorial5 Solutions
2 pages
P8-Properties of Distributions
No ratings yet
P8-Properties of Distributions
12 pages
chapter1
No ratings yet
chapter1
15 pages
Differential Forms
From Everand
Differential Forms
Henri Cartan
5/5 (2)
39.representations of Young People in Local Comic Book (Roselina Binti Musahar) PP 282-287
No ratings yet
39.representations of Young People in Local Comic Book (Roselina Binti Musahar) PP 282-287
6 pages
Socio - Ecological Systems of Coastal Village Areas in Subang Regency
No ratings yet
Socio - Ecological Systems of Coastal Village Areas in Subang Regency
14 pages
Student Clearance 2022
No ratings yet
Student Clearance 2022
4 pages
Icct Colleges Foundation, Inc.: V.V. Soliven Ave - Ii Cainta, Rizal
No ratings yet
Icct Colleges Foundation, Inc.: V.V. Soliven Ave - Ii Cainta, Rizal
7 pages
NYSYLC Annual Report
No ratings yet
NYSYLC Annual Report
14 pages
AP Payment Information: This Is What A Student Who Pays The Regular Test Fee Will See
No ratings yet
AP Payment Information: This Is What A Student Who Pays The Regular Test Fee Will See
2 pages
Week 4: Quarter 1
No ratings yet
Week 4: Quarter 1
5 pages
AyuVed Guide
No ratings yet
AyuVed Guide
40 pages
PRJM6004 Project Procurement Management Trimester 2 2017 Miri Sarawak Campus INT
No ratings yet
PRJM6004 Project Procurement Management Trimester 2 2017 Miri Sarawak Campus INT
7 pages
Gold Exp B1P U7 Lang Test A
No ratings yet
Gold Exp B1P U7 Lang Test A
2 pages
Stqa Unit - 2 Part A
No ratings yet
Stqa Unit - 2 Part A
4 pages
Perimeter and Area of Rectangles
No ratings yet
Perimeter and Area of Rectangles
2 pages
CO1 - Series and Parallel Circuit
100% (2)
CO1 - Series and Parallel Circuit
7 pages
Foundations of Behavior
No ratings yet
Foundations of Behavior
53 pages
Question Bank - PB & N - ESE
No ratings yet
Question Bank - PB & N - ESE
10 pages
2818019 SVVT Practical File
No ratings yet
2818019 SVVT Practical File
50 pages
Preview The Essential Guide To Psychiatric Rehabilitation Practice1
No ratings yet
Preview The Essential Guide To Psychiatric Rehabilitation Practice1
10 pages
Langley WR Assign8final 7490
No ratings yet
Langley WR Assign8final 7490
8 pages
Group Dynamics
No ratings yet
Group Dynamics
2 pages
1-Poster Competition FYP Infineon Week UTeM 2016
No ratings yet
1-Poster Competition FYP Infineon Week UTeM 2016
11 pages
How Science and Technology Affect Society
No ratings yet
How Science and Technology Affect Society
2 pages
2021-AL-Political-Science-Marking-Scheme-English-Medium (1) (1)
No ratings yet
2021-AL-Political-Science-Marking-Scheme-English-Medium (1) (1)
41 pages
Roles of Comm Director
No ratings yet
Roles of Comm Director
10 pages
Art Course Description
No ratings yet
Art Course Description
3 pages
Zscore 1 Bsit
No ratings yet
Zscore 1 Bsit
14 pages
Communication and Interpersonal Skills at Work: Week 1: Know Yourself
No ratings yet
Communication and Interpersonal Skills at Work: Week 1: Know Yourself
2 pages
First Class Dhanbad 2012
No ratings yet
First Class Dhanbad 2012
4 pages
Akshat Sanghvi: Experience Summary
No ratings yet
Akshat Sanghvi: Experience Summary
3 pages
Family Theories
No ratings yet
Family Theories
25 pages