Il 0% ha trovato utile questo documento (0 voti)

69 visualizzazioni

Intro Prediction

Il documento tratta di metodi per la valutazione di modelli predittivi. Descrive l'errore quadratico medio sui dati di training e test come metrica e introduce la cross validation come metodo per evitare la dipendenza dalla particolare divisione dei dati in training e test. Discute inoltre la distinzione tra errore predittivo condizionato ed errore predittivo atteso.

Caricato da

Mattia

Formati disponibili

Scarica in formato PDF, TXT o leggi online su Scribd

Il 0% ha trovato utile questo documento (0 voti)

69 visualizzazioni

Intro Prediction

Caricato da

Mattia

Formati disponibili

Scarica in formato PDF, TXT o leggi online su Scribd

Sei sulla pagina 1/ 8

Generalità sulla valutazione di metodi previsivi

Nicola Lunardon - [email protected]

U7-2009 (Secondo piano)

Riferimenti
• An Introduction to Statistical Learning, paragrafi 2.1.5, 2.2

• An Introduction to Statistical Learning, capitolo 3 per ripasso sulla regressione lineare

Introduzione
Consideriamo il seguente esempio con variabile risposta continua

1
• Punti neri: diagramma di dispersione per le coppie (yi , xi ) di cui disponiamo, i = 1, ..., n = 200
La risposta è generata secondo la relazione

1
Y = x+ϵ
30
ϵ ∼ N (0, 1)

• Linea blu: vera relazione che lega la variabile risposta y alla variabile esplicativa x

• Linea arancione (Modello 0): relazione stimata con una retta di regressione derivante dal
modello

Y = β1 X + ϵ
Con i dati a disposizione βˆ1 = 0.02859(1/30 = 0.033)

• Linea verde (Modello 1): relazione stimata con una regressione polinomiale (spline con 12
nodi)
• Situazione irrealistica
– Conosciamo la vera relazione tra la risposta e l’esplicativa
– Quale modello scegliere ?
Confrontando le relazioni stimate dei due modelli con la linea blu → Modello 0
• Situazione reale
– Non conosciamo la vera relazione
– Quale modello scegliere?
Consideriamo il training mean squared error
n
X
−1
M SEtr = n (yi − yˆi )2
i=1

dove yˆi sono le previsioni che fornisce il modello

∗ Modello 0: M SEtr = 1.0426815
∗ Modello 1: M SEtr = 0.9978994
Supponiamo di disporre di altre n∗ = 200 coppie (yi∗ , x∗i ) non utilizzate per stimare i modelli.
Vediamo il diagramma dei nuovi dati e aggiungiamo le relazioni stimate in precedenza
Utilizziamo i modelli per prevedere yi∗ sulla base delle rispettive x∗i . Consideriamo il test mean
squared error:
∗
n
X
∗ −1
M SEte = (n ) (yi∗ − yˆi∗ )2
i=1

dove yˆi∗ sono le previsioni che fornisce il modello (sulla base delle rispettive x∗i )

2
• Modello 0: M SEte = 1.0247233
• Modello 1: M SEte = 1.0304042

In sintesi
• L’indicazione che ci fornisce il M SEtr è di scegliere il Modello 1. Più il modello è flessibile e
più si adatterà ai dati → piùpiccolosaràMSEtr .

• L’indicazione che ci fornisce il M SEte è di scegliere il Modello 0. Questa è la quantità che è

ragionevole considerare in un contesto di previsione.

Problema: nella pratica si dispone di un solo insieme di dati. Come fare quindi per non basare la
propria scelta sul M SEtr ?

Metodi di valutazione
Training set - Test set
Una soluzione è quella di dividere l’insieme di dati a disposizione in due:

• Training set (insieme di stima): insieme di dati che verrà utilizzato per stimare i modelli

3
• Test set (insieme di verifica): insieme di dati che verrà utilizzato per valutare l’errore di
previsione.
Non vi è una regola precisa per determinare la proporzione di osservazioni che andranno a comporre
ciascuno degli insiemi. Dipende dalla complessità del problema (numero di variabili, numerosità
campionaria, . . . )
Consideriamo i dati presentati all’inzio e attuiamo la divisione casuale con proporzione: 75 % /25
%

• Modello 0: M SEte = 1.2172192

• Modello 1: M SEte = 1.2542386

La divisione è casuale, ma pur sempre arbitraria. Consideriamo un’altra divisione casuale

• Modello 0: M SEte = 0.7801636

• Modello 1: M SEte = 0.8689308

Convalida incrociata (Cross validation)

É metodo che permette di alleviare il problema dell’arbitrarietà della divisione in training set e test
set.
Operativamente:
• L’insieme di dati viene diviso in K parti (o K folds)
– Stima del modello su un training set basato unendo K − 1 parti
– Si fa la previsione sull’unico insieme che non ha fatto parte training set e si calcola l’errore
di previsione
• Si reiterano i due punti precedenti per K volte, ovvero fino a quando ciascuno dei K insiemi
ha svolto la funzione di test set
• La stima dell’errore di previsione è ottenuta come media aritmetica dei K errori di previsione

Per esempio, Supponiamo di avere un insieme di dati composto dalla variabile risposta, y , e una
esplicativa, x. L’insieme è composto da 15 unità

4
Di seguito si riportano gli identificativi delle unità che compongono ciascuno dei 7 folds con cui si è
deciso di strutturare la convalida incrociata.

A titolo di esempio, si riporta il training set quando il Fold 1 attua da test set.

Di seguito il test set associato al training set di cui sopra

Sulla scelta del numero di fold si possono fare considerazioni dettagliate; indicativamente si sceglie
il numero di fold valutando quanto oneroso è il processo di stima/verifica.
Quando K = n la K fold la cross validation prende il nome di leave one out cross validation. A
differenza di una K fold, con K < n, non c’è aleatorietà del processo, tuttavia è computazionalmente
intenso.
Ritornando all’esempio di partenza, si ha che con la leave one out cross validation

• Modello 0: M SEte = 1.0544348

• Modello 1: M SEte = 1.1378942

5
1 Il contesto della classificazione
Per valutare gli errori dei classificatori si fa ricorso a misure di perdita diverse rispetto agli scarti al
quadrato tra valori veri e previsti.
Spesso si utilizza l’errore di classificazione

Iw̸=x (x)
con IA(x) (x) funzione indicatrice che vale 1 se si verifica l’evento A(x) (che dipende da x).
In concreto, l’errore di classificazione quando si considera yi e la sua previsione yˆi è

Iyi ̸=yˆi (yˆi )

Al di là della misura di perdita considerata, i concetti e metodi esposti in precedenza rimangono
validi nel contesto di classificazione.

Sull’errore di previsione
Nel seguito ci ricondurremo al contesto di previsione di una variabile continua.
È opportuno fare la distinzione tra:

• Errore atteso di previsione condizionato

• Errore atteso di previsione

È bene richiamare quanto segue, le variabili esplicative si assumono fissate e la variabile risposta è
generata secondo la relazione

Y = γx + ϵ
con ϵ ∼ N (0, σ 2 )
La variabile risposta osservata per ciascuna unità, yi , è realizzazione di

Yi = γxi + ϵ
Disponiamo di coppie (yi , xi ), i = 1, ..., n, sulla base di tali coppie stimiamo il nostro modello e lo
indichiamo con M̂ .
La previsione restituita dal nostro modello sulla base di una nuova esplicativa x∗ è

yˆ∗ = M̂ (x∗ )

Errore atteso di previsione condizionato

In parole: è l’errore atteso dal nostro modello quando lo usiamo per prevedere una nuova osservazione
generata dalla relazione

Y ∗ = γx∗ + ϵ
In formule:
h i2
EY ∗ Y ∗ − M̂ (x∗ )

6
Nella relazione di cui sopra, il valore atteso è solamente rispetto a Y ∗ , ovvero considero il campione
utilizzato per stimare M̂ , ovvero (yi , xi ),i = 1, . . . , n, fissato.
L’errore atteso di previsione condizionato è la quantità a cui naturalmente siamo interessati. Una
volta che ho ottenuto il modello stimato M̂ lo uso per fare previsione.

Errore atteso di previsione

In parole: è l’errore atteso che ci attendiamo nel prevedere una nuova osservazione, y ∗ , generata
dalla relazione

Y ∗ = γx∗ + ϵ
quando il modello è stimato utilizzando un gran numero di nuovi campioni di dimensione n generati
dalla relazione

Yi = γxi + ϵ
In formula:
h i2
EY y ∗ − M̂ (x∗ : Y )

si è enfatizzata la dipendenza del modello stimato da Y

si noti che y ∗ è una realizzazione di Y ∗ ed è una quantità non aleatoria.
Nella relazione di cui sopra, il valore atteso è solamente rispetto a Y . Voglio valutare cosa succede
all’errore di previsione al variare dei campioni utilizzati per stimare il mio modello.

Cosa è possibile stimare

L’errore atteso di previsione condizionato è la quantità più di interesse nella pratica. Ciò che è
possibile realisticamente stimare è, però, l’errore atteso di previsione.
La logica porterebbe a dedurre che una K fold cross validation è:

• più adatta a stimare l’errore atteso di previsione quando il numero di fold è basso
se il numero di fold è basso, allora mi aspetto che gli insiemi di stima saranno molto
diversi rispetto all’insieme di stima composto dal campione intero e produrranno, quindi,
modelli stimati molto diversi da quello che si stima con l’intero insieme di dati
• più adatta a stimare l’errore atteso di previsione condizionato quando il numero di fold è alto

– se il numero di fold è elevato, allora mi aspetto che gli insiemi di stima saranno simili
rispetto all’insieme di stima composto dal campione intero e produrranno, quindi, modelli
stimati molto simili a quello che si stima con l’intero insieme di dati
– una leave one out cross validation dovrebbe essere la migliore stima dell’errore atteso di
previsione condizionato

Nella pratica, però, si è osservato che tutti i metodi tendono a stimare l’errore atteso di previsione.

7
Illustrazione
Consideriamo il calcolo teorico dell’errore atteso di previsione quando utilizziamo il Modello 0,
ovvero il modello di regressione lineare che postula la relazione Y = β1 X + ϵ
Sulla base del campione di cui disponiamo, (yi , xi ), i = 1, ..., n, il Modello 0 stimato è

M̂ = M̂ (z) = β̂1 z
dove β̂1 è la stima di β1 ottenuta con il metodo dei minimi quadrati
Pn
yi xi
β̂1 = Pi=1
n 2
i=1 xi
Vogliamo valutare
nh i2 o
EY y ∗ − M̂ (x∗ : Y )

quando

Y = γx + ϵ, ϵ ∼ N (0, σ 2 )
)
La coppia (y ,x rappresenta una nuova osservazione, sono quantità fissate
Nel seguito l’unica quantità stocastica è M̂ (x∗ ; Y ): va quindi pensata come variabile casuale. Questo
significa considerare lo stimatore β̂1 e non la stima
Pn
Yi xi
β̂1 = Pi=1 n 2
i=1 xi
Svolgiamo il quadrato
h i2
y ∗ − M̂ (x∗ ; Y ) = (y ∗ )2 + [M̂ (x∗ ; Y )]2 − 2M̂ (x∗ ; Y )y ∗

Calcoliamo il valore atteso

Potrebbero piacerti anche

Formulario Statistica
100% (1)
Formulario Statistica
15 pagine
Ricerca Operativa Risposte A Domande Aperte Paniere 2021
Nessuna valutazione finora
Ricerca Operativa Risposte A Domande Aperte Paniere 2021
7 pagine
Esp Pallinometro
Nessuna valutazione finora
Esp Pallinometro
19 pagine
Econometria 1
Nessuna valutazione finora
Econometria 1
59 pagine
Appunti Econometria 1 1
Nessuna valutazione finora
Appunti Econometria 1 1
10 pagine
Minimi Quadrati
Nessuna valutazione finora
Minimi Quadrati
16 pagine
Calcolo Numerico 2011
Nessuna valutazione finora
Calcolo Numerico 2011
69 pagine
Econometria 1
Nessuna valutazione finora
Econometria 1
14 pagine
Compitob 10-01-2023-Con Soluzioni
Nessuna valutazione finora
Compitob 10-01-2023-Con Soluzioni
4 pagine
Compito 1
Nessuna valutazione finora
Compito 1
2 pagine
Limiti Con Excel
100% (1)
Limiti Con Excel
6 pagine
ALN1 Aritmetica 2024
Nessuna valutazione finora
ALN1 Aritmetica 2024
150 pagine
Terza_esercitazione_soluzioni
Nessuna valutazione finora
Terza_esercitazione_soluzioni
6 pagine
Esercitazioni Di Statistica
Nessuna valutazione finora
Esercitazioni Di Statistica
18 pagine
Dinamica e Modellistica Della Turbolenza - Esercitazioni Del Corso
Nessuna valutazione finora
Dinamica e Modellistica Della Turbolenza - Esercitazioni Del Corso
24 pagine
4 - Regressione Lineare
Nessuna valutazione finora
4 - Regressione Lineare
44 pagine
Anova Appunti
Nessuna valutazione finora
Anova Appunti
58 pagine
Capacitated Vehicule Routing With Simulated Annealing
Nessuna valutazione finora
Capacitated Vehicule Routing With Simulated Annealing
18 pagine
05 Equazioni Non Lineari p1
Nessuna valutazione finora
05 Equazioni Non Lineari p1
36 pagine
eserc 9 marzo Slides Corso R III parte
Nessuna valutazione finora
eserc 9 marzo Slides Corso R III parte
35 pagine
Intr 8
Nessuna valutazione finora
Intr 8
20 pagine
Inedite Statistica
Nessuna valutazione finora
Inedite Statistica
6 pagine
Calcolo Delle Probabilità
Nessuna valutazione finora
Calcolo Delle Probabilità
232 pagine
Econometria Applicata
Nessuna valutazione finora
Econometria Applicata
5 pagine
Lezione4
Nessuna valutazione finora
Lezione4
18 pagine
Modelli Econometrici Scheda
Nessuna valutazione finora
Modelli Econometrici Scheda
52 pagine
Logit Probit PDF
Nessuna valutazione finora
Logit Probit PDF
31 pagine
Interpolazione, - Regressione, - Correlazione
Nessuna valutazione finora
Interpolazione, - Regressione, - Correlazione
46 pagine
Calcolo Approssimato Della Radice Quadrata
Nessuna valutazione finora
Calcolo Approssimato Della Radice Quadrata
6 pagine
Incertezza Di Misura
Nessuna valutazione finora
Incertezza Di Misura
12 pagine
TD01
Nessuna valutazione finora
TD01
3 pagine
errorifin
Nessuna valutazione finora
errorifin
45 pagine
Metodo Di Riduzione
Nessuna valutazione finora
Metodo Di Riduzione
3 pagine
Domande Aperte Metodi
Nessuna valutazione finora
Domande Aperte Metodi
6 pagine
lab3_100325
Nessuna valutazione finora
lab3_100325
23 pagine
Tesina Del Laboratorio Di Misure Elettriche Ed Elettroniche
Nessuna valutazione finora
Tesina Del Laboratorio Di Misure Elettriche Ed Elettroniche
60 pagine
Lezione 3 Statistica Descrittiva 2
Nessuna valutazione finora
Lezione 3 Statistica Descrittiva 2
19 pagine
Raccolta Esercizi
Nessuna valutazione finora
Raccolta Esercizi
34 pagine
Incertezza Di Misura
Nessuna valutazione finora
Incertezza Di Misura
102 pagine
Modulo 3-Norma Uni-Cei Env 13005
Nessuna valutazione finora
Modulo 3-Norma Uni-Cei Env 13005
13 pagine
Appunti Modellistica 2020 3
Nessuna valutazione finora
Appunti Modellistica 2020 3
23 pagine
Statistica Lezione DOE
Nessuna valutazione finora
Statistica Lezione DOE
54 pagine
Seconda Relazione Di Fisica
Nessuna valutazione finora
Seconda Relazione Di Fisica
3 pagine
Applicazioni Del Modello Logistico in Ambito Biomedicale
Nessuna valutazione finora
Applicazioni Del Modello Logistico in Ambito Biomedicale
287 pagine
Risoluzione Simulazione 2
Nessuna valutazione finora
Risoluzione Simulazione 2
7 pagine
Intervalli Confidenza
Nessuna valutazione finora
Intervalli Confidenza
16 pagine
Indicazioni Analisi Dati
Nessuna valutazione finora
Indicazioni Analisi Dati
20 pagine
L02 Incertezza combinata
Nessuna valutazione finora
L02 Incertezza combinata
26 pagine
P Sciortino PDF
Nessuna valutazione finora
P Sciortino PDF
64 pagine
ETEROSCHEDASTICITA
Nessuna valutazione finora
ETEROSCHEDASTICITA
7 pagine
Equazioni e disequazioni
Da Everand
Equazioni e disequazioni
Alessio Mangoni
Nessuna valutazione finora
Metodo Monte Carlo
Nessuna valutazione finora
Metodo Monte Carlo
8 pagine
3.3 Il Modello Di Regressione Lineare Multipla RID
Nessuna valutazione finora
3.3 Il Modello Di Regressione Lineare Multipla RID
27 pagine
Slide 10
Nessuna valutazione finora
Slide 10
53 pagine
MBA HRD II SEM 206 Chi Square
Nessuna valutazione finora
MBA HRD II SEM 206 Chi Square
16 pagine
2022 MSI - Lez 03 - Incertezza Combinata
Nessuna valutazione finora
2022 MSI - Lez 03 - Incertezza Combinata
22 pagine
domandeAnalisiDati
Nessuna valutazione finora
domandeAnalisiDati
35 pagine
Esercizi EXERCISE Svolti MATLAB
Nessuna valutazione finora
Esercizi EXERCISE Svolti MATLAB
39 pagine
Cap. 4 - Parte 2
Nessuna valutazione finora
Cap. 4 - Parte 2
21 pagine
Test di verifica di ipotesi: esercizi svolti
Da Everand
Test di verifica di ipotesi: esercizi svolti
Eleonora Bernasconi
Nessuna valutazione finora
Derivate
Nessuna valutazione finora
Derivate
10 pagine
Schema Generale Per Lo Studio Di Una Funzione
Nessuna valutazione finora
Schema Generale Per Lo Studio Di Una Funzione
19 pagine
Appunti Di Meccanica Computazionale PDF
Nessuna valutazione finora
Appunti Di Meccanica Computazionale PDF
129 pagine
Alberti - Analisi in Più Variabili
Nessuna valutazione finora
Alberti - Analisi in Più Variabili
74 pagine
Luc CA 12 Risposta Al Gradino
Nessuna valutazione finora
Luc CA 12 Risposta Al Gradino
16 pagine
Esercizi Integrali Misti
Nessuna valutazione finora
Esercizi Integrali Misti
10 pagine