2 e Tabelle Di Contingenza
2 e Tabelle Di Contingenza
DI CONTINGENZA
91
TABELLE DI CONTINGENZA
Esempio
SESSO
INTERESSE PER
Maschio Femmina Totale
STATISTICA
Alto 62 26 88
Medio 35 29 64
Basso 3 45 48
Totale 100 100 200
I criterio
1 2 Totale
II criterio
1 a b a+b
2 c d c+d
93
TABELLA DI CONTINGENZA m x n
I criterio
1 2 … m
1
II criterio
94
IL TEST DI INDIPENDENZA χ2
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
Ipotesi
H0: le due variabili sono indipendenti;
H1: le due variabili non sono indipendenti.
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
97
I gradi di libertà
In generale
Esempi:
gdl di una tabella 2 x 2 = (2-1) x (2-1) = 1
gdl di una tabella 3 x 2 = (3-1) x (2-1) = 2
98
Confronto tra frequenze osservate e attese
Test χ2
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
Evidentemente No
99
?
Le differenze tra le due distribuzioni sono
attribuibili al caso oppure il rendimento
scolastico è, in qualche modo, legato allo stato
nutrizionale?
Test χ2
2
(O - E)
χ2 = ∑
E
dove O=frequenze osservate
E= frequenze attese
100
Calcolo di χ2
Calcoliamo il valore di χ2 utilizzando le
informazioni contenute nelle tabelle precedenti.
χ =
2 (105 − 44.4)
2
+
(15 − 75.6)
2
+
(80 − 140.6)
2
+
(300 − 239.4 )
2
=
44.4 75.6 140.6 239.4
60.6 2 (−60.6) 2 (−60.6) 2 (60.6) 2
= + + + =
44.4 75.6 140.6 239.4
3672.36 3672.36 3672.36 3672.36
= + + + =
44.4 75.6 140.6 239.4
= 82.71 + 48.58 + 26.12 + 15.34 =
= 172.75
Si ottiene un valore del test χ2=172.75 con 1gdl.
La consultazione della tavola sinottica del χ2
consente la lettura dei valori critici.
Per α = 0.05 e 1gdl, il valore critico di χ2 =3.84
Decisione statistica
Regola di decisione
Rifiuto H0 se χ2 calcolato > χ2 tabulato
102
RIASSUMENDO:
COME UTILIZZARE IL TEST χ2
104
Test χ2 di indipendenza e
test z sulla differenza tra 2 proporzioni.
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
( pˆ − pˆ ) − ( p − p )
z= 1 2 1 2 0
p(1 − p) p(1 − p)
+
n1 n2
105 15
p̂ 1 = = 0 . 57 p̂ 2 = = 0 . 05
185 315
x1 + x 2 105 + 15 120
p= = = = 0 .24
n1 + n 2 185 + 315 500
0 .57 − 0 .05
z= = 13
0 .24 ⋅ (1 − 0 .24 ) 0 .24 ⋅ (1 − 0 .24 )
+
185 315
Decisione statistica
Rifiuto H0, perché 13, maggiore di 1.96, cade
nella regione di rifiuto.
Conclusione
La proporzione di studenti con rendimento scarso
non è uguale all’interno dei due gruppi con
diverso stato nutrizionale.
Ciò equivale a dire che esiste una relazione di
dipendenza tra rendimento scolastico e stato
nutrizionale.
106
MISURE DI ASSOCIAZIONE TRA
DUE VARIABILI NOMINALI.
Si ricorda che:
107
STUDI PROSPETTIVI E
RISCHIO RELATIVO
In generale:
MALATTIA
FATTORE DI RISCHIO Sì No Totale
Esposti a b a+b
Non esposti c d c+d
Totale a+c b+d n
a ( a + b)
RR= c (c + d )
109
Come interpretare i valori assunti dal RR
Esempio
L’essere sposati con un fumatore è associato a un
rischio relativo di malattie cardiache pari a 1.3.
Ciò significa che i non fumatori sposati con
fumatori sono colpiti 1.3 volte di più da malattie
cardiache rispetto a non fumatori sposati con non
fumatori.
110
Intervallo di confidenza per RR
i =1 Ei
111
Esercizio Daniel pag.506 12.7.1
Tra i dati raccolti in uno studio prospettivo sulla
depressione postnatale nelle donne (Boyce et al.)
compaiono i dati riassunti nella tabella che segue.
Dal campione dei soggetti in studio, si vuole stimare il
rischio relativo di diventare un “caso” di depressione
postnatale in donne primipare, sposate o conviventi in
maniera stabile, ad un mese dal parto, quando è presente il
fattore di rischio, rappresentato da un partner indifferente.
Depressione
Partner indifferente Sì No Totale
Sì 5 21 26
No 8 82 90
Totale 13 103 116
5 26 0.1923
RR= 8 90 = 0.0889 = 2.2
112
Calcoliamo l’intervallo di confidenza al 95% per
RR con la seguente formula:
1± ( z1− a / 2 / χ 2 )
100(1 − α )% I .C. = RR
k
(O − E ) 2
χ2 = ∑ i i
= 2.1682
z=1.96 i =1 Ei
Depressione
Partner indifferente Sì No Totale
Sì 5 (2.92) 21(23.09) 26
No 8(10.08) 82(79.91) 90
Totale 13 103 116
113
STUDI CASO-CONTROLLO E
ODDS RATIO
INFARTO MIOCARDICO
FATTORE DI RISCHIO Casi Controlli Totale
Colesterolo ≥240 mg/dl 100 70 170
Colesterolo <240mg/dl 87 193 280
Totale 187 263 450
In generale:
MALATTIA
FATTORE DI RISCHIO Casi Controlli Totale
Esposti a b a+b
Non esposti c d c+d
Totale a+c b+d n
114
Definizione di odds
Probabilità di malattia
Odds di malattia =
Probabilità di non malattia
116
Come interpretare i valori assunti da =OR
117
Esercizio Daniel pag.509 12.7.2
La tavola che segue riporta 158 soggetti classificati come
casi e controlli rispetto alla presenza dell’infezione da
sifilide e secondo il numero di partner sessuali (fattore di
rischio) negli ultimi 90 giorni.
Si desidera confrontare l’odds dell’infezione da sifilide tra i
soggetti con tre o più partner sessuali, negli ultimi 90
giorni, rispetto all’odds dei soggetti con nessun partner
sessuale negli ultimi 90 giorni.
Infezione da
sifilide
O
N di partner sessuali negli Casi Controlli Totale
ultimi 90 gg
≥3 41 58 99
0 10 49 59
Totale 51 107 158
Cohen et al., American Journal of Public Health, 82(1992), 552-556
a
b = ad = 41 ⋅ 49 = 3.46
OR= c bc 58 ⋅10
d
Coloro che hanno avuto tre o più partner sessuali
negli ultimi 90 giorni hanno una probabilità di
infezione 3.46 volte più elevata dei non casi.
118
I.C. al 95% per OR
1± ( z1− a / 2 / χ 2 )
I .C. = OR
k
(Oi − Ei ) 2
χ =∑
2
= 10.1223
i =1 E i
1± (1.96 / 10.1223)
L1;L2= 3.46 = 1.61;7.43
Conclusione
Abbiamo un grado di fiducia del 95% che l’OR
della popolazione sia compreso entro i due limiti
calcolati.
Poiché l’intervallo non contiene 1 è possibile
concludere che nella popolazione aver avuto 3 o
più partner sessuali negli ultimi 90 gg aumenta la
probabilità di contrarre la malattia di 3.46 volte.
119
IL χ2 DI MANTEL-HAENSZEL
Variabile di confounding
Nello studio della relazione tra una data malattia
e un presunto fattore di rischio, può capitare che
vi sia un’altra variabile (associata alla malattia,
al fattore di rischio o ad entrambi), che può
falsare la vera relazione tra le due variabili.
Come procedere?
I soggetti, casi o controlli, vengono assegnati a
strati, che corrispondono alle diverse modalità
della variabile di confounding.
La variabile di confounding può essere
categoriale o continua; se è continua deve essere
categorizzata.
Esempio: se la variabile di confounding è l’età, è possibile categorizzarla
raggruppando i dati in classi di età mutuamente esclusive.
120
Come calcolare il χ2 di
Mantel-Haenszel
Campione
Fattore di rischio Casi Controlli Totale
Presente ai bi ai+bi
Assente ci di ci+di
Totale ai+ci bi+di ni
121
3.Per ogni strato calcolare la quantità:
∑ (a i − ei ) 2
χ MH
2
= i =1
k
∑v
i =1
i
122
L’ODDS RATIO DI MANTEL-HAENSZEL
k
ai di
∑
n
= i =k1
i
ORMH
bi ci
∑i =1
ni
123
Esercizio
Si vuole valutare l’efficacia di una profilassi antibiotica su
pazienti da sottoporre a due diversi tipi di intervento
chirurgico (intervento A e intervento B), in relazione alla
comparsa di eventuali infezioni postoperatorie.
Prima dell’intervento, fu somministrato antibiotico a 303
dei 606 pazienti da sottoporre all’intervento A, mentre i
restanti 303 ricevettero un placebo;
fu somministrato antibiotico a 301 dei 612 pazienti da
sottoporre all’intervento B, mentre i restanti 311
ricevettero un placebo.
La comparsa di infezioni postoperatorie nei pazienti
esaminati è sintetizzata nella tabella seguente.
Intervento B
Numero totale di pazienti 301 311 612
Numero di pazienti affetti da 14 25 39
infezione postoperatoria
Assunzioni
Sono verificate le assunzioni necessarie per un
uso appropriato del test χ di Mantel-Haenszel
2
Ipotesi
H0: non c’è associazione tra trattamento
antibiotico perioperatorio e comparsa di infezioni
postoperatorie in pazienti sottoposti a intervento
di tipo A e di tipo B.
H1: c’è associazione tra trattamento antibiotico
perioperatorio e comparsa di infezioni
postoperatorie in pazienti sottoposti a intervento
di tipo A e di tipo B.
Test
∑ (a i − ei ) 2
χ MH
2
= i =1
k
∑v
i =1
i
125
Regola di decisione
Per α=0.05 il valore di χ2 critico è 3.841.
Rifiutiamo H0 se il valore calcolato della statistica
test è ≥ 3.841.
Intervento B: strato 2
Infezione
postoperatoria
Fattore di rischio (nessun antibiotico Sì No Totale
prima dell’intervento)
Sì 25 286 311
No 14 287 301
Totale 39 573 612
126
Calcolo delle frequenze attese:
e1=(43+260)(43+26)/606=303·69/606=34.5
e2=(25+286)(25+14)/612=311·39/612=19.82
Calcolo di v1 e di v2:
v1=(303)(303)(69)(537)/(6062)(606-1)=15.3112
v2=(311)(301)(39)(573)/(6122)(612-1)=9.1418
Calcolo di χ2:
127
Calcolo dell’odds ratio di Mantel-Haenszel
- calcoliamo il denominatore:
(b1c1/n1) + (b2c2/n2) =
= [(260)(26)/606] + [(286)(14)/612] = 17.697599