Bioestadística - Clase 5

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 32

BIOESTADÍSTICA

NÉSTOR ISRAEL QUINAPANTA CASTRO, MD, MSC.


REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE

• Es una técnica estadística que cuantifica la relación entre dos


variables cuantitativas, asumiendo que dicha relación es lineal.

VARIABLE VARIABLE
INDEPENDIENTE DEPENDIENTE
• Variable “fija” • No controlada por el
controlada por el investigador
investigador
REPRESENTACIÓN DE VARIABLES EN
REGRESIÓN LINEAL
REGRESIÓN LINEAL SIMPLE

• Presenta capacidad predictiva, de forma que puede conocerse el


valor de una variable Y, una vez que se conoce el valor de una
variable X a través del cálculo de los coeficientes a y b. Para
conseguir la mejor predicción de Y a partir de X.
REGRESIÓN LINEAL

• Habiendo observado la variable edad (variable independiente o


explicativa).

• ¿Somos capaces de predecir el talla de un individuo? (variable


dependiente o explicada).
y = a + bx
• La constante a se llama ordenada en el origen, que es el valor
de Y cuando X vale 0 (sería la estatura de un recién nacido), y
la b se llama coeficiente de regresión, también denominado
pendiente, e indica el cambio (decremento o incremento en
este caso) de Y por cada unidad de incremento de X; es decir,
los centímetros que crece un niño al año.
REGRESIÓN LINEAL SIMPLE

• La relación entre dos variables cuantitativas puede


establecerse a partir de la ecuación de una recta:

y = a + bx
• Por ejemplo, puede establecerse la relación entre la edad de
un niño (variable X) y su correspondiente talla (variable Y).
EJ: RELACIÓN TEÓRICA ENTRE LA EDAD Y LA
TALLA DE UN NIÑO.
ES UN MODELO DETERMINISTA

• Ya que no considera la existencia de errores ni la variabilidad aleatoria, y


concluye que, a tal edad, le corresponde tal estatura. Sin embargo, nunca
será posible realizar predicciones perfectas de la estatura que tendrá un
niño una vez conocida su edad, ya que, aunque la edad tenga un efecto
importante sobre la estatura, existe un cierto grado de variabilidad
aleatoria (ruido o «error») y de ajuste inadecuado de los datos a la función
que define el modelo, dado que existen otras muchas variables que
influyen en la talla.
RELACIÓN REAL ENTRE LA EDAD Y LA TALLA DE UN
GRUPO DE NIÑOS, INCLUYENDO LA VARIABILIDAD ALEATORIA.
ERROR ALEATORIO

• La distancia entre cada punto y el valor de y predicho en la


recta de regresión se conoce como residual (e; error
aleatorio).
ERROR ALEATORIO

• Ejemplo: Es la distancia entre el valor de la talla observado y el


valor de la talla que predice el modelo
CENTROIDE

• La recta de regresión siempre pasa por el punto correspondiente a la media de


las X y la media de las Y. Este punto se llama centroide, o centro de gravedad.
COEFICIENTE DE CORRELACIÓN
EJEMPLO: PACIENTES CON MELANOMA UVEAL

𝐵𝑎𝑠𝑒 𝑚á𝑥𝑖𝑚𝑎=7,276+0,773∙𝐴𝑙𝑡𝑢𝑟𝑎 𝑚á𝑥𝑖𝑚𝑎


PREDICCIÓN

• Si tuviera una altura máxima de 10,3


• Y real = 16.35
• ¿Cuánto corresponde esto con respecto a la base máxima?
• Residual = Y real – Y observado = 1.12
DESCOMPOSICIÓN DE LA SUMA DE CUADRADOS EN
UNA REGRESIÓN.
SUMA DE CUADRADOS

• Se obtendrá así la suma de cuadrados (SC) explicada


por la regresión (SC regresión) y otra que no es
explicada por la regresión y que se llama suma de
cuadrados residual (SC residual). La suma de ambas
será la suma de cuadrados total (SC total).
HIPÓTESIS

• La (hipótesis nula, H0): No existe relación lineal

• La hipótesis alternativa (H1) existe relación lineal


CONTRASTES DEL MODELO DE REGRESIÓN
LINEAL

Rechazamos la H0: EXISTE RELACIÓN LINEAL porque p < 0.05


CUANDO SE RECHAZA H0:

yPRED = a + bx
• Sin embargo, la predicción nunca es perfecta y queda algo sin explicar.
• Lo que queda sin explicar está expresado en la varianza residual que
aparece en la tabla del ANOVA de regresión.
REGRESIÓN LINEAL MÚLTIPLE

• En la naturaleza no se suelen dar relaciones únicamente entre dos


variables sino que existen muchos más factores, por ejemplo, los kilos
perdidos por una persona a lo largo de un mes no solo estarán
condicionados a la dieta alimentaria en sí, también se pueden ver
afectados por el ejercicio realizado si tenemos en cuenta la duración, la
intensidad, la ingesta de algún suplemento de aceleración del
metabolismos, la edad, el sexo, etc.
EJEMPLO :PACIENTES CON MELANOMA
UVEAL

𝑦=𝑎+𝑏1∙𝑥1+𝑏2∙𝑥2+⋯+𝑏𝑘∙𝑥𝑘+𝑒

𝑏𝑎𝑠𝑒=𝑎+𝑏1∙𝑎𝑙𝑡𝑢𝑟𝑎+𝑏2∙𝑒𝑑𝑎𝑑+𝑏3∙𝑎𝑔𝑢𝑑𝑒𝑧𝑎 𝑣𝑖𝑠𝑢𝑎𝑙+𝑏4∙𝑝𝑖𝑜+𝑏5∙𝑛.º 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑛𝑡𝑒𝑠 𝑎𝑓𝑒𝑐𝑡𝑎𝑑𝑜𝑠


EJEMPLO :PACIENTES CON MELANOMA
UVEAL
EJEMPLO :PACIENTES CON MELANOMA
UVEAL
EJEMPLO :PACIENTES CON MELANOMA
UVEAL
EJEMPLO :PACIENTES CON MELANOMA
UVEAL
COEFICIENTE DE DETERMINACIÓN (R2)

• Se interpreta como el porcentaje de la variabilidad total


de la variable dependiente (Y) que es explicado por la
variable independiente (X).
EJEMPLO :PACIENTES CON MELANOMA
UVEAL
EJEMPLO: PACIENTES CON MELANOMA
UVEAL

𝐻0: 𝑏1=𝑏2=⋯=𝑏𝑘=0 (≡𝑅=0)


𝐻1: 𝑏𝑖≠0 (≡𝑅≠0) 𝑃𝑎𝑟𝑎 𝑎𝑙𝑔ú𝑛 𝑖=1,2,⋯,𝑘
SUPUESTOS DEL MODELO DE REGRESIÓN

• Normalidad de la distribución condicional de la variable Y (variable dependiente).

• Homogeneidad de varianzas («homocedasticidad»).

• Independencia de las observaciones yi.

También podría gustarte