Regresion Multiple
Regresion Multiple
Regresion Multiple
Muestra Aleatoria
1
Cuatro hipótesis comunes
con la
regresión lineal simple
•Normalidad
•Homocedasticidad
•Linealidad
•Independencia de las observaciones
Es decir, {(X1i,X2i,…,Xki,Yi): i=1,2,…,n} son vectores
aleatorios independientes
2
Datos y estimación de los parámetros
Geométricamente, la
nube de puntos ahora
está en un espacio de
dimensión k+1
¡Difícil de visualizar
para k>2!
donde:
son los residuos
2007 Estadística; 3º CC. AA. 6
Ejemplo 1
Estimación del tamaño de Trilobites
En la mayoría de las condiciones de preservación, es difícil
encontrar ejemplares completos de Trilobites.
La cabeza (cephalon) suelta es mucho más común.
3
Dibujos de Sam Gon III
4
y = β0 + β1x1 + β2x2
Intervalos de confianza
5
Contrastes de hipótesis
6
Predicción de un nuevo valor de Y dados los
valores x10 ,…, xk0 de las variables explicativas
Ejemplo 1
Estimación del tamaño de Trilobites
7
Análisis de la Varianza
Coeficiente de determinación
Tabla Anova
Rechazaremos H0 , al nivel α, si :
Relación entre F y R2
8
Ejemplo 1
Estimación del tamaño de Trilobites
Gr. de libertad Suma de cuadrados cuadrados medios F Valor crítico de F
Regresión 2 5586'22 2793'11 40'32 0'0000004
Residuos 17 1177'70 69'28
Total 19 6763'92
Estadísticas de la regresión
Coeficiente de correlación múltiple 0'909
Coeficiente de determinación R2 0'826
R2 ajustado 0'805
Error típico 8'323
Observaciones 20
R2=0,83
9
Ejemplo 2
Respiración de líquenes
10
Plano de regresión
Tasa de respiración = β0 + β1Potasio + β2Zinc
* *
*
* *
*
* *
*
* * *
*
Datos * *
11
Análisis de la varianza (tabla A#OVA)
Source df SS MS F p
Total 8 2644.0
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,90
Coeficiente de determinación R^2 0,81
R^2 ajustado 0,79
Error típico 8,40
Observaciones 9
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,69
Coeficiente de determinación R^2 0,47
R^2 ajustado 0,40
Error típico 14,14
Observaciones 9
12
Extensiones: 1- interacciones
Del análisis anterior concluiríamos que el Potasio (K) no es un importante
predictor para la tasa de respiración del liquen (A pesar de que se sabe que es
significativo en ausencia de Zinc)
Sin embargo, el Análisis de la Varianza permite también estudiar interacciones
entre las variables predictoras.
Por ejemplo, podemos definir la interacción creando una nueva variable
resultante de multiplicar K por Zn (la nueva variable es K*Zn).
Los resultados de una regresión multilineal con predictores K, Zn, K*Zn son
Tabla ANOVA
ANÁLISIS DE VARIANZA
Promedio de
Grados de Suma de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 3 2545,6 848,52 43,10 0,00054
Residuos 5 98,4 19,69
Total 8 2644,0
13
Al poner el producto de las dos variables como tercer predictor
no tenemos un plano sino una superficie curva.
Ejercicio: comentar y
criticar este ejemplo
14
¿podemos convertirlo en una relación lineal?
Ejemplo 3
Predicción de estados tormentosos en Florida
Experimental forecasting of dry season storminess over Florida and the
southeast United States from the ENSO (niño-southern oscillation) signal
using multiple linear regression techniques.
Bartlett C. Hagemeyer, National Weather Service, Melbourne, Florida
Rebecca A. Almeida, Florida Institute of Technology, Melbourne, Florida
15
Las regiones del #IÑO
R= 0.74
F significativo al nivel 0,01 y los contrastes de la t al nivel 0,005
16