Marcevargas2713@javerianacali Edu Co
Marcevargas2713@javerianacali Edu Co
Marcevargas2713@javerianacali Edu Co
Taller 2
Este tipo de variable suele llamarse variable indicadora o dummy. Este trabajo tiene como
objetivo mostrar el manejo de variables indicadoras dentro de un modelo de regresión lineal
y como se interpretan los coeficientes de un modelo con estas características. Para esto se
propone como ejemplo la siguiente base de datos.
Tager et al. (1983) realizaron un estudio dirigido a evaluar la función pulmonar de niños en
exposición al humo de cigarrillo (fumadores activos o pasivos). La base de datos
BaseDatos.txt, que corresponde a una parte de la original, contiene información sobre la
capacidad pulmonar de niños entre 3 y 15 años medida con el Volumen Espiratorio Forzado
(FEV - Forced Expiratory Volume) (litros) y de las siguientes variables medidas a cada niño:
Ajuste un modelo de regresión lineal usando como respuesta la variable FEV y como
variables de predicción una de las dos variables cuantitativas (Edad (Age) o Estatura
(Height)) y una de las dos variables cualitativas (Género (Sex) o Fumador (Smoker)).
Para la estimación del modelo debe tener en cuenta el aporte de las variables predictoras
dentro del mismo y la calidad del ajuste, así como el cumplimiento de los supuestos. En caso
de no cumplimiento de los supuestos realizar la transformación adecuada.
Desarrollo
En esta regresión con todas las variables el modelo explica: Adjusted R²=72.52%
Esta variable tiene peso de casi 10% en el modelo, y su probabilidad demuestra que
se rechaza la ho. Es la variable que más aporta al modelo, por lo que la altura es un
factor determinante a la hora de evaluar los resultados de la regresión lineal.
En esta regresión con todas las variables el modelo explica: Adjusted R²=72.71%
Esta variable tiene peso de más del 10% en el modelo, y su probabilidad demuestra
que se rechaza la ho. Es la variable que más aporta al modelo, por lo que la altura es
un factor determinante a la hora de evaluar los resultados de la regresión lineal.
3. Comprobación
De acuerdo con los resultados obtenidos se determina que este es el orden de significancia
de las variables, en el modelo:
Age y Sex
En esta regresión con todas las variables el modelo explica: Adjusted R²=54.29%
Con las variables edad y sexo, aunque son significantes en esta regresión lineal, el modelo
evaluado con estas dos variables tiene un nivel medio a la hora de explicar la FEV, la edad
tiene un peso de 13% en la explicación del modelo.
Height y Sex
En esta regresión con todas las variables el modelo explica: Adjusted R²=72.18%
Con las variables altura y sexo, esta regresión lineal explica en un nivel alto a la hora de
explicar la capacidad la FEV, la variable altura tiene bastante significancia con t=20% sobre
el modelo. Por lo que la altura continúa siendo la variable con más peso en el modelo.
Age y Smoker
En esta regresión con todas las variables el modelo explica: Adjusted R²=50.07%
Con las variables edad y ser fumador , esta regresión lineal explica en un nivel apenas medio
la capacidad la FEV, la variable edad tiene bastante significancia sobre el modelo y la
variable fumador (signo negativo) tiene un efecto de disminución sobre la FEV, Por lo que
en este modelo la edad resulta ser significativa.
Height y Smoker:
En esta regresión con todas las variables el modelo explica: Adjusted R²=71.08%
Con las variables altura y ser fumador , esta regresión lineal explica en un nivel alto la
capacidad la FEV, la variable Height sigue siendo la variable con más significancia en los
modelos evaluados con t=16%. Por lo que este modelo se considera bueno a la hora de
explicar la FEV con un Adjusted R²=71.08%.
• Hombre=1 o mujer=0
• HeightxMale
En esta regresión con todas las variables ( Height, sex y HeightxMale )el modelo explica:
Adjusted R²=72.80%
Es el mejor modelo hasta ahora***
Con las variables altura y altura si es hombre , esta regresión lineal explica en un nivel alto
la capacidad la FEV, la variable Height sigue siendo la variable con más significancia en los
modelos evaluados. Por lo que este modelo se considera bueno a la hora de explicar la FEV
con un Adjusted R²=72.08%.
• Fumador(Current)=1 o No fumador(Non)=0
• AgexSmokerCurrent
En esta regresión con todas las variables ( Age, Smoker y AgexSmokerCurrent )el modelo
explica: Adjusted R²=53.06%
Con las variables edad y ser fumador , esta regresión lineal explica en nivel medio la
capacidad la FEV, la variable Age teniendo bastante significancia con un t aproximado de
11%. Por lo que este modelo se considera aceptable a la hora de explicar la FEV con un
Adjusted R²=53.06%.
• Fumador(Current)=1 o No fumador(Non)=0
• HeightxSmokerCurrent
En esta regresión con todas las variables ( Height, Smoker y HeightxSmokerCurrent )el
modelo explica: Adjusted R²=71.24%
Con las variables altura y ser fumador , esta regresión lineal explica en nivel alto la
capacidad la FEV, la variable Altura se confirma como la variable de mayor significancia en
todas las evaluaciones del modelo, en este caso con t=15%. Por lo que este modelo se
considera bueno a la hora de explicar la FEV con un Adjusted R²=71.24%.
6. Anova del modelo Height, sex y su ajuste con la variable Heigthxsex
Res. Df : 148
Df: 2
Estadística F: 1.4898
P Value : 0.226
En esta regresión con todas las variables ( Height, sex y HeightxMale )el modelo explica:
Adjusted R²=72.80%
Es el mejor modelo
1. Altura (Variable de predicción cuantitativa):
Con las variables altura , sexo y altura si es hombre , esta regresión lineal explica en un
nivel alto la capacidad la FEV, la variable Height sigue siendo la variable con más
significancia en los modelos evaluados.
Por lo que este modelo se considera bueno a la hora de explicar la FEV con un Adjusted
R²=72.08%.
Interpretación:
Siendo la altura una variable muy determinante a la hora de estimar el modelo, la variación
entre hombres y mujeres es la siguiente:
0.10645
0.02701
[1] 0.13346
0.10645
Recomendación
El mejor modelo, se obtiene al hacer la regresión lineal con el logaritmo de FEV (logFEV) y
el logaritmo de la mejor variable, la más significativa (LogHeight)