Regresión Múltiple - Excel - Spss
Regresión Múltiple - Excel - Spss
[email protected]
Ejemplo 1. El objetivo es ajustar un modelo de la forma estimando los
parámetros correspondientes y calcular el coeficiente de determinación . Asume alfa
de 5%.
Solución:
Primeramente crea una base de datos para las variables de la siguiente forma:
EXCEL A B C
1 Y X1 X2
2 8 4 20
3 10 3 22
4 12 6 23
5 13 6 26
6 15 7 27
7 18 8 30
En el menú principal abrir la barra de Datos y marcar Análisis de datos con el cursor (si no
aparece la opción Análisis de datos se debe activar desde complementos la
opción Herramientas de Análisis)
Se abre la ventana Análisis de datos y en ella marcar la opción Regresión al activarla hay que
llenar los siguientes campos:
Rango Y de entrada: Debe contener los datos de la variable dependiente. Escribe A2:A7
Rango X de entrada: Debe contener los datos de las variables independientes DIGITA: B2:C7
Nivel de confianza: Activarla y escribir 95%.
Opciones de salida: Activar Rango de salida si quieres que los resultados del análisis se
muestren en la misma hoja de cálculo donde están los datos (debes indicar la celda donde quieres
que se muestren). Activar Hoja nueva si quieres que los resultados se muestren en una nueva hoja
de cálculo. Observa en la siguiente figura las opciones marcadas:
Luego Aceptar y los resultados se muestran de la siguiente manera:
Resumen
Estadísticas de la regresión
Observaciones 6
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de Valor
de los F
libertad cuadrados crítico de F
cuadrados
67.923076
Regresión 2 61.9649123 30.9824561 9 0.003176
Total 5 63.3333333
Probabili Inferior Superior
Coeficientes Error típico Estadístico t
dad 95% 95%
Intercepción -8.89474 2.808059 -3.16757 0.05058 -17.83123 0.04176
X1 0.36842 0.352627 1.04479 0.37289 -0.75380 1.49064
X2 0.78947 0.178913 4.41261 0.02160 0.22009 1.35885
Resultados de datos de
Análisis de los residuales
probabilidad
Pronóstico Residuos
Observación Residuos Percentil Y
Y estándares
5 15.0000 0 0 75 15
y su
INTERVALOS DE CONFIANZA
Intervalo de confianza para el término constante β0 al nivel de 95%:
-17,83123 < β0 < 0,04176
Con un 95% de confianza el verdadero valor de β0 se encuentra dentro del intervalo
(-17,83123; 0,04176)
Intervalo de confianza para el parámetro β1:
--0,75380 < β1 < 1,49064
Con un 95% de confianza el verdadero valor de β1 se encuentra dentro del intervalo
(-0,75380; 1,49064)
Intervalo de confianza para el parámetro β2:
--0,22009 < β2 < 1,35885
Con un 95% de confianza el verdadero valor de β2 se encuentra dentro del intervalo
(-0,22009; 1,35885)
ANOVA
H0: β1 = β2 = 0 (El modelo no es apropiado)
Ha: β1 ≠ β2 ≠ 0 (El modelo es apropiado)
El intercepto Β0 tiene como Pvalue (0,05057503) > α, por lo tanto, la recta pasa por el
origen.
1. Modelo a usar:
a. Estimación del Modelo
Y= β 0 + β1 X+ β2 X+ β3 X+ β4 X + β5 X+ε
Donde:
Y = variable dependiente: Precio.
Β0: Constante del modelo.
Β1: Coeficiente de X1, siendo X1 la variable independiente: Foco.
Β2: Coeficiente de X2, siendo X2 la variable independiente: Brillantez.
Β3: Coeficiente de X3, siendo X3 la variable independiente: Falta de
convergencia.
Β4: Coeficiente de X4, siendo X4 la variable independiente: Distorsión.
Β5: Coeficiente de X5, siendo X5 la variable independiente: Uniformidad.
Cuadro Nº1
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -950.061 266.332 -3.567 .003
Foco 37.903 3.552 .970 10.672 .000
Brillantez 4.623 3.569 .133 1.295 .214
Falta de Convergencia -20.318 13.554 -.128 -1.499 .153
Distorsiòn 19.573 5.631 .355 3.476 .003
Uniformidad -24.419 7.644 -.275 -3.194 .006
a. Dependent Variable: Precio
Sum of
Model Squares df Mean Square F Sig.
1 Regression 781130.1 5 156226.025 26.743 .000a
Residual 93466.964 16 5841.685
Total 874597.1 21
a. Predictors: (Constant), Uniformidad, Falta de Convergencia, Foco, Distorsiòn,
Brillantez
b. Dependent Variable: Precio
H0: β1 = β2 = β3 = β4 = β5 = 0
Ha: β1 ≠ β2 ≠ β3 ≠ β4 ≠ β5 ≠ 0
Cuadro Nº 4
Model Summaryd
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -550.681 242.529 -2.271 .034
Foco 32.663 4.802 .836 6.802 .000
2 (Constant) -406.268 221.960 -1.830 .083
Foco 33.585 4.265 .859 7.874 .000
Uniformidad -24.770 9.691 -.279 -2.556 .019
3 (Constant) -880.654 233.579 -3.770 .001
Foco 38.577 3.815 .987 10.111 .000
Uniformidad -27.897 7.984 -.314 -3.494 .003
Distorsiòn 17.360 5.380 .315 3.227 .005
a. Dependent Variable: Precio
Scatterplot
Dependent Variable: Precio
1800
1600
1400
1200
1000
P re c io
800
600
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0
Figura N° 2
2
Frequency
Figura N° 3
b) En el gráfico P-P Plot los residuos se ajusta a la línea recta, por lo que podemos
afirmar que los residuos son normales.
Normal P-P Plot of Unstandardized Residual
1,0
,8
E x p e c te d C u m P r o b
,5
,3
0,0
0,0 ,3 ,5 ,8 1,0
Figura 4
Conclusiones del ejemplo N° 2. La empresa ChanChung S.A. con la finalidad de
obtener mejor información en la adquisición de los monitores realizó el estudio de la
influencia de características (Variables: foco, brillantez, falta de convergencia,
distorsión y uniformidad) en el precio, quedando con la propuestas:
a) Modelo1: con todas las variables
El modelo estimado es:
Y= - 950,061 + 37,903X1 + 4,623X2 – 20,318X3 + 19,573X4 – 24,419X5
Los parámetros resultan ser significativos para el foco, distorsión y uniformidad
a un nivel de significación 5% (Cuadro N°1), pero la falta de convergencia y la
brillantez son no significativos, estadísticamente induce a buscar un mejor
modelo aunque teóricamente, la experiencia indica que estas variable influyen
significativamente (según estudios anteriores).
b) Modelo 2: con tres variables
El modelo estimado es:
Y= - 880,654 + 38,577X1 – 27,897X2 + 17,360X3
B1 = El precio queda aumentado en 38,577, cada vez que aumenta el nivel del
foco en una unidad.
B2 = El precio de los monitores disminuye en – 27,897, cada vez que aumenta
el nivel de uniformidad en una unidad.
B3 = Por cada unidad que aumenta la distorsión el precio de los monitores
queda aumentado en 17,360.
Finalmente, se recomienda a la empresa el modelo 2, con tres variables.
Y= β 0 + β1 X+ β2 X+ ε
Donde:
Y = variable dependiente: Precio.
Β0: es la constante del modelo.
Β1: es coeficiente de X1, siendo X1 la variable independiente: Foco.
Β2: es coeficiente de X2, siendo X2 la variable ficticia: Marca.
Gráfico Nº1
1800
1600
1400
1200
1000
Marca
800
P r e c io
Samsung
600 Sony
40 50 60 70
Foco
Como podemos observar que a mayor nivel de foco, aumenta el precio de los
monitores, no habiendo interacción entre la marca (Sony y Samsung). Si bien tienen las
mismas pendientes son linealmente coincidentes.
El modelo estimado es:
Y= - 597,407 + 33,333X1 + 23,959X2
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -597.405 267.727 -2.231 .038
Marca 23.959 52.384 .060 .457 .653
Foco 33.333 5.114 .853 6.518 .000
a. Dependent Variable: Precio
Gastos de
Beneficios Horas
publicidad
(Miles US$) extras
(Miles US$)
1,3 0,3 4
3,5 1,5 9
2,8 0,7 6
3 1,1 7,5
3,3 1,2 8
4 2 7
3,7 2 (1 + UD)