Analisis de Regresion, Paso A Paso, Usando Excel: PRQ 801 - Diseño de Plantas de Procesos
Analisis de Regresion, Paso A Paso, Usando Excel: PRQ 801 - Diseño de Plantas de Procesos
Analisis de Regresion, Paso A Paso, Usando Excel: PRQ 801 - Diseño de Plantas de Procesos
2018
Análisis de regresión, paso a paso, usando Excel
El ejemplo utilizado es un modelo de regresión referido a los precios de las casas explicado por
- Metros cuadrados
- Número de dormitorios
- Número de baños
- Número de garajes
- Existencia o no de una piscina
- Si está cerca de un lago artificial y
- Si está dentro de un country club
El objetivo es el de explicar la variación en los precios de las casa, usando la variación en las variables
independientes. En otras palabras, se está haciendo la pregunta, “porqué varían los precios de casas
de una a otra?” Una explicación es que pueden haber diferentes características que expliquen este
hecho. Por lo tanto, se usarán las variaciones en las características de las casas para explicar la
variación en los precios de las casas.
Se requiere organizar los datos en columnas, para usar la función de regresión, incorporada en Excel.
La primera columna contiene los valores de la variable dependiente (precio) y las siguientes
columnas contienen los valores referidos a las variables independientes. Cada columna tiene un
nombre para facilitar la interpretación de los resultados.
En el menú Tools, se encuentra la opción Data Analysis. Dentro de Data Analysis se debe elegir
Regression
Ver Figura 2
Figura 1: Datos sobre precios de casas en función de sus diferentes características
File/Options/Add-ins/Go
(Ver Figura 2)
Figura 2: Cómo habilitar la opción de Análisis de Datos
Paso 3: Especificar los datos a usarse en la regresión y el lugar de salida de los resultados
De la regresión, a partir del menú con las especificaciones de la regresión, se puede especificar la
variable dependiente [Input Y Range] y las columnas de las variables independientes [Input X
Range].
Y= Precio de la casa
a0 = Variable independiente X4 = Número de autos que entran en el garaje
X1 = Superficie X5 = Existencia de piscina
X2 = Número de dormitorios X6 = Cercanía a un lago artificial
X3 = Número de baños X7 = Está en un country club
Y = a0 + a1X1+a2X2+a3X3+a4X4+a5X5+a6X6+a7X7+Error
Información resumida
correlación
1
El error standard está expresado en la misma unidad de medida que la variable dependiente. Por eso, en este caso, como
los precios están datos en dólares, este valor está expresado en la misma unidad.
5. Observations (observaciones), se refiere al número de datos –observaciones – que se
Análisis de varianza
La información proveniente del análisis de varianza, proporciona un desglose de la variación total
de la variable dependiente (en este caso el precio de las casas), en las porciones explicadas y no
explicadas por las variables dependientes utilizadas para ajustar la ecuación de regresión.
hipótesis nula:
H 0: β 1 = β 2 = β 3 = β 4 = β 5 = β 6 = β 7 = 0
probabilidad más allá del valor calculado. Comparando este valor con – por ejemplo – 5%,
Los resultados de la recta estimada de regresión incluyen los coeficientes estimados, el error
estándar de los coeficientes, los estadísticos t calculados, el valor correspondiente de p,y los
variación de los precios de las casas, son la superficie (en pies cuadrados), el número de
dormitorios y el número de baños, tal como se indica por (1) el estadístico t calculado que es
mayor que los otros valores críticos, y (2), los valores calculados de p que son menores que el
1. La relación entre la superficie de las casas y los precios de las mismas es positiva: cuanto
promedio, que por cada pie cuadrado adicional de superficie, el precio de la casa sube en
148.43 dólares.
variable de superficie, ya que casa más grandes tienden a tener más dormitorios.
3. El número de baños está positivamente relacionado con los precios de las casas (el valor
4. Las otras variables independientes no añaden nada más que pudiera ser significativo a la
Correlaciones
Cuando se usa regresión múltiple para estimar una relación, siempre existe la posibilidad de que
exista correlación entre las variables independientes. Esta correlación puede ser pareada (pair-
wise) o múltiple. Observando los datos referidos a la correlación, generados a partir de la
función Correlation (Correlación) con Data Analysis (Análisis de Datos), se observa que existe