Vista previa del material en texto
ADA 3 Fecha de emisión: 21/10/2022 Fecha de entrega: 27/10/2022 Pautas generales: Por equipos de tres, los alumnos resuelven ÚNICAMENTE 6 de los problemas enlistados a continuación. Enviando dos archivos: a) Un archivo en formato pdf que incluya los enunciados de los problemas escogidos y las soluciones y/o respuestas a los mismos. b) Un archivo de Excel que incluya el proceso seguido para resolver los problemas. (En caso de realizar todos tus procesos con una calculadora, deberás incluir dichos procesos en el primer archivo capturados a computadora). El título de los archivos será: “ADA3.Nombre1_Apellido1.Nombre2_Apellido2.Nombre3_Apellido3” INSTRUCCIONES: Usar los datos de los ejercicios para obtener un modelo de regresión lineal simple. El análisis de regresión debe contener los siguientes puntos: 1. Gráfica de dispersión de puntos y descripción. 2. Ajustar un modelo de regresión lineal. Obtener una estimación de los parámetros del modelo y su interpretación. 3. Coeficiente de determinación y de correlación. 4. Contrastar la significación del modelo propuesto. 5. Validar los supuestos de modelo por medio de los residuales. PROBLEMA 2 El gobierno estudiantil en la universidad local intenta determinar si el precio de admisión al salón de juegos del centro estudiantil tiene un impacto en el número de estudiantes que utilizan las instalaciones. El costo de admisión y el número de estudiantes que ingresan al salón se registran durante 12 viernes seguidos y se muestran en la siguiente tabla. Haga e interprete el modelo de regresión. 1. GRÁFICA DE DISPERSIÓN DE PUNTOS Y DESCRIPCIÓN. En la gráfica se logra ver cierta tendencia de línea, pero con una ligera dispersión. Dicha tendencia es negativa, por lo que se cree que un modelo de regresión lineal no dará un buen ajuste. 2. AJUSTAR UN MODELO DE REGRESIÓN LINEAL. OBTENER UNA ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO Y SU INTERPRETACIÓN. Estimación de los parámetros es la siguiente: B0 = 124.05 B1 = -25.347 La ecuación de regresión que relaciona las dos variables es: Boletas = -25.347precio + 124.05 La pendiente es negativa (-25.34), por lo que aumentar x en una unidad, la variable y disminuirá 25.34 unidades. 3. COEFICIENTE DE DETERMINACIÓN Y DE CORRELACIÓN. Mínimos cuadrados Tabla ANOVA Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio F Valor-p Regresión 1622.17822 1 1622.17822 216.805611 0.000000041780 Error 74.8217822 10 7.48217822 Total 1697 11 Suma de Cuadrados de Regresión: 1622.17822 Suma de Cuadrados de Error: 74.8217822 Suma Total de Cuadrados: 1697 a) Coeficiente de determinación R2 = 0.9559 El coeficiente de determinación R2 tiene un ajuste de bondad intermedio, ya que mientras más cerca de 1 mejor es el ajuste y más fiable es la regresión. b) Coeficiente de correlación Nuesto coeficiente de correlación al ser más alto de 0.7 nos quiere decir que tiene una fuerte relación lineal. 4. CONTRASTAR LA SIGNIFICACIÓN DEL MODELO PROPUESTO. Para responder de manera más formal la pregunta, realicemos la siguiente prueba de hipótesis: 𝐻0: 𝛽1 = 0 𝑣𝑠 𝐻𝑎: 𝛽1 ≠ 0 Es decir: H0: No existe relación lineal significativa entre la variable Precio y Boletas Vs Ha: Existe relación lineal significativa entre la variable Precio y Boletas Prueba de Significancia (t) alpha 0.05 Estadístico V-C Valor-p Comparación -14.72432 2.22813885 0.000000041780 -0.049999958 Conclusión: Cómo el Valor -p (0.000000041780) es menor que el Alpha (0.05), se rechaza la hipótesis nula por lo que concluye que existe relación lineal significativa entre la variable Precio y Boletas. 5. VALIDAR LOS SUPUESTOS DE MODELO POR MEDIO DE LOS RESIDUALES. Esta gráfica de los residuales estandarizados, podemos observar que todos los datos están en la banda de entre 2 y -2, a excepción de un punto, el (60.68, 2.04), siendo así un punto atípico. Sin embargo, como el 95% de los demás puntos están dentro del rango anteriormente mencionado, dichos puntos tienen una distribución normal. PROBLEMA 3 Para reducir los crímenes, el presidente ha presupuestado más dinero para poner más policía en las calles de nuestra ciudad. ¿Qué información ofrece el modelo de regresión con base en estos datos sobre el número de policías en patrullas y el numero diario de crímenes reportados? 1. GRÁFICA DE DISPERSIÓN DE PUNTOS Y DESCRIPCIÓN. En la gráfica se logra ver cierta tendencia de línea, pero con una ligera dispersión. Dicha tendencia es positiva, por lo que se cree que un modelo de regresión lineal dará un buen ajuste. 2. AJUSTAR UN MODELO DE REGRESIÓN LINEAL. OBTENER UNA ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO Y SU INTERPRETACIÓN. Estimación de los parámetros es la siguiente: B0 = 3.556 B1 = 1.3362 La ecuación de regresión que relaciona las dos variables es: Crímenes = 1.3362policía + 3.556 La pendiente es positiva (1.3362), por lo que aumentar x en una unidad, la variable y aumentará 1.3362 unidades. 3. COEFICIENTE DE DETERMINACIÓN Y DE CORRELACIÓN. Mínimos cuadrados Tabla ANOVA Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio F Valor-p Regresión 207.112069 1 207.112069 36.1368764 0.000954977644 Error 34.387931 6 5.73132184 Total 241.5 7 Suma de Cuadrados de Regresión: 207.112069 Suma de Cuadrados de Error: 34.387931 Suma Total de Cuadrados: 241.5 a) Coeficiente de determinación R2 = 0.8576 El coeficiente de determinación R2 tiene un ajuste de bondad intermedio, ya que mientras más cerca de 1 mejor es el ajuste y más fiable es la regresión. b) Coeficiente de correlación Nuesto coeficiente de correlación al ser más alto de 0.7 nos quiere decir que tiene una fuerte relación lineal. 4. CONTRASTAR LA SIGNIFICACIÓN DEL MODELO PROPUESTO. Para responder de manera más formal la pregunta, realicemos la siguiente prueba de hipótesis: 𝐻0: 𝛽1 = 0 𝑣𝑠 𝐻𝑎: 𝛽1 ≠ 0 Es decir: H0: No existe relación lineal significativa entre la variable Policía y Crímenes Vs Ha: Existe relación lineal significativa entre la variable Policía y Crímenes Prueba de Significancia (t) alpha 0.05 Estadístico V-C Valor-p Comparación 6.01139555 2.44691185 0.000954977644 -0.049045022 Conclusión: Cómo el Valor -p (0.000954977644) es menor que el Alpha (0.05), se rechaza la hipótesis nula por lo que concluye que existe relación lineal significativa entre la variable Policías y Crímenes. 5. VALIDAR LOS SUPUESTOS DE MODELO POR MEDIO DE LOS RESIDUALES. La gráfica anterior corresponde a los residuales estandarizados, en esta podemos observar que todos los datos están en la banda de entre -2 y 2 por lo que se confirma que los datos tienen distribución normal. A excepción del punto (27.60, -2.16) siendo este un punto atípico. PROBLEMA 7 Un consultor está interesado en el grado de precisión con que un nuevo índice de desempeño laboral mide lo que es importante para una corporación. Una forma de verificarlo es analizar la relación entre el índice de evaluación del trabajo y el salario de un empleado. Se tomó una muestra de ocho empleados y se recabó información del salario (en miles de dólares) y el índice de evaluación del trabajo (1 a 10, donde 10 es la mejor calificación). 1. GRÁFICA DE DISPERSIÓN DE PUNTOS Y DESCRIPCIÓN. En la gráfica se logra ver cierta tendencia de línea, además dicha tendencia es positiva, por lo que se cree que un modelo de regresión lineal dará buen ajuste. 2. AJUSTAR UN MODELO DE REGRESIÓN LINEAL. OBTENER UNA ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO Y SU INTERPRETACIÓN. Estimación de los parámetros es la siguiente: B0 = -2.1132 B1 = 4.2138 La ecuación de regresión que relaciona las dos variables es: Salario = 4.2138I.E.T. – 2.1132 La ecuación tiene una pendiente positiva de 4.21381, por lo que aumentar una unidad en I.E.T,la variable y aumentará 4.21381 unidades. 3. COEFICIENTE DE DETERMINACIÓN Y DE CORRELACIÓN. a) Coeficiente de determinación El coeficiente de determinación tiene un ajuste de bondad intermedio, ya que mientras más cerca de 1, mejor es el ajuste y más fiable es la regresión. b) Coeficiente de correlación Nuesto coeficiente de correlación al ser más alto de 0.7 nos quiere decir que tiene una fuerte relación lineal, una correlación muy estrecha. 4. CONTRASTAR LA SIGNIFICACIÓN DEL MODELO PROPUESTO. Para responder de manera más formal la pregunta, realicemos la siguiente prueba de hipótesis: 𝐻0: 𝛽1 = 0 𝑣𝑠 𝐻𝑎: 𝛽1 ≠ 0 Es decir: H0: No existe relación lineal significativa entre la variable I.E.T y Salario Vs Ha: Existe relación lineal significativa entre la variable I.E.T y Salario Prueba de significancia (F) Alpha 0.05 Estadístico V-C Valor-p Comparación 199.925772 5.98737761 0.000007815826 -0.049992184 Conclusión: como mi estadístico de prueba es mayor a mi valor critico, se rechaza la hipótesis nula, concluyendo que sí existe relación lineal significativa entre la variable I.E.T y Salario. 5. VALIDAR LOS SUPUESTOS DE MODELO POR MEDIO DE LOS RESIDUALES. La gráfica anterior corresponde a los residuales estandarizados, en esta podemos observar que todos los datos están en la banda de entre 2 y -2, por lo que se confirma que los datos tienen distribución normal. No se encontraron puntos atípicos. PROBLEMA 8 En finanzas, es de interés observar la relación entre Y, el rendimiento promedio de las acciones, y X, el rendimiento global del mercado. El coeficiente de la pendiente calculada por una regresión lineal se conoce como la beta de las acciones por los analistas de inversiones. Una beta mayor que 1 indica que la acción es relativamente sensible a cambios en el mercado, mientras que una beta menor que 1 indica que la acción es relativamente insensible. Para los datos siguientes, calcule la beta y pruebe si ésta es significativamente menor que 1. Use α= 0.05. 1. GRÁFICA DE DISPERSIÓN DE PUNTOS Y DESCRIPCIÓN. Esta gráfica de dispersión se logra ver cierta tendencia de línea, además dicha tendencia es positiva, por lo que se cree que un modelo de regresión lineal dará buen ajuste. Además, nos muestra que la beta, al ser menor que uno, la acción es relativamente sensible al rendimiento global del mercado. 2. AJUSTAR UN MODELO DE REGRESIÓN LINEAL. OBTENER UNA ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO Y SU INTERPRETACIÓN. Estimación de los parámetros es la siguiente: B0 = 6.066 B1 = 0.4101 La ecuación de regresión que relaciona las dos variables es: Rendimiento promedio de las acciones = 0.4101rendimiento global del mercado + 6.066 La ecuación tiene una pendiente positiva de 0.4101, por lo que aumentar una unidad en x, la variable y aumentará 0.4101 unidades. 3. COEFICIENTE DE DETERMINACIÓN Y DE CORRELACIÓN. a) Coeficiente de determinación El coeficiente de determinación tiene un ajuste de bondad intermedio, ya que mientras más cerca de 1, mejor es el ajuste y más fiable es la regresión. b) Coeficiente de correlación Nuesto coeficiente de correlación al ser 0.9244, siendo más alto de 0.7, nos quiere decir que tiene una fuerte relación lineal. 4. CONTRASTAR LA SIGNIFICACIÓN DEL MODELO PROPUESTO. Para responder de manera más formal la pregunta, realicemos la siguiente prueba de hipótesis: 𝐻0: 𝛽1 = 0 𝑣𝑠 𝐻𝑎: 𝛽1 ≠ 0 Es decir: H0: No existe relación lineal significativa entre la variable Rendimiento promedio de las acciones y Rendimiento global del mercado Vs Ha: Existe relación lineal significativa entre la variable Rendimiento promedio de las acciones y Rendimiento global del mercado Prueba de significancia (F) Alpha 0.05 Estadístico V-C Valor-p Comparación 47.0114667 5.31765507 0.000130130001 -0.04986987 Para la conclusión de este ejercicio, se puede observar en la tabla anterior de Prueba de Significancia por medio del estadístico F, que el estadístico de prueba es mayor al valor crítico, rechazando así la hipótesis nula e indicando que la variable Rendimiento promedio de las acciones sí tiene relación lineal con la variable Rendimiento global del mercado. 5. VALIDAR LOS SUPUESTOS DE MODELO POR MEDIO DE LOS RESIDUALES. Esta gráfica de los residuales estandarizados, podemos observar que todos los datos están en la banda de entre 2 y -2, a excepción de un punto, el (13.44, 2.0728), siendo así un punto atípico. Sin embargo, como el 95% de los demás puntos están dentro del rango anteriormente mencionado, dichos puntos tienen una distribución normal. PROBLEMA 10 Los corredores de bienes raíces a menudo están interesados en ver cómo el avalúo de una casa varía de acuerdo con su tamaño. A continuación, se muestran algunos datos del área (en miles de pies cuadrados) y el avalúo (en miles de dólares) para una muestra de 11 casas. 1. GRÁFICA DE DISPERSIÓN DE PUNTOS Y DESCRIPCIÓN. En la gráfica se logra ver cierta tendencia de línea, pero con una ligera dispersión. Dicha tendencia es positiva, por lo que se cree que un modelo de regresión lineal dará un buen ajuste. 2. AJUSTAR UN MODELO DE REGRESIÓN LINEAL. OBTENER UNA ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO Y SU INTERPRETACIÓN. Estimación de los parámetros es la siguiente: B0 = 15.97 B1 = 55.95 La ecuación de regresión que relaciona las dos variables es: Valor = 55.958área + 15.97 La pendiente es positiva (55.95), por lo que aumentar x en una unidad, la variable y aumentará 55.98 unidades. 3. COEFICIENTE DE DETERMINACIÓN Y DE CORRELACIÓN. a) Coeficiente de determinación El coeficiente de determinación tiene un ajuste de bondad intermedio, ya que mientras más cerca de 1, mejor es el ajuste y más fiable es la regresión. b) Coeficiente de correlación Nuesto coeficiente de correlación al ser 0.9729, siendo más alto de 0.7, nos quiere decir que tiene una fuerte relación lineal. 4. CONTRASTAR LA SIGNIFICACIÓN DEL MODELO PROPUESTO. Para responder de manera más formal la pregunta, realicemos la siguiente prueba de hipótesis: 𝐻0: 𝛽1 = 0 𝑣𝑠 𝐻𝑎: 𝛽1 ≠ 0 Es decir: H0: No existe relación lineal significativa entre la variable Área y Valor Vs Ha: Existe relación lineal significativa entre la variable Área y Valor Prueba de Significancia (t) alpha 0.05 Estadístico V-C Valor-p Comparación 12.6476079 2.26215716 0.000000491482 -0.049999509 Conclusión: Cómo el Valor -p (0.000000491482) es menor que el Alpha (0.05), se rechaza la hipótesis nula por lo que concluye que existe relación lineal significativa entre la variable Área y Valor. 5. VALIDAR LOS SUPUESTOS DE MODELO POR MEDIO DE LOS RESIDUALES. La gráfica anterior corresponde a los residuales estandarizados, en esta podemos observar que todos los datos están en la banda de entre -2 y 2 por lo que se confirma que los datos tienen distribución normal. Por lo que no hay puntos atípicos. PROBLEMA 11 Al gerente de marketing de una gran cadena de supermercados le gustaría utilizar el espacio en el estante para predecir las ventas de alimento para mascotas. Se selecciona una muestra aleatoria de 12 tiendas de igual tamaño PETFOOD, con los siguientes resultados Prediga la media de ventas semanales de la comida para mascotas con espacio de estantes de 8 pies. Estimación puntual de 8 pies viene siendo: 2.042 La media de ventas semanales respecto a los 8 pies es de: 1.6011 Procedimiento: y = 1.45 + 0.074 (2.042) y = 1.45 + .151108 y = 1.6011 1. GRÁFICA DE DISPERSIÓN DE PUNTOS Y DESCRIPCIÓN. En este ejercicio en particular, existe una distribución algo grande entre los puntos, ocasionado que la línea no sea tan recta. Esta tendencia es positiva, por lo que se cree que un modelo de regresión lineal dará un buen ajuste. 2. AJUSTAR UN MODELO DE REGRESIÓN LINEAL. OBTENER UNA ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO Y SU INTERPRETACIÓN. Estimación de los parámetros es la siguiente: B0 = 1.45 B1 = 0.074 La ecuación de regresión que relaciona lasdos variables es: Ventas semanales = 0.074espacio en el estante + 1.45 La ecuación tiene una pendiente positiva de 0.074, por lo que aumentar una unidad en x, la variable y aumentará 0.074 unidades. 3. COEFICIENTE DE DETERMINACIÓN Y DE CORRELACIÓN. a) Coeficiente de determinación El coeficiente de determinación tiene un ajuste de bondad intermedio, ya que mientras más cerca de 1, mejor es el ajuste y más fiable es la regresión. b) Coeficiente de correlación Nuesto coeficiente de correlación al ser más alto de 0.7 nos quiere decir que tiene una fuerte relación lineal, una correlación muy estrecha. 4. CONTRASTAR LA SIGNIFICACIÓN DEL MODELO PROPUESTO. Para responder de manera más formal la pregunta, realicemos la siguiente prueba de hipótesis: 𝐻0: 𝛽1 = 0 𝑣𝑠 𝐻𝑎: 𝛽1 ≠ 0 Es decir: H0: No existe relación lineal significativa entre la variable Ventas semanales y Espacio en el estante Vs Ha: Existe relación lineal significativa entre la variable Ventas semanales y Espacio en el estante Prueba de significancia (F) Alpha 0.05 Estadístico V-C Valor-p Comparación 21.6385669 4.96460274 0.000905655850 -0.049094344 Se puede observar en la tabla anterior de Prueba de Significancia por medio del estadístico F, que el Valor-p es menor al Alpha, rechazando así la hipótesis nula e indicando que existe relación lineal significativa entre la variable Ventas semanales y Espacio en el estante. 5. VALIDAR LOS SUPUESTOS DE MODELO POR MEDIO DE LOS RESIDUALES. La distribución de los puntos en la gráfica de los residuales no sigue una tendencia, están esparcidos entre el rango 2 y -2. Por lo que no existen puntos atípicos, siendo una distribución normal. RESIDUALES ESTANDARIZADOS FRENTE A y ESTIMADA Estandarizado 92.371287128712879 86.034653465346537 79.698019801980195 73.361386138613867 70.82673267326733 98.707920792079221 98.707920792079221 86.034653465346537 73.361386138613867 60.688118811881196 96.173267326732685 86.034653465346537 1.0314098832105107 -1.1612602589118768 -1.8026703200220804 -0.53878605089219356 -0.73854243705908906 0.95239957506702289 -0.29415364845483299 -0.39592723346261433 0.64850248307387204 2.0420921187582848 0.7385424370590834 -1.3260720737983131E-2 GRÁFICA DE DISPERSIÓN: # DE CRÍMENES REPORTADOS VS POLICÍA 8 9 12 18 8 6 5 10 13 15 23 25 15 10 9 20 RESIDUALES ESTANDARIZADOS FRENTE A y ESTIMADA 14.245689655172413 15.581896551724137 19.59051724137931 27.60775 8620689655 14.245689655172413 11.573275862068964 10.23706896551724 16.918103448275861 -0.5625306578356577 -0.2601655951051367 1.5716563902765341 -2.1692322417284475 0.34063275128456849 -0.74920792640276601 -0.61742444962915444 1.3779140777790599 Gráfica de Dispersión: I.E.T vs Salario 9 7 8 4 7 5 5 6 36 25 33 15 28 19 20 22 R² = 0.9709 9 7 8 4 7 5 5 6 36 25 33 15 28 19 20 22 RESIDUALES ESTANDARIZADOS FRENTE A y ESTIMADA Estandarizado 35.811320754716981 27.383647798742139 31.59748427672956 14.742138364779873 27.383647798742139 18.955974842767294 18.955974842767294 23.169811320754718 0.19538273889721008 -1.9398776409818419 1.2253733786344074 0.25242043540817927 0.50160424489767885 3.7522501103144083E-2 0.88981931187452112 -0.94510047758619709 Gráfica de Dispersión: Rendimiento promedio de las acciones vs Rendimiento global del mercado 11 15 3 18 10 12 6 7 18 13 10 12 8 15 9 11 8 10 13 11 R² = 0.8546 11 15 3 18 10 12 6 7 18 13 10 12 8 15 9 11 8 10 13 11 RESIDUALES ESTANDARIZADOS FRENTE A y ESTIMADA Estandariza do 10.57697456492637 12.217313699241409 7.2962962962962958 13.447568049977686 10.166889781347612 10.987059348505131 8.5265506470325736 8.9366354306113323 13.447568049977686 11.39714413208389 -0.67942207009343158 -0.2649942349584839 1.0209842557761228 2.0728495843615162 -1.3795679127680969 1.5253531348490059E-2 -0.66818009838185266 1.3135532911702625 -0.59760509718729171 -0.47094284799777325 GRÁFICA DE DISPERSIÓN: ÁREA VS VALOR 1.1000000000000001 1.5 1.6 1.6 1.4 1.3 1.1000000000000001 1.7 1.9 1.5 1.3 75 95 110 102 95 87 82 115 122 98 90 1.1000000000000001 1.5 1. 6 1.6 1.4 1.3 1.1000000000000001 1.7 1.9 1.5 1.3 75 95 110 102 95 87 82 115 122 98 90 RESIDUALES ESTANDARIZADOS FRENTE A y ESTIMADA 77.523952095808383 99.907185628742511 105.50299401197604 105.50299401197604 94.311377245508965 88.715568862275447 77.523952095808383 111.09880239520957 122.29041916167664 99.907185628742511 88.715568862275447 -0.87364820567966806 -1.495535416614177 1.3949509761506715 -1.0866129441386694 0.21004135084926048 -0.53353386644416634 1.5493523932278814 1.2573066690966432 -0.11038050320882452 -0.58124225770788862 0.39945205707600012 Gráfica de Dispersión: Espacio en el estante vs Ventas semanales 5 5 5 10 10 10 15 15 15 20 20 20 1.6 2.2000000000000002 1.4 1.9 2.4 2.6 2.2999999999999998 2.7 2.8 2.6 2.9 3.1 R² = 0.6839 5 5 5 10 10 10 15 15 15 20 20 20 1.6 2.2000000000000002 1.4 1.9 2.4 2.6 2.2999999999999998 2.7 2.8 2.6 2.9 3.1 RESIDUALES ESTANDARIZADOS FRENTE A y ESTIMADA Estandarizado 1.8200000000000003 1.8200000000000003 1.8200000000000003 2.1900000000000004 2.1900000000000004 2.1900000000000004 2.56 2.56 2.56 2.93 2.93 2.93 -0.81561702762344435 1.4087930477132204 -1.5570870527356664 -0.99230147512685529 0.71856313716082343 1.4029089820758955 -0.88964959838959368 0.47904209144055043 0.82121501389808493 -1.2234255414351656 -0.11122050376683414 0.63024952134538803 GRÁFICA DE DISPERSIÓN: PRECIO VS # DE BOLETAS 1.25 1.5 1.75 2 2.1 1 1 1.5 2 2.5 1.1000000000000001 1.5 95 83 75 72 69 101 98 85 75 65 98 86