Σx = 17, Σy = 741.67, Σx² = 59, Σxy = 2725.91, Σy² = 94124.8489, N = 6 M = (Nσxy Σxσy) / (Nσx² (Σx) ²)
Σx = 17, Σy = 741.67, Σx² = 59, Σxy = 2725.91, Σy² = 94124.8489, N = 6 M = (Nσxy Σxσy) / (Nσx² (Σx) ²)
Σx = 17, Σy = 741.67, Σx² = 59, Σxy = 2725.91, Σy² = 94124.8489, N = 6 M = (Nσxy Σxσy) / (Nσx² (Σx) ²)
1. Los datos que se muestran a continuación, relacionan la cantidad gastada en alimentos por semana y
el número de miembros de una familia
b) Grafique los puntos y la recta de mejor ajuste en la misma gráfica. (Grafica de dispersión)
c) ¿La recta resume la información de los puntos de datos? (Es bueno el modelo para estimar el gasto
del hogar)?
Para determinar si la recta resume bien la información, calcularemos el coeficiente de determinación (R²).
Visualmente, parece haber una tendencia positiva, pero hay cierta dispersión en los datos.
b = (Σy - mΣx) / n
b = 56.11
entonces → y=23.826X+56.106
Para R^2
R² = SSR / SST
R² = 0.9601
e) ¿Cuánto estimaría usted que gasta en alimentos por semana una familia de seis integrantes? ¿Debe
usar la recta ajustada para estimar esta cantidad? ¿Por qué sí o por qué no?
• Contras: Estamos extrapolando más allá de nuestros datos originales (el máximo era 5 miembros).
En este caso, podríamos usar la estimación, pero con precaución. Deberíamos advertir que la precisión
puede disminuir al extrapolar y que factores adicionales podrían influir en familias más grandes que no
están capturados en nuestros datos actuales.
Total 6405,193 5
Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de Estadísticas de
estandarizados estandarizados confianza para B colinealidad
B Límite Límite
Modelo Desv. Error Beta t Sig. inferior superior Tolerancia VIF
X_Nro_miembros 23,826 2,428 ,980 9,812 ,001 17,084 30,568 1,000 1,000
c)
Los puntos se ajustan al modelo en un 96%, No existe autocorrelacion porque el
estadístico DW es próximo a 2, El estadístico F muestra una significancia menor a 0.05 lo que
implica que de manera el modelo es útil para hacer predicciones. Por ultimo la significancia del
estadístico t es menor que 0.05 por lo que el nro de integrantes explica el gasto promedio semanal
del hogar.
Por lo tanto el modelo es útil para realizar predicciones.
d)
𝐺𝑎𝑠𝑡𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜/𝑠𝑒𝑚𝑎𝑛𝑎 = 56.106 + 23.826 ∗ 𝑁𝑟𝑜 𝑚𝑖𝑒𝑚𝑏𝑟𝑜𝑠
𝑌 = 𝑎 + 𝑏𝑋
e) Según las pruebas estadística el modelo es útil para realizar predicciones.
Datos
Familia con 6 integrantes
Gasto promedio mes del hogar= ¿???
𝐺𝑎𝑠𝑡𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑚𝑒𝑠 = 56.106 + 23.826 ∗ 6
𝐺𝑎𝑠𝑡𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑚𝑒𝑠 = 199.062
2. Los datos que relacionan los pies cuadrados de espacio de vivienda, así como el precio de venta de 12
propiedades residenciales del ejemplo 3.5, se reproducen a continuación.
a) Grafique la recta y los puntos de datos en la misma gráfica. (Grafica de dispersión)
b) Comente sobre la bondad de la recta ajustada, describiendo el precio de venta de una
propiedad residencial como una función lineal de los metros cuadrado cuadrados de área de
vivienda.
c) Encuentre la recta (Ecuación) de mejor ajuste que describe estos datos
d) Si el modelo es bueno estime el precio de la vivienda con 1360 m2
X(Superficie y (Pecio en miles
Residencia m2) Bs)
1 1360 278.5
2 1940 375.7
3 1750 339.5
4 1550 329.8
5 1790 295.6
6 1750 310.3
7 2230 460.5
8 1600 305.2
9 1450 288.6
10 1870 365.7
11 2210 425.3
12 1480 268.8
Resumen del modelob
R cuadrado Error estándar de la
Modelo R R cuadrado ajustado estimación Durbin-Watson
1 ,924a ,854 ,839 239,45588 2,237
a. Predictores: (Constante), X_Superficie_m2
b. Variable dependiente: y_Pecio_miles_Bs
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1 Regresión 3354881,746 1 3354881,746 58,509 ,000b
Residuo 573391,170 10 57339,117
Total 3928272,917 11
a. Variable dependiente: y_Pecio_miles_Bs
b. Predictores: (Constante), X_Superficie_m2
Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de Estadísticas de
estandarizados estandarizados confianza para B colinealidad
Desv. Límite Límite
Modelo B Error Beta t Sig. inferior superior Tolerancia VIF
1 (Constante) -60,562 453,731 -,133 ,896 -1071,539 950,414
X_Superficie_m2 1,962 ,256 ,924 7,649 ,000 1,390 2,533 1,000 1,000
a. Variable dependiente: y_Pecio_miles_Bs
a)
b)
Σx² = 36,591,700
Σxy = 7,157,935
Σy² = 1,401,649.39
n = 12
R² = 0.854
Este valor de R² nos indica que aproximadamente el 85.4% de la variabilidad en los precios puede explicarse por la
superficie de la vivienda. Esto sugiere que existe una relación lineal bastante fuerte entre ambas variables, lo que
hace que el modelo sea relativamente confiable para estimaciones.
c) recta
y = 0.1962x - 6.0562
d)
y = 0.1962(1360) -6.0562
y = 255.06
3. Chirridos de grillos Los grillos machos chirrían frotando sus alas frontales, y su chirrido depende de la
temperatura. Los grillos chirrían más rápido con el aumento de la temperatura y más lento con la
disminución de ésta. La tabla siguiente muestra el número de chirridos por segundo para un grillo,
registrado a 10 temperaturas diferentes.
a) ¿Cuál de las dos variables (temperatura y número de chirridos) es la variable independiente, y cuál
la variable dependiente?
b) Grafique los datos usando una gráfica de dispersión. ¿Cómo describiría la relación entre
temperatura y número de chirridos?
c) Encuentre la recta de mínimos cuadrados que relaciona el número de chirridos con la temperatura.
d) Si un grillo es registrado a una temperatura de 80 grados, ¿cuál predeciría que sería su número de
chirridos?
ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 25,122 1 25,122 34,786 ,000b
Residuo 5,778 8 ,722
Total 30,900 9
a. Variable dependiente: Chirridos
b. Predictores: (Constante), Temperatura F
Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de
estandarizados estandarizados confianza para B
Límite Límite
Modelo B Desv. Error Beta t Sig. inferior superior
1 (Constante) -,257 2,921 -,088 ,932 -6,994 6,479
Temperatura ,215 ,036 ,902 5,898 ,000 ,131 ,299
F
a. Variable dependiente: Chirridos
a)
Variable independiente (x): Temperatura °F
Variable dependiente (y): Chirridos por segundo
b)
Observando el gráfico, podemos ver que existe una relación positiva entre la temperatura y el número de
chirridos: a medida que aumenta la temperatura, tiende a aumentar el número de chirridos por segundo.
La relación parece ser aproximadamente lineal.
c)
Σx = 797 (suma de temperaturas)
Σy = 169 (suma de chirridos)
Σx² = 64,425
Σxy = 13,725
Σy² = 2,891
n = 10
m = (nΣxy - ΣxΣy) / (nΣx² - (Σx)²) =0.2153
b = (Σy - mΣx) / n = -0.2573
y = 0.2153x - 0.2573
R² = 0.813
d)
Para predecir el número de chirridos a 80°F:
y = 0.2153(80) - 0.2573
y = 16.96
Por lo tanto, a 80°F, predecimos aproximadamente 17 chirridos por segundo.
4. Calificaciones trimestrales Cuando un estudiante sale mal en un examen trimestral, a veces está
convencido de que su calificación es una anomalía y que saldrá mucho mejor en el segundo trimestre.
Los datos que siguen muestran las calificaciones trimestrales (de un total de 100 puntos) para ocho
estudiantes en un curso de introducción a la estadística.
Σx² = 43,075
Σxy = 41,640
Σy² = 42,808
n=8
El coeficiente de correlación R = 0.635 indica una correlación positiva moderada entre las calificaciones del
primer y segundo trimestre. Esto sugiere que hay una tendencia a que las calificaciones más altas en el
primer trimestre se asocien con calificaciones más altas en el segundo trimestre
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1 Regresión 1322,480 1 1322,480 4,063 ,090b
Residuo 1953,020 6 325,503
Total 3275,500 7
a. Variable dependiente: Trimestre 2
b. Predictores: (Constante), Trimestre 1
Coeficientesa
Coeficientes 95.0% intervalo de confianza
Coeficientes no estandarizados estandarizados para B
Límite
Modelo B Desv. Error Beta t Sig. Límite inferior superior
1 (Constante) 8,730 30,938 ,282 ,787 -66,971 84,432
Trimestre 1 ,849 ,421 ,635 2,016 ,090 -,182 1,880
a. Variable dependiente: Trimestre 2