Σx = 17, Σy = 741.67, Σx² = 59, Σxy = 2725.91, Σy² = 94124.8489, N = 6 M = (Nσxy Σxσy) / (Nσx² (Σx) ²)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

REGRESION CORRELACION

1. Los datos que se muestran a continuación, relacionan la cantidad gastada en alimentos por semana y
el número de miembros de una familia

a) ¿Cuál de las dos variables es la variable independiente, y cuál la variable dependiente?

Variable independiente (x): Número de miembros de la familia Variable dependiente (y):


Cantidad gastada en alimentos por semana. La razón es que el número de miembros de la familia
influye en el gasto en alimentos, no al revés.

b) Grafique los puntos y la recta de mejor ajuste en la misma gráfica. (Grafica de dispersión)

c) ¿La recta resume la información de los puntos de datos? (Es bueno el modelo para estimar el gasto
del hogar)?

Para determinar si la recta resume bien la información, calcularemos el coeficiente de determinación (R²).
Visualmente, parece haber una tendencia positiva, pero hay cierta dispersión en los datos.

d) Encuentre la recta de mejor ajuste para estos datos. (Ecuación)

Σx = 17, Σy = 741.67, Σx² = 59, Σxy = 2725.91, Σy² = 94124.8489, n = 6

m = (nΣxy - ΣxΣy) / (nΣx² - (Σx)²)


m = 23.826

b = (Σy - mΣx) / n

b = 56.11

entonces → y=23.826X+56.106

Para R^2

SST = Σy² - (Σy)²/n

SSR = m * (Σxy - ΣxΣy/n)

R² = SSR / SST

R² = 0.9601

e) ¿Cuánto estimaría usted que gasta en alimentos por semana una familia de seis integrantes? ¿Debe
usar la recta ajustada para estimar esta cantidad? ¿Por qué sí o por qué no?

y = 23.826 * 6 + 56.106 = 109.06

Estimación: $109.6 por semana.

Sobre si debemos usar la recta ajustada para esta estimación:

• Pros: El modelo tiene un R² razonable y parece capturar la tendencia general.

• Contras: Estamos extrapolando más allá de nuestros datos originales (el máximo era 5 miembros).

En este caso, podríamos usar la estimación, pero con precaución. Deberíamos advertir que la precisión
puede disminuir al extrapolar y que factores adicionales podrían influir en familias más grandes que no
están capturados en nuestros datos actuales.

Resumen del modelob


Estadísticos de cambio

R cuadrado Error estándar de Cambio en R Cambio en Sig. Cambio Durbin-


Modelo R R cuadrado ajustado la estimación cuadrado F gl1 gl2 en F Watson

1 ,980a ,960 ,950 7,99225 ,960 96,275 1 4 ,001 2,242

a. Predictores: (Constante), X_Nro_miembros


Dw = próximo a 2
b. Variable dependiente: Y_gasto_alimentos

Esta próximo por lo que se asume que no


hay problemas de auto correlación
R2 Mayor que 0.5 el ajuste de los datos al modelo es bueno
ANOVAa

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 6149,689 1 6149,689 96,275 ,001b

Residuo 255,504 4 63,876

Total 6405,193 5

a. Variable dependiente: Y_gasto_alimentos


Menor a 0.05
b. Predictores: (Constante), X_Nro_miembros
La sig del estadístico F es 0.001 esto es menor que
0.05 lo que implica que el modelo es consistente
de manera general

Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de Estadísticas de
estandarizados estandarizados confianza para B colinealidad
B Límite Límite
Modelo Desv. Error Beta t Sig. inferior superior Tolerancia VIF

1 (Constante) 56,106 7,614 7,368 ,002 34,964 77,247

X_Nro_miembros 23,826 2,428 ,980 9,812 ,001 17,084 30,568 1,000 1,000

a. Variable dependiente: Y_gasto_alimentos

Mayor a 2 Mempr a 0.05


En este caso es igual a En este caso es igual a 0.001 esto indica que es
9.812 esto indica que menor que 0.05 lo que indica que esta variable
es mucho mayor a 2 aporta mucho a la predicción de la variable
dependiente

c)
Los puntos se ajustan al modelo en un 96%, No existe autocorrelacion porque el
estadístico DW es próximo a 2, El estadístico F muestra una significancia menor a 0.05 lo que
implica que de manera el modelo es útil para hacer predicciones. Por ultimo la significancia del
estadístico t es menor que 0.05 por lo que el nro de integrantes explica el gasto promedio semanal
del hogar.
Por lo tanto el modelo es útil para realizar predicciones.

d)
𝐺𝑎𝑠𝑡𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜/𝑠𝑒𝑚𝑎𝑛𝑎 = 56.106 + 23.826 ∗ 𝑁𝑟𝑜 𝑚𝑖𝑒𝑚𝑏𝑟𝑜𝑠

𝑌 = 𝑎 + 𝑏𝑋
e) Según las pruebas estadística el modelo es útil para realizar predicciones.
Datos
Familia con 6 integrantes
Gasto promedio mes del hogar= ¿???
𝐺𝑎𝑠𝑡𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑚𝑒𝑠 = 56.106 + 23.826 ∗ 6
𝐺𝑎𝑠𝑡𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑚𝑒𝑠 = 199.062

2. Los datos que relacionan los pies cuadrados de espacio de vivienda, así como el precio de venta de 12
propiedades residenciales del ejemplo 3.5, se reproducen a continuación.
a) Grafique la recta y los puntos de datos en la misma gráfica. (Grafica de dispersión)
b) Comente sobre la bondad de la recta ajustada, describiendo el precio de venta de una
propiedad residencial como una función lineal de los metros cuadrado cuadrados de área de
vivienda.
c) Encuentre la recta (Ecuación) de mejor ajuste que describe estos datos
d) Si el modelo es bueno estime el precio de la vivienda con 1360 m2
X(Superficie y (Pecio en miles
Residencia m2) Bs)
1 1360 278.5
2 1940 375.7
3 1750 339.5
4 1550 329.8
5 1790 295.6
6 1750 310.3
7 2230 460.5
8 1600 305.2
9 1450 288.6
10 1870 365.7
11 2210 425.3
12 1480 268.8
Resumen del modelob
R cuadrado Error estándar de la
Modelo R R cuadrado ajustado estimación Durbin-Watson
1 ,924a ,854 ,839 239,45588 2,237
a. Predictores: (Constante), X_Superficie_m2
b. Variable dependiente: y_Pecio_miles_Bs

ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1 Regresión 3354881,746 1 3354881,746 58,509 ,000b
Residuo 573391,170 10 57339,117
Total 3928272,917 11
a. Variable dependiente: y_Pecio_miles_Bs
b. Predictores: (Constante), X_Superficie_m2

Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de Estadísticas de
estandarizados estandarizados confianza para B colinealidad
Desv. Límite Límite
Modelo B Error Beta t Sig. inferior superior Tolerancia VIF
1 (Constante) -60,562 453,731 -,133 ,896 -1071,539 950,414
X_Superficie_m2 1,962 ,256 ,924 7,649 ,000 1,390 2,533 1,000 1,000
a. Variable dependiente: y_Pecio_miles_Bs

a)
b)

Σx = 20730 (suma de superficies)

Σy = 4035.5 (suma de precios)

Σx² = 36,591,700

Σxy = 7,157,935

Σy² = 1,401,649.39

n = 12

R² = 0.854

Este valor de R² nos indica que aproximadamente el 85.4% de la variabilidad en los precios puede explicarse por la
superficie de la vivienda. Esto sugiere que existe una relación lineal bastante fuerte entre ambas variables, lo que
hace que el modelo sea relativamente confiable para estimaciones.

c) recta

m = (nΣxy - ΣxΣy) / (nΣx² - (Σx)²) =0.1962

b = (Σy - mΣx) / n = -6.0562

y = 0.1962x - 6.0562

d)

y = 0.1962(1360) -6.0562

y = 255.06

El precio estimado sería aproximadamente $255.06

Este es un buen uso del modelo por varias razones:

1. El valor de R² es alto (85.4%)


2. El tamaño de 1360 m² está dentro del rango de nuestros datos originales

3. No estamos extrapolando más allá de los valores observados

4. La superficie solicitada está cerca de varios puntos de datos existentes

3. Chirridos de grillos Los grillos machos chirrían frotando sus alas frontales, y su chirrido depende de la
temperatura. Los grillos chirrían más rápido con el aumento de la temperatura y más lento con la
disminución de ésta. La tabla siguiente muestra el número de chirridos por segundo para un grillo,
registrado a 10 temperaturas diferentes.

a) ¿Cuál de las dos variables (temperatura y número de chirridos) es la variable independiente, y cuál
la variable dependiente?
b) Grafique los datos usando una gráfica de dispersión. ¿Cómo describiría la relación entre
temperatura y número de chirridos?
c) Encuentre la recta de mínimos cuadrados que relaciona el número de chirridos con la temperatura.
d) Si un grillo es registrado a una temperatura de 80 grados, ¿cuál predeciría que sería su número de
chirridos?

Resumen del modelob


Error Estadísticos de cambio
R estándar Cambio Sig.
R cuadrado de la en R Cambio Cambio Durbin-
Modelo R cuadrado ajustado estimación cuadrado en F gl1 gl2 en F Watson
1 ,902a ,813 ,790 ,84982 ,813 34,786 1 8 ,000 1,271
a. Predictores: (Constante), Temperatura F
b. Variable dependiente: Chirridos

ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 25,122 1 25,122 34,786 ,000b
Residuo 5,778 8 ,722
Total 30,900 9
a. Variable dependiente: Chirridos
b. Predictores: (Constante), Temperatura F
Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de
estandarizados estandarizados confianza para B
Límite Límite
Modelo B Desv. Error Beta t Sig. inferior superior
1 (Constante) -,257 2,921 -,088 ,932 -6,994 6,479
Temperatura ,215 ,036 ,902 5,898 ,000 ,131 ,299
F
a. Variable dependiente: Chirridos
a)
Variable independiente (x): Temperatura °F
Variable dependiente (y): Chirridos por segundo
b)

Observando el gráfico, podemos ver que existe una relación positiva entre la temperatura y el número de
chirridos: a medida que aumenta la temperatura, tiende a aumentar el número de chirridos por segundo.
La relación parece ser aproximadamente lineal.
c)
Σx = 797 (suma de temperaturas)
Σy = 169 (suma de chirridos)
Σx² = 64,425
Σxy = 13,725
Σy² = 2,891
n = 10
m = (nΣxy - ΣxΣy) / (nΣx² - (Σx)²) =0.2153
b = (Σy - mΣx) / n = -0.2573
y = 0.2153x - 0.2573
R² = 0.813
d)
Para predecir el número de chirridos a 80°F:
y = 0.2153(80) - 0.2573
y = 16.96
Por lo tanto, a 80°F, predecimos aproximadamente 17 chirridos por segundo.

4. Calificaciones trimestrales Cuando un estudiante sale mal en un examen trimestral, a veces está
convencido de que su calificación es una anomalía y que saldrá mucho mejor en el segundo trimestre.
Los datos que siguen muestran las calificaciones trimestrales (de un total de 100 puntos) para ocho
estudiantes en un curso de introducción a la estadística.

Estudiante Trim1 Trim2


1 70 88
2 58 52
3 85 84
4 82 74
5 70 80
6 40 36
7 85 48
8 85 96

a) ¿Cuál de las dos variables es la variable independiente, y cuál la variable dependiente?


Variable independiente (x): Calificación del primer trimestre (Trim1)
Variable dependiente (y): Calificación del segundo trimestre (Trim2)

b) Construya una gráfica de dispersión para los datos.


c) Cuanto es el grado de ajuste R entre las calificaciones de los dos trimestres. ¿Cómo describiría la
relación entre las calificaciones en el primer y el segundo trimestre?

Σx = 575 (suma Trim1)

Σy = 558 (suma Trim2)

Σx² = 43,075

Σxy = 41,640

Σy² = 42,808

n=8

r = (nΣxy - ΣxΣy) / √[(nΣx² - (Σx)²)(nΣy² - (Σy)²)] =0.635

El coeficiente de correlación R = 0.635 indica una correlación positiva moderada entre las calificaciones del
primer y segundo trimestre. Esto sugiere que hay una tendencia a que las calificaciones más altas en el
primer trimestre se asocien con calificaciones más altas en el segundo trimestre

d) Calcule la recta de regresión para predecir la calificación de un estudiante en el examen del


segundo trimestre con base en la calificación del estudiante en el primer trimestre.

m = (nΣxy - ΣxΣy) / (nΣx² - (Σx)²) =0.849


b = (Σy - mΣx) / n = 8.7304
y = 0.849x + 8.7304
R² = 0.4037

e) Usando la ecuación de la recta de regresión, prediga la calificación de un estudiante en el segundo


trimestre si su calificación en el primer trimestre fue 85.

y = 0.849(85) + 8.7304 = 80.89


Resumen del modelob
Error Estadísticos de cambio
estándar Sig.
R R cuadrado de la Cambio en Cambio en Cambio en Durbin-
Modelo R cuadrado ajustado estimación R cuadrado F gl1 gl2 F Watson
1 ,635a ,404 ,304 18,04171 ,404 4,063 1 6 ,090 2,253
a. Predictores: (Constante), Trimestre 1
b. Variable dependiente: Trimestre 2

ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1 Regresión 1322,480 1 1322,480 4,063 ,090b
Residuo 1953,020 6 325,503
Total 3275,500 7
a. Variable dependiente: Trimestre 2
b. Predictores: (Constante), Trimestre 1

Coeficientesa
Coeficientes 95.0% intervalo de confianza
Coeficientes no estandarizados estandarizados para B
Límite
Modelo B Desv. Error Beta t Sig. Límite inferior superior
1 (Constante) 8,730 30,938 ,282 ,787 -66,971 84,432
Trimestre 1 ,849 ,421 ,635 2,016 ,090 -,182 1,880
a. Variable dependiente: Trimestre 2

También podría gustarte