Obtener Archivo Recurso

Descargar como xlsx, pdf o txt
Descargar como xlsx, pdf o txt
Está en la página 1de 31

ANALISIS DE REGRESIÓN SIMPLE

10) El Banco "PRESTAMO" estudia la relación entre las variables, ingresos (X) y ahorros(Y) mensuales
de sus clientes. Una muestra aleatoria de sus clientes reveló los siguientes datos en dolarés:

Ingreso Ahorro
x y XY X2 ŷ (y - ŷ)2 Y2 (x  x)2
350 100 35000 122500 83.28 279.56 10000 80277.78
400 110 44000 160000 105.88 16.97 12100 54444.44
450 130 58500 202500 128.48 2.31 16900 33611.11
500 160 80000 250000 151.08 79.57 25600 17777.78
950 350 332500 902500 354.48 20.07 122500 100277.78
850 350 297500 722500 309.28 1658.12 122500 46944.44
700 250 175000 490000 241.48 72.59 62500 4444.44
900 320 288000 810000 331.88 141.13 102400 71111.11
600 130 78000 360000 196.28 4393.04 16900 1111.11
5700 1900 1388500 4020000 6663.362 491400 410000

n = 9
∑xy = 1388500
∑x = 5700
∑y = 1900
∑x2 = 4020000
2
(∑x) = 32490000
y 211.11
x 633.33
∑Y2 = 491400

b) Dibuje el diagrama de dispersión y describa la tendencia trazando una línea a travéz de


los puntos

400

350
f(x) = 0.451626016260163 x − 74.9186991869918
R² = 0.926205705264043
300

250

200 Column C
Linear (Column C)
150

100

50

0
300 400 500 600 700 800 900 1000
Interpretación:
EL ingreso adicional en 92,6%determinan el comportamiento el ahorro mensual

c) Determine la ecuación de regresión muestral. Interprete esta ecuación

n  xy   x  y
ˆ1  = 0.452 SCE = 6662.80
(  xi )
2 2
n x 

SCE   Yi 2   0   Yi    1  
ˆ0  y  ˆ1 x= -74.92

ŷ = -74,92 + 0,452X

Interpretación :
Por cada ingreso adicional mensual los ahorros aumentan aproximadamente en 0,452
dólares.

d) Calcule el error estandar de estimación. ¿Entre qué dos valores estarán aproximadame_
nte 95% de las pedicciones? (Suponga muestra grande)

SCE n
( y = yˆ ) 2 951.91 951.83
S 2

n  p i 1 n  p
S = 30.85 30.85

e) Analice que tan bien se ajustan los puntos del diagrama de dispersión a la línea de re_
gresión utilizando el coeficiente dedeterminación.
SCE = 6663.36
SCT = SCE - SCR

SCT   Y 2  n(Y )= 2 90288.89

SCR SCE
R2   1
= 0.93 el 93% de la varianza de y es explicada
por la regresión.
SCT SCT

11) Continuando con el ejercicio 10

a) Calcule la desviación estandar


̂
de la pendiente b (error estándar de b)
b

S2
ˆ
2
1
 n
= 0.00232173

x 2
 n( x ) 2
i 1 ˆ  1  0.0482

b) halle un intervalo de confianza de 0,95 para β. ¿Se puede afirmar que β = 0 ?


ˆ1  t 0ˆ  1   1  ˆ1  t 0ˆˆ1 1 0.452
t0 = 2.365
0.34 0.566
[0,34 ; 0,566]
se rechaza
se acepta H0 : β1 = 0
H1 : β1 ≠ 0
Por lo tanto si es significativa la regresión de y con x

c) Utilice la prueba t bilateral para probar la hipótesis nula H 0 : β = 0 al nivel de significaci_


ón del 5% . Calcule la probabilidad P.

H0 : β1 = 0
H1 : β1 ≠ 0

Estadistico de prueba ˆ1 = 9.37


T 
ˆ 1
t = 2.365
Por lo tanto se acepta H1: β1 ≠ 0 ,entonces la ecuación de regresión lineal muestral es
significativa.

P = 0.000

12) Continuando con el ejercicio 10, la pendiente de la línea de regresión muestral resultó
b = 0,452, se quiere determinar si esta pendiente es significativa en la población utilizando
el método de análisis de varianza.

a) Plantee la hipótesis nula y alternativa

H0 : β1 = 0
H1 : β1 ≠ 0

b) Determine la región de rechazo al nivel de significación 0,05 y describa la regla de decisión

F(1,7) , RC = ]5,59 , ∞[

c) Describa la tabla ANOVA y tome la decisión

SCR  ˆ1 (  xy  nx y ) CMR  SCR


H0 : β1 = 0

1
H1 : β1 ≠ 0
SCR  ˆ1 (  xy  nx y ) CMR  SCR
SCE  SCT  SCR 1
SCE
SCT   Y  n(Y )
2 2 CME 
n2
CMR
F
CME
SCR = 83626.084 CMR = 83626.084 F = 87.86
SCE = 6662.805 CME = 951.829 Ft = 5.59
SCT = 90288.889

Se rechaza H0 ,existe regresión lineal poblacional.

d) Halle la probabilidad de P de la prueba 6.12E-06

0.99999

14) Continuando con el ejercicio 10 determine el intervalo de confianza del 95% para;

a) La cantidad de ahorro promedio u y/x0.Si el ingreso es x0 = $1200

1 ( x0  x ) 2
yˆ 0   t 0 s 
n (x  x)2
ŷ = -74,92 + 0,452X

ŷ0 = 467.48 467.48 69.0037


t0s = 72.9673906 398.48 536.48
(x0  x)2 = 321111.111 [398,48 ; 536,48]

( x1/n ==x ) 20.11111111


410000

b) La cantidad de ahorro Y0 , cuando el ingreso es x0 = $1200

1 ( x0  x ) 2
yˆ 0  t 0 s 1  
n ( x  x ) 2

ŷ = -74,92 + 0,452X

ŷ0 = 467.48 467.48 100.428


t0s = 72.9674 367.05 567.91
= 2 321111 [367,05 ; 567,91]
( x0  x )
( x  x ) 2
( x0  x ) 2
( x1/n ==x ) 2 410000
0.11111

15) Continuando con el ejercicio 10

a) Calcule el coeficiente de correlación. Interprete la tendencia.

Sxy  xy  n( x )( y )
r 
SxSy [  x 2  n( x ) 2 ][  y 2  n( y ) 2 ]
r = 0.96 tendencia positiva

b) ¿ Por qué son iguales los signos de b y r ?

c) Utilizando la significancia al 5% del coeficiente regresión muestral, ¿Podemos concluir


que hay relación positiva entre ahorros e ingresos?

d) Realice la prueba bilateral de la hipótesis nula H 0: ρ = 0 al nivel de significanción 0,05.

16) Un comerciante mayorista encargó un estudio para determinar la relación entre los gastos
de publicidad semanal por radio y las ventas de sus productos. En el estudio se obtuvierón
los siguientes resultados.

x y
Gastos
de publici_ ventas
dad ($) ($) XY X2 Y2
30 300 9000 900 90000
20 250 5000 400 62500
40 400 16000 1600 160000
50 550 27500 2500 302500
70 750 52500 4900 562500
60 630 37800 3600 396900
80 930 74400 6400 864900
70 700 49000 4900 490000
80 840 67200 6400 705600
500 5350 338400 31600 3634900

n = 9
∑xy = 338400
∑x = 500
∑y = 5350
∑x2 = 31600
2
(∑x) = 250000
y 594.444444

x 55.5555556

∑Y2 = 3634900

a) Determina la ecuación de regresión de ventas sobre gastos de publicidad.

n  xy   x  y
ˆ1  = 10.77
(  xi )
2 2
n x 

ˆ0  y  ˆ=1 x -4.07

ŷ = -4,07 + 10,77X

b) Interprete la pendiente de la regresión.

Si los gastos de publicidad aumentan $1, las ventas aumentan en promedio $10,77.

c) ¿En cúanto estimará las ventas de la quinta semana?. ¿Cuantó es el error o residual en
esa semana?

ŷ = -4,07 + 10,77X
ŷ = 319.03 , no se puede determinar

17) Continuando con el ejercicio 16,

a) Haga el análisis de la validez de la regresión poblacional de ventas sobre gastos de


publicidad al nivel del 5% por medio de un ANOVA.

H0 : β1 = 0
SCR  ˆ1 ( xy  nxCMR
y) SCR
H1 : β1 ≠ 0 
SCE  SCT  SCR 1
CMR SCE
F SCT   Y 2  n(Y )CME
2

CME n2
SCR = 443618.734 CMR = 443618.734 Fc = 282.213
SCE = 11003.4884 CME = 1571.92691 Ft = 5.59
SCT = 454622.222

Se rechaza H0 : β1 = 0, existe regresión lineal poblacional.

b) Halle el coeficiente de determinación y el coeficiente de determinación ajustado. De su


comentario sobre esos valores.

SCR = SCE
0.976
R 2
 1
SCT SCT
CME
= 0.972
R 2  1 
CMT
SCT = 56827.778
CMT 
(n  1)

Existe un buen ajuste

c) A partir del análisis realizado en a) ¿Qué puede usted concluir acerca de la correlación
entre ventas y gastos de publicidad?.

Sxy  xy  n( x )( y= ) 0.988 Es significativo


r 
SxSy [ x 2  n( x ) 2 ][  y 2  n( y ) 2 ]
18) Se obtuvierón los siguientes datos para determinar la relación entre cantidad de
fertilizante y producción de papa por hectárea.

x y
Sacos de f_ Rendimi_
ertilizante p_ en quint_
or hectárea
3
ales
45
XY
135
X2
9
ŷ
45.0727273
(y - ŷ)2
0.005289
Y2
2025
20.25
(x  x)2
4 48 192 16 48.6787879 0.460753 2304 12.25
5 52 260 25 52.2848485 0.081139 2704 6.25
6 55 330 36 55.8909091 0.793719 3025 2.25
7 60 420 49 59.4969697 0.253039 3600 0.25
8 65 520 64 63.1030303 3.598494 4225 0.25
9 68 612 81 66.7090909 1.666446 4624 2.25
10 70 700 100 70.3151515 0.09932 4900 6.25
11 74 814 121 73.9212121 0.006208 5476 12.25
12 76 912 144 77.5272727 2.332562 5776 20.25
75 613 4895 645 9.29697 38659 82.5

n = 10
∑xy = 4895
∑x = 75
∑y = 613
∑x2 = 645
(∑x)2= 5625
y 61.3
y
x
∑Y = 2
7.5
38659

a) Encuentre la ecuación de regresión de la cosecha sobre el fertilizante, por el método de


mínimos cuadrados.

n  xy   x=  y3.606
ˆ1 
n  x  (  xi )
2 2

ˆ0  y  ˆ1 x
= 34.255

ŷ = 34,255 + 3,606X

b) Estime la cosecha si se aplican 12 sacos de fertilizantes. ¿Cuánto es el error o residual?

ŷ = 34,255+(3,606*12)
ŷ = 77.53

SCE n
( y  yˆ ) 2
S2   = 1.16
n  p i 1 n  p

c) Determine el coeficiente de determinación. De su comentario sobre este valor.

SCE = 9.2969697
SCT = SCE + SCR

SCT   Y 2  n=(Y ) 2 1082.1

SCR =SCE 0.991 el 99% de la varianza de y es explicada


R2   1 por la regresión.
SCT SCT
d) Determine si el coeficiente de regresión muestral es significativo utilizando el método
de intervalo de confianza para β al nivel de confianza 0,95. Es posible concluir que

H0 : β1 = 0
S2
ˆ
2

H1 : β1 ≠ 0 = 0.01409
1 n

ˆ  1  0.119
x
i 1
2
 n( x ) 2

ˆ1  t 0ˆ  1  1  ˆ1  t 0ˆ  1


t0 = 2.306
3.332 3.880
IC = [3,332 ; 3,880]

se rechaza H0 : β1 = 0
se acepta H1 : β1 ≠ 0
Por lo tanto si es significativa la regresión de y con x

e) Desarrolle un intervalo del 95% para el rendimiento promedio de papa que se obtendría
si se utiliza 12 kilogramos de fertilizante.

SCE n
( =y  yˆ1.16212121
)2
S 2

n  p i 1 Sn= p1.07801726

1 ( x0  x ) 2 77.53 1.4611
yˆ 0   t 0 s 
n (x  x ) 2 76.07 78.99

ŷ = 34,255 + 3,606X Int media. IC= [76,07 , 78,99]


ŷ0 = 77.527
t0s = 2.4859078
= 20.25
( x0  x ) 2

( x = x ) 2 82.5

1/n = 0.1

f) Desarrolle un intervalo de predicción del 95% para el rendimiento de papa que se


obtendría si se utiliza 12 kilogramos de fertilizante.

1 ( x0  x ) 2 77.527 2.8835
yˆ 0  t 0 s 1   74.64 80.41
n ( x  x ) 2
Int predicc = [74,64 , 80,41]
ŷ = 34,255 + 3,606X
ŷ0 = 77.527
t0s = 2.4859078
= 20.25
( x0  x ) 2

( x  x ) 2
= 82.5

1/n = 0.1

19) El número de horas de estudio invertidas y las calificaciones finales en un curso de Matemáticas
de una muestra 10 alumnos ha dado los siguientes resultados:
x y
Horas de Califica_
estudio ción XY X2 ŷ (y - ŷ)2 Y2
14 12 168 196 10.8387097 1.348595 144
16 13 208 256 12.3064516 0.481009 169
22 15 330 484 16.7096774 2.922997 225
20 15 300 400 15.2419355 0.058533 225
18 17 306 324 13.7741935 10.40583 289
16 11 176 256 12.3064516 1.706816 121
18 14 252 324 13.7741935 0.050989 196
22 16 352 484 16.7096774 0.503642 256
10 8 80 100 7.90322581 0.009365 64
8 5 40 64 6.43548387 2.060614 25
164 126 2212 2888 19.54839 1714

n = 10
∑xy = 2212
∑x = 164
∑y = 126
∑x2 = 2888
2
(∑x) = 26896
y 12.6

x 16.4

∑Y2 = 1714

a) Determine la recta de regresión de la calificación sobre el número de horas de estu_


dio invertidos. Interprete la ecuación de regresión.

n  xy  = x  y0.734
ˆ1 
n  x  (  xi )
2 2

ˆ0  y  ˆ1 x
= 0.565

ŷ = 0,565 + 0,734X

Interpretación:
Por cada hora de estudio adicional la calificación aumenta en aproximadamente 0,734
puntos.

b) Use el método de la prueba t para probar la hipótesis nula H 0 : β = 0 contra una alter_
nativa bilateral. Utilice el valor P en la conclusión.

SCE n
( y  yˆ ) 2 =
S2   2.44354839
n  p i 1 n  p

S2
̂
2
1
 n

x 2
 n( x ) 2
S =2
̂  1 
2 0.01231627
n

x i 1
2
 n( x ) 2
ˆ  1 = 0.111

H0 : β1 = 0
H1 : β1 ≠ 0

ˆ1
Estadistico de prueba T  = 6.613
ˆ 1
t = 2.306
P = 0

Por lo tanto se acepta H1: β1 ≠ 0, entonces la ecuación de regresión lineal muestral es


significativa.

c) Calcule el grado de asociación entre calificación y horas de estudio, ¿es significativo


al nivel 1%?

SCR  ˆ1 ( xy  nx y )
= 106.85161

SCE  SCT  SCR = 19.548387

SCT   Y 2  n(Y
=
) 2 126.4
SCR = SCE
0.845345
R  2
 1
SCT R = SCT 0.919

n = 2 6.612719
tr
t 1 =r
2
3.355
Se rechaza H0 : ρ = 0 al 1%.

d) Halle el error estándar de estimación ,

20) Sobre la base de una muestra de tamaño 28 se encontró que la ecuación de regresión
muestral de gastos mensuales (y) sobre tamaño de la familia (x) es:
ŷ = 3,975 + 0,563x
Además la covarianza de Y con X es igual a 32, y la desviación estandar de Y es igual a 5.

a) Determine el coeficiente de correlación y analizar la bondad de ajuste de la línea de


regresión con el coeficiente de determinación.

Sx = 7.539
Sx
r b
Sy
Sy = 5 Sx= 0.84889
b = 0.563 r b
Sy
Sx = 7.539

SCR = SCE
0.720
R 2
 1
SCT SCT
= 486 CMR
= 66.859
SCR  ˆ1 ( xy  nx y ) F 
SCE  SCT  SCR
= 189 CME
= 675
SCT   Y 2  n(Y ) 2

21) Una muestra de 60 de las 350 agencias de ventas de automóviles de una importadora
registrdas en un mes con X (autos vendidos por agencia), Y(venta en miles de dólares)
ha dado los siguientes resultados:

x  10 y  20  x 2  7000  y 2  42000  xy  8000


a) Determina la ecuación de regresión: ŷ = a + bx

n = 60
∑x = 600
∑y = 1200
n  xy   x=  -4y
ˆ1 
∑x2 = 7000

n  x  (  xi )
∑y2 = 42000 2
2
∑xy = 8000

y ˆ0  y  ˆ1 x
20 = 60
10
x ŷ = 60 - 4X

b) Calcule el coeficiente de determinación. ¿ Qué porcentaje de la variación total es


explicada por la regresión?

n n = n 2000
SCE   y 2   0  y   1  xy
i 1 i 1 i 1
= 2 18000
SCT   Y  n(Y ) 2

SCR SCE
= 0.89 el 89% de la varianza de y es explicada
R2   1 por la regresión.
SCT SCT
c) Pruebe la hipótesis nula H0 : β = 0 contra una alternativa bilateral al nivel de
significación 0,05. Enuncie las suposiciones necesarias.

H0 : β1 = 0
SCR  ˆ1 ( xy  nxCMR
y) SCR
H1 : β1 ≠ 0 
SCE  SCT  SCR 1
CMR SCE
F SCT   Y 2  n(Y )CME
2

CME n2
SCR = 16000 CMR = 16000 F = 464.000
SCE = 2000 CME = 34.4827586
SCT = 18000
Se rechaza H0 : β1 = 0, existe regresión lineal poblacional.

d) Pruebe la hipótesis nula H0: ρ = 0 contra una alternativa bilateral

R2 = 0.88888889
R = 0.94280904

n =2 21.540659
tr
1  tr 2 = 2.002

En consecuencia se rechaza ρ =0

22) Los contadores con frecuencia estiman los gastos generales basándose en el nivel
de producción. En la tabla que sigue se da la información racabada sobre gastos
generales y las unidades producidas en 10 plantas y se desea estimar una ecuación
de regresión para estimar gastos generales futuros:

y x
Gastos Unidades
generales producid.
($) XY X2 Y2
300 15 4500 225 90000
1000 45 45000 2025 1000000
1100 55 60500 3025 1210000
1200 75 90000 5625 1440000
600 30 18000 900 360000
800 40 32000 1600 640000
900 45 40500 2025 810000
500 20 10000 400 250000
400 18 7200 324 160000
200 10 2000 100 40000
7000 353 309700 16249 6000000

n = 10
∑xy = 309700
∑x = 353
∑y = 7000
∑x2 = 16249
2
(∑x) = 124609

y 700
35.3
x
∑Y2 = 6000000

a) Determine la ecuación de regresión y haga un análisis de los coeficientes de regresión

n  xy   x  y
ˆ1  = 16.525
(  xi )
2 2
n x 

ˆ0  y  ˆ1= x 116.652

ŷ = 116,652 + 16,525X

b) Proporciona los datos suficiente evidencia para indicar que las unidades producidas
aportan información para predecir los gastos generales?

H0 : β1 = 0
SCR  ˆ1 ( xy  nxCMR
y) SCR
H1 : β1 ≠ 0 
SCE  SCT  SCR 1
CMR SCE
F SCT   Y 2  n(Y )CME
2

CME n2
SCR = 1034492 CMR = 1034492.23 F = 126.335
SCE = 65508 CME = 8188.47179 Ft = 5.32
SCT = 1100000

Se rechaza H0 : β1 = 0, existe regresión lineal poblacional.

c) Realice un análisis de la bondad del ajuste de la ecuación de regresión lineal.

H0 : S
ρ = 0 CMT 
H1 : ρ≠ 0 (

n n = n
65507.7743
SCE   y   0  y   1  xy
2

i 1 i 1 i 1 R 2  1 
= 2 1100000
SCT   Y 2  n(Y )
SCR SCE
R2   1
SCT SCT
SCR =SCE 0.94 el 94% de la varianza de y es explicada
R2   1 por la regresión.
SCT SCT El ajuste es bueno.

d) ¿Qué puede usted concluir acerca de la correlación poblacional entre gastos generales
y unidades producidas?

H0 : ρ = 0
H1 : ρ≠ 0

n n = n
65507.7743
SCE   y   0  y   1  xy
2

i 1 i 1 i 1
= 2 1100000
SCT   Y  n(Y ) 2

SCR =SCE 0.94 el 94% de la varianza de y es explicada


R2   1 por la regresión.
SCT SCT
R = 0.96976671

n2 11.239893
tr
= 1  r2.002
2
t

Se rechaza que ρ = 0, existe correlación.

23) Las calificaciones de un grupo de estudiantes en el examen parcial (X) y en el examen


final (Y), fuerón las siguientes:

X Y XY X2 ŷ (y - ŷ)2 Y2
12 15 180 144 13.7349272 1.600409 225
8 10 80 64 10.3128898 0.0979 100
10 12 120 100 12.0239085 0.000572 144
13 14 182 169 14.5904366 0.348615 196
9 12 108 81 11.1683992 0.69156 144
14 15 210 196 15.4459459 0.198868 225
11 16 176 121 12.8794179 9.738033 256
18 20 360 324 18.8679834 1.281462 400
12 14 168 144 13.7349272 0.070264 196
10 12 120 100 12.0239085 0.000572 144
12 10 120 144 13.7349272 13.94968 100
14 16 224 196 15.4459459 0.306976 256
9 11 99 81 11.1683992 0.028358 121
12 13 156 144 13.7349272 0.540118 169
15 17 255 225 16.3014553 0.487965 289
12 15 180 144 13.7349272 1.600409 225
11 12 132 121 12.8794179 0.773376 144
12 13 156 144 13.7349272 0.540118 169
11 12 132 121 12.8794179 0.773376 144
10 13 130 100 12.0239085 0.952755 169
14 12 168 196 15.4459459 11.87454 144
13 14 182 169 14.5904366 0.348615 196
10 13 130 100 12.0239085 0.952755 169
12 15 180 144 13.7349272 1.600409 225
13 14 182 169 14.5904366 0.348615 196
12 13 156 144 13.7349272 0.540118 169
16 18 288 256 17.1569647 0.710709 324
15 17 255 225 16.3014553 0.487965 289
340 388 4829 4266 50.84511 5528

n = 28
∑xy = 4829
∑x = 340
∑y = 388
∑x2 = 4266
(∑x)2= 115600

y
13.8571429
12.1428571
x
∑Y2 = 5528

a) Determine la ecuación de regresión lineal de Y en X

n  xy   x  y
ˆ1  = 0.856
(  xi )
2 2
n x 

ˆ0  y  ˆ1 x
= 3.47

ŷ = 3,47 + 0,856X

b) Pruebe la significancia de la pendiente poblacional en α = 5%

SCR  ˆ1 ( xy  nx y ) SCR CMR CMR 


1 F 
SCE  SCT  SCR CME
2 CME 
SCE
SCT   Y  n(Y )
2
n2
SCR = 100.583 CMR = 100.583457 F = 51.434
SCE = 50.845 CME = 1.95558132 G.L = (1;26)
SCT = 151.429
Se rechaza H0 : β1 = 0, existe regresión lineal poblacional.
c) Calcule el error estándar de la pendiente b y halle el intervalo de confianza del 95%
para β. ¿Se puede aceptar que β =0,9?

SCE n
( y  yˆ ) 2
S2   = 1.95558132
n p i 1 n p

S 2=
ˆ 
2 0.0142298
1
 n

x
i 1 
2
 n( x ) 2
= 0.119
ˆ 1

ˆ1  t 0ˆ  1   1  ˆ1  t 0ˆ  1


t0 =
2.056
0.610 1.101
[0,610 ; 1,101]
Si se puede aceptar que β = 0,9

d) Halle R, R2, R2, ajustado. Interprete los resultados

Sxy  xy  n( x )(
=
y ) 0.815
r 
SxSy [  x 2  n( x ) 2 ][  y 2  n( y ) 2 ]
= 0.664
SCR SCE
R 2
 1
SCT SCT
CME = 0.651
R 2  1 
CMT
SCT = 5.60846561
CMT 
( n  1)

e) ¿Es significativo el coeficiente de correlación muestral?

Si es significativo.

24) Con los siguientes datos muestrales:

X Y
Coeficiente Notas de
de intelig_ un exam_
encia IQ en XY X2 ŷ (y - ŷ)2 Y2
135 16 2160 18225 16.2382353 0.056756 256
115 13 1495 13225 13.8735294 0.763054 169
95 12 1140 9025 11.5088235 0.241254 144
100 12 1200 10000 12.1 0.01 144
110 14 1540 12100 13.2823529 0.515017 196
120 14 1680 14400 14.4647059 0.215952 196
125 15 1875 15625 15.0558824 0.003123 225
130 15 1950 16900 15.6470588 0.418685 225
140 18 2520 19600 16.8294118 1.370277 324
1070 129 15560 129100 3.594118 1879

n = 9
∑xy = 15560
∑x = 1070
∑y = 129
∑x2 = 129100
2
(∑x) = 1144900
14.3333333
y 118.888889
x
∑Y2 = 1879

a) Halle la ecuación de regresión muestral

n  xy   x  y
ˆ1  = 0.118
n  x  (  xi )
2 2

ˆ0  y  ˆ1 x
= 0.276

ŷ = 0,276 + 0,118X

b)Interprete la pendiente de regresión parcial

Interpretación :
Si el coeficiente intelectual aumenta, entonces las notas en un examen aumentan en
0,118 puntos.

c) Utilizando t-student pruebe la hipótesis β = 0, contra la hipótesis βmayor 0 al nivel de


significancia α = 0,05. ¿Se puede aceptar que β = 1 ?

H0 : β1 = 0
H1 : β1 mayor 0

SCE n
( y  yˆ ) 2
S2   = 0.51344538
n p i 1 n p

G.L = 7
2
S
ˆ  1 
2 = 0.0002718
n

x
i 1
2
 n( x ) 2
S2
ˆ
2
1
 n

x
i 1
2
 n( x ) 2
tr
n =2 7.17139

ˆ  1 = 0.016 t =
0 1 2.365
r2

ˆ1  t 0ˆ  1  1  ˆ1  t 0ˆ  1

0.079 0.157
[0,079 ; 0,157]

Si se puede aceptar que β = 1

d) Determine el grado de asociación entre las dos variables

Sxy  xy  n(=x )( y0.938


)
r 
SxSy [  x 2  n( x ) 2 ][  y 2  n( y ) 2 ]
e) Utilizando t-student pruebe la hipótesis ρ = 0 contra la hipótesis ρ mayor 0 al nivel de
significancia α = 0,05.

H0 : ρ = 0
H1 : ρ≠ 0

G.L = 7

n = 2 7.171
tr
t1 = r 2 0 2.365

Se rechaza H0 : ρ = 0

25) En un estudio para de terminar la relación entre edad (X) y presión sanguínea (Y) una
muestra aleatoria de 9 mujeres ha dado los siguientes resultados:

X Y XY X2 ŷ (y - ŷ)2 Y2
54 148 7992 2916 141.802678 38.4068 21904
40 123 4920 1600 123.177343 0.031451 15129
70 155 10850 4900 163.088774 65.42827 24025
35 115 4025 1225 116.525438 2.32696 13225
62 150 9300 3844 152.445726 5.981576 22500
45 126 5670 2025 129.829248 14.66314 15876
55 152 8360 3025 143.133059 78.62265 23104
50 144 7200 2500 136.481153 56.53305 20736
38 114 4332 1444 120.516581 42.46583 12996
449 1227 62649 23479 304.4597 169495
n = 9
∑xy = 62649
∑x = 449
∑y = 1227
∑x2 = 23479
(∑x)2= 201601
136.333333
y 49.8888889
x
∑Y2 = 169495

a) Encuentre la ecuación de regresión de Y en X y estime la presión sanguínea para una


mujer de 75 años:

n  xy   x  y
ˆ1  = 1.33
n  x  (  xi )
2 2

ˆ0  y  ˆ1 x
= 69.96

ŷ = 69,96 + 1,33X

b) Utilizando t-Student pruebe la hipótesis β = 0,9, contra la hipótesis β mayor 0,9 al


nivel de significación α = 0,05

H0 : β1 = 0,9
H1 : β1 mayor 0,9

SCE n
( y  yˆ ) 2
S2   = 43.4942475
n p i 1 n p

S2
ˆ 
2
1
 n
= 0.0403139
x
i 1
2
 n( x ) 2

G.L = 7
t0 =
ˆ  1 = 0.201 2.365

ˆ1  t 0ˆ  1  1  ˆ1  t 0ˆ  1


0.856 1.805
[0,856 ; 1,805]

Se rechaza H0 : β1 = 0,9

c) Pruebe la hipótesis nula H0 : ρ = 0,9 contra H1 : ρ mayor 0,9


H0 : ρ = 0
H1 : ρ≠ 0

Sxy  xy  n( x )( y ) = 0.929
r 
SxSy [ x 2  n( x ) 2 ][  y 2  n( y ) 2 ]
6.62595527 falta

26) Se estudia la relación entre la variable X = Nivel socioeconómico con sus categorías:
Bajo=0, Medio=1, Alto=2 y la variable: Y = Gastos en educación quincenales (en dól_
ares). Una muestra aleatoria de 27 familias ha dado los siguientes datos:

X Y XY X2 Y2
0 64 0 0 4096
1 69 69 1 4761
2 94 188 4 8836
0 55 0 0 3025
1 60 60 1 3600
2 92 184 4 8464
0 70 0 0 4900
1 80 80 1 6400
2 89 178 4 7921
0 84 0 0 7056
1 82 82 1 6724
2 99 198 4 9801
0 73 0 0 5329
1 76 76 1 5776
2 95 190 4 9025
0 77 0 0 5929
1 56 56 1 3136
2 80 160 4 6400
0 50 0 0 2500
1 50 50 1 2500
2 89 178 4 7921
0 70 0 0 4900
1 65 65 1 4225
2 90 180 4 8100
0 64 0 0 4096
1 67 67 1 4489
2 80 160 4 6400
27 2020 2221 45 156310

n = 27
∑xy = 2221
∑x = 27
∑y = 2020
∑x2 = 45
(∑x)2= 729

y
74.8148148
1
x
∑Y2 = 156310

a) Determine la ecuación de regresión de gastos sobre ingresos

n  xy   x  y
ˆ1  = 11.167
n  x  (  xi )
2 2

ˆ0  y  ˆ1 x
= 63.648

ŷ = 63,648 + 11,167X

b) ¿Proporcionan los daros suficiente evidencia para indicar que el nivel socioeconómico
aporta información para predecir los gastos en educación?

SCR  ˆ1 ( xy  nx y ) SCR CMR CMR 


1 F 
SCE  SCT  SCR CME
2 CME 
SCE
SCT   Y  n(Y )
2
n2
SCR = 2244.500 CMR = 2244.5 F = 19.089
SCE = 2939.574 CME = 117.582963 G.L = (1;25)
SCT = 5184.074

Se rechaza H0 : β1 = 0, existe regresión lineal poblacional.

c) Realice un análisis de la bondad del ajuste de la ecuación de regresión lineal utiliza_


ndo el coeficiente de determinación.

= 0.433 El ajuste no es bueno


SCR SCE
R 2
 1
SCT SCT
d) A partir del análisis realizado en b), ¿Qué puede usted concluir acerca de la correlaci_
ón entre nivel socioeconómico y gastos en educación.

Se rechaza H0 : ρ = 0

27) Las cantidades de un compuesto químico (Y) que se disuelven en 100 gramos de agua
a diferentes temperaturas (X) se registrarón en la tabla que sigue:
X (C) Y gramos
0 10 8 10 9 11
15 15 12 14 16 18
30 27 23 25 24 26
45 33 30 32 35 34
60 46 40 43 42 45
75 50 52 53 54 55

X Y XY X2 ŷ (y - ŷ)2 Y2
0 10 0 0 7.7047619 5.268118 100 1406.25
(x  x)2
0 8 0 0 7.7047619 0.087166 64 1406.25
0 10 0 0 7.7047619 5.268118 100 1406.25
0 9 0 0 7.7047619 1.677642 81 1406.25
0 11 0 0 7.7047619 10.85859 121 1406.25
15 15 225 225 16.5161905 2.298834 225 506.25
15 12 180 225 16.5161905 20.39598 144 506.25
15 14 210 225 16.5161905 6.331215 196 506.25
15 16 240 225 16.5161905 0.266453 256 506.25
15 18 270 225 16.5161905 2.201691 324 506.25
30 27 810 900 25.327619 2.796858 729 56.25
30 23 690 900 25.327619 5.41781 529 56.25
30 25 750 900 25.327619 0.107334 625 56.25
30 24 720 900 25.327619 1.762572 576 56.25
30 26 780 900 25.327619 0.452096 676 56.25
45 33 1485 2025 34.1390476 1.297429 1089 56.25
45 30 1350 2025 34.1390476 17.13172 900 56.25
45 32 1440 2025 34.1390476 4.575525 1024 56.25
45 35 1575 2025 34.1390476 0.741239 1225 56.25
45 34 1530 2025 34.1390476 0.019334 1156 56.25
60 46 2760 3600 42.9504762 9.299595 2116 506.25
60 40 2400 3600 42.9504762 8.70531 1600 506.25
60 43 2580 3600 42.9504762 0.002453 1849 506.25
60 42 2520 3600 42.9504762 0.903405 1764 506.25
60 45 2700 3600 42.9504762 4.200548 2025 506.25
75 50 3750 5625 51.7619048 3.104308 2500 1406.25
75 52 3900 5625 51.7619048 0.056689 2704 1406.25
75 53 3975 5625 51.7619048 1.53288 2809 1406.25
75 54 4050 5625 51.7619048 5.00907 2916 1406.25
75 55 4125 5625 51.7619048 10.48526 3025 1406.25
1125 892 45015 61875 132.2552 33448 19687.5

n = 30
∑xy = 45015
∑x = 1125
∑y = 892
∑x2 = 61875
(∑x)2= 1265625

y
29.7333333
37.5
x
∑Y2 = 33448

a) Encuentre la ecuación de regresión de Y en X

n  xy   x  y
ˆ1  = 0.587
(  xi )
2 2
n x 

ˆ0  y  ˆ1 x
= 7.705

ŷ = 7,705 + 0,587X

b) Estime la varianza de la regresión poblacional

SCE n
( y  yˆ ) 2
S 2
  = 4.723
n p i 1 n p

c) Determine el coeficiente de regresión estandarizado beta

Sx 26.055
SY 15.454
b 0.587

Sx
= 0.99
beta  b
Sy
d) Calcule el error estándar de la pendiente b. Además desarrolle un intervalo de confianza
del 95% para β. ¿ Se puede aceptar que β = 0,6 ?

S2
ˆ  1 
2
n
= = 0.00023992
x
i 1
2
 n( x ) 2

= 0.015
ˆ  1
H0 : β1 = 0
H1 : β1 ≠ 0

ˆ1  t 0ˆ  1  1  ˆ1  t 0ˆ  1


t0 = 2.048
0.556 0.619
[0,556 ; 0,619]
Por lo tanto se acepta que β = 0,6

e) Determine un intervalo de confianza del 95% para la cantidad promedio de producto


químico que se disolverá en 100 gramos de agua a 50 grados C.

SCE n
( =y  yˆ4.72340136
)2
S 2

n  p i 1 Sn= p2.17333876

1 ( x0  x ) 2
yˆ 0   t 0 s  37.08 0.90422
n (x  x ) 2 36.17 37.98
ŷ = 7,705 + 0,587X IC = [36,17 ; 37,98]
ŷ0 = 37.0761905
t0s = 4.45099778
= 156.25
( x0  x ) 2
= 19687.5
( x  x ) 2
1/n = 0.03333333

f) Determine un intervalo de predicción del 95% para la cantidad de producto


químico que se disolverá en 100 gramos de agua a 50 grados C.

1 ( x0  x ) 2
yˆ 0  t 0 s 1   37.076 4.541915
n ( x  x ) 2 32.53 41.62
IC = [32,53 , 41,62]
ŷ = 7,705 + 0,587X
ŷ0 = 37.0761905
t0s = 4.45099778
= 156.25
( x0  x ) 2
= 19687.5
( x  x ) 2
1/n = 0.03333333

28) El gerente de ventas de una cadena de tiendas obtuvo información (ver tabla que sigue )
de los pedidos por internet y del número de ventas realizadas por esa modalidad. Como
parte de su presentación en la próxima reunión de vendedores al gerente le gustaría dar
información específica sobre la relación entre el número de pedidos y el número de ven_
tas realizadas.
X Y
Número de Número
pedidos de ventas XY X2 Y2
50 45 2250 2500 2025
56 55 3080 3136 3025
60 50 3000 3600 2500
68 65 4420 4624 4225
65 60 3900 4225 3600
50 40 2000 2500 1600
79 75 5925 6241 5625
35 30 1050 1225 900
42 38 1596 1764 1444
15 12 180 225 144
520 470 27401 30040 25088

n = 10
∑xy = 27401
∑x = 520
∑y = 470
∑x2 = 30040
(∑x)2= 270400
y 47
x 52

∑Y2 = 25088

a) Use el método de mínimos cuadrados para expresar la relación entre estas dos variables.

n  xy   x  y
ˆ1 
(  xi )
2 2 = 0.987
n x 

ˆ0  y  ˆ=1 x -4.324

ŷ = -4,324 + 0,987X

b) haga un análisis de los coeficientes de regresión

SCR  ˆ1 (  xy  nx y ) SCR


CMR  CMR
SCE  SCT  SCR 1 F
SCE CME
CME 
SCT   Y 2  n(Y ) 2 n2
SCR = 2922.507 CMR = 2922.507 F = 1083.944
SCE = 75.493 CME = 2.69617857 G.L = (1;28)
SCT = 2998.000

Se rechaza H0 : β1 = 0, existe regresión lineal poblacional.

c) ¿Proporcionan los datos suficiente evidencia para indicar que las unidades producidas
aportan información para predecir los gastos generales?.

Sxy  xy  n( x= )( y ) 0.9873
r 
SxSy [  x 2  n( x ) 2 ][  y 2  n( y ) 2 ]
r2 = 0.975

d) Realice un análisis de la bondad del ajuste de la ecuación de regresión lineal.

SCR = SCE
0.975 el ajuste es bueno
R2   1
SCT SCT
e) ¿Qué puede usted concluir acerca de la correlación poblacional entre gastos generales y
unidades producidas?.
x 350 400 450 500 950 850 700 900 600
y 100 110 130 160 350 350 250 320 130
0  Y     X Y 
i 1 i i
Fuente de Suma de Grados de Cuadrados F(calculad
Variacion Cuadrados Libertad Medios o)

Regresion 83626.084 1 83626.08 87.86


Error 6662.805 7 951.83
Total 90288.889 8
SCT
CMT  = 122222.22222
( n  1)

CME
= 0.933 El ajuste es bueno
R 2  1 
CMT

También podría gustarte