UNIDAD 5 VALIDEZ DE UNA ECUACIÓN DE REGRESIÓN Error Estándar de Estimación y Coeficiente de Determinación
UNIDAD 5 VALIDEZ DE UNA ECUACIÓN DE REGRESIÓN Error Estándar de Estimación y Coeficiente de Determinación
UNIDAD 5 VALIDEZ DE UNA ECUACIÓN DE REGRESIÓN Error Estándar de Estimación y Coeficiente de Determinación
Material de Clase
Carrera: CONTABILIDAD Y AUDITORÍA
Docente: Econ. Catalina Salgado Córdova
a) Pruebas de significancia
b) Error estándar de estimación
c) Coeficiente de determinación
En el caso de no ser significativa la pendiente, es decir que β=0, se concluye que la variable
independiente (X) no es una buena opción para estimar la variable dependiente (Y). En estos
^ ).
casos es preferible utilizar el promedio de Y (Ý ¿para hacer estimaciones de Y (Y
b− β
t=
sB
Donde:
b Pendiente de la regresión de la ecuación de la muestra.
Β Pendiente de la regresión de la ecuación de la población
sB Error estándar de la pendiente
x́=
∑x
n
Ý =
∑Y
n
2. Encontrar la desviación estándar de la variable dependiente y de la variable
dependiente.
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas
SX=
√ ∑ ( X− X́ )
n−1
2
SY =
√ ∑ ( Y −Ý )
n−1
3. Determinar el coeficiente de correlación (r).
r=
∑ ( X− X́ )( Y −Ý )
( n−1 ) s x s y
4. Determinar el valor de la pendiente (b).
sY
b=r
sX
5. Determinar el valor de la intersección (a).
a=Ý −b X́
6. Determinar la ecuación de regresión:
Y^ =a+bX
7. Determinar la suma de cuadrados del error o residuo.
2
SSE=∑ ( Y −Y^ )
8. Determinar la estimación de la varianza de los residuos
2
2
s=
∑ ( Y −Y^ )
e
n−2
9. Determinar el error estándar de la pendiente.
s 2e
s B=
√ ∑ ( X− X́ )
2
Ejemplo:
Representante No. de No. Copiadoras
llamadas vendidas (Y)
(X)
1 20 30
2 40 60
3 20 40
4 30 60
5 10 30
6 10 40
7 20 40
8 20 50
9 20 30
10 30 70
Datos:
x́=22
Ý =45
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas
S X =¿9.19
SY =14.34
r =0.7588
b=1.184
a=¿ 18.95
Y^ =18.95+ 1.184 X
^
Calcular la suma de cuadrados de las diferencias entre el valor de Y y el valor estimado de Y ( Y
).
No. No. de No. Y estimado ( Y −Y^ )2 ( X − X́ )
2
llamada Copiadoras Y^
s (X) vendidas (Y)
1 20 30 42,632 159,567 4
2 40 60 66,312 39,8413 324
3 20 40 42,632 6,927 4
4 30 60 54,472 30,5588 64
5 10 30 30,792 0,6273 144
6 10 40 30,792 84,7873 144
7 20 40 42,632 6,9274 4
8 20 50 42,632 54,2874 4
9 20 30 42,632 159,5674 4
10 30 70 54,472 241,1188 64
784,2097 760
Determinar la estimación de la varianza de los residuos
2
2
s=
∑ ( Y −Y^ )
e
n−2
784,2097
s2e =
10−2
2
se =¿ 98,0262
s B=
√760
s B=0.3591
1. Hipótesis
Ho: β=0
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas
Ha: β ≠ 0
2. Nivel de significancia
α= 0.05
3. Estadístico de prueba crítico
t con 10-2 gl con 8gl. Prueba de dos colas
t=+ -2.306
4. Regla de decisión: Si al calcular el estadístico de prueba t este está entre -2.306 y
+2.306 se acepta la hipótesis nula, de lo contrario se acepta la hipótesis alternativa.
b− β
t=
sB
1,184−0
t=
0.3591
t=3,2971
6. Conclusión:
Con un nivel de significancia de 0,05 existe suficiente evidencia estadística para
aceptar que la pendiente de la ecuación de regresión es significativa, por lo tanto, es
diferente de cero.
Valor p
Sirve para confirmar la aceptación o rechazo de una hipótesis nula, bajo el siguiente criterio:
Interpretar
0.01 Existe evidencia muy fuerte de que la hipótesis nula no sea verdadera.
0.001 Existe evidencia extremadamente fuerte de que la hipótesis nula no sea verdadera.
El valor t se encuentra entre 2.896 y 3.355 y tienen un nivel de significancia de 0.02 y 0.01.Por
lo tanto el valor p esta entre 0.01 y 0.02.
Es necesario contar con una medida para describir cuán preciso es, el pronóstico de Y con base
en X, o a la inversa, qué tan inexacta puede ser la estimación. Esta medida se denomina error
estándar de estimación, simbolizado por Sy.x El subíndice y.x se interpreta como el error de Y
para un valor dado de X.
2
Desviación estándar de los residuos: sy.x= se=
√ ∑ ( Y −Y^ )
n−2
Si el error estándar de estimación es pequeño significa que los datos están relativamente
cercanos a la recta de regresión, y la ecuación de regresión sirve para predecir los valores
estimados de Y con poco error, es mejor el ajuste de la ecuación.
Si el error estándar de estimación es grande significa que los datos están muy dispersos
respecto a la recta de regresión, y, la ecuación de regresión no proporcionará una estimación
precisa de Y.
Ejemplo:
s2e =
∑ ( Y −Y^ )
n−2
2 784,208
s=
e
10−2
2
se =¿ 98,026
2
784,2097
se=sy.x=
√ ∑ ( Y −Y^ )
n−2 √ 10−2
= 9,901
C) EL COEFICIENTE DE DETERMINACIÓN
Consulte la autoevaluación 13-1 donde se estudió la relación entre la cantidad que gastó en
publicidad (X) y los ingresos por ventas en un mes dado (Y)
1,8
A) se=sy.x=
√ 4−2
= 0.9487
El 93.70% de la variación en los ingresos por ventas en un mes dado se explica por la variación
en la cantidad que gastó en publicidad.
Un medio conveniente para mostrar la relación entre estas tres medidas es una tabla ANOVA.
Coeficiente de determinación:
SSR
r 2=
SSTotal
SSE
r 2=1−
SSTotal
Ejemplo:
Fuente de variación Grados de Libertad Suma de Cuadrados Media Cuadrática F
gl SS MS
Regresión 1 1065,41 1065.41 10.87
Residual o error 8 784,21 98.03
Total 9 1849,62
Coeficiente de determinación:
SSR 1065.41
r 2= = =0.576
SSTotal 1849,62
r 2=57.6 %
SSE
r 2=1−
SSTotal
784,21
r 2=1− =0.576
1849,62
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas
SSR 24.2
r 2= = =0.9308
SS 26
SSE
r 2=1−
SSTotal
1.8
r 2=1− =0.9308 93,08%
26
1. Para cada valor de X, existen valores de Y. Los valores de Y siguen una distribución
normal.
2. Las medias de estas distribuciones normales se encuentran en la recta de regresión,
^ es la media de la distribución.
por lo tanto Y
3. Todas las desviaciones estándares de estas distribuciones normales son iguales y su
mejor estimación es el error estándar de estimación.
4. Todos los valores de Y son independientes.
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas
Suponiendo que los valores de Y siguen una distribución normal con media Y ^ y
desviación estándar igual al error estándar de estimación (Se) o (Sx.y) se pueden
obtener los intervalos de confianza y los intervalos de predicción.
^ , dado X. (Todos)
Intervalo de confianza: Determina el intervalo para la media de Y
^ , dado un
Intervalo de predicción: Determina el intervalo para un valor puntual de Y
valor de X. (Un valor particular)
Formula:
√
1
IC=Y^ ± t∗se 1+ +
( X − X́ )
n ∑ ( X− X́ )2
t con n-2 gl.
2
∑ ( X− X́ ) =760
X=25
Y^ =18.95+ 1.184 X
Y^ =18.95+ 1.184 ( 25 )=48,5526
t con 8 gl dos colas (porque es intervalo se suma y se resta) = ± 2.306
Intervalo de confianza:
2
IC=Y^ ± t∗se
1
√
+
( X − X́ )
n ∑ ( X− X́ )2
2
1 ( 25−22 )
IC=48,5526± 2,306∗9,9
√ 10
+
760
IC=48,5526± 7,6356
Li= 40,917
Ls= 56,1882
Interpretación: Para todos los vendedores que realicen 25 llamadas se espera que las ventas
varíen entre 40,9 y 56,2 copiadoras.
√
1
IC=Y^ ± t∗se 1+ +
( X − X́ )
n ∑ ( X− X́ )2
2
1 (25−22 )
IC=48,5526± 2,306∗9,9 1+ +
10 √ 760
IC=48,5526± 24.072
Li= 24,4806
Ls= 72,6244
Las estimaciones son menos precisas cuando hay un alejamiento en cualquier dirección, de la
media de la variable independiente. El intervalo de predicción siempre será más ancho debido
al 1 adicional debajo del radical