REGRESION LINEAL SIMPLE
1) Los siguientes son algunos de los datos contenidos en un conjunto clásico
denominado “datos piloto de graficacion” que aparecen en Fitting Equations
to Data, de Daniel y Wood, publicado en 1971. La respuesta y es el
contenido de ácido del material determinado por análisis volumétrico;
mientras que el regresor x es el contenido de ácido orgánico determinado por
extracción y ponderación.
y x y x
76 123 70 109
62 55 37 48
66 100 82 138
58 75 88 164
88 159 43 28
a) Haga un ajuste de regresión lineal simple; calcule la pendiente y la intersección.
b) Interprete los coeficientes del modelo
c) Interprete r y R2
d) Pruebe la normalidad de los datos
SOLUCION:
a) El diagrama de dispersión es una gráfica en la que cada punto trazado representa
un par de valores observados por las variables independiente y dependiente.
En este primer caso se concluye que:
Variable Dependiente es Y: El contenido de ácido del material determinado por
análisis volumétrico.
Variable Independiente es X: el contenido de ácido orgánico determinado por
extracción y ponderación.
Por lo tanto, las hipótesis son las siguientes:
Ho: El contenido del ácido del material determinado por análisis volumétrico y el
contenido de ácido orgánico determinado por extracción y ponderación son
independientes.
H1: El contenido del ácido del material determinado por análisis volumétrico y el
contenido de ácido orgánico determinado por extracción y ponderación son
dependientes.
GGraph
[ConjuntoDatos0]
INTERPRETACIÓN:
En el gráfico de dispersión Simple de Y por X se observa que el valor de la variable
independiente X, se traza en relación con el eje horizontal y el valor de la variable
dependiente Y, en relación con el eje vertical. Por lo tanto, se concluye que dichas las
variables, están relacionas de manera que aumenta el valor de una e incrementa el de
la otra hasta que llegan a un punto donde ambas se igualan. Existiendo una
correlación positiva.
Regresión
Variables entradas/eliminadasa
Variables Variables
Modelo entradas eliminadas Método
1 Xb . Introducir
a. Variable dependiente: Y
b. Todas las variables solicitadas introducidas.
Estadísticas de residuosa
Desv.
Mínimo Máximo Media Desviación N
Valor pronosticado 41,60 89,64 67,00 16,723 10
Residuo -11,665 10,862 ,000 5,406 10
Desv. Valor pronosticado -1,519 1,354 ,000 1,000 10
Desv. Residuo -2,035 1,894 ,000 ,943 10
a. Variable dependiente: Y
Gráficos
INTERPRETACION:
El gráfico P-P, de regresión de Residuos estandarizado variable dependiente: Y.
LA PENDIENTE ES MAYOR QUE 0 POR LO TANTO LA TENDENCIA LINEAL ES
CRECIENTE.
b) Interprete los coeficientes del modelo
INTERPRETACION:
El modelo es altamente significativo en su conjunto, por lo tanto, se
rechaza la Hipótesis Nula con un nivel de significancia de α= 0.05 y
se acepta la Hipótesis Alterna.
El modelo resulta de la siguiente manera Y=31.708+0.353X
Se compara con los datos del SPSS y son los correctos.
Coeficientesa
Coeficien
tes
Coeficientes no estandari
estandarizados zados
Desv.
Modelo B Error Beta t Sig.
1 (Consta 31,709 4,422 7,171 ,000
nte)
X ,353 ,040 ,952 8,750 ,000
ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 2517,025 1 2517,025 76,571 ,000b
Residuo 262,975 8 32,872
Total 2780,000 9
INTERPRETACION:
Con un total de 9 grados de libertad se realiza la comparación con los
resultados del SPSS y el Excel lo cual nos da que el Fcalculado es de 76,571
igual al resultado del Excel.
c) Interprete los r y R ^2
Correlaciones
X Y
X Correlación de Pearson 1 ,952**
Sig. (bilateral) ,000
N 10 10
**
Y Correlación de Pearson ,952 1
Sig. (bilateral) ,000
N 10 10
Comentario de la Correlación:
**. La correlación es significativa en el nivel 0,01 (bilateral).
Resumen de procesamiento de casos
Casos
Válido Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
X 10 100,0% 0 0,0% 10 100,0%
Y 10 100,0% 0 0,0% 10 100,0%
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Variables entradas/eliminadasa
Variables Variables
Modelo entradas eliminadas Método
1 Xb . Introducir
a. Variable dependiente: Y
b. Todas las variables solicitadas introducidas.
Resumen del modelob
R cuadrado Error estándar
Modelo R R cuadrado ajustado de la estimación
1 ,952a ,905 ,894 5,733
a. Predictores: (Constante), X
b. Variable dependiente: Y
Descriptivos
Estadístico Error estándar
X Media 99,90 14,970
95% de intervalo de Límite inferior 66,04
confianza para la media Límite superior 133,76
Media recortada al 5% 100,33
Mediana 104,50
Varianza 2240,989
Desviación estándar 47,339
Mínimo 28
Máximo 164
Rango 136
Rango intercuartil 90
Asimetría -,104 ,687
Curtosis -1,301 1,334
Y Media 67,00 5,558
95% de intervalo de Límite inferior 54,43
confianza para la media Límite superior 79,57
Media recortada al 5% 67,50
Mediana 68,00
Varianza 308,889
Desviación estándar 17,575
Mínimo 37
Máximo 88
Rango 51
Rango intercuartil 29
Asimetría -,487 ,687
Curtosis -,690 1,334
Con r = 0.952: existe una perfecta correlación positiva, es decir que todos los puntos
caen sobre una línea con pendiente positiva.
d) Prueba de Normalidad
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
*
X ,129 10 ,200 ,952 10 ,695
Y ,116 10 ,200* ,939 10 ,540
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Ho: LOS DATOS DE LA VARIABLE SIGUEN UNA DISTRIBUCION NORMAL
H1: LOS DATOS DE LA VARIABLE NO SIGUEN UNA DISTRIBUCION NORMAL
SIG=0,540 > 0.05, por lo tanto, se acepta la Ho
Conclusión: LOS DATOS DE LA VARIABLE SIGUEN UNA DISTRIBUCIÓN
NORMAL
X
Y