Regresión Lineal
Regresión Lineal
Regresión Lineal
HUAMANGA
FACULTAD DE CIENCIAS DE LA SALUD
ESCUELA DE FARMACIA Y
BIOQUÍMICA
E S TA D Í S T I C A APLICADA A LA SALUD
D O C E N T E : B A U T I S TA LÓ P E Z , L U I S
Contenidos:
4
Ejemplos:
2. Los siguientes datos se refieren al crecimiento de una colonia de bacterias en un medio de cultivo:
X: 3 6 9 12 15 18
Y: 115000 147000 239000 356000 579000 864000,
Siendo X el número de días desde la inoculación e Y el número de bacterias.
Comprobar gráfica y numéricamente que el tipo de asociación entre ambas variables no es lineal.
3. Las bodegas modernas utilizan vehículos guiados computarizados y automatizados para el manejo de
materiales. En consecuencia, la disposición física de la bodega debe diseñarse con cuidado a modo de evitar el
congestionamiento de los vehículos y optimar el tiempo de respuesta. En The journal of Engineering for Industry
(agosto 1993) se estudió el diseño óptimo de una bodega automatizada. La disposición empleada supone que los
vehículos no se bloquean entre sí cuando viajan dentro de la bodega, es decir, no hay congestionamiento. La
validez de este supuesto se verificó simulando por ordenador las operaciones de la bodega. En cada simulación se
varió el número de vehículos y se registró el tiempo de congestionamiento (tiempo total que un vehículo bloquea
a otro). Los datos se muestran en la tabla de abajo. Los investigadores están interesados en conocer la relación
entre el tiempo de congestionamiento (Y) y el número de vehículos (X).
Dureza previa: 182 232 191 200 148 249 276 213 241 480 262
Dureza posterior: 198 210 194 220 138 220 219 161 210 313 226
(a) Calcula la media, mediana, percentiles 25 y 75 de la dureza antes y después del proceso.
(b) Calcula la desviación típica en ambos casos. ¿En qué caso hay mayor variabilidad?.
(c) ¿Se puede afirmar que el proceso de templado mejora la dureza de las piezas?.
(d) Decide si un modelo lineal es adecuado para explicar la dureza posterior en función de la dureza previa.
En caso afirmativo obtenlo y predice la dureza tras el proceso de templado de una pieza con un dureza
previa de 215.
5 En la muestra de 12 estudiantes que rindieron en un examen de simulacro y una pruebas de selección. Para ver si
un modelo de regresión lineal tiene sentido, comenzamos dibujando un diagrama de dispersión.
25
Fórmulas reducidas
1. Coeficiente de correlación
27
Coeficiente de correlación:
𝑛 σ 𝑥𝑦 − (σ 𝑥)(σ 𝑦)
𝑟=
[𝑛 σ 𝑥 2 − (σ 𝑥)2 ][𝑛 σ 𝑦 2 − (σ 𝑦)2 ]
Donde:
x: variable independiente
y: variable dependiente
28
Propiedades del coeficiente de correlación
29
2. Método de mínimos cuadrados
Observación:
1. Es totalmente incorrecto despejar X de la ecuación Y = a + bx para calcular la recta de
regresión de X sobre Y.
El dueño de una empresa que vende carros desea determinar si hay relación lineal
entre los años de experiencia de sus vendedores y la cantidad de carros que
venden. Los siguientes datos representan los años de experiencia (X) y las
unidades de carros vendidas al año (Y), de 10 vendedores de la empresa.
X (años) 3 4 6 7 8 12 15 20 22 26
y (Ventas) 9 12 16 19 23 27 34 37 40 45
31
Hallamos la correlación i X (años) y (Ventas) xy x2 y2
1 3 9 27 9 81
2 4 12 48 16 144
𝑛 σ 𝑥𝑦 − (σ 𝑥)(σ 𝑦) 3 6 16 96 36 256
𝑟= 4 7 19 133 49 361
𝑟=
[10 2103 − 1232 ][10 8250 − 2622 ]
𝑟 = 0.9835929
Interpretación: Existe una muy buena relación lineal entre los años de experiencia y las unidades que vende el
vendedor. Además mientras más experiencia tiene el vendedor más carros venderá. Se puede usar los años de
experiencia para predecir las unidades que venderá anualmente a través de una línea recta.
32
Aplicación en Excel
33
Método de mínimos cuadrados
i X (años) y (Ventas) xy x2 y2
1 3 9 27 9 81
2 4 12 48 16 144
3 6 16 96 36 256
4 7 19 133 49 361
5 8 23 184 64 529
10 2103 − (123) 8
9
20
22
37
40
740
880
400
484
1369
1600
10 26 45 1170 676 2025
Total 123 262 4112 2103 8250
262 − 1.5072(123)
𝑎= = 7.66144
10
34
Propiedades
ECUACIÓN LINEAL
𝑦 = 7.661 + 1.507𝑥
35
Propiedades
Ejercicio: los siguientes datos corresponden a los precios de los terrenos en venta.
36