Sesión Regresión y Correlación
Sesión Regresión y Correlación
Sesión Regresión y Correlación
REGRESIÓN Y CORRELACIÓN
EJEMPLO:
2.- Se quiere analizar la relación entre la edad y el tiempo efectivo de servicios
de los trabajadores de una empresa. Para el efecto se consideró una muestra
de 15 trabajadores, obteniendose los siguientes resultados:
Tiempo de
Edad servicio
Chart Title
27 4
60
27 6
30 9 50
40
30
Chart Title
60
50
32 12
32 8 40
34 10
30
36 13
39 14 20
40 18
40 16 10
42 22
0
42 18 4 6 9 12 8 10 13 14 18 16
46 22
46 20
48 24
Determinación de los valores "a" y "b", el modelo de regresión lineal y la frecuencia esperada
xi yi xiyi xi2 y*
48 24 1152 2304 23.648
40 18 720 1600 16.64
30 9 270 900 7.88
39 14 546 1521 15.764
46 22 1012 2116 21.896
42 22 924 1764 18.392
27 4 108 729 5.252
36 13 468 1296 13.136
34 10 340 1156 11.384
46 20 920 2116 21.896
32 12 384 1024 9.632
42 18 756 1764 18.392
40 16 640 1600 16.64
32 8 256 1024 9.632
27 6 162 729 5.252
Ʃ 561 216 8658 21643
EL MODELO DE REGRESIÓN SERÁ: 𝑦 = 𝑎𝑥 + 𝑏
𝑦 = 0.876𝑥 − 18,4
EJEMPLO:
3.- En una evaluación de campo se midió la altura de las vaquillas criollas y
su correspondiente peso vivo, en un muestreo aleatorio, obteniendose
los siguientes resultados:
xi yi xiyi xi2
81 175 14175 6561
89 189 16821 7921
98 185 18130 9604
99 201 19899 9801
101 285 28785 10201
105 255 26775 11025
110 301 33110 12100
111 290 32190 12321
115 261 30015 13225
118 261 30798 13924
Ʃ 1027 2403 250698 106683
𝑦 = 3.231𝑥 − 91.529
𝑦 = 𝑎𝑥 + 𝑏
Chart Title
Chart Title
2 8 10 13 14 18 16 22 18 22 20 24
𝑦 = 𝑎𝑥 + 𝑏
al y la frecuencia esperada
𝛴𝑦_𝑖=𝑎𝛴𝑥_𝑖+𝑛𝑏 (1)
𝛴𝑥_𝑖 𝑦_𝑖=𝑎𝛴𝑥_𝑖^2+𝑏𝛴𝑥_𝑖
(2)
b=-18.4
= 𝑎𝑥 + 𝑏
𝑦 = 0.876𝑥 − 18,4
Chart Title
350
300
250
Chart Title
350
300
250
200
150
100
50
0
111 98 101 110 99 89 105 115 81 118
y* 𝛴𝑦_𝑖=𝑎𝛴𝑥_𝑖+𝑛𝑏
(1)
𝑦 = 𝑎𝑥 + 𝑏
= 3.231𝑥 − 91.529
-8694 0.87605804111
-9924
Reemplazando en (1)
REGRESIÓN Y CORRELACIÓN
Existen dos tipos de correlación, identificadas por las letras "r" y "p". La correlación "r" se usa
en variables cuantitativas continuas y en variables cuantitativas discretas cardinales, mientras
que la correlación "p" se usa en variables cuantitativas discretas ordinales.
CORRELACIÓN "r"
𝑟=(∑128▒𝑥𝑦)/√(𝛴𝑥^2 𝛴𝑦^2 )
Donde: 𝑥=𝑥_𝑖−𝑥 ̅
𝑦=𝑦_𝑖−𝑦 ̅
Ejemplo 1 La siguiente tabla muestra las presiones sanguineas sistólicasen cada una de 10 parejas de gemelos
idénticos. Determinar su coeficiente de correlación.
Parejas xi yi x y
1 118 115 -3 -8
2 116 119 -5 -4
3 118 116 -3 -7
4 120 119 -1 -4
5 122 118 1 -5
6 122 138 1 15
7 122 124 1 1
8 120 128 -1 5
9 124 126 3 3
10 125 130 4 7
Promedio 121 123
Sumatoria 1207 1356.3
La correlación puede ser positiva o negativa y sus valores pueden ir desde " -1" hasta "+1".
-1 ≤ r ≤ +1
EJEMPLO:
2.- En una evaluación de campo se midió la altura de las vaquillas criollas y
su correspondiente peso vivo, en un muestreo aleatorio, obteniendose
los siguientes resultados:
La correlación puede ser positiva o negativa y sus valores pueden ir desde " -1" hasta "+1".
-1 ≤ r ≤ +1
a de 10 parejas de gemelos
𝑟=(∑128▒𝑥𝑦)/√(𝛴𝑥^2 𝛴𝑦^2 )
xy x2 y2
22 7 69
20 22 18 r= 113
20 7 53 √72*478
3 0 18
-7 2 28 r= 113
19 2 216 √34416
1 2 0
-3 0 22 r= 113
9 11 7 185.515498
29 18 45
113 72 478 r= 0.61
CONCLUSIÓN Existe una alta correlación entre la altura de las vaquillas criollas y su pe
3497
√1210*20724
3497
√25076040
3497
5007.598227
0.6983387727
0.7
REGRESIÓN Y CORRELACIÓN
CORRELACIÓN "P"
Usada en variables cuantitativas discretas ordinales
La correlación "p" se obtiene aplicando la siguiente fórmula:
𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁^2−1)
Donde:
N= Número de parejas de datos
D2 = Diferencia entre cada pareja de datos elevado al cuadrado
La correlación puede ser positiva o negativa y sus valores pueden ir desde " -1" hasta "+1".
-1 ≤ p ≤ +1
𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁
x y D D2
1 7 -6 36
2 9 -7 49
3 12 -9 81
4 2 2 4
5 8 -3 9
6 1 5 25
7 5 2 4
8 6 2 4
9 4 5 25
10 11 -1 1
11 10 1 1
12 3 9 81
Ʃ 78 78 320
Ejemplo 2 Determine el coeficiente de correlación entre el orden en que se ubican un grupo de cuyes
por conformación (x) a las tres semanas de edad y el orden en que se ubican en base al
peso vivo (y) a las 8 semanas de edad.
𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁
x y D D2
1 1 0 0
2 3 -1 1
3 5 -2 4
4 4 0 0
5 2 3 9
6 6 0 0
7 8 -1 1
8 7 1 1
9 9 0 0
10 10 0 0
Ʃ 55 55 16
evado al cuadrado (x-y)2
a la universidad y
nal de un grupo
𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁^2−1)
p= 1- 6 * 320
12 (122 -1)
p= 1- 1920
1716
p= 1- 1.11888111888
p= -0.11888111888
p= -0.12 CONCLUSIÓN No hay correlación entre el orden de ing
un grupo de cuyes
can en base al
𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁^2−1)
VALORES DE "r"
de -0.20 a 0.20
de 0.21 a 0.40 ó de -0.40 a -0.21
p= 1- 6*16 de 0.41 a 0.70 ó de -0.70 a -0.41
10 (102-1) de 0.71 a 0.90 ó de -0.90 a -0.71
Mayor a 0.90 a menor a -0.90
p= 1- 96
10(99)
CONCLUSIÓN Perfecta correlación entre el orden en q
p= 1- 96
990
p= 1- 0.09696969697
p= 0.90303030303
o hay correlación entre el orden de ingreso a la universidad y el rendimiento académico
erfecta correlación entre el orden en que se ubican un grupo de cuyes por conformación x a las 3 tresemanas de edad y el orden en qu
as de edad y el orden en que se ubican en base al peso vivo (y) a las 8 semanas de edad)