Sesión Regresión y Correlación

Descargar como xlsx, pdf o txt
Descargar como xlsx, pdf o txt
Está en la página 1de 23

UNIVERSIDAD CATÓLICA DE SANTA MARÍA

ESCUELA PROFESIONAL DE MEDICINA VETERINARIA Y ZOOTECNIA


BIOESTADÍSTICA
DOCENTE: Dr. Alexander Daniel Obando Sánchez

REGRESIÓN Y CORRELACIÓN

REGRESIÓN LINEAL SIMPLE

Los modelos de regresión pueden ser lineales o no lineales. Entonces, primero


se debe determinar si es o no lineal. La forma es graficarlo a fin de obtener el modelo.
De ser lineal no tiene que haber una recta perfecta.

EJEMPLO:
2.- Se quiere analizar la relación entre la edad y el tiempo efectivo de servicios
de los trabajadores de una empresa. Para el efecto se consideró una muestra
de 15 trabajadores, obteniendose los siguientes resultados:

Trabajador Edad Tiempo de


servicio
1 48 24
2 40 18
3 30 9
4 39 14
5 46 22
6 42 22
7 27 4
8 36 13
9 34 10
10 46 20
11 32 12
12 42 18
13 40 16
14 32 8
15 27 6

Ordenación y graficación de los datos

Tiempo de
Edad servicio
Chart Title
27 4
60
27 6
30 9 50

40

30
Chart Title
60

50
32 12
32 8 40
34 10
30
36 13
39 14 20
40 18
40 16 10
42 22
0
42 18 4 6 9 12 8 10 13 14 18 16
46 22
46 20
48 24

¿Qué compotamiento tiene el espectro?


El modelo que le corresponde
En este caso corresponde a un modelo lineal
𝑦 = 𝑎𝑥 + 𝑏
La edad determina el tiempo de servicio? NO
Pero hay una relación y, por tanto, hay una regresión

Determinación de los valores "a" y "b", el modelo de regresión lineal y la frecuencia esperada

xi yi xiyi xi2 y*
48 24 1152 2304 23.648
40 18 720 1600 16.64
30 9 270 900 7.88
39 14 546 1521 15.764
46 22 1012 2116 21.896
42 22 924 1764 18.392
27 4 108 729 5.252
36 13 468 1296 13.136
34 10 340 1156 11.384
46 20 920 2116 21.896
32 12 384 1024 9.632
42 18 756 1764 18.392
40 16 640 1600 16.64
32 8 256 1024 9.632
27 6 162 729 5.252
Ʃ 561 216 8658 21643
EL MODELO DE REGRESIÓN SERÁ: 𝑦 = 𝑎𝑥 + 𝑏

𝑦 = 0.876𝑥 − 18,4

EJEMPLO:
3.- En una evaluación de campo se midió la altura de las vaquillas criollas y
su correspondiente peso vivo, en un muestreo aleatorio, obteniendose
los siguientes resultados:

Vaquillas Altura Peso vivo


1 111 290
2 98 185
3 101 285
4 110 301
5 99 201
6 89 189
7 105 255
8 115 261
9 81 175
10 118 261

a) Verificar si el espéctro tiene un comportamiento lineal


b) Estimar el modelo de regresión lineal
c) Predecir la altura de los animales en base al peso vivo real

Altura Peso vivo


81 175
89 189
98 185
99 201
101 285
105 255
110 301
111 290
115 261
118 261

xi yi xiyi xi2
81 175 14175 6561
89 189 16821 7921
98 185 18130 9604
99 201 19899 9801
101 285 28785 10201
105 255 26775 11025
110 301 33110 12100
111 290 32190 12321
115 261 30015 13225
118 261 30798 13924
Ʃ 1027 2403 250698 106683

EL MODELO DE REGRESIÓN SERÁ: 𝑦 = 𝑎𝑥 + 𝑏

𝑦 = 3.231𝑥 − 91.529
𝑦 = 𝑎𝑥 + 𝑏

regresión lineal positiva


na muestra

Chart Title
Chart Title

2 8 10 13 14 18 16 22 18 22 20 24

modelo que le corresponde

𝑦 = 𝑎𝑥 + 𝑏

al y la frecuencia esperada

𝛴𝑦_𝑖=𝑎𝛴𝑥_𝑖+𝑛𝑏 (1)

𝛴𝑥_𝑖 𝑦_𝑖=𝑎𝛴𝑥_𝑖^2+𝑏𝛴𝑥_𝑖
(2)

216= 561a +15b ¨(1)


8658= 21643a + 561b ¨(2)

Multiplico en (1) por 562 y en la (2) por -15

121176= 314721a + 8415b


-129870= -324645a - 8415b
-8694= -9924a entonces a=
Hallo b:

216= 561a + 15b ´(1)


216= 561 (0.876)+15b

b=-18.4

= 𝑎𝑥 + 𝑏

𝑦 = 0.876𝑥 − 18,4

Chart Title
350

300

250
Chart Title
350

300

250

200

150

100

50

0
111 98 101 110 99 89 105 115 81 118

y* 𝛴𝑦_𝑖=𝑎𝛴𝑥_𝑖+𝑛𝑏
(1)

𝛴𝑥_𝑖 𝑦_𝑖=𝑎𝛴𝑥_𝑖^2+𝑏𝛴𝑥_𝑖 (2)

2403= 1027a +10b ¨(1)


250698= 106683a + 1027b ¨(2)

Multiplico en (1) por 562 y en la (2) por -15

2467881= 1054729a + 10270 b


-2506980= -1066830a + (-10270b)
-39099= -12101a
39099= 12101a
3.231= a

𝑦 = 𝑎𝑥 + 𝑏

= 3.231𝑥 − 91.529
-8694 0.87605804111
-9924
Reemplazando en (1)

2403= 1027a + 10b


2403= 1027 (3.231)+10b
2403= 3318.294 + 10b
-915.2938= 10b
-91.52938= b
-91.529 b
UNIVERSIDAD CATÓLICA DE SANTA MARÍA
ESCUELA PROFESIONAL DE MEDICINA VETERINARIA Y ZOOTECNIA
BIOESTADÍSTICA
DOCENTE: Dr. Alexander Daniel Obando Sánchez

REGRESIÓN Y CORRELACIÓN

Existen dos tipos de correlación, identificadas por las letras "r" y "p". La correlación "r" se usa
en variables cuantitativas continuas y en variables cuantitativas discretas cardinales, mientras
que la correlación "p" se usa en variables cuantitativas discretas ordinales.

CORRELACIÓN "r"

𝑟=(∑128▒𝑥𝑦)/√(𝛴𝑥^2 𝛴𝑦^2 )

Donde: 𝑥=𝑥_𝑖−𝑥 ̅
𝑦=𝑦_𝑖−𝑦 ̅

xi Son los valores de las observaciones x


yi Son los valores de las observaciones y

Ejemplo 1 La siguiente tabla muestra las presiones sanguineas sistólicasen cada una de 10 parejas de gemelos
idénticos. Determinar su coeficiente de correlación.

Parejas xi yi x y
1 118 115 -3 -8
2 116 119 -5 -4
3 118 116 -3 -7
4 120 119 -1 -4
5 122 118 1 -5
6 122 138 1 15
7 122 124 1 1
8 120 128 -1 5
9 124 126 3 3
10 125 130 4 7
Promedio 121 123
Sumatoria 1207 1356.3

La correlación puede ser positiva o negativa y sus valores pueden ir desde " -1" hasta "+1".
-1 ≤ r ≤ +1

VALORES DE "r" Grado de correlación


de -0.20 a 0.20 No hay correlación
de 0.21 a 0.40 ó de -0.40 a -0.21 Baja correlación
de 0.41 a 0.70 ó de -0.70 a -0.41 Buena correlación
de 0.71 a 0.90 ó de -0.90 a -0.71 Alta correlación
Mayor a 0.90 a menor a -0.90 Perfecta correlación

EJEMPLO:
2.- En una evaluación de campo se midió la altura de las vaquillas criollas y
su correspondiente peso vivo, en un muestreo aleatorio, obteniendose
los siguientes resultados:

Vaquillas Altura Peso vivo x


1 111 290 8
2 98 185 -5
3 101 285 -2
4 110 301 7
5 99 201 -4
6 89 189 -14
7 105 255 2
8 115 261 12
9 81 175 -22
10 118 261 15
Promedio 103 240
Sumatoria 1027 2643.3

Determine el coeficiente de correlación e indicar que grado tiene?

La correlación puede ser positiva o negativa y sus valores pueden ir desde " -1" hasta "+1".

-1 ≤ r ≤ +1

VALORES DE "r" Grado de correlación


de -0.20 a 0.20 No hay correlación
de 0.21 a 0.40 ó de -0.40 a -0.21 Baja correlación
de 0.41 a 0.70 ó de -0.70 a -0.41 Buena correlación
de 0.71 a 0.90 ó de -0.90 a -0.71 Alta correlación
Mayor a 0.90 a menor a -0.90 Perfecta correlación
observaciones x
observaciones y

a de 10 parejas de gemelos
𝑟=(∑128▒𝑥𝑦)/√(𝛴𝑥^2 𝛴𝑦^2 )

xy x2 y2
22 7 69
20 22 18 r= 113
20 7 53 √72*478
3 0 18
-7 2 28 r= 113
19 2 216 √34416
1 2 0
-3 0 22 r= 113
9 11 7 185.515498
29 18 45
113 72 478 r= 0.61

CONCLUSIÓN: Las presiones sanguíneas sistólicas de lo

" -1" hasta "+1".


𝑟=(∑128▒𝑥𝑦)/√(𝛴𝑥^2 𝛴𝑦^2 )
y xy x 2
y 2

50 412.51 68.89 2470.09


-55 259.91 22.09 3058.09
45 -75.99 2.89 1998.09 r=
61 443.11 53.29 3684.49
-39 145.41 13.69 1544.49
-51 702.81 187.69 2631.69 r=
15 33.81 5.29 216.09
21 254.61 151.29 428.49
-65 1417.01 470.89 4264.09 r=
21 316.71 234.09 428.49
3497.39 1210.1 20724.1
r=
r=

CONCLUSIÓN Existe una alta correlación entre la altura de las vaquillas criollas y su pe

" -1" hasta "+1".


√(𝛴𝑥^2 𝛴𝑦^2 )

as presiones sanguíneas sistólicas de los gemelos estan bien correlacionadas


8▒𝑥𝑦)/√(𝛴𝑥^2 𝛴𝑦^2 )

3497
√1210*20724

3497
√25076040

3497
5007.598227

0.6983387727
0.7

la altura de las vaquillas criollas y su peso vivo correspondiente


UNIVERSIDAD CATÓLICA DE SANTA MARÍA
ESCUELA PROFESIONAL DE MEDICINA VETERINARIA Y ZOOTECNIA
BIOESTADÍSTICA
DOCENTE: Dr. Alexander Daniel Obando Sánchez

REGRESIÓN Y CORRELACIÓN

CORRELACIÓN "P"
Usada en variables cuantitativas discretas ordinales
La correlación "p" se obtiene aplicando la siguiente fórmula:

𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁^2−1)

Donde:
N= Número de parejas de datos
D2 = Diferencia entre cada pareja de datos elevado al cuadrado

La correlación puede ser positiva o negativa y sus valores pueden ir desde " -1" hasta "+1".

-1 ≤ p ≤ +1

Ejemplo 1 Determinar el coeficiente de correlación entre el orden en que ingresan a la universidad y


el orden del rendimiento académico al termino de su formación profesional de un grupo
de estudiantes de medicina veterinaria.

𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁
x y D D2
1 7 -6 36
2 9 -7 49
3 12 -9 81
4 2 2 4
5 8 -3 9
6 1 5 25
7 5 2 4
8 6 2 4
9 4 5 25
10 11 -1 1
11 10 1 1
12 3 9 81
Ʃ 78 78 320
Ejemplo 2 Determine el coeficiente de correlación entre el orden en que se ubican un grupo de cuyes
por conformación (x) a las tres semanas de edad y el orden en que se ubican en base al
peso vivo (y) a las 8 semanas de edad.
𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁
x y D D2
1 1 0 0
2 3 -1 1
3 5 -2 4
4 4 0 0
5 2 3 9
6 6 0 0
7 8 -1 1
8 7 1 1
9 9 0 0
10 10 0 0
Ʃ 55 55 16
evado al cuadrado (x-y)2

a la universidad y
nal de un grupo

𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁^2−1)

p= 1- 6 * 320
12 (122 -1)

p= 1- 1920
1716

p= 1- 1.11888111888

p= -0.11888111888
p= -0.12 CONCLUSIÓN No hay correlación entre el orden de ing

un grupo de cuyes
can en base al

𝑝=1−(6𝛴𝐷^2)/𝑁(𝑁^2−1)
VALORES DE "r"
de -0.20 a 0.20
de 0.21 a 0.40 ó de -0.40 a -0.21
p= 1- 6*16 de 0.41 a 0.70 ó de -0.70 a -0.41
10 (102-1) de 0.71 a 0.90 ó de -0.90 a -0.71
Mayor a 0.90 a menor a -0.90
p= 1- 96
10(99)
CONCLUSIÓN Perfecta correlación entre el orden en q
p= 1- 96
990

p= 1- 0.09696969697
p= 0.90303030303
o hay correlación entre el orden de ingreso a la universidad y el rendimiento académico

VALORES DE "r" Grado de correlación


de -0.20 a 0.20 No hay correlación
de 0.21 a 0.40 ó de -0.40 a -0.21 Baja correlación
de 0.41 a 0.70 ó de -0.70 a -0.41 Buena correlación
de 0.71 a 0.90 ó de -0.90 a -0.71 Alta correlación
Mayor a 0.90 a menor a -0.90 Perfecta correlación

erfecta correlación entre el orden en que se ubican un grupo de cuyes por conformación x a las 3 tresemanas de edad y el orden en qu
as de edad y el orden en que se ubican en base al peso vivo (y) a las 8 semanas de edad)

También podría gustarte