Ejercicios de Correlación y Regresión Lineal
Ejercicios de Correlación y Regresión Lineal
Ejercicios de Correlación y Regresión Lineal
ID 709702
ID 706142
ID 116936
Contaduría publica
Estadística
Girardot Cundinamarca
2019
2
ID 709702
ID 706142
ID 116936
Tutor
Contaduría publica
Estadística
Girardot Cundinamarca
2019
3
Tabla de contenido
EJERCICIOS ................................................................................................................................ 7
Ejercicio 1 ................................................................................................................................................ 7
Hallar la media de las variables............................................................................................................ 8
Tabla de cálculos .................................................................................................................................. 8
Hallar coeficiente de correlación lineal ................................................................................................ 8
Interpretación del coeficiente de correlación lineal r. .......................................................................... 9
Coeficiente de determinación. .............................................................................................................. 9
Hallar desviación estándar de las variables ........................................................................................ 10
Ecuación de regresión ........................................................................................................................ 10
Hallar pendiente ................................................................................................................................. 10
Hallar intersección en el eje y ............................................................................................................ 10
Reemplazando ecuación de regresión lineal ...................................................................................... 11
Ejercicio 2 .............................................................................................................................................. 12
Hallar la media de las variables.......................................................................................................... 12
Tabla de cálculos ................................................................................................................................ 13
Hallar coeficiente de correlación lineal .............................................................................................. 13
Interpretación del coeficiente de correlación lineal r. ........................................................................ 13
Coeficiente de determinación. ............................................................................................................ 14
Hallar desviación estándar de las variables ........................................................................................ 15
Ecuación de regresión ........................................................................................................................ 15
Hallar pendiente ................................................................................................................................. 15
Hallar intersección en el eje y ............................................................................................................ 15
Reemplazando ecuación de regresión lineal ...................................................................................... 16
Ejercicio 3 .............................................................................................................................................. 17
Hallar la media de las variables.......................................................................................................... 18
Tabla de cálculos ................................................................................................................................ 18
Hallar coeficiente de correlación lineal .............................................................................................. 18
Interpretación del coeficiente de correlación lineal r. ........................................................................ 19
Coeficiente de determinación. ............................................................................................................ 19
Hallar desviación estándar de las variables ........................................................................................ 20
Ecuación de regresión ........................................................................................................................ 20
Hallar pendiente ................................................................................................................................. 20
Hallar intersección en el eje y ............................................................................................................ 20
Reemplazando ecuación de regresión lineal ...................................................................................... 21
Ejercicio 4 .............................................................................................................................................. 21
Hallar la media de las variables.......................................................................................................... 22
Tabla de cálculos ................................................................................................................................ 23
Hallar coeficiente de correlación lineal .............................................................................................. 23
Interpretación del coeficiente de correlación lineal r. ........................................................................ 23
Coeficiente de determinación. ............................................................................................................ 24
Hallar desviación estándar de las variables ........................................................................................ 24
Ecuación de regresión ........................................................................................................................ 25
Hallar pendiente ................................................................................................................................. 25
Hallar intersección en el eje y ............................................................................................................ 25
Reemplazando ecuación de regresión lineal ...................................................................................... 25
Ejercicio 5 .............................................................................................................................................. 26
Hallar la media de las variables.......................................................................................................... 27
Tabla de cálculos ................................................................................................................................ 27
4
Tabla de tablas
Tabla de ilustraciones
EJERCICIOS
calcule el valor del coeficiente de correlación lineal r, calcule los valores críticos de r a partir de
determine si existe evidencia suficiente para sustentar la afirmación de que existe una correlación
Ejercicio 1
IPC y pizza A continuación se presentan los valores pareados del Índice de precios al
consumidor (IPC) y el precio de una rebanada de pizza, incluidos en la tabla 10-1 del problema
del capítulo. ¿Existe una correlación lineal entre el IPC y el costo de una rebanada de pizza?
Costo
IPC de
pizza
30,20 0,15
48,30 0,35
112,30 1,00
162,20 1,25
191,90 1,75
197,80 2,00
Tabla 1 Tabla de datos ejercicio 1
Diagrama de dispersión
2,5
1,5
0,5
0
0 50 100 150 200
∑ 𝑥𝑖
𝑥̅ =
𝑛
742.70
𝑥̅ = = 123.783
6
∑ 𝑦𝑖
𝑦̅ =
𝑛
6,50
𝑦̅ = = 1.083
6
Tabla de cálculos
(𝑦𝑖
𝑥 𝑦 𝑥2 𝑦2 𝑥𝑦 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅ )2 𝑦𝑖 − 𝑦̅
− 𝑦̅)2
30,20 0,15 912,040 0,023 4,530 −93,583 8757,840 −0,933 0,871
48,30 0,35 2332,890 0,123 16,905 −75,483 5697,734 −0,733 0,538
112,30 1,00 12611,290 1,000 112,300 −11,483 131,867 −0,083 0,007
162,20 1,25 26308,840 1,563 202,750 38,417 1475,840 0,167 0,028
191,90 1,75 36825,610 3,063 335,825 68,117 4639,880 0,667 0,444
197,80 2,00 39124,840 4,000 395,600 74,017 5478,467 0,917 0,840
𝟕𝟒𝟐, 𝟕𝟎 𝟔, 𝟓𝟎 𝟏𝟏𝟖𝟏𝟏𝟓, 𝟓𝟏𝟎 𝟗, 𝟕𝟕𝟎 𝟏𝟎𝟔𝟕, 𝟗𝟏𝟎 𝟐𝟔𝟏𝟖𝟏, 𝟔𝟐𝟖 𝟐, 𝟕𝟐𝟖
Tabla 2 Tabla de cálculos ejercicio 1
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2
6(1067.910) − (742.70)(6.50)
𝑟=
√6(118115.510) − (742.70)2 √6(9.770) − (6.50)2
1579.91
𝑟= = 0.985
√157089.77√16.37
9
Para la interpretación se va utilizar un nivel de significancia del 0.05 para 6 pares de datos, se
Hay evidencia suficiente para sustentar la conclusión de que existe una correlación lineal
Coeficiente de determinación.
𝑟 2 = (0.985)
𝑟 2 = 0.970
𝑟 2 = 97 %
∑(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥 = √
𝑁−1
26181,628
𝑠𝑥 = √ = 72.362
5
∑(𝑦𝑖 − 𝑦̅)2
𝑠𝑦 = √
𝑁−1
2.728
𝑠𝑦 = √ = 0.739
5
Ecuación de regresión
𝑦̂ = 𝑏0 + 𝑏1 𝑥
Hallar pendiente
𝑠𝑦
𝑏1 = 𝑟
𝑠𝑥
0.739
𝑏1 = 0.985 = 0.010
72.362
𝑏0 = 𝑦̅ − 𝑏1 𝑥̅
𝑦̂ = −0.155 + 0.010𝑥
1,5
0,5
0
0 50 100 150 200
Ejercicio 2
IPC y precio del boleto del metro A continuación se presentan los valores pareados del Índice
de precios al consumidor (IPC) y el precio del boleto del metro, incluidos en la tabla 10-1 del
problema del capítulo. ¿Existe una correlación lineal entre el IPC y el precio del boleto del
metro?
Tarifa del
IPC
metro
30,20 0,15
48,30 0,35
112,30 1,00
162,20 1,35
191,90 1,50
197,80 2,00
Tabla 4 Tabla de datos ejercicio 2
Diagrama de dispersión
2,5
1,5
0,5
0
0 50 100 150 200
∑ 𝑥𝑖
𝑥̅ =
𝑛
742.70
𝑥̅ = = 123.783
6
∑ 𝑦𝑖
𝑦̅ =
𝑛
13
6,35
𝑦̅ = = 1.058
6
Tabla de cálculos
(𝑦𝑖
𝑥 𝑦 𝑥2 𝑦2 𝑥𝑦 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅ )2 𝑦𝑖 − 𝑦̅
− 𝑦̅)2
30,20 0,15 912,040 0,023 4,530 −93,583 8757,840 −0,908 0,825
48,30 0,35 2332,890 0,123 16,905 −75,483 5697,734 −0,708 0,502
112,30 1,00 12611,290 1,000 112,300 −11,483 131,867 −0,058 0,003
162,20 1,35 26308,840 1,823 218,970 38,417 1475,840 0,292 0,085
191,90 1,50 36825,610 2,250 287,850 68,117 4639,880 0,442 0,195
197,80 2,00 39124,840 4,000 395,600 74,017 5478,467 0,942 0,887
742,70 6,35 118115,510 9,218 1036,155 26181,628 2,497
Tabla 5 Tabla de cálculos ejercicio 2
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2
6(1036.155) − (742.70)(6.35)
𝑟=
√6(118115.510) − (742.70)2 √6(9.218) − (6.35)2
1500.785
𝑟= = 0.978
√157089.77√14.98
Para la interpretación se va utilizar un nivel de significancia del 0.05 para 6 pares de datos, se
Hay evidencia suficiente para sustentar la conclusión de que existe una correlación lineal
Coeficiente de determinación.
𝑟 2 = (0.978)
𝑟 2 = 0.956
𝑟 2 = 95.6 %
Hay 95.6 % de variación del IPC y el precio del boleto del metro.
15
∑(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥 = √
𝑁−1
26181,628
𝑠𝑥 = √ = 72.362
5
∑(𝑦𝑖 − 𝑦̅)2
𝑠𝑦 = √
𝑁−1
2.497
𝑠𝑦 = √ = 0.707
5
Ecuación de regresión
𝑦̂ = 𝑏0 + 𝑏1 𝑥
Hallar pendiente
𝑠𝑦
𝑏1 = 𝑟
𝑠𝑥
0.707
𝑏1 = 0.978 = 0.010
72.362
𝑏0 = 𝑦̅ − 𝑏1 𝑥̅
𝑦̂ = −0.180 + 0.010𝑥
1,5
0,5
0
25 45 65 85 105 125 145 165 185
Ejercicio 3
sanguínea sistólica (en mm Hg) obtenidas de la misma mujer (según datos de “Consistency of
Blood Pressure Differences Between the Left and Right Arms”, de Eguchi, et al., Archives of
Internal Medicine, vol. 167). ¿Existe evidencia suficiente para concluir que hay una correlación
lineal entre las mediciones de la presión sanguínea sistólica del brazo derecho y del izquierdo?
Brazo
Brazo derecho
izquierdo
102 175
101 169
94 182
79 146
79 144
Tabla 7 Tabla de datos ejercicio 3
∑ 𝑥𝑖
𝑥̅ =
𝑛
455
𝑥̅ = = 91
5
∑ 𝑦𝑖
𝑦̅ =
𝑛
816
𝑦̅ = = 163.2
5
Tabla de cálculos
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2
5(74937) − (455)(816)
𝑟=
√5(41923) − (455)2 √5(134362) − (816)2
3405
𝑟= = 0.867
√2590√5954
19
Para la interpretación se va utilizar un nivel de significancia del 0.05 para 5 pares de datos, se
No existe evidencia suficiente para sustentar la conclusión de que existe una correlación lineal
entre las mediciones de la presión sanguínea sistólica del brazo derecho y del izquierdo.
Coeficiente de determinación.
𝑟 2 = (0.867)
𝑟 2 = 0.752
𝑟 2 = 75.2 %
Hay 75.2 % de variación en las mediciones de la presión sanguínea sistólica del brazo derecho
y del izquierdo.
20
∑(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥 = √
𝑁−1
518
𝑠𝑥 = √ = 11.380
4
∑(𝑦𝑖 − 𝑦̅)2
𝑠𝑦 = √
𝑁−1
1190.800
𝑠𝑦 = √ = 17.254
4
Ecuación de regresión
𝑦̂ = 𝑏0 + 𝑏1 𝑥
Hallar pendiente
𝑠𝑦
𝑏1 = 𝑟
𝑠𝑥
17.254
𝑏1 = 0.867 = 1.314
11.380
𝑏0 = 𝑦̅ − 𝑏1 𝑥̅
𝑦̂ = 43.626 + 1.314𝑥
Ejercicio 4
Tarifas aéreas A continuación se presentan los precios (en dólares) de tarifas aéreas de
diferentes aerolíneas que vuelan de la ciudad de Nueva York (JFK) a San Francisco. Los precios
aerolíneas son US Air, Continental, Delta, United, American, Alaska y Northwest. ¿Hay
evidencia suficiente para concluir que existe una correlación lineal entre los precios de los
22
boletos comprados con 30 días de anticipación y los boletos comprados con un día de
anticipación?
30 días Un día
244 456
260 614
264 567
264 943
278 628
318 1088
280 536
Tabla 10 Tabla de datos ejercicio 4
Diagrama de dispersión
1100
1000
900
800
700
600
500
400
240 250 260 270 280 290 300 310 320
∑ 𝑥𝑖
𝑥̅ =
𝑛
1908
𝑥̅ = = 272.571
7
∑ 𝑦𝑖
𝑦̅ =
𝑛
4832
𝑦̅ = = 690.286
7
23
Tabla de cálculos
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2
7(1340192) − (1908)(4832)
𝑟=
√7(523336) − (1908)2 √7(3661094) − (4832)2
161888
𝑟= = 0.709
√22888√2279434
Para la interpretación se va utilizar un nivel de significancia del 0.05 para 7 pares de datos, se
No hay evidencia suficiente para sustentar la conclusión de que existe una correlación lineal
entre los precios de los boletos comprados con 30 días de anticipación y los boletos comprados
Coeficiente de determinación.
𝑟 2 = (0.709)
𝑟 2 = 0.503
𝑟 2 = 50.3 %
Hay 50.3 % de variación de los precios de los boletos comprados con 30 días de anticipación
∑(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥 = √
𝑁−1
3269.714
𝑠𝑥 = √ = 23.344
6
25
∑(𝑦𝑖 − 𝑦̅)2
𝑠𝑦 = √
𝑁−1
325633.429
𝑠𝑦 = √ = 232.964
6
Ecuación de regresión
𝑦̂ = 𝑏0 + 𝑏1 𝑥
Hallar pendiente
𝑠𝑦
𝑏1 = 𝑟
𝑠𝑥
232.964
𝑏1 = 0.709 = 7.075
23.344
𝑏0 = 𝑦̅ − 𝑏1 𝑥̅
𝑦̂ = −1238.154 + 7.075𝑥
Ejercicio 5
cabeza (en cm) de focas a partir de fotografías, y los pesos (en kg) de las focas (según datos de
Montana State University). El objetivo del estudio consistía en determinar si era posible calcular
los pesos de las focas a partir de fotografías de sus cabezas. ¿Existe evidencia suficiente para
concluir que hay una correlación lineal entre las anchuras de las cabezas de las focas a partir de
∑ 𝑥𝑖
𝑥̅ =
𝑛
51
𝑥̅ = = 8.5
6
∑ 𝑦𝑖
𝑦̅ =
𝑛
1108
𝑦̅ = = 184.666
6
Tabla de cálculos
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2
6(9639) − (51)(1108)
𝑟=
√6(439) − (51)2 √6(214482) − (1108)2
1326
𝑟= = 0.948
√33√59228
Para la interpretación se va utilizar un nivel de significancia del 0.05 para 6 pares de datos, se
Hay evidencia suficiente para sustentar la conclusión de que existe una correlación lineal
entre las anchuras de las cabezas de las focas a partir de fotografías y los pesos de las focas.
29
Coeficiente de determinación.
𝑟 2 = (0.948)
𝑟 2 = 0.899
𝑟 2 = 89.9 %
Hay 89.9 % de variación de las anchuras de las cabezas de las focas a partir de fotografías y
∑(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥 = √
𝑁−1
5.500
𝑠𝑥 = √ = 1.049
5
∑(𝑦𝑖 − 𝑦̅)2
𝑠𝑦 = √
𝑁−1
9871.333
𝑠𝑦 = √ = 44.433
5
Ecuación de regresión
𝑦̂ = 𝑏0 + 𝑏1 𝑥
Hallar pendiente
𝑠𝑦
𝑏1 = 𝑟
𝑠𝑥
44.433
𝑏1 = 0.948 = 40.155
1.049
30
𝑏0 = 𝑦̅ − 𝑏1 𝑥̅
𝑦̂ = −156.650 + 40.155𝑥
Anchura de la
̂ = −𝟏𝟓𝟔. 𝟔𝟓𝟎 + 𝟒𝟎. 𝟏𝟓𝟓𝒙
𝒚
cabeza
7,2 132,466
7,4 140,497
9,8 236,869
9,4 220,807
8,8 196,714
8,4 180,652
Tabla 17 Reemplazo ecuación de regresión lineal ejercicio 5
ANEXOS