Grupo 01 - Solución Tarea 02 - Semana 03
Grupo 01 - Solución Tarea 02 - Semana 03
Grupo 01 - Solución Tarea 02 - Semana 03
ALUMNOS
Centurión Salazár, Jesus Alexander
Garcia Mori, Alex
Llaury Miranda, Marcos
Rodríguez Varas, Fernando
CICLO
VIII CICLO
TRUJILLO - PERÚ
2024
AD NACIONAL DE TRUJILLO
ENCIAS FÍSICAS Y MATEMÁTICAS
OFESIONAL DE ESTADÍSTICA
ÓN TAREA 2 - SEMANA 3
CURSO
LISIS DE REGRESIÓN II
DOCENTE
naqué Centeno Enrique
ALUMNOS
ón Salazár, Jesus Alexander
Garcia Mori, Alex
aury Miranda, Marcos
dríguez Varas, Fernando
CICLO
VIII CICLO
TRUJILLO - PERÚ
2024
EJERCICIO 1
1.- Obtenga el modelo de regresión por tramos
X* = 4500
Año PIB(X) (Xi - 4500)*Di GCP(Y)
1960 2501.8 -1998.2 1597.4
1961 2560 -1940 1630.3
1962 2715.2 -1784.8 1711.1
1963 2834 -1666 1781.6
1964 2998.6 -1501.4 1888.4
1965 3191.1 -1308.9 2007.7
1966 3399.1 -1100.9 2121.8
1967 3484.6 -1015.4 2185
1968 3652.7 -847.3 2310.5
1969 3765.4 -734.6 2396.4
1970 3771.9 -728.1 2451.9
1971 3898.6 -601.4 2545.5
1972 4105 -395 2701.3
1975 4311.2 -188.8 2876.9
1974 4319.6 -180.4 2812.3
1973 4341.5 -158.5 2833.8
1976 4540.9 40.9 3035.5
1977 4750.5 250.5 3164.1
1978 5015 515 3303.1
1980 5161.7 661.7 3374.1
1979 5173.4 673.4 3383.4
1982 5189.3 689.3 3470.3
1981 5291.7 791.7 3422.2
1983 5423.8 923.8 3668.6
1984 5813.6 1313.6 3863.3
1985 6053.7 1553.7 4064
1986 6263.6 1763.6 4228.9
1987 6475.1 1975.1 4369.8
1988 6742.7 2242.7 4546.9
1989 6981.4 2481.4 4675
1991 7100.5 2600.5 4778.4
1990 7112.5 2612.5 4770.3
1992 7336.6 2836.6 4934.8
1993 7532.7 3032.7 5099.8
1994 7835.5 3335.5 5290.7
1995 8031.7 3531.7 5433.5
1996 8328.9 3828.9 5619.4
DIAGRAMA DE DISPERSION
9000
8000
7000
6000
5000
4000
3000
2000
1000
0
2000 3000 4000 5000 6000 7000 8000 9000 10000 11000 12000
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9993
Coeficiente de determinación R^2 0.9985
Presenta un R2 del 99,85% ; es decir, el modelo e
R^2 ajustado 0.9985 del Gasto de Consumo Personal en u
Error típico 69.9445
Observaciones 46
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 2 144153449.8 72076724.9 14732.9 0.00
Residuos 43 210365.9 4892.2
Total 45 144363815.7
Modelo:
GCP = -122.897 + 0.675*PIB + 0.057*(Xi-4500)*D
0 si Xi < 4500
Di= 1 si Xi > 4500
Interpretacion
Coef. Del PBI
0,675 es el cambio esperado en el GASTO DE CONSUMO PERSONAL(y) , por cada cambio de monto en miles de millones de d
Coef. De(Xi-X*)*D
0,057 es el cambio esperado en el GASTO DE CONSUMO PERSONAL(y), por cada monto superior a 4500 miles de millones de
Coeficiente independiente
-122,897 es el valor esperado del GASTO DE CONSUMO PERSONAL(y) , cuando el PRODUCTO BRUTO INTERNO es cero
del 99,85% ; es decir, el modelo explica la variabilidad
Gasto de Consumo Personal en un 99,85%
N° Tiempo de Carros
trabajo semanal vendidos
1 170 270
2 420 310
3 294 315
4 502 182
5 392 360
6 82 160
7 54 140
8 350 360
9 440 310
10 480 200
11 160 190
12 204 220
13 14 80
14 50 110
15 20 60
16 220 310
17 70 190
18 470 270
SOLUCIÓN:
VARIABLES:
Y: Tiempo de trabajo
X: Unidades de carros vendidos
X*: Variación del tiempo trabajado cuando se tienen unidades de carros vendidos de 224
1 170 270 46 1
2 420 310 86 1
3 294 315 91 1
4 502 182 0 0
5 392 360 136 1
6 82 160 0 0
7 54 140 0 0
8 350 360 136 1
9 440 310 86 1
10 480 200 0 0
11 160 190 0 0
12 204 220 0 0
13 14 80 0 0
14 50 110 0 0
15 20 60 0 0
16 220 310 86 1
17 70 190 0 0
18 470 270 46 1
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.700
Coeficiente de determinación R^2 0.490
R^2 ajustado 0.421
Error típico 133.848
Observaciones 18
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los
libertad cuadrados cuadrados F
Regresión 2 257679.50 128839.75 7.19
Residuos 15 268728.50 17915.23
Total 17 526408.00
Modelo:
𝒀 ̂=−𝟏𝟒𝟕.𝟎+𝟐.𝟎𝟐(𝑿)−𝟏.𝟓𝟖(𝒙𝒊−𝟐𝟐𝟒)∗𝑫
El incrementó al tiempo laboral resultante es de 2 unidades de carros vendidos . La diferencia entre am
estadísticamente significativo debido a que la variable dicótoma tiene un p valor mayor al 5%.
didos de 224
Valor crítico de F
0.01
n C.T. U.P.
1 250 990
2 410 2200
3 630 3300
4 770 4200
5 1000 5400
6 1800 6200
7 2000 7100
8 2300 8200
9 2700 9100
10 2900 10200
SOLUCIÓN:
VARIABLES:
Y: C.T = Costo total dólares
X: U.P Unidades de producción
X*: Variación del costo total cuando se tienen unidades de producción 5689
1 250 990 0 0
2 410 2200 0 0
3 630 3300 0 0
4 770 4200 0 0
5 1000 5400 0 0
6 1800 6200 511 1
7 2000 7100 1411 1
8 2300 8200 2511 1
9 2700 9100 3411 1
10 2900 10200 4511 1
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.986
Coeficiente de determinación R^2 0.972
R^2 ajustado 0.964
Error típico 185.470
Observaciones 10
ANÁLISIS DE VARIANZA
Grados de libertadSuma de cuadrados
Promedio de los cuadrados F
Regresión 2 8423845.477 4211922.739 122.442
Residuos 7 240794.523 34399.218
Total 9 8664640.000
Modelo:
𝒀 ̂=−𝟏𝟐𝟒.𝟒𝟓𝟔+𝟎.𝟐𝟓𝟑(𝑿)+𝟏.𝟑𝟐(𝒙𝒊−𝟓𝟔𝟖𝟗)∗𝑫
El incremento del costo total resultante de producción es de 25 dólares aproximadamente por unidad, y cua
producción por encima de 5689 unidades el costo total tiene un incremento de 38 dólares por unidad, la dif
ambos no es estadísticamente significativa debido a que el p valor de la variable dicótoma está por deba
Valor crítico de F
0.000
(i) 1 2 3 4 5
Yi 55 100 78 120 116
Xi 3 7 9 10 14
a.-Estimar la regresión lineal sin considerar el umbral e interpretar resultados.
b.-Estimar la regresión lineal considerando el umbral e interpretar resultados.
c.-Comentar sobre los resultados de los incisos a y b.
SOLUCIÓN:
X* = 15000
X* = 15 mil estudiantes
(i) Yi Xi (Xi-x*)*D
1 55 3 0 DIAGRAMA DE
2 100 7 0 250
3 78 9 0
200
4 120 10 0
5 116 14 0 150
6 140 18 3
100
7 162 22 7
8 170 24 9 50
9 146 26 11 0
10 200 28 13 0 5 10 15
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9347
Presenta un R2 del 87.37% ; es decir, e
Coeficiente de determinación R^2 0.8737 Ventas Trimestrales en miles d
R^2 ajustado 0.8579
Error típico 16.5714
Observaciones 10
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 15191.204 15191.204 55.319 0.000
Residuos 8 2196.896 274.612
Total 9 17388.100
Modelo:
Se observa que el estado inicial de las ventas trimestrales cuando la población es 0 sería de 53 miles de dolares, e
coeficiente B1= 4.7, significa que por cada mil estudiantes las ventas trimestrales aumentarán 4.7 veces.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9362
Presenta un R2 del 87.64% ; es decir,
Coeficiente de determinación R^2 0.8764 de Ventas Trimestrales en mile
R^2 ajustado 0.8411
Error típico 17.5216
Observaciones 10
ANÁLISIS DE VARIANZA
Para b2 = -1.223 significa que cada vez que los estudiantes sobrepase la población de
15 mil, la variable ventas trimestrales disminuirán -1.223 por cada miles de estudiantes (1
unidad de la población de estudiantes)
Cuando se estima una ecuación de regresión con umbral el nivel de significancia de los valores resulta ser
insignificativos debido a que p valor es mayor de 5% esto quiere decir que el umbral afecta al modelo de regresión
las ventas mientras que en cuando se estima un modelo de regresión sin umbral las variables son significativa ya q
su p valor es menor del 5% esto quiere decir que estaría proporcionando un buen modelo de regresión a las venta
población de 15 mil estudiantes
6 7 8 9 10
140 162 170 146 200
18 22 24 26 28
DIAGRAMA DE DISPERSIÓN
5 10 15 20 25 30
r crítico de F
El modelo resulta significativo
Superior 95% Inferior 95.0%Superior 95.0%
79.389 26.584 79.389
Ambas variables son significativas al 5%.
6.161 3.245 6.161
Superior 95%
91.776
9.749
6.102
cia de los valores resulta ser
mbral afecta al modelo de regresión y a
ral las variables son significativa ya que
uen modelo de regresión a las ventas.
gnificativas al 5%.
EJERCICIO 5
Se tomaron datos en 15 localidades sobre los cigarros consumidos (cientos por persona) y la
mortalidad por cáncer de pulmón (muertes/100000 habitantes), se pide:
a) Se pide realizar la regresión por tramos si sabe que la mortalidad puede cambiar su
pendiente al alcanzar 25.00 (cientos por personas) de cigarrillos.
b) Interpretar los resultados
n Moratalidad(Y) Cigarrillos(x)
1 17.05 18.2
2 19.8 25.82
3 15.98 18.24
4 22.07 28.6
5 22.83 31.1
6 24.55 33.6
7 27.27 40.46
8 23.57 28.27
9 13.58 20.1
10 22.8 27.91
11 20.3 26.18
12 16.59 22.12
13 16.84 21.84
14 17.71 23.44
15 25.45 21.58
SOLUCIÓN:
a) Se pide realizar la regresión por tramos si sabe que la mortalidad puede cambiar su pendiente al alc
VARIABLES:
Y: Mortalidad
X: Cigarrillos
X*: Umbral de consumo de cigarrillos 25
1 17.05 18.2 0
2 19.8 25.82 0.82
3 15.98 18.24 0
4 22.07 28.6 3.6
5 22.83 31.1 6.1
6 24.55 33.6 8.6
7 27.27 40.46 15.46
8 23.57 28.27 3.27
9 13.58 20.1 0
10 22.8 27.91 2.91
11 20.3 26.18 1.18
12 16.59 22.12 0
13 16.84 21.84 0
14 17.71 23.44 0
15 25.45 21.58 0
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.800
Coeficiente de determinación R^2 0.640
R^2 ajustado 0.580
Error típico 2.607
Observaciones 15
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadrados
Regresión 2 144.931 72.465
Residuos 12 81.551 6.796
Total 14 226.482
Modelo:
𝒀 ̂=𝟒.𝟓𝟖𝟗+𝟎.𝟔𝟑(𝑿)−𝟎.𝟏𝟓𝟕(𝒙𝒊−𝟐𝟓)∗𝑫
El incremento total de la mortalidad es de 63 personas, mientras que para aquellas personas que tienen u
diarios la mortalidad es de 47, pero entre ambos no se alcanza un grado de significancia debido a que el valo
mayor del 5%.
os (cientos por persona) y la
pide:
ad puede cambiar su
0
1
0
1
1
1
1
1
0
1
1
0
0
0
0
F Valor crítico de F
10.663 0.002
SOLUCIÓN:
a) Se pide realizar la regresión por tramos si sabe que la mortalidad puede cambiar su pendiente al alc
VARIABLES:
Y: Costo total
X: Producción
X*: Umbral cuando la producción 5
D: 1: Producción > 5
0: Producción < 5
193 1 0 0
226 2 0 0
249 3 0 0
244 4 0 0
257 5 0 1
260 6 1 1
274 7 2 1
297 8 3 1
350 9 4 1
420 10 5 1
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.94425560642877
Coeficiente de determinación R^2 0.89161865027217
R^2 ajustado 0.86065255034993
Error típico 24.3852827911985
Observaciones 10
ANÁLISIS DE VARIANZA
Suma de Promedio de los
Grados de libertad cuadrados cuadrados
Regresión 2 34243.506 17121.753
Residuos 7 4162.494 594.642
Total 9 38406.000
Modelo:
𝒀 ̂=𝟐𝟎𝟒.𝟒𝟗+𝟕.𝟑𝟓(𝑿)+𝟐𝟏.𝟑𝟖(𝒙𝒊−𝟓)∗𝑫
➢ B0= Se estima que el costo total promedio tendrá un aumento de 204.5 dólares cuando no hay intervenció
➢ B1= Se estima que el costo total promedio incrementará en 7.4 dólares por cada unidad de producción.
➢ B2= Se estima que el costo total promedio cuando se tiene una producción mayor a 5 tendrá un aumento
tabla, sobre producción de
Obtenga la regresión lineal por tramos, considere los datos de la tabla: concentración de
madera y resistencia del papel
madera papel
1 6.3
1.5 11.1
2 20
3 25
4 26.1
4.5 30
5 33.8
5.5 34
6 38.1
6.5 39.9
7 42
8 55
9 53.1
10 52
11 50
12 45
13 42.8
14 27.8
15 21.9
16 18
17 15
18 12
SOLUCIÓN:
VARIABLES:
Y: Resistencia del papel
X: Concentración de la madera
X*: Umbral de la concentración 9
D: 1: concentración de madera >9
0: concentración de madera < 9
6.3 1 0 0
11.1 1.5 0 0
20 2 0 0
25 3 0 0
26.1 4 0 0
30 4.5 0 0
33.8 5 0 0
34 5.5 0 0
38.1 6 0 0
39.9 6.5 0 0
42 7 0 0
55 8 0 0
53.1 9 0 0
52 10 1 1
50 11 2 1
45 12 3 1
42.8 13 4 1
27.8 14 5 1
21.9 15 6 1
18 16 7 1
15 17 8 1
12 18 9 1
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.977
Coeficiente de determinación R^2 0.955
R^2 ajustado 0.950
Error típico 3.269
Observaciones 22
ANÁLISIS DE VARIANZA
Suma de Promedio de los
Grados de libertad cuadrados cuadrados
Regresión 2 4320.19 2160.10
Residuos 19 203.09 10.69
Total 21 4523.29
Modelo:
𝒀 ̂=𝟑.𝟐𝟗+𝟓.𝟗𝟖(𝑿)−𝟏𝟏.𝟐𝟏(𝒙𝒊−𝟗)∗𝑫
➢ B0 = Se estima que la resistencia promedio del papel aumentará en 3.3 cuando no intervienen las otras va
➢ B1 = Se estima que la resistencia promedio del papel aumentará en 5.95 por cada incremento de unidad q
➢ B2 = Se estima que la resistencia promedio cuando se tiene una concentración de madera mayor a 9 tend
tabla: concentración de
F Valor crítico de F
202.08 0.00