Actividad 6

Descargar como xlsx, pdf o txt
Descargar como xlsx, pdf o txt
Está en la página 1de 27

Matrícula Alumno

3067621
Eduardo Arámbula Acosta

Actividad 6: Análisis de factores que inciden en el consumo de petróleo


de una empresa constructora.
Descripción:
Objetivo de la actividad:

Análisis de factores que inciden en el consumo de petróleo de una empresa constructora por medio de las pruebas de
hipótesis sobre los coeficientes de regresión.

Descripción de la actividad:

Por medio de esta actividad los alumnos probarán las hipótesis sobre los coeficientes de regresión, determinando los
intervalos de confianza de los mismos coeficientes.

Requerimientos para la actividad:

Excel o Minitab.
Instrucciones (actividad colaborativa o individual):
Recomendación: consulta la explicación del tema 13, 14 y 15.
Recursos de apoyo: en el siguiente link encontrarás los recursos de apoyo tema 13, 14 y 15.

Realiza las siguientes acciones:

1. Reúnanse en equipos de 2 personas y revisen la siguiente información.

Una empresa constructora de caminos presenta gastos enormes por consumo de petróleo. Realizando un análisis, se
concluyó que los tres factores que más inciden en el consumo de petróleo al día (en litros) eran:
• El número de horas-máquina trabajadas durante el día.
• La distancia recorrida por los transportes realizados durante el día (en kilómetros).
• El rendimiento promedio de los motores que se utilizan en la faena diaria (en horas por litro).

Recogiendo los datos de estas cuatro variables durante nueve días consecutivos, se obtuvieron los siguientes datos:

Consumo Número de Distancia de Rendimiento


diario de horas- transportes promedio
petróleo (Y) máquina (X1) (X2) motores (X3)

320 20 630 2.4


200 10 398 4
785 50 1,395 1.8
376 22 720 2.6
2,405 120 4,230 0.6
893 40 1,752 0.1
1,930 93 4,000 0.05
8,010 380 15,780 0.01
1,540 75 3,080 0.04

Estos datos se deben ingresar a Excel o Minitab y llevar a cabo lo siguiente:

a) Estima e interpreta en el contexto del problema los coeficientes de la ecuación de regresión múltiple.

b) Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis.

c) Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de una prueba de hipótes
para cada uno de los coeficientes.

d) Calcula e interpreta R2 en el contexto del problema.

e) Calcula el error estándar de estimación.

f) Calcula R2ajustada.

g) Determina los intervalos de confianza.

Preguntas de discusión en el aula

1. Presenta una conclusión tomando en cuenta el contexto del problema.

2. Considerando todos los análisis realizados en el ejercicio—coeficientes individuales, coeficiente de regresión


múltiple, coeficiente de determinación ajustado, significancia del modelo de regresión, significancia de los coeficie
individuales, error estándar e intervalo de confianza—, ¿cuáles te ayudan a justificar tu conclusión y por qué?

Nota para el alumno: Considera que tu actividad debe estar documentada (proceso) y fundamentada.
Entregable(s): Resultados de ejercicio y proceso.
Criterios de evaluación de la actividad:
1. Obtención de los coeficientes de regresión.
2. Realización de pruebas de hipótesis.
3. Interpretación en el contexto del problema.
sumo de petróleo

medio de las pruebas de

esión, determinando los

ealizando un análisis, se
an:

on los siguientes datos:


ueba de hipótesis.

as de una prueba de hipótesis

s, coeficiente de regresión
, significancia de los coeficientes
u conclusión y por qué?

mentada.
Una empresa constructora de caminos presenta gastos enormes por consumo de petróleo. Realizando un análisi
que más inciden en el consumo de petróleo al día (en litros), eran:

• El número de horas-máquina trabajadas durante el día.

• La distancia recorrida por los transportes realizados durante el día (en kilómetros).

• El rendimiento promedio de los motores que se utilizan en la faena diaria (en horas por litro).

Recogiendo los datos de estas cuatro variables durante nueve días consecutivos, se obtuvieron los siguientes datos:

Número de horas- Distancia de


Consumo diario de petróleo
máquina transportes

320 20 630
200 10 398
785 50 1,395
376 22 720
2,405 120 4,230
893 40 1,752
1,930 93 4,000
8,010 380 15,780
1,540 75 3,080

Estos datos se deben ingresar a Excel o Minitab y llevar a cabo lo siguiente:

a) Estima e interpreta en el contexto del problema los coeficientes de la ecuación de regresión múltiple.
(Utiliza el análisis de regresión en Excel)

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.99981265033256
Coeficiente de determinación R^2 0.99962533576501
R^2 ajustado 0.99940053722402
Error típico 59.7466950306019
Observaciones 9

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Regresión 3 47620373.2177202
Residuos 5 17848.3378353987
Total 8 47638221.5555556
Termino Coeficientes Error típico S
Intercepción -26.0134475373071 42.7484481304273
Variable X 1 B1 11.2994939980755 2.76214798826352
Variable X 2 B2 0.23745943233084 0.0662035285509654
Variable X 3 B3 -4.70767704372368 17.204845150998

La ecuación de regresion múltiple es:


or consumo de petróleo. Realizando un análisis, se concluyó que los tres factores

kilómetros).

ria (en horas por litro).

secutivos, se obtuvieron los siguientes datos:

Rendimiento promedio
motores

2.4
4
1.8
2.6
0.6
0.1
0.05
0.01
0.04

de la ecuación de regresión múltiple.

Promedio de los cuadrados F Valor crítico de F


15873457.7392401 4446.7607812079 5.53448959603474E-09
3569.66756707975
Estadístico t Probabilidad Inferior 95% Superior 95%
-0.608523786827043 0.569422300145613 -135.901831803025 83.8749367284106
4.09083584445423 0.0094390889269698 4.19916655210595 18.3998214440451
3.58680930651653 0.0157610648999606 0.0672778443826936 0.407641020278977
-0.273625074937138 0.795315989279181 -48.9341394738146 39.5187853863672
Inferior 95.0% Superior 95.0%
-135.901831803025 83.8749367284106
4.19916655210595 18.3998214440451
0.0672778443826936 0.407641020278977
-48.9341394738146 39.5187853863672
b) Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis.

1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=𝛽_2=𝛽_3=0 (El número de horas-máquina trabajadas X1 , la distancia recorrida por los

En oposición a:
Ha : βi ≠ 0 (Al menos una variable independiente X, ya sea el número de horas-máquina trabajadas X1, la distancia
consumo diario de petróleo Y).

2) Estadística de prueba

𝐹_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝐶𝑀 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛)/(𝐶𝑀 𝐸𝑟𝑟𝑜𝑟)

Revisamos el inciso anterior y buscamos (cuadrados medios=CM):


CM Regresión 15873457.739
Fcalculada= 4446.7607812079
CM Error 3569.6675671

3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica:

El valor de Fteórica puede obtenerse en la tabla siguiente:

4) Conclusión

Puesto que Fcalculada = 4446.76 es mayor que F teórica = 5.41

Interpretación: En este problema ya que es 4446.76 es mayor a 5.41 se rechaza la hipotesis es decir si existe evidencia de que
afecta a Y.
e una prueba de hipótesis.

distancia recorrida por los transportes X2 y el rendimiento promedio de los motores X3 no afectan el consumo diario de petróle

trabajadas X1, la distancia recorrida por los transportes X2 y el rendimiento promedio de los motores X3, afectan el

ecir si existe evidencia de que al menos una X


el consumo diario de petróleo Y).

es X3, afectan el
c) Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de una prueba de
coeficientes.
El modelo a evaluar es el obtenido en el inciso a)

Prueba para determinar si la variable X1 tiene efecto significativo en el consumo diario de petróleo.
1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=0 (El número de horas-máquina trabajadas X1 no afectan el consumo diario d

En oposición a:
Ha : β1 ≠ 0 (El número de horas-máquina trabajadas X1 no afectan el consumo diario de petróleo Y).

2) Estadística de prueba
𝑆_(𝑏_1 )= 2.76214798826352
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= 4.09 es mayor que t teórica: 2.57

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=

4) Conclusión
Puesto que |tcalculada |= 4.09 es mayor que t teórica = 2.57
Eso significa que la evidencia que puede afectar la X

Prueba para determinar si la variable X2 tiene efecto significativo en el consumo diario de petróleo.
1) Establecimiento de hipotésis
𝐻_0: 𝛽_2=0 (La distancia recorrida por los transportes X2 no afectan el consumo diario

En oposición a:
Ha : β2 ≠ 0 (La distancia recorrida por los transportes X2 no afectan el consumo diario de petróleo Y).

2) Estadística de prueba
𝑆_𝑏2= 0.0662035285509654 error típico
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que tteórica:

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=

R= 12.85

4) Conclusión
Puesto que |tcalculada |= 12.85 es mayor que t teórica = 2.57
se rechaza Ho. (Existe evidencia de que al menos la variable independiente de la distancia recorrida por los transportes X
Eso significa que la evidencia que puede afectar la X
Prueba para determinar si la variable X3 tiene efecto significativo en el consumo diario de petróleo.
1) Establecimiento de hipotésis
𝐻_0: 𝛽_3=0 (El rendimiento promedio de los motores X3 no afectan el consumo diario

En oposición a:
Ha : β3 ≠ 0 (El rendimiento promedio de los motores X3 no afectan el consumo diario de petróleo Y).

2) Estadística de prueba
𝑆_𝑏3= 17.204845150998
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= 0.27 es mayor que t teórica: 2.57

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=

12.85

4) Conclusión
Puesto que |tcalculada |= 0.27 es menor que tteórica = 2.57

Interpretación: En el problema 1 ya que es 4.09 mayor a 2.57 se rechaza la hipotesis es decir si existe evidencia de que a
2.57 se rechaza la hipotesis es decir si existe evidencia de que al menos una X afecta a Y. Siguiendo con el tercer proble
de alguna X afecte a Y.

Eso significa que la evidencia que puede afectar la X


a todas las etapas de una prueba de hipótesis para cada uno de los

rio de petróleo.

as X1 no afectan el consumo diario de petróleo Y).

diario de petróleo Y).

4.09083584445421

rio de petróleo.

tes X2 no afectan el consumo diario de petróleo Y).

diario de petróleo Y).

3.58680930651652 coeficiente / error típico


istancia recorrida por los transportes X2 afectan el consumo diario de petróleo Y).

rio de petróleo.

es X3 no afectan el consumo diario de petróleo Y).

diario de petróleo Y).

0.273625074937138
s es decir si existe evidencia de que al menos una X afecta a Y. Continuando con el problema 2 ya que es 3.58 mayor a
cta a Y. Siguiendo con el tercer problema, 0.27 es menor que 2.57, la hipotesis no se rechaza es decir no existe evidencia
ue es 3.58 mayor a
r no existe evidencia
d) Calcula e interpreta R2 en el contexto del problema.

𝑅^2=(𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛)/(𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠R=


𝑡𝑜𝑡𝑎𝑙𝑒𝑠) 0.9996253

Eso significa que el coeficente de determinación es confiable ya que se acerca al 1.


e) Calcula el error estándar de estimación.

𝑆_𝜀=√(𝑆𝐶𝐸/(𝑛−𝑘−1))=√𝐶𝑀𝐸R= 11.844186

Eso significa
f) Calcula R2ajustada.

𝑅_𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜^2=1−(1−𝑅^2 )((𝑛−1)/(𝑛−𝑘−1))=
R= 0.9977936
g) Determina los intervalos de confianza.
Intercepción + t ( número de datos - número de variables indep,
"X" - 1 - ) error típico LSC LIC

𝑏_1±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b1= 11.299494 18.185748 -12.66145

Si se establece un intervalo de confianza al 95% para el consumo diario de petróleo, y se tiene el valor crítico:
t tabulada R= 46.801382
𝑡_(0.05∕2) (5)=𝑡_0.025 (5)=2.5706
2.5706 Sb1
Mientras 𝑆_(𝑏_1 )= , el cual se obtiene del excel en el inciso a): 2.762148
Entonces, con un 95% de confianza, se tiene que el verdadero valor B2 se encuentra en el intervalo.
LSC LIC
𝑏_2±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b2= 0.2374594 15.489804 -15.3574

Si se establece un intervalo de confianza al 95% para el consumo diario de petróleo, y se tiene el valor crítico:
𝑡_(0.05∕2) (5)=𝑡_0.025 (5)=2.5706
R= 11.299494
Mientras 𝑆_(𝑏_2 )= 0.2374594 , el cual se obtiene del excel en el inciso a): 0.0662035

Entonces, con un 95% de confianza, se tiene que el verdadero valor B2 se encuentra en el intervalo
LSC LIC
32.628445 1.7812452
𝑏_3±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b3=

Si se establece un intervalo de confianza al 95% para el consumo diario de petróleo, y se tiene el valor crítico:

𝑡_(0.05∕2) (5)=𝑡_0.025 (5)=2.5706


R= 11.299494
Mientras 𝑆_(𝑏_2 )= -4.707677 , el cual se obtiene del excel en el inciso a): 17.204845

Entonces, con un 95% de confianza, se tiene que el verdadero valor B2 se encuentra en el intervalo
ervalo.

ervalo

ervalo

También podría gustarte