Serie Prueba de Hipotesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 28

UNIVERSIDAD NACIONAL AUTÓNOMA DE

MÉXICO
FACULTAD DE ESTUDIOS SUPERIORES
CUAUTITLÁN
PROBABILIDAD Y ESTADÍSTICA
INTEGRANTES DE EQUIPO:

-Castillo Gonzalez Gael Alejandro


-Cedillo Nieto Omar Miguel
-Farias Lozano Ricardo
-Ortiz Zarate Isaac Humberto
-Valero Hernandez Angel Guillermo

GRUPO: 2401
PROFESOR:
EDGAR RODRIGUEZ GALVAN

EVALUACIÓN 3: EJERCICIOS
PRUEBA DE HIPÓTESIS
PROBLEMA 1.
Se sabe que un cierto tipo de automóvil no sufre daños visibles el 25% del tiempo
en pruebas de choque a 10 mph. Se ha propuesto un diseño de defensa
modificado en un esfuerzo por incrementar este porcentaje. Sea p la proporción
de todos los choques a 10 mph con esta nueva defensa en los que no producen
daños visibles. Las hipótesis a ser tratadas son H0: p = 0.25 (ninguna mejora
contra Ha: p > 0.25. La prueba se basará en un experimento que implica n = 20
choques independientes con prototipos del nuevo diseño. Intuitivamente, H0
deberá ser rechazada si un número sustancial de los choques no muestra daños.
Considérese el siguiente procedimiento de prueba:
Estadístico de prueba: X = número de choques sin daños visibles
Región de rechazo: R8 = {8, 9, 10, . . ., 19, 20}; es decir, rechazar H0 si x ≥ 8,
donde x es el valor observado del estadístico de prueba.

Cuando H0 es verdadera, la distribución de probabilidad de X es binomial con n =


20 y p = 0.25. Entonces
α = P(error de tipo I) = P(H0 es rechazada cuando es verdadera)
= P(X ≥ 8 cuando X ~ Bin(20, 0.25)) = 1 – B(7; 20, 0.25)
= 1 — 0.898 = 0.102
β(0.3) = P(error de tipo II cuando p = 0.3)
= P(H0 no es rechazada cuando es falsa porque p = 0.3)
= P(X ≤ 7 cuando X ~ Bin(20, 0.3)) = B(7; 20, 0.3) = 0.772
Cuando p es en realidad 0.3 y no 0.25 (un “pequeño” alejamiento de H0),
¡aproximadamente el 77% de todos los experimentos de este tipo darían por resultado
que H0 fuera incorrectamente rechazada!

La tabla adjunta muestra β para valores seleccionados de p (cada uno calculado para la
región de rechazo R
p 0.3 0.4 0.5 0.6 0.7 0.8
β( p) 0.772 0.416 0.132 0.021 0.001 0.00
00
PROBLEMA 2

En el Ejemplo 20 del Capítulo 4, se planteó el caso de una empresa productora de


automóviles que debía reducir la emisión de dióxido de carbono (CO2) de los coches
que produce, debido a una nueva legislación por parte del gobierno: la emisión debe ser
de cómo máximo de 140 gramos por kilómetro al finalizar el corriente año. Al finalizar el
año, el gobierno tomó una muestra de 20 coches de la fábrica y observó una media de
143 g/km. y un desvío estándar de 5 g/km. Se supone que la emisión de CO2 sigue una
distribución Normal. En el ejemplo mencionado, se calculó la probabilidad de que la
media
muestral sea 143, siendo la media real 140.

Ese procedimiento es un tanto rudimentario, y se realizó únicamente para presentar la


distribución de muestreo. Lo más natural sería formular una prueba de hipótesis que
testee si la media realmente es 140 g/km. Por lo tanto, las hipótesis nula y alternativa
serían:
H0: µ=140
H1: µ>140
Utilizando lo expuesto en esta sección, y suponiendo que el test se realiza al 95%,
tenemos que
𝑆
VC= µ+t19;0.95×
𝑁
5
=140+1,729×
20
=141.93
Si X̅ supera ese valor, se rechazará la hipótesis nula. Como el valor observado es de
143, se rechaza la hipótesis de que la emisión es de 140 g/km. Y se concluye que la
empresa no cumplió con el requisito.
PROBLEMA 3
Una ONG desea comparar si el ingreso medio de dos ciudades es igual. Se supone
que la distribución
de los ingresos es Normal, y que los desvíos son sX = 600 y sY = 750. Para realizar el
estudio se
realizará una prueba de hipótesis con a = 0, 05. Si los datos obtenidos del proceso de
muestreo son los siguientes, ¿a qué conclusión se llega?

Ciudad X Ciudad Y

nX = 60 nY = 70
𝑥=2100 𝑦= 1850

Expresando en términos estadísticos lo enunciado, tenemos que:


H0: µX - µY = 0
H1: µX - µY ≠ 0
Los valores críticos para la prueba:
VC1=C0-Z0.975 σ2𝐴/𝑛 + σ2𝐵/𝑚 VCD= C0+Z0.975 2 2
σ𝐴/𝑛 + σ𝐵/𝑚
2 2 2 2
600 750 600 750
=0-1.96× 60
+ 70
=0+1.96× 60
+ 70
=-232.20 =232.50

Calculando X̅- 𝑌=2100 -1850 =250 , obtenemos que la diferencia entre las medias
muestrales excede el valor crítico superior y, por lo tanto, no se acepta la hipótesis nula.
PROBLEMA 4

Calculando la varianza común, tenemos que:

≅647. 43

Los valores críticos de la distribución t-Student son:


Tn+m-2;1-α/2=t128;0.975=1.6568 y -t128;0.975=-1.36568
Si calculamos el estadístico para realizar la prueba, tenemos que:

Siendo este valor superior al VC superior de la variable t, no se acepta la hipótesis nula.


Problema 5
Si un candidato cree que ganará las próximas elecciones obteniendo aproximadamente el
50% de los votos (con el 45% se asegura no tener que ir a ballotage). Por lo tanto, ya que
el interés radica en encontrar evidencia suficiente para negar su creencia de que ganará,
sus hipótesis nula y alternativa serán:

Suponga que se realizará la prueba de hipótesis con nivel de significación del 5%


(probabilidad de error de Tipo I) y que para realizar la prueba se tomará una muestra de
500 personas. Entonces, utilizando lo expuesto en esta sección, podemos hallar el VC y
construir la regla de decisión: El valor crítico, al tratarse de una prueba unilateral inferior
es:

Por lo tanto, si más del 46,3% de los encuestados está a favor del candidato, no se podrá
rechazar la hipótesis nula, mientras que en caso contrario se rechazará la misma
concluyendo que la evidencia muestral rechaza la hipótesis de que el candidato ganará
con el 50%.
Porcentaje crítico en cantidad de personas= 0, 463×500=231, 61

Por lo tanto, si 232 personas o más favorecen al candidató, no se podrá rechazar la


hipótesis nula.
ESTIMACIONES
Problema 1
Un fabricante automotriz ha producido un nuevo tipo de defensa, la que se presume
absorbe impactos con menos daño que las defensas previas. El fabricante ha utilizado
esta defensa en una secuencia de 25 choques controlados con un muro, cada uno a 10
mph, utilizando uno de sus modelos de carro compacto. Sea X = el número de choques
que no provocaron daños visibles al automóvil. El parámetro que tiene que ser estimado
es p = la proporción de todos los choques que no provocaron daños [alternativamente, p =
P (ningún daño en un choque)]. Si se observa que X es x = 15, el estimador y
estimaciones más razonables son
𝑋 15
Estimación = 𝑛 = 25
= 0. 60

Problema 2
En el futuro inmediato habrá un creciente interés por desarrollar aleaciones de Mg de bajo
costo para varios procesos de fundición. Es por consiguiente importante contar con
formas prácticas de determinar varias propiedades mecánicas de esas aleaciones. El
artículo “On the Development of a New Approach for the Determination of Yield Strength in
Mg-based Alloys” (Light Metal Age, octubre de 1998: 50-53) propuso un método
ultrasónico para este propósito. Considere la siguiente muestra de observaciones de
módulo elástico (GPa) de especímenes de aleación AZ91D tomados de un proceso de
fundición a troquel:
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
La estimación correspondiente es:

La estimación de σ sería entonces σˆ = s = = √0.25125= 0.501.

2
^2 Σ(𝑋𝑖−𝑥) 1.75875
σ = 𝑛
estimación = 8
= 0. 220
Problema 3
Una muestra de cinco medidas del diámetro de una esfera se registró como 6.33, 6.37,
6.36, 6.32 y 6.37 centímetros. Determinar unas estimas insesgadas y eficientes de (a) la
verdadera media, (b) la verdadera varianza
(a) Estima insesgada y eficiente de la verdadera media (es decir, de la media
poblacional).
Σ𝑥 6.33+6.37+6.36+6.32+6.37
𝑥= 𝑛
= 5
= 6. 35

(b) Estima insesgada y eficiente de la verdadera varianza (es decir, de la varianza


poblacional)
^2 𝑛 2
2
Σ(𝑥−𝑥)
𝑠 = 𝑛−1
𝑠 = 𝑛−1

2 2 2 2 2
(6.33−6.35) +(6.37−6.35) +(6.36−6.35) +(6.32−6.35) +(6.37−6.35)
= 5−1

2
=0.00055c𝑚
^
𝑠 = 0. 00055 = 0. 023
Problema 4
Se sometió a prueba un grupo de camiones ligeros con motores que utilizan diésel como
combustible para saber si la humedad, la temperatura del aire y la presión barométrica
influyen en la cantidad de óxido nitroso que emiten (en ppm). Las emisiones se midieron
en distintos momentos y en diversas condiciones experimentales. Los datos se presentan
en la tabla 12.1
Ajuste este modelo de regresión lineal múltiple a los datos con los que cuenta y luego
estime la cantidad de óxido nitroso que emiten los camiones en las siguientes
condiciones: 50% de humedad, tem

peratura de 76˚F y una presión barométrica de 29.30.

La solución del conjunto de las ecuaciones de estimación produce los estimadores únicos
b0= −3.507778, b1 = −0.002625, b2 = 0.000799, b3 = 0.154155.

Por lo tanto, la ecuación de regresión es:


^
𝑦= −3.507778 − 0.002625x1 + 0 .000799x2 + 0.154155x3.

Para 50% de humedad, una temperatura de 76˚F y una presión barométrica de 29.30, la
cantidad estimada de óxido nitroso emitido es:
^
𝑦=−3.507778 − 0.002625(50.0) + 0 .000799(76.0) + 0 .1541553(29.30)

= 0.9384 ppm.
Problema 5
Una receta de muffins de calabacín afirma que produce 12 magdalenas, con 250 calorías
por muffins. En cambio, decides hacer mini-muffins, y la receta rinde 20 magdalenas. Si
comes 4, ¿cuántas calorías vas a consumir?
250𝑐𝑎𝑙
12muffins× 𝑚𝑢𝑓𝑓𝑖𝑛
= 3000𝑐𝑎𝑙
3000𝑐𝑎𝑙
20𝑚𝑖𝑛𝑖−𝑚𝑢𝑓𝑖𝑛
= 150𝑐𝑎𝑙

150𝑐𝑎𝑙
4𝑚𝑖𝑛𝑖 − 𝑚𝑢𝑓𝑖𝑛 × 𝑚𝑖𝑛𝑖−𝑚𝑢𝑓𝑖𝑛
= 600𝑐𝑎𝑙
MUESTREO.
Problema 1

Se tienen las estaturas de 3000 estudiantes varones de una universidad, están


distribuidas normalmente, con media de 68.0 pulgadas y desviación estándar de 3.0
pulgadas. Si se toman 80 muestras cada una de 25 estudiantes.

¿En cuantas muestras del problema 5.3 puede esperarse que la media a) este entre 66.8
y 68.3 pulgadas, b) sea menor a 66.4 pulgadas?

𝑥−µ𝑥 𝑥−68.8
La media de una muestra en unidades estándar está dada por Z= σ𝑥
= 0.6

a) 66.8 en unidades estándar = (66.8-68.0)/0.6= -2.0

68.3 en unidades estándar = (68.3-68.0)/0.6 = 0.5

Proporción de muestras cuyas medias están entre 66.8 y 68.3 pulgadas

=(área bajo la curva normal entre z= -2.0 y z= 0.5)

=(área entre z = -2 y z= 0) + (área entre z= 0 y z= 0.5)

= 0.4772 + 0.1915= 0.6687

Entonces, la cantidad esperada de muestras= (80)(0.6687) o 53 .

b) 66.4 en unidades estándar= (66.4- 68.0/0.6 = -2.67)

Proporción de muestras cuyas medias son menores a 66.4 pulgadas

= (área bajo la curva normal a la izquierda de z= -2.67)

=(área a la izquierda de z = 0) – (área entre z= -2.67 y z= 0)


= 0.5 – 0.4962 = 0.0038

Entonces, la cantidad esperada de muestras = (80)(0.0038) = 0.304 o cero.


Problema 2

La resistencia a la rotura X de cierto remache que se utiliza en el motor de una máquina


tiene una media de 5000 psi y una desviación estándar de 400 psi. Se toma una muestra
aleatoria de 36 remaches. Considere la distribución de Xˉ , la media muestral de la
resistencia a la rotura.
a) ¿Cuál es la probabilidad de que la media de la muestra caiga entre 4800 psi y 5200
psi?
b) ¿Qué muestra n sería necesaria para tener P(4900 < X¯ < 5100) = 0.99?
Datos:
μ=5000 psi
σ=400 psi
n=36 remaches
a) Probabilidad de que la media de la muestra caiga entre 4800 psi y 5200 psi
σ 400
Desviación estándar σ𝑥 = = = 66. 6667 𝑝𝑠𝑖
𝑛 36

Calculamos los valores 𝑧 correspondientes a 4800 psi y 5200 psi:


4800−5000
𝑧1 = 66.6667
=− 3. 0000

5200−5000
𝑧2 = 66.6667
= 3. 0000

Buscamos estas probabilidades en la tabla de la distribución normal estándar 𝑁(0,1):


P(Z<−3.00)=0.0013
Entonces, la probabilidad de que la media muestral caiga entre 4800 psi y 5200 psi es:
P(4800<Xˉ<5200)=P(−3.00<Z<3.00)=0.9987−0.0013=0.9974≈99.7400%
b) Tamaño de muestra necesario para 𝑃(4900<𝑋ˉ<5100)=0.99
400
Usamos 𝜇=5000 y definimos los valores 𝑧 para los límites deseados con σ𝑥 =
𝑛

4900−5000 5100−5000
𝑃( σ𝑥
<𝑍< σ𝑥
) = 0. 99

−100 100
𝑃( σ𝑥
<𝑍< σ𝑥
) = 0. 99

El valor 𝑧 correspondiente a una probabilidad acumulada de 0.995 (porque 0.99/2=0.495 a


cada lado del centro de la distribución) es aproximadamente 2.575:
100 100
σ𝑥
= 2. 575; 2.575
= σ𝑥

σ𝑥 = 38. 8350 𝑝𝑠𝑖


Entonces:
400
σ𝑥 =
𝑛

400
𝑛= 38.8350
= 10. 3000

𝑛 = 106. 0900≈106 remaches


Problema 3
8.13 Los baleros de rodamiento de cierta marca pesan 0.50 g con una desviación
estándar de 0.02 g. ¿Cuál es la probabilidad de que dos lotes, de 1 000 baleros cada uno,
difieran en su peso por más de 2 g?
Solución.
Sean x ̅_1 y x ̅_2 los pesos medios de los baleros de los dos lotes. Entonces

µ𝑥1 − 𝑥2 = µ𝑥1 − µ𝑥2 = 0. 50 − 0. 50 = 0

σ1² σ2² (0.02)² (0.02)²


Y σ𝑥1 − 𝑥2 = 𝑁1
+ 𝑁2
= 1000
+ 1000
= 0. 000895

La variable estandarizada para la diferencia de medias es


(𝑥1−𝑥2)−0
𝑧= 0.000895

Y está distribuida casi normalmente.


Una diferencia de 2 g en los lotes es equivalente a una diferencia de 2/1000= 0.002 g en
las medias. Esto puede ocurrir si 𝑥1 − 𝑥2 ≥ 0. 002 𝑜 𝑥1 − 𝑥2 ≤− 0. 002; es decir

0.002−0 −0.002−0
𝑧≥ 0.000895
= 2. 23 𝑜 𝑧 ≤ 0.000895
=− 2. 23

Entonces Pr{z ≥ 2.23 o z ≤ -2.23 } = Pr{ z ≥ 2.23} + Pr{ z ≤ -2.23 } = 2(0.5000 – 0.4871) =
0.0258.
Problema 4
Quinientos balines tienen un peso medio de 5.02 onzas y una desviación estándar de 0.30
onzas. Encontrar la probabilidad de que una muestra aleatoria de 100 balines tomada de
este grupo tenga un peso combinado

a) entre 496 y 500 onzas

b) más de 510 onzas

En la distribución muestral de las medias, µ𝑥 = µ = 5.02 onzas.

σ 𝑁−𝑛 0.30 500−100


σ𝑥 = 𝑁−1
= 500−1
= 0. 027
𝑛 100

a) El peso combinado de los 100 balines estará entre 496 y 500 onzas si el peso medio
de los 100 balines está entre 4.96 y 5.00 onzas (figura 5-4).

4.96−5.02
4.96 en unidades estándar = 0.027
=− 2. 22

5.00−5.02
5.00 en unidades estándar = 0.027
=− 0. 74

Probabilidad que buscamos


= (área entre z = -2.22 y z = -0.74)
= (área entre z= -2.22 y z = 0) – (área entre z = -0.74 y z = 0)
= 0.4868 – 0.2704 = 0.2164

b) El peso combinado que excederá 510 onzas si el peso medio de los 100 balines
excede 5.10 onzas (figura 5-5).
5.10−5.02
5.10 en unidades estándar = 0.027
= 2. 96

Probabilidad que buscamos


= (área a la derecha de z = 2.96)
= (área a la derecha de z= 0) – (área entre z = 0 y z = 2.96)
= 0.5 – 0.4985 = 0.0015

Solo hay 3 posibilidades en 2000 de extraer una muestra de 100 balines con un peso
combinado que exceda las 510 onzas.
Problema 5
A y B juegan "caras y cruces", lanzando cada quien 50 monedas. A ganará el juego si
lanza 5 o más caras que B, de otra manera B gana. Determine las posibilidades en contra
de que A gane cualquier juego en particular.

Solución.
Sean PA y PB la proporción de caras obtenidas por A y por B. Si considera que ninguna de las
monedas está cargada, la probabilidad p de obtener cara es 1/2. Entonces

µ𝑃𝐴−𝑃𝐵 = µ𝑃𝐴−µ𝐵 = 0

1 1
𝑝𝑞 𝑝𝑞 2( 2 )( 2 )
σ𝑃𝐴−𝑃𝐵 = σ²𝑃𝐴 − σ²𝑃𝐵 = 𝑁𝐴
+ 𝑁𝐵
= 50
= 0. 10

La variable estandarizada para la diferencia en proporciones es z=(PA-PB- 0)/0.10.


Considerando una variable continua, 5 o más caras significan 4.5 o más caras, de tal
manera que la diferencia en proporciones debe ser 4.5/50 = 0.09 0 más; es decir, z es
mayor o igual a (0.09 - 0)/0.10 = 0.9 (o z ≥ 0.9). La probabilidad de esto es el área bajo la
curva normal a la derecha de: z=0.9, que es (0.5000 - 0.3159) = 0.1841.
Por lo tanto, las probabilidades en contra de que A gane son (1 - 0.1841) : 0.1841 =
0.8159 : 0.1841 o 4.43 a 1.
REGRESION Y CORRELACION LINEAL

Problema 1
a)Construya una línea recta que se aproxime a los datos de la tabla 13-1.
b) Encuentre una ecuación para esta recta

Tabla 13-1

X 2 3 5 7 9 10

Y 1 3 7 11 15 17
SOLUCIÓN
a) Grafique los puntos (2, 1), (3, 3), (5, 7), (7, 11), (9, 15) y (10, 17) en un sistema rectangular de
coordenadas, como se muestra en la figura 13-4. Está claro en tal figura que todos los puntos se
encuentran en una línea recta; por lo tanto, una línea recta se ajusta a los datos exactamente.

b)Para determinar la ecuación de la recta dada por


𝑌 = 𝑎0 + 𝑎1𝑋
solo se necesitan dos puntos.Elija los puntos (2, 1) y (3, 3), por ejemplo. Para el punto (2, 1), X=2 y
Y=1; sustituyendo estos valores en la ecuación anterior resulta
1 = 𝑎0 + 2𝑎1…………….(1)
De manera similar, para el punto (3, 3), X=3 y Y=3; sustituyendo estos valores en la misma ecuación
resulta
3 = 𝑎0 + 3𝑎1…………….(2)
Resolviendo las ecuaciones (1) y (2) simultáneamente, a0=-3 y a1=2, la ecuación requerida es:
𝑌 =− 3 + 2𝑋 𝑜 𝑌 = 2𝑋 − 3
Para verificar, se puede mostrar que los puntos (5, 7), (7, 11), (9, 15) y (10, 17) también se
encuentran en la recta.
PROBLEMA 2
a) muestre que la ecuación de una recta que pasa por los puntos (𝑋1, 𝑌1) 𝑦 (𝑋2, 𝑌2) está dada
por:
𝑌2−𝑌1
𝑌 − 𝑌1 = 𝑋1−𝑋1
(𝑋 − 𝑋1)

b) Encuentre la ecuación de una recta que pasa por los puntos (2, -3) y (4, -5)
Solución:
a) La ecuación de una recta es

𝑌 = 𝑎0 + 𝑎1𝑋…………………..(29)
Dado que (𝑋1, 𝑌1) está en la recta,

𝑌1 = 𝑎0 + 𝑎1𝑋1…………………(30)
Dado que (𝑋2, 𝑌2) está en la recta,

𝑌2 = 𝑎0 + 𝑎1𝑋2…………………(31)
Restando la ecuación (30) de la (29),

𝑌 − 𝑌1 = 𝑎1(𝑋 − 𝑋1)............. (32)

Restando la ecuación (30) de la (31),


𝑌2−𝑌1
𝑌2 − 𝑌1 = 𝑎1(𝑋2 − 𝑋1) o 𝑎1 = 𝑋2−𝑋1

Sustituyendo este valor de a1 en la ecuación (32) se obtiene


𝑌2−𝑌1
𝑌 − 𝑌1 = 𝑋1−𝑋1
(𝑋 − 𝑋1)

como se requirió, La cantidad


𝑌2−𝑌1
𝑋1−𝑋1

que suele abreviarse como m, representa el cambio en Y, dividido entre el cambio


correspondiente en X y es la pendiente de la línea. La ecuación requerida puede escribirse
𝑌 − 𝑌1 = 𝑚(𝑋 − 𝑋1)

b) Primer método (usando el resultado del inciso a)

Correspondiente al primer punto (2, -3) se tiene 𝑋1 = 2 y 𝑌1 =− 3; correspondiente al


segundo punto (4, 5), se tiene 𝑋2 = 4 y 𝑌2 = 5. Por lo tanto la pendiente es
𝑌2−𝑌1 5−(−3) 8
𝑋1−𝑋1
= 4−2
= 2
=4

y la ecuación requerida es

𝑌 − 𝑌1 = 𝑚(𝑋 − 𝑋1) 𝑜 𝑌 − (− 3) = 4(𝑋 − 2)

que puede escribirse Y+3=4(X-2) o Y=4X-11

Segundo método
La ecuación de la recta es 𝑌 = 𝑎0 + 𝑎1𝑋. Dado que el punto (2, -3) está en la recta
− 3 = 𝑎0 + 2𝑎1 y que el punto (4, 5) está en la recta 5 = 𝑎0 + 4𝑎1resolviendo estas dos
ecuaciones simultáneamente se obtiene a1=4 y a0=-11. Entonces la ecuación requerida es

Y=-11+4X o Y=4X-11
PROBLEMA 3
14.1 La tabla 14-1 muestra las estaturas X y Y respectivas, en pulgadas (pulg), de una muestra
de 12 padres y sus hijos mayores.

a) Construya un diagrama de dispersión.


b) Calcule la recta de regresión de mínimos cuadrados de Y sobre X.
c) Determine la recta de regresión de mínimos cuadrados de X sobre Y.

TABLA 14.1

Estatura X del padre 65 63 67 64 68 62 70 66 68 67 69 71


(plg)

Estatura Y del hijo 68 66 68 65 69 66 68 65 71 67 68 70


(pulg)

SOLUCIÓN

a) El diagrama de dispersión se obtiene graficando los puntos (X, Y) en un sistema rectangular


de coordenadas, como se muestra en la figura 14-2.

b) La recta de regresión de Y sobre X está dada por 𝑌 = 𝑎0 + 𝑎1𝑋, donde 𝑎0 𝑦 𝑎1 se obtienen


resolviendo las ecuaciones normales

Σ 𝑌 = 𝑎0𝑁 + 𝑎1Σ 𝑋

2
Σ 𝑋𝑌 = 𝑎0Σ 𝑋 + 𝑎1Σ 𝑋

Las sumas se presentan en la tabla 14-2, de donde las ecuaciones normales se convierten en
12𝑎0 + 800𝑎1 = 811

800𝑎0 + 53418𝑎1 = 54107

de estas se encuentran que 𝑎0 = 35. 82 𝑦 𝑎1 = 0. 476, por lo tanto, Y=35.82 + 0.476X. La gráfica
de esta ecuación se muestra en la siguiente imagen.

Otro método
2
(Σ𝑌)(Σ𝑋 )−(Σ𝑋)(Σ𝑋𝑌)
𝑎0 = 2 2 = 35. 82
𝑁 Σ𝑋 −(Σ𝑋)

𝑁 Σ𝑋𝑌−(Σ𝑋)(Σ𝑌)
𝑎1 = 2 2 = 0. 476
𝑁 Σ𝑋 −(Σ𝑋)

c) La recta de regresión de X sobre Y está dada por 𝑋 = 𝑏0 + 𝑏1𝑌, donde b0 y b1 se obtienen


resolviendo las ecuaciones normales

Σ𝑋 = 𝑏0𝑁 + 𝑏1Σ𝑌

2
Σ𝑋𝑌 = 𝑏0Σ𝑌 + 𝑏1Σ𝑌

Usando las sumas de las tabla 14-2, estas se convierten en

12𝑏0 + 811𝑏1 = 800

811𝑏0 + 54849𝑏1 = 54107

de donde se encuentra que b0=-3.38 y b1=1.036; por lo tanto, X=-3.38+1.036Y


Problema 4:
Una compañía local de energía seleccionó una residencia típica para desarrollar un modelo
empírico para el consumo de energía (en kilowatts por día) como una función de la
temperatura promedio diaria durante los meses de invierno.Se obtuvo la siguiente
información durante un periodo de 15 días.
a) Grafique los datos. ¿Sugiere la gráfica una asociación lineal?
b) Para un modelo lineal simple, obténgase la ecuación estimada de regresión y grafique sobre
la gráfica de la parte a

Consumo en energía (kW) Temperatura (C)

70 0

57 8

60 7.5

63 13.5

57 14

66 8.5

67 4.5

107 -11

96 -7.5 SOLUCIÓN:
a) Graficar los datos: Primero,
88 -8.5
graficamos los puntos en un
80 1.5 gráfico de dispersión. La
temperatura (𝑥) estará en el
64 0.5 eje horizontal y el consumo de
energía (𝑦) en el eje vertical.
79 2
b) Calcular la ecuación de
82 -6 regresión lineal
97 -4 Para calcular la ecuación de
regresión lineal 𝑦 = 𝑎 + 𝑏𝑥,
primero necesitamos encontrar los valores de las sumas necesarias.
Paso 1: Calcular las sumas necesarias
∑x= 0+8+7.7+13.5+14+8.5+4.5-11-7.5-8.5+1.5+0.5+2-6-4=22
∑y= 70+57+60+63+57+66+67+107+96+88+80+64+79+82+97=1133
∑x^2= 0^2+8^2+7.7^2+13.5^2+14^2+8.5^2+4.5^2-11^2-7.5^2-8.5^2+1.5^2+0.5^2
+2^2-6^2-4^2=701.25
∑xy= (0⋅70)+(8⋅57)+(7.5⋅60)+(13.5⋅63)+(14⋅57)+(8.5⋅66)+(4.5⋅67)+(−11⋅107)+
(−7.5⋅96)+(−8.5⋅88)+(1.5⋅80)+(0.5⋅64)+(2⋅79)+(−6⋅82)+(−4⋅97)=−411.25
Paso 2: Calcular la pendiente b y la ordenada al origen a
𝑛(Σ𝑥𝑦)−(Σ𝑥)(Σ𝑦) 15(−411.25)−(22)(1133) −31094.75
𝑏= 2 2 = 2 = 10034.75
≈− 3. 10
𝑛 (Σ𝑥) −(Σ𝑥) 15(701.15) −(22)

𝑛(Σ𝑥𝑦)−(Σ𝑥)(Σ𝑦) 1133(701.25)−(22)(−411.25) 804733.75


𝑎= 2 2 = 2 = 10034.75
≈ 80. 19
𝑛 (Σ𝑥) −(Σ𝑥) 15(701.25) −(22)

Ecuación de regresión lineal

La ecuación de regresión lineal es: 𝑦 = 80.19 − 3.10𝑥

Paso 3: Graficar la ecuación de regresión. En el gráfico de dispersión que ya realizamos,


trazamos la línea de regresión usando la ecuación 𝑦 = 80.19 − 3.10x

Interpretación
La pendiente negativa indica que, a medida que la temperatura aumenta, el consumo de
energía disminuye. Este resultado es lógico ya que durante los meses de invierno, se consume
más energía cuando hace más frío (menor temperatura).
PROBLEMA 5

Calcule el coeficiente de correlación lineal entre las variables X y Y presentadas en la tabla


14-7.

TABLA 14-7

X 1 3 4 6 8 9 11 14

Y 1 2 4 4 5 7 8 9

SOLUCIÓN
El procedimiento para el cálculo puede organizarse como en la tabla 14-8
Σ𝑥𝑦 84
𝑟= = = 0. 977
(Σ𝑥²)(Σ𝑦²) (132)(56)

Esto muestra que existe una muy alta correlación lineal entre las variables, como ya se
observó en los problemas 13.8 y 13.12.

X Y 𝑥 = 𝑋 −𝑋 𝑦 = 𝑌 −𝑌 x² xy y²

1 1 -6 -4 36 24 16

3 2 -4 -3 16 12 9

4 4 -3 -1 9 3 1

6 4 -1 -1 1 1 1

8 5 1 0 1 0 0

9 7 2 2 4 4 4

11 8 4 3 16 12 9

14 9 7 4 49 28 16

Σ𝑋 = 56 Σ𝑌 = 40 Σ𝑥² = 132 Σ𝑥𝑦 = 84 Σ𝑦² = 56


𝑋=56/8=7 𝑌=40/8=7
Referencias
PRUEBA DE HIPOTESIS
1. Pag 288 del libro Devore, J. L. (2010). Probabilidad y estadística para ingeniería y
ciencias. 7e.

2. Pag 178 del libro Bacchini, R. D., Vázquez, L. V., Bianco, M. J., & Casparri, M. T.
(2018). Introducción a la Probabilidad y a la Estadística. Facultad de Ciencias
Económicas, Universidad de Buenos Aires.
http://bibliotecadigital.econ.uba.ar/download/libros/Bacchini_Introduccion-a-la-probabi
lidad-y-a-la-estadistica-2018.pdf

3. Pag 180 del libro Bacchini, R. D., Vázquez, L. V., Bianco, M. J., & Casparri, M. T.
(2018). Introducción a la Probabilidad y a la Estadística. Facultad de Ciencias
Económicas, Universidad de Buenos Aires.
http://bibliotecadigital.econ.uba.ar/download/libros/Bacchini_Introduccion-a-la-probabi
lidad-y-a-la-estadistica-2018.pdf

4. Pag 181 del libro Bacchini, R. D., Vázquez, L. V., Bianco, M. J., & Casparri, M. T.
(2018). Introducción a la Probabilidad y a la Estadística. Facultad de Ciencias
Económicas, Universidad de Buenos Aires.
http://bibliotecadigital.econ.uba.ar/download/libros/Bacchini_Introduccion-a-la-probabi
lidad-y-a-la-estadistica-2018.pdf

5. Pag 182 del libro Bacchini, R. D., Vázquez, L. V., Bianco, M. J., & Casparri, M. T.
(2018). Introducción a la Probabilidad y a la Estadística. Facultad de Ciencias
Económicas, Universidad de Buenos Aires.
http://bibliotecadigital.econ.uba.ar/download/libros/Bacchini_Introduccion-a-la-probabi
lidad-y-a-la-estadistica-2018.pdf

ESTIMACIÓN

1. Pag 229 del libro Devore, J. L. (2010). Probabilidad y estadística para ingeniería y
ciencias. 7e.
2. Pag 230 del libro Devore, J. L. (2010). Probabilidad y estadística para ingeniería y
ciencias. 7e.
3. Pag 199 del libro Spiegel, M. R. (1976). Teoría y problemas de probabilidad y
estadística.
4. Pág 446 del libro Walpole, R. E. (2012). Probabilidad y estadística para ingeniería
y ciencias (9a. ed.).

5. Libretexts. (2022, 2 noviembre). 1.5: Resolución de problemas y estimación.


LibreTexts Español.
https://espanol.libretexts.org/Matematicas/Matematicas_Aplicadas/Las_matematic
as_en_la_sociedad_(Lippman)/01%3A_Resoluci%C3%B3n_de_problemas/1.05%
3A_Resoluci%C3%B3n_de_problemas_y_estimaci%C3%B3n

MUESTREO

1. Del libro Spiegel, M. Schiller,. J ., & Srinivasan, R. (2013).Probabilidad y


estadistica (4ª ed). The McGraw-Hill/ Companies, Inc.

2. Pag. 261 del libro Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2012).
Probabilidad y estadística para ingeniería y ciencias (9ª ed.). Pearson Educación.

3. Del libro Spiegel, M. Schiller,. J ., & Srinivasan, R. (2013).Probabilidad y estadistica


(4ª ed). The McGraw-Hill/ Companies, Inc.

4. Pag. 190 del libro Spiegel, M., & Stephens, L. Estadística (3ª ed). The McGraw-Hill.

5. Pag. 197 del libro Spiegel, M., & Stephens, L. Estadística (3ª ed). The McGraw-Hill.

REGRESIÓN Y CORRELACIÓN LINEAL

1. Pag. 289 del libro Murray, R. S., Larry, J. S.(2001). Estadística. 3ra edición

2. Pag. 291 del libro Murray, R. S., Larry, J. S.(2001). Estadística. 3ra edición

3. Pag. 322 del libro Murray, R. S., Larry, J. S.(2001). Estadística. 3ra edición

4. Pag. 491 del libro Canavos, C. George (1988). Probabilidad y estadística


Aplicaciones y métodos. Mc Graw Hill. 1ra edición.

5. Pag 329 del libro Murray, R. S., Larry, J. S.(2001). Estadística. 3ra edición

También podría gustarte