2020 Estimación de Parametros y Pruebas de Hipotesis
2020 Estimación de Parametros y Pruebas de Hipotesis
2020 Estimación de Parametros y Pruebas de Hipotesis
Estimación de parámetros
Pruebas de hipótesis
Conceptos
Procedimientos
Aplicaciones
Año 2020
Carlos Garibaldi
Estimación de parámetros
La estimación de parámetros es un procedimiento que utiliza resultados de una
muestra para estimar o sacar conclusiones de parámetros de una población
Cada parámetro θ tiene su mejor estimador 𝜃̂. En la tabla se presentan los parámetros
con sus correspondientes estimadores.
σ2 S2
σ S
Por lo tanto
x−
P (- Z/2 < < Z/2 ) = 1-
n
1-
/2 /2
-Z/2 0 Z/2 Z
Hay que tener en cuenta que los intervalos de confianza no están centrados en , están
centrados en la media de la muestra
n n
3250 – 1,96
31,62 < < 3250 + 1,96
31,62
50 50
[3241,23 ; 3258,76]
Entonces, se estima que la resistencia media a la compresión está entre 3241,23 y 3258,76
psi.
Cerca del 95% de las veces que calculemos una media muestral, ésta se encontrará dentro
del intervalo, un 5% no. Las veces se refiere a todas las veces que se realice un muestreo
aleatorio y se calcule el intervalo.
Confiamos que el intervalo elegido sea uno de los “buenos” y no uno “malo” porque estos son
sólo el 5%. Pero, no podemos saber si μ pertenece al intervalo particular que construimos
Si se utiliza x como una estimación de se puede tener una confianza de (1-) 100
% de que el error no excederá una magnitud específica e, cuando el tamaño de la
muestra es:
𝑍2 𝛼/2 𝜎 2
n= 𝑒2
Ejemplo Para el ejemplo anterior de la compresión de concreto, ¿qué tan grande debe ser
la muestra? si se quiere trabajar con una confianza del 95 % y el error de estimación no
debe superar 5 psi
𝑍 2 𝛼/2 𝜎 2
n=
𝑒2
n=
1,962 x31,622
52
n = 154
𝑛0
n= 𝑛0 +(𝑁−1) ; n0 es el tamaño de muestra de la primera etapa
𝑁
Z Riesgo Confianza
Crece Disminuye Crece
Decrece Crece Decrece
Sea x una variable aleatoria con media desconocida y varianza desconocida 2 puede
obtenerse un intervalo de confianza de 100 (1-) por ciento, utilizando una variable
aleatoria.
x−
t=
s
n
El procedimiento es el mismo que en el caso anterior, solo que ahora se trabaja con la
variable aleatoria t
En la figura se observa una gráfica simétrica con valores t; recuerde que la curva t, es
platicúrtica, es decir que es más aplanada que la curva normal
1-
/2 /2
-t/2 0 t/2 t
Por lo tanto
Ejemplo Suponga que el ingeniero no cuenta con la 2 y toma una muestra aleatoria de 20
especímenes, en ella, obtiene una resistencia media a la compresión de 3250 psi y una varianza de
800. El intervalo de confianza del 95 % es:
s s
x - t
/2 < < x + t /2
n n
3250 – 2,093
28,28 < < 3250 + 2,093
28,28
50 50
[3241,63 ; 3258,37]
GL 0,30 0,20 0,10 0.05 0,025 0,010 0,005
1 . . .
2.
.
. ‘
18
19 2,093
.
30
Donde
P ( - Z/2 < Z < Z/2 ) = 1-
Por lo tanto
x−
P (- Z/2 < < Z/2 ) = 1-
s
n
Ejemplo Suponga que el ingeniero no cuenta con la 2 . De una muestra de 50 especímenes, obtiene la
resistencia media a la compresión de 3250 psi y la varianza de 800. El intervalo de confianza del 95 %
es:
s s
x - Z
/2 < < x + Z /2
n n
3250 – 1,96
28,28 < < 3250 + 1,96
28,28
50 50
[3246,16 ; 3257,84]
Los intervalos de confianza y los límites de confianza resultantes que hasta ahora hemos
analizado en realidad son bilaterales, es decir, tienen límites superior e inferior. Sin
embargo, hay muchas aplicaciones en las que sólo se requiere un límite.
Entonces
P (- Z/2 < pˆ − P < Z/2 ) = 1-
p(1 − p)
n
Si se utiliza p̂ como una estimación de P se puede tener una confianza de (1-) 100
e = Z/2 p (1 − p )
n
o bien se puede decir que el error de estimación es la diferencia que hay entre el
estimador y el parámetro ( p̂ -P)
Ejemplo Un complejo hotelero necesita estimar el porcentaje de turistas que requerirán estadía con
pensión completa, en las próximas vacaciones invernales. Para ello utilizó información pasada, en la
cual, de 500 turistas, 100 requirieron ese tipo de pensión. Se pretende una confianza del 95 % de que
la estimación sea correcta.
[0,16 ; 0,23]
Es decir que se estima que entre el 16 % al 23 % estaría el porcentaje de turistas que utilizaría pensión
completa.
Ejemplo Para el caso anterior el tamaño de muestra que se necesita si no se quiere cometer un error
mayor a 3 % en la estimación, es:
𝑍2 𝛼/2 𝑃(1−𝑃)
n= 𝑒2
0,032
n = 683
𝑛0
n= 𝑛0 +(𝑁−1) ; n0 es el tamaño de muestra de la primera etapa
𝑁
/2
/2
X21-/2 X2/2
( n − 1) S 2 < 2 < (n − 1) S 2
X 2 / 2 X 21 − / 2
En caso de estimar la desviación estándar poblacional, se utiliza el mismo intervalo,
pero se aplica raíz cuadrada a todos los valores, quedando;
(𝑛−1).𝑠2 (𝑛−1).𝑠2
√ 2 < < √ 𝑥2
𝑥𝛼/2 1−𝛼/2
Ejemplo Los siguientes son los pesos (en gramos) de 10 alfajores de chocolate de una empresa
alimenticia: 22, 23, 25, 26, 24, 22, 23, 24, 25, y 26. Encuentre un intervalo de confianza del 95 % para
la varianza de todos los alfajores de la empresa. Suponga distribución normal.
(n − 1) S 2 (n − 1) S 2
< <
2
X 2 / 2 X 21 − / 2
9 x 2,222 9x 2,22
< 2 <
19,023 2,70
[2,33 ; 16,42]
Se presenta un extracto de la tabla chi-cuadrado
GL 0,995 0,990 0,975 0,950 0,900 0,500 0,100 0,050 0,025 0,010
1 0,000039 0,000157 0,000982 0,003932 0,015791 0,454936 2,705544 3,841459 5,023886 6,634897
2 0,010025 0,020101 0,050636 0,102587 0,210721 1,386294 4,605170 5,991465 7,377759 9,210340
3 0,071722 0,114832 0,215795 0,351846 0,584374 2,365974 6,251388 7,814728 9,348404 11,344867
4 0,206989 0,297109 0,484419 0,710723 1,063623 3,356694 7,779440 9,487729 11,143287 13,276704
5 0,411742 0,554298 0,831212 1,145476 1,610308 4,351460 9,236357 11,070498 12,832502 15,086272
6 0,675727 0,872090 1,237344 1,635383 2,204131 5,348121 10,644641 12,591587 14,449375 16,811894
7 0,989256 1,239042 1,689869 2,167350 2,833107 6,345811 12,017037 14,067140 16,012764 18,475307
8 1,344413 1,646497 2,179731 2,732637 3,489539 7,344122 13,361566 15,507313 17,534546 20,090235
9 1,734933 2,087901 2,700390 3,325113 4,168159 8,342833 14,683657 16,918978 19,022768 21,665994
10 2,155856 2,558212 3,246973 3,940299 4,865182 9,341818 15,987179 18,307038 20,483177 23,209251
1.2 Una muestra de seis empresas, arrojó la siguiente cantidad de empleados: 40, 50, 30, 100, 50, y 80
empleados respectivamente.
a. Realice una estimación puntual de la cantidad promedio verdadero de todas las empresas de la
provincia.
b. Calcule un estimador insuficiente y otro ineficiente de la cantidad promedio real.
1.3 El gerente de control de calidad de una fábrica de lámparas eléctricas desea estimar la duración promedio
de un embarque de lámparas. Se selecciona una muestra aleatoria de 64 focos, que indican una duración
promedio de 540 horas con una desviación estándar de 120 horas. Establezca una estimación con
intervalo de confianza de 95 % de la duración promedio real de los focos de este embarque.
1.4 Suponga que se desea estimar el promedio de ventas por tienda para un producto determinado de
consumo popular. Determine el intervalo de confianza del 95 % considerando que las ventas se
distribuyen aproximadamente normal. Se tomó una muestra de 25 con una media muestral de $
3.425.000. Se conoce que la desviación de todas las tiendas es $ 200.000
1.5 Una muestra aleatoria de 100 propietarios de automóviles de la ciudad de Mendoza revela que éstos
conducen su automóvil, en promedio, 2000 kilómetros por mes, con una desviación estándar de 250
kilómetros. Suponga que la distribución de las mediciones es aproximadamente normal.
a) Construya un intervalo de confianza del 99% para el número promedio de kilómetros que un
propietario de un automóvil conduce anualmente en Mendoza. b) ¿Cuál sería el error en la estimación?
1.6 Un fabricante produce anillos de pistón para un motor de automóvil. Se sabe que el diámetro de los anillos
se distribuye aproximadamente normal y con una desviación estándar de 0.001 mm. Una muestra
aleatoria de 15 anillos tiene un diámetro medio de 74.036 mm. Construya un intervalo de confianza de
dos lados del 99 % con respecto al diámetro medio de los anillos de pistón.
1.7 Una máquina produce piezas plásticas. Se toma una muestra de las piezas y los diámetros son 1.01, 0.97,
1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros. Calcule un intervalo de confianza del 99% para la
media del diámetro de las piezas. Suponga una distribución aproximadamente normal.
1.8 Se prueban 70 autos de tipo sedan y se registran los litros de nafta consumidos en un recorrido de 100
km, obteniéndose una media muestral, x=6,8 litros y un desvío estándar muestral, s=1,4 litros. Obtenga
un intervalo de aproximadamente 95% de confianza para la cantidad media de litros de nafta consumida
por ese tipo de vehículo en 100 km.
1.9 Se sabe que la vida en horas de una bombilla eléctrica de 75 watts se distribuye normal con desviación
estándar de 25 horas. Una muestra de 20 bombillas dio un promedio de vida útil de 1.014 horas.
a. Construya un intervalo de dos lados del 95 por ciento respecto a la vida media
b. Construya un intervalo de dos lados del 99 por ciento.
1.10 Una muestra aleatoria de 10 barras de cereales de cierta marca tiene, en promedio, 230 calorías por barra
y una desviación estándar de 15 calorías. Construya un intervalo de confianza del 99% para el contenido
medio verdadero de calorías de esta marca de barras. Suponga que la distribución del contenido calórico
es aproximadamente normal
1.11 Las estaturas de una muestra aleatoria de 50 futbolistas de la liga tienen una media de 178 centímetros y
una desviación estándar de 7 centímetros.
a) Construya un intervalo de confianza del 95% para la estatura media de todos los futbolistas de la liga.
b) ¿Cuántos futbolistas se deberían medir si se pretende una confianza del 99%?
1.12 El gerente de la división de lámparas para vehículos debe estimar el número promedio de horas que
durarán los focos fabricados por cada tipo de vehículo. Se toma una muestra de 40 focos de
determinada línea y el tiempo promedio de funcionamiento fue 1520 horas. Se sabe que la desviación
estándar de la duración es 30 horas. a) Calcule el error estándar de la media. b) Construya un intervalo
de confianza del 90% para la media de la población el año
1.14 Un analista desea estimar el salario diario promedio de los trabajadores de una compañía, con un
margen de error de $ 250 y una confianza del 90 %. Se estima que la desviación estándar de los
salarios no es mayor de $ 1.000 ¿cuál es el número de expedientes que deben muestrearse, como
mínimo para satisfacer este objetivo de investigación?
1.15 El análisis de gases en la sangre arterial de 10 pacientes proporcionó los siguientes valores de
Pa02 en reposo: 75, 80, 80, 74, 84, 79, 79, 88, 87, 85. Encuentre el intervalo de confianza para la
media con el 95% de confianza
1.16 Para una muestra aleatoria de 100 hogares de un área metropolitana grande, el número de hogares
en los que cuando menos un adulto está desempleado es 12. Estime el porcentaje de hogares de esa
área en los que cuando menos un adulto esté desempleado, utilizando un intervalo de confianza del
95 %.
1.17 Se realizó un muestreo aleatorio simple, de un embarque de 20.000 piezas de línea “premiun”
registrándose 15 piezas dañadas de un total de 210 observadas. Obtenga un intervalo del 95% de
confianza para estimar la verdadera proporción y a partir de él, la cantidad de piezas dañadas
1.18 Un fabricante de celulares usa una serie de pruebas. Todos los celulares deben pasar todas las
pruebas antes de que se comercialicen. De una muestra aleatoria de 1000 celulares, 30 no pasan
alguna de las pruebas. Calcule un intervalo de confianza del 95% para la proporción de los
celulares de la población que pasan todas las pruebas.
1.19 Se llevará a cabo un estudio para estimar el porcentaje de ciudadanos de las islas que están a favor
de tener un vuelo diario que lo conecte con la parte continental. ¿Qué tan grande debería ser la
muestra si se desea tener al menos 95% de confianza en que el estimado esté dentro del 1% del
porcentaje verdadero?
1.20 Un pequeño fabricante adquiere un lote de 200 partes electrónicas del “exceso de inventario” de una
empresa grande. Se encuentra que para una muestra aleatoria de 50 partes 5 de ellas tienen
defectos. Estime la proporción de todas las partes del embarque que tienen defectos, utilizando un
intervalo de confianza del 95 %.
1.22 Cine “Argentino” encuesto a 100 personas que habían visto una coproducción argentino-española
y les preguntaron si les parecía satisfactorio el nivel de los actores principales; 70 de los
encuestados, aprobaban ese nivel de los actores principales. a) Estime con un 90% de confianza la
proporción de personas que le gusta ese nivel de los actores. b) ¿Qué muestra se debería tomar si
se pretende una confianza del 99%, al mismo error?
1.23 Como supervisor del proceso de empacado de café en sobres, suponga que se toma una
muestra aleatoria de 12 de los sobres en la planta empacadora. El peso neto de los sobres de café
es el que se reporta en la tabla.
Gramos Nro. de
sobre
15.7 1
15.8 2
15.9 2
16.0 3
16.1 3
16.2 1
Determine:
a. El peso neto promedio por sobre
b. La desviación estándar muestral
c. Suponiendo que el peso del café empacado tiene distribución aproximadamente
normal, estime el peso promedio por sobre de café, utilice un intervalo de confianza del 95
%.
1.25 Para un determinado producto de consumo masivo, el promedio de ventas por expendio, el año
pasado, de acuerdo con una muestra de n = 10 tiendas fue de $ 3.425.000 con una desviación de $
200.000. Se supone que las ventas por expendio tienen una distribución normal. Estime la
desviación de las ventas de todas las tiendas, utilizando intervalo de confianza del 90 %.
1.26 En un estudio de costos del seguro de automóviles, una muestra aleatoria de 80 costos de
reparación de carrocerías para una clase particular de daños tiene una media de $ 472,36 y una
desviación estándar de $ 62,35. Si ese valor promedio se utiliza como estimación puntual del costo
de reparación medio real de esta clase de daños, ¿con qué confianza podemos afirmar que el error
no excederá de $ 10?
1.27 Si se quiere determinar la aptitud mecánica media de un gran grupo de trabajadores, ¿qué tamaño
debe tener una muestra aleatoria para asegurar con una probabilidad de 0.95 que la media
muestral no difiera de la real por más de 3.0 puntos? Supóngase que sabemos por experiencia que
la desviación poblacional es de 20.
1.28 El director administrativo de un colegio desea usar la media de una muestra aleatoria para estimar
la cantidad promedio de tiempo que tardan los alumnos en ir de una clase a la siguiente, y además
quiere poder asegurar con una confianza del 99 % que el error es a lo más 0.25 minutos. Si puede
suponerse por experiencia que la desviación real es de 1.40 minutos ¿qué tamaño debe tener la
muestra?
1.29 Una muestra aleatoria de 100 profesores en una gran ciudad revela un salario promedio de $
48700, con una desviación estándar de $ 4800, ¿con qué nivel de confianza podemos afirmar que
el salario medio semanal de todos los profesores de esa ciudad está entre $ 47200 y $ 50200?
1.30 Un distribuidor de combustible mantiene registros sobre las operaciones con sus clientes. Si una
muestra de n = 18 de estos registros indica ventas promedio de 63,84 galones de diésel, con una
desviación estándar de 2,75 galones y si utilizamos ese promedio como estimación de las ventas
medias por cliente, ¿qué podemos decir, con una confianza del 99 %, acerca del error máximo?
1.31 Una maquina produce barras que se utilizan en el tren trasero para la fabricación de una pickup. Se
selecciona una muestra aleatoria de 15 barras y se mide la longitud en centímetros. Los
datos resultantes se muestran a continuación:
82 82.6 82.4 81.9 81.4 82.5 81 80.5
80.8 80.9 81 82 82.8 82.4 82.3
Construya un intervalo de confianza de dos lados de 95 por ciento respecto a la longitud promedio
de las barras.
1.32 Se obtuvo una muestra aleatoria de 18 terminales de autoservicio y se determinó que en promedio
estaban fuera de servicio 8 minutos al día, con una desviación estándar de 0.90 minutos. Construya
un intervalo del 90% de confianza para la media poblacional
1.33 Un fabricante de calculadoras está interesado en saber la fracción de unidades defectuosas que se
producen. Una muestra aleatoria de 800 calculadoras incluye 18 defectuosas. Calcule un intervalo
de confianza del 99 por ciento respecto de la fracción de unidades defectuosas.
1.34 Debe votarse una ley provincial y el oficialismo desea encontrar la proporción de personas que
están a favor del proyecto de ley. Encuentre el tamaño de muestra requerido para estimar la
proporción verdadera dentro de 0.05 con un nivel de confianza del 95%. Suponga que no se tiene
idea de cuál es la proporción. ¿Cuál sería el cambio en el tamaño de la muestra si pensara que
cerca del 75% de las personas están a favor del proyecto?
1.35 Se lleva a cabo un estudio para determinar el porcentaje de propietarios de casa que poseen al
menos dos aparatos de televisión ¿qué tan grande debe ser la muestra si se desea tener una
confianza del 99 por ciento de que el error al estimar esta cantidad sea menor que 0.01?
1.36 En un estudio de los tiempos de circulación sanguínea en el miocardio, se obtuvieron los tiempos
de circulación aparente en una muestra de 25 pacientes con enfermedad arterial coronaria. Se
encontró que la variancia de la muestra es de 1.03. Construya intervalos de confianza del 99 % para
la varianza poblacional
Una hipótesis estadística es una aseveración o conjetura con respecto a una o más
poblaciones.
La verdad o falsedad de una hipótesis estadística, nunca se sabe con certeza, a menos
que se examine toda la población.
En su lugar, se toma una muestra aleatoria de esa población de interés y se utiliza
la información de la muestra para proporcionar evidencias que apoyen o no la
hipótesis.
La evidencia de la muestra que es consistente con la hipótesis conduce al no rechazo
de la hipótesis, mientras que si es inconsistente con la hipótesis conduce al rechazo
de esta.
Debe quedar claro que la aceptación de una hipótesis implica que los datos de la
muestra no dan la suficiente evidencia para rechazarla
Generalmente el científico se interesa en apoyar con fuerza una opinión, por lo tanto,
desea llegar a la opinión en forma de rechazo
Ejemplo Si un investigador en medicina desea mostrar fuertes evidencias a favor de que el fumar
aumenta el riesgo de contraer cáncer, la hipótesis a probar debe ser de la forma “no hay aumento en el
riesgo de contraer cáncer como producto de fumar” Como resultado, seguramente la opinión se alcanza
por medio de un rechazo
Ejemplo Nos dicen que la vida media de las computadoras es 5 años pero sospechamos que es menor.
Consideramos la afirmación: “la vida media de las computadoras es 5 años” como la hipótesis nula H0,
y a nuestra sospecha: “la vida media de las computadora es menor a 5 años” como hipótesis alternativa
(H1).
Una vez que se establecen la hipótesis nula y la alternativa, el paso siguiente consiste
en hallar la evidencia para tomar la decisión. La calidad de los datos es
fundamental; la información debe ser precisa y no tener sesgo. Una mayor precisión
se obtiene con un mayor tamaño de muestra: para evitar el sesgo los datos deben
provenir de un muestreo aleatorio simple.
Es posible establecer las siguientes reglas para decidir qué proposición se utiliza como
hipótesis nula y cual como hipótesis alternativa.
Esta es una probabilidad un poco elevada. Por supuesto, es preferible que las
probabilidades de cometer los errores tipo I y tipo II sean lo más baja posible.
Para un tamaño de muestra fijo, una disminución en la probabilidad de un error, por
lo general tiene como resultado un aumento en la probabilidad del otro error. Para
reducir ambas probabilidades se debe aumentar el tamaño de la muestra.
o Los errores tipo I y tipo II están relacionados. Cuando uno disminuye por lo
general el otro aumenta.
o El tamaño de la región crítica, probabilidad de cometer el error tipo I, siempre
se puede reducir al ajustar el o los valores críticos.
o Entre más grande sea la distancia entre el valor real y el valor hipotético, será
menor .
o Un aumento en el tamaño de la muestra reducirá y en forma simultanea
https://www.youtube.com/watch?v=5ZvKgnRVSjI
Tipos de pruebas
La hipótesis alternativa es la que determina si la prueba es de una cola o de dos colas
(una región de rechazo o doble región de rechazo)
Ejemplo. Un ingeniero asevera que el diámetro promedio de todas las piezas de un lote, es de 20 mm..
H0; = 20 mm.
H1; 20 mm. (Prueba bilateral o de dos colas)
H0; ≤ 6 mm.
H1; > 6 mm. (Prueba lateral derecha, de una sola cola)
H0; ≥ 10
H1; < 10 (Prueba lateral izquierda, de una sola cola)
Las pruebas de hipótesis se realizan para aceptar o rechazar el valor que puede
adoptar cierto parámetro en la población.
▪ H0 ; = 40.000
H1 ; 40.000
X −
Z=
n
Como la prueba es de dos colas, la región de rechazo está dividida en dos partes, es decir que
habrá dos regiones críticas
/2
/2
1 -
X*= −Z X *= + Z
n n
X * = 40000− 1,96 5000 X * = 40000+ 1,96 5000
100 100
X * = 39020 X * = 40980
Rechazar si X 39020
Rechazar si X 40980
No rechazar si 39020 X 40980
▪ Como de la muestra se obtuvo una X = 42000 kilómetros. El estadístico cae en zona de rechazo.
▪ Entonces la decisión estadística es rechazar la hipótesis nula
▪ Por lo tanto, no es correcta la aseveración del ingeniero, se rechaza que la duración promedio de
las correas es de 40.000 kilómetros
https://www.youtube.com/watch?v=QZkD1AH4dtU
Ejemplo Se quiere determinar la potencia de la prueba y la probabilidad de cometer el error tipo II, es
decir y Para ello es necesario plantea un valor específico de hipótesis alternativa, H1; = 40.700
kilómetros.
Para calcular y 1-. se utiliza el gráfico del ejemplo anterior, trasladando la línea de los puntos críticos
39020 y 40980 hasta la gráfica siguiente. Ésta última gráfica muestra la distribución considerando cierta
la media de la hipótesis alternativa, y con los puntos críticos estandarizados y transformados a Z
1-
1-
X * − 1
Z=
n
Z = 39020− 40700 = -3,36
5000
100
Entonces:
Otro método alternativo para resolver una prueba de hipótesis sería trabajar con los
valores críticos Z* de la tabla de la distribución normal estándar y luego
calcular la estadística Z, para observar en que región cae y tomar la decisión. Para el
mismo ejemplo, se tiene:
/2
/2
1 -
Z*=-1,96 0 z*=1,96
X − 42000−40000
Z= = =4
5000
√100
n
si –1,96<Z<1,96 No rechazo H0
Ejemplo En un pequeño pueblo de India, se quiere probar que la edad promedio de sus
habitantes está por encima de 70 años. La muestra de 100 habitantes arroja una edad promedio
de 71,80 años y una desviación estándar de 8,9 años. El nivel de significancia es de 0.05
H0 ; ≤ 70
H1 ; › 70
Se calcula Z= 71,80 − 70 =2,0224
8,9
100
Como se trata de una prueba lateral derecha, el área a la derecha de z= 2,0224 es P=0,0215
Al ser el valor de P=0,0215 < = 0,05 se rechaza la hipótesis nula
Cuando se quiera realizar una prueba de hipótesis para la media poblacional con
varianza poblacional desconocida, se utiliza la distribución t de student con grados
de libertad = n-1
Ejemplo Ahora presuma que, en el problema del ejemplo referido a la media de la duración de
las correas, se desconoce la desviación estándar de la población, pero se conoce la desviación de
la muestra, que es de 8000 kilómetros; y se toma una muestra de tamaño 25.
/2
/2
1 -
t*=-2,064 0 t*=2,064
X − 42000− 40000
T= = = 1,25
s 8000
n 25
https://www.youtube.com/watch?v=M2O-kWEfxYI
H0; P = 0,30
H1; P 0,30
Ejemplo Según su experiencia el ingeniero de fabrica afirma que la proporción de correas que se
rompen antes de los 40.000 kilómetros es de 0,20 . Se toma una muestra de 200 vehículos y se
encuentra que en 30 de ellos la correa se rompió antes de los 40.000 kilómetros. Trabaje con
= 0.05.
H0 ; P = 0,20
H1 ; P 0,20
El nivel de significación se fija en 0,05. Ésta es la probabilidad de cometer el error tipo I (Rechazar
la H0, cuando es cierta)
La región de rechazo está dividida en dos partes, es decir que habrá dos regiones críticas
/2
/2
1 -
p̂ * =0,145 p̂ * =0,255
P 0(1 − P 0) P 0(1 − P 0)
p̂ * = P0 - Z p̂ * = P0 + Z
n n
p̂ * = 0,145 p̂ * = 0,255
Es correcta la aseveración del ingeniero, se acepta que la proporción de correas que se rompen
antes de los 40.000 kilómetros es de 0,20
https://www.youtube.com/watch?v=ttMkW7HdIKU
https://www.youtube.com/watch?v=mm_7RuYUGdM
0 2n-1
( n − 1) s 2
2 =
02
Ejemplo Un fabricante de pilas para relojes afirma que la duración de sus pilas se distribuye en
forma aproximadamente normal, con una desviación estándar igual 1,1 años. Si una muestra
aleatoria de 10 de tales pilas tiene una desviación estándar de 1.3 años. Utilice un nivel de
significancia de 0,05 para probar la afirmación del fabricante.
▪ H0 ; 2 = 1,21
H1 ; 2 1,21
0,95
0,025 0,025
2,70 19,023
Z= ( X 1 − X 2 ) − ( 1 − 2 ) 0
12 22
( )+( )
n1 n2
• H1 ; (1 − 2 ) 0 ; (1 2 )
• H0 ; (1 − 2 ) 0 ; (1 2 )
• H0 ; (1 − 2 ) 0 ; ( 1 2 )
H1 ; ( A − B ) 0
▪ El nivel de significación es 0,05
▪ Regla de decisión :
En la mayoría de los casos, en las pruebas de dos medias, prevalece la situación que
no se conocen las desviaciones estándar de las poblaciones. Si se hacen
suposiciones de que las distribuciones son normales y que tienen la misma
desviación estándar σ1 = σ2 , se puede utilizar la prueba t combinada de dos
muestras.
( X 1 − X 2 ) − ( 1 − 2 )
t=
S p2 S p2
( )+( )
n1 n2
; donde
Ejemplo De 100 recién nacidos en una clínica de la ciudad, una muestra aleatoria de 12 nenas
tiene un peso promedio de 2,90kgs con una desviación estándar de 0,40. Una muestra aleatoria
de 10 varones tienen un peso promedio 3.150 con una desviación estándar de 0.30 Se prueba
la hipótesis de que si hay diferencias en el peso promedio de ambos sexos. Utilice el nivel de
significancia del 5%
H0 ; ( 1 − 2 ) = 0
H1 ; (1 − 2 ) ≠ 0
▪ El nivel de significación es 0,05
▪ Regla de decisión :
(11)(0.16) + (9)(0,09)
S p2 = = 0,1285
12 + 10 − 2
▪ Esto quiere decir que no se puede concluir que el desgaste promedio del
material 1 excede el del material 2 en más de dos unidades.
( X 1 − X 2 ) − ( 1 − 2 )
t*=
S12 S 22
( )+( )
n1 n2
tiene una distribución t aproximada con grados de libertad aproximados
𝑆2 𝑆 2
( 1 + 2 )2
v=
𝑛1 𝑛2
𝑆2 𝑆2
−2
( 1⁄𝑛1 )2 ( 2⁄𝑛2 )2
+
𝑛1− 1 𝑛2− 1
Ejemplo Un fabricante de televisores prueba dos tipos de microcircuitos. Se obtuvieron los datos:
Se desea probar
Ho : µ1= µ2
H1 : µ1≠µ2
https://www.youtube.com/watch?v=yGelIc-H2ng
https://www.youtube.com/watch?v=tR_8mY2OVY8
Una suposición fundamental en la que se basa este análisis consiste en que las diversas
medias muestrales se obtienen a partir de poblaciones con distribución normal y con la
misma varianza 2; aunque si las muestras son lo suficientemente grandes no se
necesita el supuesto de normalidad.
En estas pruebas se plantea como hipótesis nula que las medias poblacionales son
iguales y como hipótesis alternativa, que no todas las medias son iguales:
H0: 1 = 2 = 3 ….= k
H1: 1 , 2 , 3…., k no son todas iguales
El primer paso en el análisis de varianza indica que debemos obtener una estimación
de la varianza poblacional a partir del cálculo de la varianza entre las medias
muestrales, esta estimación se la conoce como varianza entre columnas
∑(𝑥−𝑥̅ )2
Recuerde que la varianza de la muestra es: S2 =
𝑛−1
Ahora bien, como se trabaja con medias muestrales y una gran media, al sustituir
para el cálculo de la varianza entre medias muestrales, queda:
∑(𝑥̅ −𝑥̿ )2
𝑠𝑥̅2 = ; siendo k el número de muestras
𝑘−1
∑ 𝑥̅
𝑥̿ = (gran media)
𝑛
2
Recuerde que 2𝑥̅ = 𝑛
, por lo tanto, la varianza de la población queda
2 = 2𝑥̅ . 𝑛
Como no se cuenta con toda la información para utilizar esta ecuación, y aplicando
alguna estimación, en definitiva, para obtener la estimación de la varianza entre
columnas, se utilizará esta ecuación:
∑ 𝑛𝑗 (𝑥̅𝑗 −𝑥̿ )2
̂2𝑏 =
𝑘−1
̅𝑗
𝑥 media muestral de la j-esima muestra
̿
𝑥 gran media
k número de muestras
𝑛 −1
̂2𝑤 = (𝑛𝑗−𝑘 )𝑠𝑗2
𝑡
donde ,
̂2𝑤 = varianza dentro de las muestras o dentro de columnas
𝑛𝑗 = tamaño de la j-esima muestra
Método A 15 18 19 22 11
Método B 22 27 18 21 17
Método C 18 24 19 16 22 15
En este caso, la razón para utilizar análisis de varianza es decidir si estas tres muestras (una muestra es
el pequeño grupo de estudiantes instruidos por cualquier método) se tomaron de poblaciones (una
población es el número total de estudiantes que pudieron ser instruidos por ese método) que tienen las
mismas medias.
Debido a que estamos probando la habilidad y rapidez en la resolución de problemas de acuerdo con los
tres métodos, se debe determinar si las tres muestras, representadas por las medias muestrales, 𝑥̅1 = 17,
𝑥̅2 = 21 y 𝑥̅3 x =19, pudieron haberse tomado de poblaciones con la misma media, .
Un planteamiento formal de las hipótesis nula y alternativa que deseamos probar sería:
H0: 1 = 2 = 3
H1: 1 , 2 , y 3 no son todas iguales
Para obtener la varianza entre las medias muestrales o entre columnas, se presentan cálculos y tabla:
∑ 𝑥𝑖 304
𝑥̿ = = = 19
𝑛 16
O bien
∑ 𝑥̅ 𝑗 57
𝑥̿ = = = 19
𝑘 3
n ̅
𝒙 ̿
𝒙 ̅- 𝒙̿
𝒙 (𝒙
̅ − 𝒙̿ ) 𝟐
n.(𝒙
̅ − 𝒙̿ ) 𝟐
5 17 19 17-19=-2 4 5x4=20
5 21 19 21-19=2 4 5x4=20
6 19 19 19-19=0 0 6x0=0
2
∑ n. (𝒙
̅ − 𝑥̿ ) =40
∑ 𝑛𝑗 (𝑥̅ 𝑗 −𝑥̿ )2 40
̂2𝑏 = 𝑘−1
=2 = 20
Para obtener la varianza dentro de las muestras o dentro de columnas se presentan cálculos de la varianza
de cada muestra
∑(𝑥−𝑥̅ )2 70
𝑠12 = = = 17,5
𝑛−1 5−1
∑(𝑥−𝑥̅ )2 62
𝑠22 = = = 15,5
𝑛−1 5−1
∑(𝑥−𝑥̅ )2 70
𝑠12 = = = 12
𝑛−1 6−1
𝑛 −1
Se aplica la ecuación:
̂2𝑤 = (𝑛𝑗−𝑘 ) 𝑠𝑗2
𝑡
̂2𝑤 = (13 ) 17,5 + (13 ) 15,5 + (13 ) 12
4 4 5
̂2𝑤 = 14,769 (varianza dentro de columnas)
̂2𝑏
20
Siendo el coeficiente F F= =
̂2𝑤
14,769
F = 1,354
El número de grados de libertad en el denominador (en la 4 7,71 6,94 6,59 6,39 6,26
parte izquierda de la tabla) se puede obtener con la 5 6,61 5,79 5,41 5,19 5,05
ecuación: 6 5,99 5,14 4,76 4,53 4,39
(nj-1) = nt-k = (5-1) + (5-1) + (6-1) = 13 7 5,59 4,74 4,35 4,12 3,97
Recuerde que, con el método trabajado para la explicación, se han usado muestras
pequeñas, en la práctica deberían ser muestras más grandes; así mismo, en los
ejemplos planteados, se realizó un análisis de varianza de un solo factor
https://www.youtube.com/watch?v=YewLM8SO
SKE
𝑓𝑐 𝑓𝑟
fe =
𝑛
gl = (r-1)(c-1)
Socio
Reacción Varón Mujer Total
A favor 20 19 39
En contra 10 16 26
Total 30 35 65
gl = (2-1)(2-1) = 1
valor crítico 2 (gl=1 ; =0,05) = 3,84
Se calculan las frecuencias esperadas para cada celda, los resultados se presentan en la tabla de abajo
fe = 30x39 = 18 fe = 35x39 = 21
65 65
30x 26
fe = = 12 fe = 35x 26 = 14
65 65
Socio
Reacción Varón Mujer Total
A favor 18 21 39
En contra 12 14 26
Total 30 35 65
https://www.youtube.com/watch?v=gHkMGcn2MsE
2.1 El intendente afirma que el tiempo medio que tardan las ambulancias del servicio de emergencias de la
ciudad desde que recibe el pedido hasta llegar al lugar del hecho es de 12 minutos. Un periodista
sospecha que el tiempo en realidad es mayor, porque se trata de una ciudad muy grande y nunca
puede ser menor a 12 minutos. ¿Qué hipótesis nula y qué alternativa debe plantear? El periodista
obtiene el tiempo que tardaron las ambulancias en llegar al lugar del accidente utilizando los registros
de 44 accidentes, Si la media muestral obtenida fue de 15 minutos, la desviación estándar de 4
minutos ¿a qué conclusión se llega, con un nivel de significancia del 5%?
2.2 El gerente de crédito de una cadena de tiendas, afirma que el saldo mensual promedio de los clientes
con cuenta es de 30000 $. Para probar su afirmación, un auditor selecciona una muestra aleatoria de
100 cuentas y encuentra que el saldo promedio es de 35000 $ con una desviación estándar de 12500
$. Con un nivel de significación de 0,01, ¿A qué conclusiones llegaría el auditor?
2.3 Aceros Pimiango. S.A., fabrica barras de acero. El proceso de producción hace barras con una longitud
promedio de, cuando menos, 2,8 pies cuando el proceso funciona correctamente. Se selecciona una
muestra de 25 barras en la línea de producción. La muestra indica una longitud promedio de 2,43 pies
y una desviación estándar de 0,20 pies. La compañía desea determinar si la maquina necesita algún
ajuste.
a) Indique las hipótesis nula y alternativa
b) Si la compañía desea probar la hipótesis al nivel de significación de 0,05 ¿qué
decisión tomaría?
2.4 El gerente de personal de una empresa querría determinar la cantidad de tiempo que necesitan los
empleados para llegar a su trabajo. Se selecciona una muestra aleatoria de 12 empleados y se registra
el tiempo en minutos para llegar al trabajo, con los siguientes resultados:
15 30 50 60 25 65
45 90 75 50 50 20
Con nivel de significación de 0,01 ¿hay pruebas de que el tiempo de promedio de viaje de los empleados
es de menos de 60 minutos?
2.5 Los siguientes datos son de la circunferencia craneal (en centímetros) de 15 niños recién nacidos.
Se desea probar la hipótesis nula de que la circunferencia promedio es 34.5 contra la hipótesis alterna
que es menor a ese valor. Sea el nivel de significancia del 1 %
2.6 En una muestra de 49 adolescentes que se prestaron como sujetos para un estudio inmunológico, una
variable de interés fue la prueba del diámetro de reacción de la piel a un antígeno. La media de la
muestra y la desviación estándar fueron eritemas de 21 y 11 mm, respectivamente, ¿Es posible conducir
a partir de estos datos que la media de la población es menor que 30? Sea el nivel de significancia del 5
%. Obtenga la potencia de la prueba si el diámetro promedio verdadero fuera 25 mm.
2.7 Una maquina vendedora de refrescos está proyectada para despachar, cuando funciona correctamente
cuando menos 7 onzas de refresco por vaso con una desviación estándar de 0,2 onza. Si el estadístico
selecciona una muestra aleatoria de 16 vasos para un estudio especial y el estadístico está dispuesto a
tener un riesgo () de tipo I de 5 %, calcule la potencia de la prueba y la probabilidad de un error tipo II
() si la cantidad promedio de población despachada es:
a) 6,9 onzas por vaso
b) 6,8 onzas por vaso
2.8 En el problema anterior. Si el estadístico seleccionó una muestra aleatoria de 25 vasos, arrojando una
varianza de 0.2 onza y utilizó un riesgo () de 5 %, calcule la potencia de la prueba y la probabilidad de
un error tipo II () , si la población promedio despachada es: a) 6,9 onzas b) 6,8 onzas
Compare los resultados de ambos problemas
2.10 Los siguientes datos se refieren a los niveles de presión intraocular (en mm Hg) registrados en una
muestra de 21 individuos de edad avanzada:
¿Es posible conducir a partir de estos datos que la media de la población de la cual se extrajo la muestra
es mayor que 14? Sea nivel de significancia del 0.05.
2.11 Se plantea la hipótesis de que no más del 5% de las refacciones que se fabrican en un proceso de
manufactura tiene defectos. Para una muestra aleatoria de n = 100 refacciones, se encuentra que 10
están defectuosas. Pruebe la hipótesis nula al 5 % del nivel de significancia.
2.12 Una aerolínea afirma que solo el 6 % de todos los equipos perdidos nunca se encuentra. Si en una
muestra aleatoria, 17 de 200 artículos de equipaje nunca son encontrados, pruébese la hipótesis nula de
que p = 0,06 contra la hipótesis alternativa de que p > 0,06 con un nivel de significancia del 0,05.
2.13 Un estudio en 90 mujeres que habían dado a luz recientemente, elegidas al azar entre los registros de
un departamento de bienestar social, reveló que 27 de ellas tuvieron un problema de infección intraparto
0 posparto. Pruebe la hipótesis nula que dice que la proporción de la población con un problema de
infección intraparto 0 posparto es ≤ a 0.25. Sea el nivel de significancia de 0.05
2.14 La vida útil promedio de una muestra aleatoria de n = 10 focos, es de 4000 horas, con una desviación
estándar de 200 horas. En general, se asume que la vida útil de los focos tiene una distribución normal.
Suponga que, antes de obtener la muestra, se plantea la hipótesis de que la desviación estándar de la
población no es superior a 150. Trabaje con un nivel de significancia del 1 % para probar dicha hipótesis.
2.15 Empléese el nivel de significancia 0,01 para probar la hipótesis nula de que la desviación es 0,015
pulgadas para los diámetros de ciertos pernos contra la hipótesis alternativa de que la desviación difiere
de ese valor, suponiendo que una muestra de tamaño 15 produjo s2 = 0,00011.
2.16 Suponga que se plantea la hipótesis de que la desviación estándar del salario por hora de los
trabajadores a destajo en una determinada industria es 3000 $. Para una muestra de 15 trabajadores
elegidos al azar, se encuentra que la desviación estándar es de 2000 $. Se supone que las cifras de
ingresos de los trabajadores de la población tienen distribución normal. ¿Puede rechazarse la hipótesis
nula utilizando un nivel de significancia del 5 %
2.17 Con base en las especificaciones dadas por un ingeniero de proceso, se plantea la hipótesis de que la
desviación estándar de los diámetros de ciertas piezas no es mayor de 3 mm. Para una muestra de n =
12 piezas, se encuentra una desviación estándar de 4,2 mm. Se supone que la distribución de los
diámetros es aproximadamente norma. ¿Puede rechazarse la hipótesis nula que la desviación estándar
verdadera no es mayor de 3 mm. a un nivel de significancia del
a) 5 % y b) del 1%?
2.18 Se registraron los valores de la capacidad vital de una muestra de 10 pacientes con obstrucción crónica
severa de las vías respiratorias. La variancia de las 10 observaciones fue de 0.75. Pruebe la hipótesis
nula que indica que la variancia de la población es de 1.00. Sea a. =0.05.
2.19 Una investigación de dos tipos de equipo de fotocopiado reveló que 75 fallas del primer tipo de equipo
fueron reparadas en un tiempo promedio de 83,2, mientras que 75 fallas del equipo del segundo tipo
fueron reparadas en un tiempo promedio de 90,8 minutos. Se conoce que las desviaciones
estándares poblacionales son 19,3 y de 21,4 minutos, respectivamente.
Pruebe la hipótesis nula 1 - 2 = 0 (es decir que en promedio se tarda el mismo tiempo para reparar
cualquier tipo de equipo) contra la hipótesis alternativa de que 1 - 2 0
con un nivel de significancia de = 0,05.
2.21 En un programa de capacitación industrial, algunos aprendices son instruidos con el método A, el cual
consiste en instrucción mecanizada, y algunos son capacitados con el método B, que entraña también la
atención personal de un instructor. Si muestras aleatorias de tamaño 10 son tomadas de grandes grupos
de aprendices capacitados por cada uno de estos métodos, y las calificaciones que obtuvieron en una
prueba de aprovechamiento son:
Método A
71 75 65 69 73 66 68 71 74 68
Método B
72 77 84 78 69 70 77 73 65 75
Úsese un nivel de significancia de 0,05 para probar la afirmación de que hay diferencias en los
métodos. Supóngase que las poblaciones muestreadas pueden aproximarse con distribuciones
normales que tienen la misma variancia.
No fumadores
18.1 6 10,8 11 7,7 17,9 8,5 13 18,9
Fumadores
16,6 13,9 11,3 26,5 17,4 15,3 15,8 12,3 18,6 12 24,1 16,5 21,8 16,3 23,4 18,8
Pruebe la hipótesis que hay diferencias en los índices de destrucción pulmonar debido al consumo de
cigarrillos. Los índices siguen una distribución aproximadamente normal, aunque no se conozcan las
variancias, se suponen iguales. Nivel de significancia 0.05
2.23 Realice la misma prueba del ejercicio anterior, pero considere, que las desviaciones estándar de las
poblaciones son diferentes
2.24 Una compañía constructora presenta 3 métodos de construcción. Se tomaron varios proyectos y los
datos reflejan la cantidad de mts cuadrados construidos en 30 días. Significancia 5%
Sistema A 55 60 63 56 59 55
Sistema B 57 53 64 49 62
Sistema C 66 52 61 57
2.25 Se asignan en forma aleatoria 15 participantes de un programa técnico a tres distintos métodos de
instrucción. En la tabla se presentan las calificaciones del avance al término de la unidad de instrucción y
se presentan las calificaciones promedias. Pruebe que no hay diferencias entre los métodos de
instrucción con una significancia del 5 %
2.26 Se desea saber el grado de ansiedad respecto de ciertas enfermedades, realizándose un test que mide
el grado de ansiedad del individuo. Los resultados se dan en la tabla
2.27 Se presentan los datos relacionados con la reacción de los estudiantes ante la ampliación de un
programa cultural colegial de acuerdo con la clase a la que pertenecen, en donde “división menor” indica
que se trata de un alumno de nuevo ingreso o que se encuentra en el segundo año, y la “división
superior” señala que los alumnos se encuentran en el tercero o cuarto año. Pruebe la hipótesis nula de
que la posición de clase y la reacción ante el programa cultural son variables independientes, utilizando
el nivel de significancia del 5 %
Clase
Reacción Menor Superior
A favor 40 38
En contra 20 32
2.28 Una empresa multinacional desea conocer si hay diferencias significativas en el grado de satisfacción de
los empleados según el país. Pruebe al 5% de significancia la hipótesis de que la satisfacción no depende
del país en la que se encuentran los empleados
Satisfacción
Reacción Alta Media Baja
España 500 300 100
Francia 700 350 150
Italia 650 200 150
Matriz: el rango de celdas de los datos frente a los que se ha de contrastar el parámetro
X: el valor del parámetro a comprobar
Sigma: la desviación estándar conocida de la población, si omite usa la desviación de la muestra
Rango real: rango con datos observados para contrastar con los esperados
Rango esperado: rango de datos que contiene el resultado del producto de los totales de
filas y columnas con el total general
Estimación de parámetros
Pruebas de hipótesis
Bibliografía
Webgrafía
Estimación de parámetros
https://www.youtube.com/watch?v=fpdZMHsTlIc https://www.youtube.com/watch?v=2wugQGs1GNY
https://www.youtube.com/watch?v=cMqgG_lBC2U https://www.youtube.com/watch?v=VQJpcYPfEI4
https://www.youtube.com/watch?v=QqaO9b2HdYQ
Pruebas de hipótesis
https://www.youtube.com/watch?v=5ZvKgnRVSjI https://www.youtube.com/watch?v=tR_8mY2OV
https://www.youtube.com/watch?v=QZkD1AH4dtU Y8
https://www.youtube.com/watch?v=M2O-kWEfxYI
https://www.youtube.com/watch?v=YewLM8SO
https://www.youtube.com/watch?v=ttMkW7HdIKU
https://www.youtube.com/watch?v=gHkMGcn2MsE
https://www.youtube.com/watch?v=mm_7RuYUGdM
https://www.youtube.com/watch?v=yGelIc-H2ng