2020 Estimación de Parametros y Pruebas de Hipotesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 51

Estadistica

Estimación de parámetros
Pruebas de hipótesis

Conceptos
Procedimientos
Aplicaciones

Año 2020

Carlos Garibaldi
Estimación de parámetros
La estimación de parámetros es un procedimiento que utiliza resultados de una
muestra para estimar o sacar conclusiones de parámetros de una población

Cuando el conjunto de datos proviene de la población completa, el valor que resume


esos datos es un parámetro. Un parámetro es un número que describe la población,
pero en la práctica casi nunca sabremos cuál es ese número porque no podemos
conocer perfectamente a toda la población.

Cuando el conjunto de datos proviene de una muestra, el número obtenido para


resumirlos es un estadístico, que se utiliza como una estimación o una aproximación
al valor del parámetro.
La diferencia que existe entre el valor del parámetro y el valor del estadístico se
conoce como error de estimación.

Existen dos tipos de estimaciones: estimaciones puntuales y estimaciones de


intervalos.

Una estimación puntual, utiliza un


solo valor de la muestra para estimar
el valor del parámetro. Por ejemplo,
se usa la media de la muestra x para
estimar la media poblacional 

Para que la estimación puntual sea


buena, es deseable que el estimador
(valor de la muestra) cumpla una serie
de propiedades.
Se va a utilizar 𝜃̂ para designar los
estimadores y θ para denotar los
parámetros

o Insesgabilidad. Un estimador 𝜃̂ es un estimador insesgado del parámetro θ,


si su esperanza es igual al parámetro
E (𝜃̂)=θ x cumple la propiedad, ya que E( x )= 
o Consistencia. Un estimador es consistente si a tamaños de muestras grandes,
su valor se acerca al verdadero valor del parámetro. Esto es: n N
𝜃̂ θ
o Eficiencia. Si se consideran todos los posibles estimadores insesgados de algún
parámetro, el que tiene menor variación, se dice que es un estimador eficiente

o Suficiencia. Es suficiente aquel estimador que utiliza toda la información de la


muestra

Cada parámetro θ tiene su mejor estimador 𝜃̂. En la tabla se presentan los parámetros
con sus correspondientes estimadores.

Estimación de parámetros y pruebas de hipótesis 2


Parámetro Estimador
(θ) (𝜽
̂)
µ x
P 𝑝̂

σ2 S2

σ S

En muchas ocasiones una estimación puntual


no proporciona suficiente información acerca
del parámetro de interés. Una estimación de
intervalo de la forma LI <  < LS podría
resultar más útil y con una “garantía” de
cubrir el valor a estimar. Los puntos extremos
de este intervalo serán variables aleatorias
puesto que son funciones de datos
provenientes de una muestra.

En general para construir un intervalo del


parámetro desconocido , se deben encontrar
dos estadísticas LI y LS tales que:

P (LI <  < LS) = 1 - 

El intervalo LI <  < LS se llama intervalo de confianza de (1 - ) 100%. La fracción


1 -  se denomina coeficiente de confianza o grado de confianza. Los extremos LI
y LS se denominan límites de confianza inferior y superior

Entonces, se tiene una probabilidad de 1 -  de seleccionar una variable aleatoria que


produzca un intervalo que contenga al parámetro 

La longitud de un intervalo de confianza observado es una medida importante de la


calidad de la información obtenida de la muestra. La longitud de medio intervalo  - LI
o LS -  se denomina la precisión del estimador.
Cuanto mayor es el intervalo de confianza, tanto
mayor confianza se tendrá de que el intervalo
contiene el verdadero valor de . Una situación
ideal sería un intervalo relativamente corto con https://www.youtube.com/watch?v=fpdZMHsTlIc
una elevada confianza. https://www.youtube.com/watch?v=cMqgG_lBC2U
https://www.youtube.com/watch?v=QqaO9b2HdYQ
https://www.youtube.com/watch?v=2wugQGs1GNY
https://www.youtube.com/watch?v=VQJpcYPfEI4

Estimación de la media poblacional


Sea x una variable aleatoria con media desconocida  y varianza conocida 2 y
supóngase que se toma una muestra aleatoria de tamaño n, puede obtenerse un
intervalo de confianza de 100 (1-) por ciento.

Si la distribución de muestreo de x es normal y según el teorema central del límite la


estadística Z es:

Estimación de parámetros y pruebas de hipótesis 3


x−
Z=

n
Donde
P (-Z/2 < Z < Z/2 ) = 1- ; se puede observar en la figura

Por lo tanto

x−
P (- Z/2 < < Z/2 ) = 1-

n

Como se pretende estimar la media  esto puede reacomodarse

P ( x - Z/2  <  < x + Z/2  ) = 1-


n n

De esta manera el intervalo de confianza para la media poblacional  con varianza


conocida 2 queda:

x - Z/2  <  < x + Z/2 


n n

1-
/2 /2
-Z/2 0 Z/2 Z

Si se utiliza x como una estimación de  se tiene una confianza de (1-) 100 % de



que el error de estimación no excederá de Z/2
n

e = Z/2
n
El error de estimación es la diferencia que hay entre el estimador y el parámetro
( x -)

Hay que tener en cuenta que los intervalos de confianza no están centrados en , están
centrados en la media de la muestra

Estimación de parámetros y pruebas de hipótesis 4


.
Ejemplo un ingeniero analiza la resistencia media a la compresión de concreto. Esta se
distribuye aproximadamente normal con una 2 = 1000. Una muestra aleatoria de 50
especímenes tiene una resistencia media a la compresión de 3250 psi. El intervalo de
confianza del 95 % es:

x - Z /2 <  < x + Z 


/2

n n

3250 – 1,96
31,62 <  < 3250 + 1,96
31,62
50 50

[3241,23 ; 3258,76]

Entonces, se estima que la resistencia media a la compresión está entre 3241,23 y 3258,76
psi.
Cerca del 95% de las veces que calculemos una media muestral, ésta se encontrará dentro
del intervalo, un 5% no. Las veces se refiere a todas las veces que se realice un muestreo
aleatorio y se calcule el intervalo.
Confiamos que el intervalo elegido sea uno de los “buenos” y no uno “malo” porque estos son
sólo el 5%. Pero, no podemos saber si μ pertenece al intervalo particular que construimos

Determinación del tamaño de muestra

Si se utiliza x como una estimación de  se puede tener una confianza de (1-) 100
% de que el error no excederá una magnitud específica e, cuando el tamaño de la
muestra es:
𝑍2 𝛼/2 𝜎 2
n= 𝑒2

Ejemplo Para el ejemplo anterior de la compresión de concreto, ¿qué tan grande debe ser
la muestra? si se quiere trabajar con una confianza del 95 % y el error de estimación no
debe superar 5 psi

𝑍 2 𝛼/2 𝜎 2
n=
𝑒2

n=
1,962 x31,622
52
n = 154

Cuando se muestrea sin reposición, el tamaño de la muestra se puede determinar en


dos etapas. En primer lugar, se determina el tamaño de la muestra según lo visto
arriba, sin tener en cuenta el factor de corrección. Luego se aplica el factor de
corrección y el tamaño de muestra queda:

𝑛0
n= 𝑛0 +(𝑁−1) ; n0 es el tamaño de muestra de la primera etapa
𝑁

La siguiente secuencia de tablas muestra las relaciones que se producen entre


diferentes conceptos utilizados en estimación:

Estimación de parámetros y pruebas de hipótesis 5


Relaciones entre el tamaño de muestra, riesgo, y nivel de confianza

Muestra Riesgo Confianza


Crece Disminuye Crece
Decrece Crece Decrece

Relaciones entre el error, riesgo, y nivel de confianza

Error Riesgo Confianza


Crece Disminuye Crece
Decrece Crece Decrece

Relaciones entre la variable Z, riesgo, y nivel de confianza

Z Riesgo Confianza
Crece Disminuye Crece
Decrece Crece Decrece

Rara vez se conoce la desviación estándar de la población, al momento de realizar una


estimación, en ese caso se usa la s (desviación estándar de la muestra) como
estimación de la  (desviación estándar poblacional)

Sea x una variable aleatoria con media desconocida  y varianza desconocida 2 puede
obtenerse un intervalo de confianza de 100 (1-) por ciento, utilizando una variable
aleatoria.

x−
t=
s
n

Tiene una distribución t de Student con n-1 grados de libertad

El procedimiento es el mismo que en el caso anterior, solo que ahora se trabaja con la
variable aleatoria t

P ( - t/2 < t < t/2 ) = 1-

En la figura se observa una gráfica simétrica con valores t; recuerde que la curva t, es
platicúrtica, es decir que es más aplanada que la curva normal

1-
/2 /2
-t/2 0 t/2 t

Por lo tanto

Estimación de parámetros y pruebas de hipótesis 6


x−
P (- t/2 < < t/2 ) = 1-
s
n

Como se pretende estimar la media  esto puede reacomodarse


s s
P ( x - t/2 << x + t/2 ) = 1-
n n

De esta manera el intervalo de confianza para la media poblacional  con varianza


desconocida 2 , queda:
s s
x - t/2 <  < x + t/2
n n

Ejemplo Suponga que el ingeniero no cuenta con la 2 y toma una muestra aleatoria de 20
especímenes, en ella, obtiene una resistencia media a la compresión de 3250 psi y una varianza de
800. El intervalo de confianza del 95 % es:
s s
x - t
/2 <  < x + t /2
n n

3250 – 2,093
28,28 <  < 3250 + 2,093
28,28
50 50

[3241,63 ; 3258,37]

el valor t/2 = 2,093 se encuentra en la tabla de la distribución t, con 19 grados de


libertad (n-1) y un riesgo a la derecha de t de 0,025, ya que el riesgo total es es
0,05, pero se distribuye en forma normal

En la figura se presenta un extracto de la tabla t, en donde se muestran los valores


necesarios para este ejemplo


GL 0,30 0,20 0,10 0.05 0,025 0,010 0,005
1 . . .
2.
.
. ‘
18
19 2,093
.
30

Tenga en cuenta que, en la práctica, si x es una variable aleatoria con media


desconocida  , varianza desconocida 2 y se toma muestra aleatoria de tamaño n >
30 puede obtenerse un intervalo de confianza de 100 (1-) por ciento, aplicando
distribución normal.

Estimación de parámetros y pruebas de hipótesis 7


x−
Z=
s
n

Donde
P ( - Z/2 < Z < Z/2 ) = 1-

Por lo tanto
x−
P (- Z/2 < < Z/2 ) = 1-
s
n

Como se pretende estimar la media  esto puede reacomodarse


s s
P ( x - Z/2 << x + Z/2 ) = 1-
n n
De esta manera el intervalo de confianza para la media poblacional  con varianza
desconocida 2 y muestras grandes, queda:
s s
x - Z/2 <  < x + Z/2
n n

Ejemplo Suponga que el ingeniero no cuenta con la 2 . De una muestra de 50 especímenes, obtiene la
resistencia media a la compresión de 3250 psi y la varianza de 800. El intervalo de confianza del 95 %
es:
s s
x - Z
/2 <  < x + Z /2
n n

3250 – 1,96
28,28 <  < 3250 + 1,96
28,28
50 50
[3246,16 ; 3257,84]

Los intervalos de confianza y los límites de confianza resultantes que hasta ahora hemos
analizado en realidad son bilaterales, es decir, tienen límites superior e inferior. Sin
embargo, hay muchas aplicaciones en las que sólo se requiere un límite.

Estimación de la proporción poblacional


A menudo se requiere construir un intervalo de confianza de 100 (1-) por ciento en
una proporción

Si el tamaño de muestra n es suficientemente grande, se sabe por el teorema del


límite central, que la variable aleatoria p̂ se distribuye aproximadamente normal
Por lo tanto
pˆ − P
Z=
p(1 − p)
n

Estimación de parámetros y pruebas de hipótesis 8


Donde
P ( - Z/2 < Z < Z/2 ) = 1-

Entonces
P (- Z/2 < pˆ − P < Z/2 ) = 1-
p(1 − p)
n

Como se pretende estimar la proporción P, esto puede reacomodarse

P( p̂ -Z/2 p (1 − p ) < P < p̂ +Z/2 p (1 − p ) ) = 1-


n n

De esta manera el intervalo de confianza para la proporción poblacional P queda:

p̂ -Z/2 p (1 − p ) < P < p̂ +Z/2 p (1 − p )


n n

Si se utiliza p̂ como una estimación de P se puede tener una confianza de (1-) 100

% de que el error de estimación no excederá de Z/2 p(1 − p)


n

e = Z/2 p (1 − p )
n

o bien se puede decir que el error de estimación es la diferencia que hay entre el
estimador y el parámetro ( p̂ -P)

Ejemplo Un complejo hotelero necesita estimar el porcentaje de turistas que requerirán estadía con
pensión completa, en las próximas vacaciones invernales. Para ello utilizó información pasada, en la
cual, de 500 turistas, 100 requirieron ese tipo de pensión. Se pretende una confianza del 95 % de que
la estimación sea correcta.

p̂ -Z/2 p (1 − p ) < P < p̂ +Z/2 p (1 − p )


n n

0,20-1,96 0,20(1 − 0,20) < P < 0,20+1,96 0,20(1 − 0,20)


500 500

[0,16 ; 0,23]

Es decir que se estima que entre el 16 % al 23 % estaría el porcentaje de turistas que utilizaría pensión
completa.

Determinación del tamaño de la muestra

También se puede determinar que si se utiliza p̂ como una estimación de P se tiene


una confianza de (1-) 100 % de que el error no excederá una magnitud específica
e, cuando el tamaño de la muestra es:

Estimación de parámetros y pruebas de hipótesis 9


𝑍2 𝛼/2 𝑃(1−𝑃)
n= 𝑒2
Como P es la proporción real que se quiere estimar al tomar la muestra, hay dos
caminos alternativos para determinar el P que se usaría en esta ecuación: se puede
utilizar algún valor de P en base a datos o experiencia pasada o bien utilizar el valor de
P=0.50, ya que de esta manera el producto de P. (1-P) sería el valor más grande posible
y daría como resultado un valor adecuado de n para realizar la estimación.

Ejemplo Para el caso anterior el tamaño de muestra que se necesita si no se quiere cometer un error
mayor a 3 % en la estimación, es:

𝑍2 𝛼/2 𝑃(1−𝑃)
n= 𝑒2

n = 1,96 0,20(1 − 0,20)


2

0,032
n = 683

Cuando se muestrea sin reposición, el tamaño de la muestra se puede determinar en


dos etapas, como en el caso de estimación de media. En primer lugar, se determina
el tamaño de la muestra según lo visto arriba, sin tener en cuenta el factor de
corrección. Luego se aplica el factor de corrección y el tamaño de muestra queda:

𝑛0
n= 𝑛0 +(𝑁−1) ; n0 es el tamaño de muestra de la primera etapa
𝑁

Estimación de la varianza poblacional


Cuando se requiere construir un intervalo de confianza de 100 (1-) por ciento en
una varianza, se utiliza la estadística:
(n − 1) S 2
X =
2
2
Donde
P (X21-/2 < X2 < X2/2 ) = 1-

En la figura puede observar la gráfica de la distribución X2 con n-1 grados de libertad


(distribución asimétrica, con valores X2 positivos)

/2
/2

X21-/2 X2/2

Estimación de parámetros y pruebas de hipótesis 10


Entonces
(n − 1) S 2
P(X21-/2 < < X2/2 ) = 1-
2
Como se pretende estimar la varianza 2, el intervalo de confianza para la varianza
queda

( n − 1) S 2 < 2 < (n − 1) S 2
X 2 / 2 X 21 −  / 2
En caso de estimar la desviación estándar poblacional, se utiliza el mismo intervalo,
pero se aplica raíz cuadrada a todos los valores, quedando;

(𝑛−1).𝑠2 (𝑛−1).𝑠2
√ 2 < < √ 𝑥2
𝑥𝛼/2 1−𝛼/2

Ejemplo Los siguientes son los pesos (en gramos) de 10 alfajores de chocolate de una empresa
alimenticia: 22, 23, 25, 26, 24, 22, 23, 24, 25, y 26. Encuentre un intervalo de confianza del 95 % para
la varianza de todos los alfajores de la empresa. Suponga distribución normal.

(n − 1) S 2 (n − 1) S 2
< <
2

X 2 / 2 X 21 −  / 2

9 x 2,222 9x 2,22
< 2 <
19,023 2,70

[2,33 ; 16,42]
Se presenta un extracto de la tabla chi-cuadrado

GL 0,995 0,990 0,975 0,950 0,900 0,500 0,100 0,050 0,025 0,010

1 0,000039 0,000157 0,000982 0,003932 0,015791 0,454936 2,705544 3,841459 5,023886 6,634897

2 0,010025 0,020101 0,050636 0,102587 0,210721 1,386294 4,605170 5,991465 7,377759 9,210340

3 0,071722 0,114832 0,215795 0,351846 0,584374 2,365974 6,251388 7,814728 9,348404 11,344867

4 0,206989 0,297109 0,484419 0,710723 1,063623 3,356694 7,779440 9,487729 11,143287 13,276704

5 0,411742 0,554298 0,831212 1,145476 1,610308 4,351460 9,236357 11,070498 12,832502 15,086272

6 0,675727 0,872090 1,237344 1,635383 2,204131 5,348121 10,644641 12,591587 14,449375 16,811894

7 0,989256 1,239042 1,689869 2,167350 2,833107 6,345811 12,017037 14,067140 16,012764 18,475307

8 1,344413 1,646497 2,179731 2,732637 3,489539 7,344122 13,361566 15,507313 17,534546 20,090235

9 1,734933 2,087901 2,700390 3,325113 4,168159 8,342833 14,683657 16,918978 19,022768 21,665994

10 2,155856 2,558212 3,246973 3,940299 4,865182 9,341818 15,987179 18,307038 20,483177 23,209251

Estimación de parámetros y pruebas de hipótesis 11


Actividades de aprendizaje

1.1 Considérese cuatro rollos de alambre especial, con longitudes 3, 6, 9, y 11 metros


Lístese todas las posibles muestras de tamaño 2 que pueden tomarse con reemplazo.
Calcúlese la media de cada muestra y luego verifique que la media de estas sea igual a la media
poblacional ¿qué propiedad de los buenos estimadores está verificando?

1.2 Una muestra de seis empresas, arrojó la siguiente cantidad de empleados: 40, 50, 30, 100, 50, y 80
empleados respectivamente.
a. Realice una estimación puntual de la cantidad promedio verdadero de todas las empresas de la
provincia.
b. Calcule un estimador insuficiente y otro ineficiente de la cantidad promedio real.

1.3 El gerente de control de calidad de una fábrica de lámparas eléctricas desea estimar la duración promedio
de un embarque de lámparas. Se selecciona una muestra aleatoria de 64 focos, que indican una duración
promedio de 540 horas con una desviación estándar de 120 horas. Establezca una estimación con
intervalo de confianza de 95 % de la duración promedio real de los focos de este embarque.

1.4 Suponga que se desea estimar el promedio de ventas por tienda para un producto determinado de
consumo popular. Determine el intervalo de confianza del 95 % considerando que las ventas se
distribuyen aproximadamente normal. Se tomó una muestra de 25 con una media muestral de $
3.425.000. Se conoce que la desviación de todas las tiendas es $ 200.000

1.5 Una muestra aleatoria de 100 propietarios de automóviles de la ciudad de Mendoza revela que éstos
conducen su automóvil, en promedio, 2000 kilómetros por mes, con una desviación estándar de 250
kilómetros. Suponga que la distribución de las mediciones es aproximadamente normal.
a) Construya un intervalo de confianza del 99% para el número promedio de kilómetros que un
propietario de un automóvil conduce anualmente en Mendoza. b) ¿Cuál sería el error en la estimación?

1.6 Un fabricante produce anillos de pistón para un motor de automóvil. Se sabe que el diámetro de los anillos
se distribuye aproximadamente normal y con una desviación estándar de 0.001 mm. Una muestra
aleatoria de 15 anillos tiene un diámetro medio de 74.036 mm. Construya un intervalo de confianza de
dos lados del 99 % con respecto al diámetro medio de los anillos de pistón.

1.7 Una máquina produce piezas plásticas. Se toma una muestra de las piezas y los diámetros son 1.01, 0.97,
1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros. Calcule un intervalo de confianza del 99% para la
media del diámetro de las piezas. Suponga una distribución aproximadamente normal.

1.8 Se prueban 70 autos de tipo sedan y se registran los litros de nafta consumidos en un recorrido de 100
km, obteniéndose una media muestral, x=6,8 litros y un desvío estándar muestral, s=1,4 litros. Obtenga
un intervalo de aproximadamente 95% de confianza para la cantidad media de litros de nafta consumida
por ese tipo de vehículo en 100 km.

1.9 Se sabe que la vida en horas de una bombilla eléctrica de 75 watts se distribuye normal con desviación
estándar de 25 horas. Una muestra de 20 bombillas dio un promedio de vida útil de 1.014 horas.

a. Construya un intervalo de dos lados del 95 por ciento respecto a la vida media
b. Construya un intervalo de dos lados del 99 por ciento.

1.10 Una muestra aleatoria de 10 barras de cereales de cierta marca tiene, en promedio, 230 calorías por barra
y una desviación estándar de 15 calorías. Construya un intervalo de confianza del 99% para el contenido
medio verdadero de calorías de esta marca de barras. Suponga que la distribución del contenido calórico
es aproximadamente normal

1.11 Las estaturas de una muestra aleatoria de 50 futbolistas de la liga tienen una media de 178 centímetros y
una desviación estándar de 7 centímetros.
a) Construya un intervalo de confianza del 95% para la estatura media de todos los futbolistas de la liga.
b) ¿Cuántos futbolistas se deberían medir si se pretende una confianza del 99%?

1.12 El gerente de la división de lámparas para vehículos debe estimar el número promedio de horas que
durarán los focos fabricados por cada tipo de vehículo. Se toma una muestra de 40 focos de
determinada línea y el tiempo promedio de funcionamiento fue 1520 horas. Se sabe que la desviación
estándar de la duración es 30 horas. a) Calcule el error estándar de la media. b) Construya un intervalo
de confianza del 90% para la media de la población el año

Estimación de parámetros y pruebas de hipótesis 12


1.13 Se sabe por registros históricos, que la desviación estándar del nivel de ventas por tienda de un
producto es $ 200.000 y se supone que la población de la totalidad de ventas por tienda una
distribución normal. ¿Cuál es el tamaño mínimo de muestra que se requiere para estimar el
promedio de ventas con un margen de error de $ 100.000 y con una confianza del 95 %?

1.14 Un analista desea estimar el salario diario promedio de los trabajadores de una compañía, con un
margen de error de $ 250 y una confianza del 90 %. Se estima que la desviación estándar de los
salarios no es mayor de $ 1.000 ¿cuál es el número de expedientes que deben muestrearse, como
mínimo para satisfacer este objetivo de investigación?

1.15 El análisis de gases en la sangre arterial de 10 pacientes proporcionó los siguientes valores de
Pa02 en reposo: 75, 80, 80, 74, 84, 79, 79, 88, 87, 85. Encuentre el intervalo de confianza para la
media con el 95% de confianza

1.16 Para una muestra aleatoria de 100 hogares de un área metropolitana grande, el número de hogares
en los que cuando menos un adulto está desempleado es 12. Estime el porcentaje de hogares de esa
área en los que cuando menos un adulto esté desempleado, utilizando un intervalo de confianza del
95 %.

1.17 Se realizó un muestreo aleatorio simple, de un embarque de 20.000 piezas de línea “premiun”
registrándose 15 piezas dañadas de un total de 210 observadas. Obtenga un intervalo del 95% de
confianza para estimar la verdadera proporción y a partir de él, la cantidad de piezas dañadas

1.18 Un fabricante de celulares usa una serie de pruebas. Todos los celulares deben pasar todas las
pruebas antes de que se comercialicen. De una muestra aleatoria de 1000 celulares, 30 no pasan
alguna de las pruebas. Calcule un intervalo de confianza del 95% para la proporción de los
celulares de la población que pasan todas las pruebas.

1.19 Se llevará a cabo un estudio para estimar el porcentaje de ciudadanos de las islas que están a favor
de tener un vuelo diario que lo conecte con la parte continental. ¿Qué tan grande debería ser la
muestra si se desea tener al menos 95% de confianza en que el estimado esté dentro del 1% del
porcentaje verdadero?

1.20 Un pequeño fabricante adquiere un lote de 200 partes electrónicas del “exceso de inventario” de una
empresa grande. Se encuentra que para una muestra aleatoria de 50 partes 5 de ellas tienen
defectos. Estime la proporción de todas las partes del embarque que tienen defectos, utilizando un
intervalo de confianza del 95 %.

1.21 Un administrador universitario desea estimar la proporción de estudiantes inscriptos en programas


de postgrado en administración de empresas, que también tienen licenciaturas en la misma área,
con un margen de error del 5 % y una confianza del 90 %. ¿Qué tamaño de muestra debe
utilizarse, como mínimo, si no existe ninguna base para estimar el valor apropiado de la proporción
antes de tomar la muestra? Ahora, suponga que la población es finita, y su tamaño es de 1000,
¿Cuál sería el tamaño de muestra a tomar?

1.22 Cine “Argentino” encuesto a 100 personas que habían visto una coproducción argentino-española
y les preguntaron si les parecía satisfactorio el nivel de los actores principales; 70 de los
encuestados, aprobaban ese nivel de los actores principales. a) Estime con un 90% de confianza la
proporción de personas que le gusta ese nivel de los actores. b) ¿Qué muestra se debería tomar si
se pretende una confianza del 99%, al mismo error?
1.23 Como supervisor del proceso de empacado de café en sobres, suponga que se toma una
muestra aleatoria de 12 de los sobres en la planta empacadora. El peso neto de los sobres de café
es el que se reporta en la tabla.

Gramos Nro. de
sobre
15.7 1
15.8 2
15.9 2
16.0 3
16.1 3
16.2 1

Determine:
a. El peso neto promedio por sobre
b. La desviación estándar muestral
c. Suponiendo que el peso del café empacado tiene distribución aproximadamente
normal, estime el peso promedio por sobre de café, utilice un intervalo de confianza del 95
%.

Estimación de parámetros y pruebas de hipótesis 13


1.24 Con los datos de la muestra aleatoria del problema 1.23. Estime la varianza para todos los sobres de
café que se empacan en la planta, utilizando intervalo de confianza del 90 %.

1.25 Para un determinado producto de consumo masivo, el promedio de ventas por expendio, el año
pasado, de acuerdo con una muestra de n = 10 tiendas fue de $ 3.425.000 con una desviación de $
200.000. Se supone que las ventas por expendio tienen una distribución normal. Estime la
desviación de las ventas de todas las tiendas, utilizando intervalo de confianza del 90 %.

1.26 En un estudio de costos del seguro de automóviles, una muestra aleatoria de 80 costos de
reparación de carrocerías para una clase particular de daños tiene una media de $ 472,36 y una
desviación estándar de $ 62,35. Si ese valor promedio se utiliza como estimación puntual del costo
de reparación medio real de esta clase de daños, ¿con qué confianza podemos afirmar que el error
no excederá de $ 10?

1.27 Si se quiere determinar la aptitud mecánica media de un gran grupo de trabajadores, ¿qué tamaño
debe tener una muestra aleatoria para asegurar con una probabilidad de 0.95 que la media
muestral no difiera de la real por más de 3.0 puntos? Supóngase que sabemos por experiencia que
la desviación poblacional es de 20.

1.28 El director administrativo de un colegio desea usar la media de una muestra aleatoria para estimar
la cantidad promedio de tiempo que tardan los alumnos en ir de una clase a la siguiente, y además
quiere poder asegurar con una confianza del 99 % que el error es a lo más 0.25 minutos. Si puede
suponerse por experiencia que la desviación real es de 1.40 minutos ¿qué tamaño debe tener la
muestra?

1.29 Una muestra aleatoria de 100 profesores en una gran ciudad revela un salario promedio de $
48700, con una desviación estándar de $ 4800, ¿con qué nivel de confianza podemos afirmar que
el salario medio semanal de todos los profesores de esa ciudad está entre $ 47200 y $ 50200?

1.30 Un distribuidor de combustible mantiene registros sobre las operaciones con sus clientes. Si una
muestra de n = 18 de estos registros indica ventas promedio de 63,84 galones de diésel, con una
desviación estándar de 2,75 galones y si utilizamos ese promedio como estimación de las ventas
medias por cliente, ¿qué podemos decir, con una confianza del 99 %, acerca del error máximo?

1.31 Una maquina produce barras que se utilizan en el tren trasero para la fabricación de una pickup. Se
selecciona una muestra aleatoria de 15 barras y se mide la longitud en centímetros. Los
datos resultantes se muestran a continuación:
82 82.6 82.4 81.9 81.4 82.5 81 80.5
80.8 80.9 81 82 82.8 82.4 82.3

Construya un intervalo de confianza de dos lados de 95 por ciento respecto a la longitud promedio
de las barras.

1.32 Se obtuvo una muestra aleatoria de 18 terminales de autoservicio y se determinó que en promedio
estaban fuera de servicio 8 minutos al día, con una desviación estándar de 0.90 minutos. Construya
un intervalo del 90% de confianza para la media poblacional

1.33 Un fabricante de calculadoras está interesado en saber la fracción de unidades defectuosas que se
producen. Una muestra aleatoria de 800 calculadoras incluye 18 defectuosas. Calcule un intervalo
de confianza del 99 por ciento respecto de la fracción de unidades defectuosas.

1.34 Debe votarse una ley provincial y el oficialismo desea encontrar la proporción de personas que
están a favor del proyecto de ley. Encuentre el tamaño de muestra requerido para estimar la
proporción verdadera dentro de 0.05 con un nivel de confianza del 95%. Suponga que no se tiene
idea de cuál es la proporción. ¿Cuál sería el cambio en el tamaño de la muestra si pensara que
cerca del 75% de las personas están a favor del proyecto?

1.35 Se lleva a cabo un estudio para determinar el porcentaje de propietarios de casa que poseen al
menos dos aparatos de televisión ¿qué tan grande debe ser la muestra si se desea tener una
confianza del 99 por ciento de que el error al estimar esta cantidad sea menor que 0.01?

1.36 En un estudio de los tiempos de circulación sanguínea en el miocardio, se obtuvieron los tiempos
de circulación aparente en una muestra de 25 pacientes con enfermedad arterial coronaria. Se
encontró que la variancia de la muestra es de 1.03. Construya intervalos de confianza del 99 % para
la varianza poblacional

Estimación de parámetros y pruebas de hipótesis 14


Para la estimación de parámetros, Excel dispone de la función estadística
INTERVALO.CONFIANZA.NORM , para distribuciones normales.
La función devuelve el intervalo de confianza para una media de una población con
distribución normal

al ejecutar la función debe ingresar en:


Alfa: el nivel de significancia empleado para calcular el nivel de confianza
Desv_estandar: la desviación estándar de la población
Tamaño: el tamaño de muestra

Estimación de parámetros y pruebas de hipótesis 15


En caso de realizar una estimación con distribución T de student, Excel dispone la
función estadística INTERVALO.CONFIANZA.T
La función devuelve el intervalo de confianza para una media de una población con
distribución T de student

al ejecutar la función debe ingresar en:


Alfa: el nivel de significancia empleado para calcular el nivel de confianza
Desv_estandar: un valor estimado de desviación estándar de la población
Tamaño: el tamaño de muestra

Estimación de parámetros y pruebas de hipótesis 16


Pruebas de hipótesis
Muchas veces, el problema al que se enfrenta un científico, ingeniero, o profesional,
no es tanto la estimación de un parámetro poblacional, sino más bien la formación
de un procedimiento de decisión que se base en la información proporcionada por la
muestra. El profesional postula o conjetura algo acerca del valor que puede asumir
cierto parámetro

Una hipótesis estadística es una aseveración o conjetura con respecto a una o más
poblaciones.
La verdad o falsedad de una hipótesis estadística, nunca se sabe con certeza, a menos
que se examine toda la población.
En su lugar, se toma una muestra aleatoria de esa población de interés y se utiliza
la información de la muestra para proporcionar evidencias que apoyen o no la
hipótesis.
La evidencia de la muestra que es consistente con la hipótesis conduce al no rechazo
de la hipótesis, mientras que si es inconsistente con la hipótesis conduce al rechazo
de esta.
Debe quedar claro que la aceptación de una hipótesis implica que los datos de la
muestra no dan la suficiente evidencia para rechazarla
Generalmente el científico se interesa en apoyar con fuerza una opinión, por lo tanto,
desea llegar a la opinión en forma de rechazo

Ejemplo Si un investigador en medicina desea mostrar fuertes evidencias a favor de que el fumar
aumenta el riesgo de contraer cáncer, la hipótesis a probar debe ser de la forma “no hay aumento en el
riesgo de contraer cáncer como producto de fumar” Como resultado, seguramente la opinión se alcanza
por medio de un rechazo

La estructura de la prueba de hipótesis se formula con el uso de una hipótesis nula,


que se denota con Ho y es la hipótesis para probar. El rechazo de Ho conduce a la
aceptación de la hipótesis alternativa H1

Ejemplo Nos dicen que la vida media de las computadoras es 5 años pero sospechamos que es menor.
Consideramos la afirmación: “la vida media de las computadoras es 5 años” como la hipótesis nula H0,
y a nuestra sospecha: “la vida media de las computadora es menor a 5 años” como hipótesis alternativa
(H1).

Entonces las hipótesis se escriben:

H0: µ = 5 y H1: µ < 5

Una vez que se establecen la hipótesis nula y la alternativa, el paso siguiente consiste
en hallar la evidencia para tomar la decisión. La calidad de los datos es
fundamental; la información debe ser precisa y no tener sesgo. Una mayor precisión
se obtiene con un mayor tamaño de muestra: para evitar el sesgo los datos deben
provenir de un muestreo aleatorio simple.

La hipótesis simple se refiere a un valor exacto que afirmamos o conjeturamos sobre


el parámetro de una población, como puede ser P=030.
La hipótesis compuesta, se refiere a un conjunto de valores aproximados que
afirmamos o conjeturamos sobre el parámetro, por ejemplo, P≥0,30.

Estimación de parámetros y pruebas de hipótesis 17


Una hipótesis nula siempre se establece de modo que el parámetro asuma un valor
(el indicador de igualdad =, ≤, ≥ debe aparecer en esta hipótesis), mientras que la
hipótesis alternativa permite la posibilidad de uno o más valores.

Es posible establecer las siguientes reglas para decidir qué proposición se utiliza como
hipótesis nula y cual como hipótesis alternativa.

o La conclusión a la que se desea o espera llegar como resultado de la prueba


generalmente se usa como hipótesis alternativa.
o La hipótesis nula debe contener una proposición de igualdad, ya sea =, ≤, ≥.
o La hipótesis nula es la que debe ser comprobada.
o Las hipótesis nula y alternativa son complementarias. Es decir, las dos
contemplan de manera exhaustiva todos los valores posibles que los
parámetros de suposición pueden asumir.

El procedimiento de una prueba de hipótesis se realiza para tomar alguna decisión


respecto de las hipótesis. La decisión se fundamenta en la información recogida de
la muestra y por lo tanto no se tendrá la certeza de que la decisión es la correcta.

La idea detrás de la prueba de hipótesis


es pensar que si la hipótesis nula, por
ejemplo: µ=µ0, fuera verdadera la
diferencia entre la media muestral 𝑥̅ y µ0
debería ser pequeña. Si es demasiado
grande esa diferencia, seguramente se
toma la decisión a favor de la hipótesis
alternativa. Para saber si la diferencia
entre, por ejemplo, la media muestral 𝑥 ̅
y el valor especificado en la hipótesis
nula (µ0) es grande se necesita construir
un estadístico.

Por lo tanto, al tomar la decisión, se podrían cometer errores:

▪ El rechazo de la hipótesis nula cuando es verdadera, se llama error tipo I


▪ La aceptación de la hipótesis nula cuando es falsa, se llama error tipo II

Al probar hipótesis estadísticas, se pueden producir diferentes situaciones que se


visualizan en la tabla
H0 es verdadera H0 es falsa
Aceptar H0 Decisión correcta Error tipo II
Rechazar H0 Error tipo I Decisión correcta

La probabilidad de cometer el error tipo I, también se llama nivel de significación,


se denota con , e indica la probabilidad de rechazar la hipótesis nula cuando es
verdadera.
Esta probabilidad la fija el investigador, comúnmente a valores bajos, por ejemplo 5
% o1%

 = P (Error tipo I) = P (R H0 / H0 es verdadera)

También se le conoce como tamaño de la región crítica, es muy pequeña y por lo


tanto es poco probable que se cometa el error tipo I

Estimación de parámetros y pruebas de hipótesis 18


El error tipo II es la aceptación de la hipótesis nula falsa. La probabilidad de cometer
el error tipo II, se denota por , es imposible de calcularla, a menos que se tenga
una hipótesis alternativa especifica.

 = P (Error tipo II) = P (A H0 / H0 es falsa)

Esta es una probabilidad un poco elevada. Por supuesto, es preferible que las
probabilidades de cometer los errores tipo I y tipo II sean lo más baja posible.
Para un tamaño de muestra fijo, una disminución en la probabilidad de un error, por
lo general tiene como resultado un aumento en la probabilidad del otro error. Para
reducir ambas probabilidades se debe aumentar el tamaño de la muestra.

Hay una serie de propiedades a tener en cuenta:

o Los errores tipo I y tipo II están relacionados. Cuando uno disminuye por lo
general el otro aumenta.
o El tamaño de la región crítica, probabilidad de cometer el error tipo I, siempre
se puede reducir al ajustar el o los valores críticos.
o Entre más grande sea la distancia entre el valor real y el valor hipotético, será
menor .
o Un aumento en el tamaño de la muestra reducirá  y  en forma simultanea

La potencia de una prueba es la probabilidad de rechazar H 0, dado que una


alternativa específica es verdadera.
Se denota como 1-, para poder calcular esta probabilidad se debe tener un valor
específico de la hipótesis alternativa.
Para producir una potencia alta, se debe aumentar  o aumentar el tamaño de la
muestra. También se hará más grande 1- cuando sean grandes las diferencias entre
el valor de la hipótesis nula y el valor de la hipótesis alternativa.
El complemento de la potencia de una prueba es  y es la probabilidad de cometer el
error tipo II

https://www.youtube.com/watch?v=5ZvKgnRVSjI

Tipos de pruebas
La hipótesis alternativa es la que determina si la prueba es de una cola o de dos colas
(una región de rechazo o doble región de rechazo)

▪ Una prueba es de una cola lateral derecha (zona de rechazo a la derecha),


cuando la hipótesis alternativa, plantea un valor del parámetro o una serie de
valores mayores al valor del parámetro propuesto en la hipótesis nula.

▪ Una prueba es de una cola lateral izquierda, (zona de rechazo a la izquierda)


cuando la hipótesis alternativa, plantea un valor del parámetro o una serie de
valores menores al valor del parámetro propuesto en la hipótesis nula.

Estimación de parámetros y pruebas de hipótesis 19


▪ Una prueba es dos colas o
bilateral (dos zonas de rechazo,
una a la izquierda y la otra a la
derecha), cuando la hipótesis
alternativa, no indica un valor
específico del parámetro y hay
que asumir que es distinto, ya
sea superando o estando
debajo del valor propuesto en la
hipótesis nula

Ejemplo. Un ingeniero asevera que el diámetro promedio de todas las piezas de un lote, es de 20 mm..

H0;  = 20 mm.
H1;   20 mm. (Prueba bilateral o de dos colas)

El técnico afirma que la duración promedio de las pantallas no es mayor a 6 años

H0;  ≤ 6 mm.
H1;  > 6 mm. (Prueba lateral derecha, de una sola cola)

El farmacéutico asegura que el promedio de medicamento solicitado es mayor o igual a 10 cajas

H0;  ≥ 10
H1;  < 10 (Prueba lateral izquierda, de una sola cola)

Etapas en una prueba de hipótesis


En un procedimiento de prueba de hipótesis se deben llevar a cabo una serie de pasos
o etapas, a saber:

❑ Establecer la población y el parámetro de interés


❑ Formular la hipótesis nula
❑ Expresar la hipótesis alternativa
❑ Especificar el nivel de significación ()
❑ Escoger el tamaño de la muestra
❑ Determinar la estadística de la prueba
❑ Establecer los valores críticos que dividen las regiones de rechazo y de no
rechazo

❑ Recolectar los datos de la muestra y calcular el valor del estadístico apropiado


❑ Determinar si el estadístico ha caído en la región de rechazo o en la región de
no rechazo
❑ Tomar la decisión estadística
❑ Expresar la decisión estadística en términos del problema

Las pruebas de hipótesis se realizan para aceptar o rechazar el valor que puede
adoptar cierto parámetro en la población.

Estimación de parámetros y pruebas de hipótesis 20


Se examinarán una serie de pruebas de hipótesis de una muestra, para la media
poblacional, la proporción poblacional, y la varianza poblacional.

Prueba de hipótesis para la media poblacional


En este caso la aplicación del procedimiento es para una prueba de la media
poblacional con varianza conocida, en donde la media muestral sigue una
distribución normal, según el teorema central del límite.

Ejemplo Un ingeniero de fabrica asevera que la duración promedio de una correa de


distribución es de 40.000 kilómetros. Se conoce que la desviación estándar es de 5.000
kilómetros. Se desea determinar si es correcta la aseveración del ingeniero, para ello se toma
una muestra de 100 vehículos, dando una duración promedio de las correas de 42.000
kilómetros. El investigador fija en un 5% el nivel de significación.

▪ H0 ;  = 40.000
H1 ;   40.000

Cuando no hay un valor alternativo de la media, se asume en la H1 que la media es diferente


del valor propuesto en la H0
La hipótesis alternativa determina si la prueba es de una cola o de dos colas (una región de
rechazo o doble región de rechazo)
En este caso como la H1 dice que la media es diferente de 40.000 kilómetros, se tiene una
prueba de dos colas

▪ El nivel de significación se fija en 0,05. Ésta es la probabilidad de cometer el error tipo I


(Rechazar la H0, cuando es cierta)

▪ Al conocer la desviación estándar de la población, se utiliza la distribución normal y la


estadística de prueba es:

X −
Z=

n
Como la prueba es de dos colas, la región de rechazo está dividida en dos partes, es decir que
habrá dos regiones críticas

/2
/2
1 -

X * = 39020  = 40.000 X * =40980

▪ Los valores críticos ( X * ) surgen de despejar del estadístico de prueba

 
X*= −Z X *= + Z
n n
X * = 40000− 1,96 5000 X * = 40000+ 1,96 5000
100 100

X * = 39020 X * = 40980

Estimación de parámetros y pruebas de hipótesis 21


Las regiones criticas o de rechazo son: a la derecha de X * = 40980 y a la izquierda de
*
X = 39020

▪ Por lo tanto, la regla de decisión sería:

Rechazar si X  39020
Rechazar si X  40980
No rechazar si 39020  X  40980

▪ Como de la muestra se obtuvo una X = 42000 kilómetros. El estadístico cae en zona de rechazo.
▪ Entonces la decisión estadística es rechazar la hipótesis nula

▪ Por lo tanto, no es correcta la aseveración del ingeniero, se rechaza que la duración promedio de
las correas es de 40.000 kilómetros

https://www.youtube.com/watch?v=QZkD1AH4dtU

Si se quiere determinar la potencia de la prueba (1-) y la probabilidad de cometer


el error tipo (), vemos el ejemplo

Ejemplo Se quiere determinar la potencia de la prueba y la probabilidad de cometer el error tipo II, es
decir  y Para ello es necesario plantea un valor específico de hipótesis alternativa, H1;  = 40.700
kilómetros.

Para calcular  y 1-. se utiliza el gráfico del ejemplo anterior, trasladando la línea de los puntos críticos
39020 y 40980 hasta la gráfica siguiente. Ésta última gráfica muestra la distribución considerando cierta
la media de la hipótesis alternativa, y con los puntos críticos estandarizados y transformados a Z

Hipótesis nula cierta


/2 H0 ; =40000
/2
1 -

X * = 39020  = 40.000 X * =40980


Hipótesis alternativa cierta
H1 ; =40700


1- 
1- 

Z*= -3,36 Z*= 0,56


Observe como se desplaza hacia la derecha la distribución ya que ahora se considera cierta
la H1 ;  = 40.700

Estimación de parámetros y pruebas de hipótesis 22


Para estandarizar puntos críticos X* , se usa el valor de la media según la hipótesis
alternativa:

X * − 1
Z=

n
Z = 39020− 40700 = -3,36
5000
100

Z = 40980− 40700 = 0,56


5000
100

Entonces:

1- = P (Z< -3,36) + P (Z>0,56) = 0,2881


 = P(-3,36<Z<0,56) = 0,7119
Observe que las probabilidades encontradas se corresponden al área debajo de la curva
según el gráfico

Otro método alternativo para resolver una prueba de hipótesis sería trabajar con los
valores críticos Z* de la tabla de la distribución normal estándar y luego
calcular la estadística Z, para observar en que región cae y tomar la decisión. Para el
mismo ejemplo, se tiene:

/2
/2
1 -

Z*=-1,96 0 z*=1,96

X − 42000−40000
Z= = =4
 5000
√100
n

Regla de decisión: si Z < Z* = -1,96 Rechazo H0


si Z > Z* = 1,96 Rechazo H0

si –1,96<Z<1,96 No rechazo H0

Como Z=4 ; entonces se rechaza la H0

En estadística aplicada, también se ha adoptado el uso de la aproximación del valor


P, para tomar la decisión de rechazar o no la hipótesis nula. Muchos programas de
computación usan este valor en la toma de decisiones.

Estimación de parámetros y pruebas de hipótesis 23


El área, por debajo de la Normal Estándar para valores tan o más extremos como el
valor observado del estadístico de la prueba en dirección de la hipótesis alternativa,
se llama valor p.
Un valor p es el nivel de significancia más bajo en que el valor observado del
estadístico de prueba es significativo; corresponde a la proporción de valores del
estadístico de la prueba, tan o más extremos, que se obtendrían como resultado del
muestreo aleatorio si la hipótesis nula fuera verdadera. Cuanto más pequeño sea el
valor p, tanto mayor será la evidencia a favor de la hipótesis alternativa.

El criterio que se sigue es:

Si el valor P ≤  se rechaza la hipótesis nula


Si el valor P ›  no se rechaza la hipótesis nula

Ejemplo En un pequeño pueblo de India, se quiere probar que la edad promedio de sus
habitantes está por encima de 70 años. La muestra de 100 habitantes arroja una edad promedio
de 71,80 años y una desviación estándar de 8,9 años. El nivel de significancia es de 0.05

H0 ;  ≤ 70
H1 ;  › 70
Se calcula Z= 71,80 − 70 =2,0224
8,9
100

Como se trata de una prueba lateral derecha, el área a la derecha de z= 2,0224 es P=0,0215
Al ser el valor de P=0,0215 <  = 0,05 se rechaza la hipótesis nula

Cuando se quiera realizar una prueba de hipótesis para la media poblacional con
varianza poblacional desconocida, se utiliza la distribución t de student con grados
de libertad = n-1

Ejemplo Ahora presuma que, en el problema del ejemplo referido a la media de la duración de
las correas, se desconoce la desviación estándar de la población, pero se conoce la desviación de
la muestra, que es de 8000 kilómetros; y se toma una muestra de tamaño 25.

/2
/2
1 -

t*=-2,064 0 t*=2,064

X − 42000− 40000
T= = = 1,25
s 8000
n 25

Regla de decisión: si T < t* = -2,064 Rechazo H0


si T > t* = 2,064 Rechazo H0

si – 2,064 <T< 2,064 No rechazo H0

Estimación de parámetros y pruebas de hipótesis 24


Como T = 1,25 No se rechaza la H0

https://www.youtube.com/watch?v=M2O-kWEfxYI

Tenga en cuenta que, en la práctica, si se quiere probar una media poblacional


varianza desconocida 2 y se toma muestra aleatoria de tamaño n > 30 puede aplicar
distribución normal con este estadístico
x−
Z=
s
n

Relación con la estimación por intervalo

El enfoque de prueba de hipótesis está muy relacionado con el enfoque de estimación


por intervalo.
Cuando la prueba es bilateral con H0 ;  = 0 contra la alternativa H1 ;   0 a un
nivel de significancia  , es equivalente a un intervalo de confianza de 100(1-)%
sobre  y rechazar H0 si 0 no está dentro del intervalo de confianza.
Si 0 está dentro del intervalo de confianza, la hipótesis no se rechaza.

Prueba de hipótesis para la proporción poblacional


La prueba de hipótesis, también se la puede utilizar para probar hipótesis referidas a
datos cualitativos.
Un modelo de formulación de la hipótesis podría ser que la proporción de personas
que tienen cierto virus tipo A es de 0,30, contra la alternativa que la proporción de
personas con virus tipo A es diferente de 0,30.

H0; P = 0,30
H1; P  0,30

En términos generales el procedimiento a seguir es similar al que se utiliza para


medias

Ejemplo Según su experiencia el ingeniero de fabrica afirma que la proporción de correas que se
rompen antes de los 40.000 kilómetros es de 0,20 . Se toma una muestra de 200 vehículos y se
encuentra que en 30 de ellos la correa se rompió antes de los 40.000 kilómetros. Trabaje con 
= 0.05.

H0 ; P = 0,20
H1 ; P  0,20

Cuando no hay un valor alternativo de la proporción, se asume en la H1 que la proporción es


diferente del valor propuesto en la H0 .En este caso como la H1 dice que la proporción es diferente
de 0,20 kilómetros, se tiene una prueba de dos colas

El nivel de significación se fija en 0,05. Ésta es la probabilidad de cometer el error tipo I (Rechazar
la H0, cuando es cierta)

Como la muestra es grande se trabaja con distribución normal

Estimación de parámetros y pruebas de hipótesis 25


Z= pˆ − P
p(1 − P)
n

La región de rechazo está dividida en dos partes, es decir que habrá dos regiones críticas

/2
/2
1 -

p̂ * =0,145 p̂ * =0,255

Los valores críticos ( p̂ * ) surgen de despejar del estadístico de prueba

P 0(1 − P 0) P 0(1 − P 0)
p̂ * = P0 - Z p̂ * = P0 + Z
n n

p̂ * = 0,20 - 1,96 0,20(1 − 0,20) p̂ * = 0,20 + 1,96 0,20(1 − 0,20)


200 200

p̂ * = 0,145 p̂ * = 0,255

Por lo tanto, la regla de decisión sería:

Rechazar si p̂ < 0,145


Rechazar si p̂ > 0,255
No rechazar si 0,145 < p̂ < 0,255

Como de la muestra se obtuvo una p̂ = 0,15. El estadístico cae en zona de no rechazo.


Entonces la decisión estadística es no rechazar la hipótesis nula

Es correcta la aseveración del ingeniero, se acepta que la proporción de correas que se rompen
antes de los 40.000 kilómetros es de 0,20

https://www.youtube.com/watch?v=ttMkW7HdIKU
https://www.youtube.com/watch?v=mm_7RuYUGdM

Prueba de hipótesis para la varianza poblacional


Muchas veces se requiere controlar que las mediciones de productos o procesos caen
dentro de las especificaciones. Estas especificaciones se cumplen si la varianza del
proceso es suficientemente pequeña.

Para probar hipótesis referidas a varianzas poblaciones se utiliza la distribución χ2


con n-1 grados de libertad.

Estimación de parámetros y pruebas de hipótesis 26


1- 

0 2n-1

El estadístico para utilizar está dado por:

( n − 1) s 2
2 =
 02
Ejemplo Un fabricante de pilas para relojes afirma que la duración de sus pilas se distribuye en
forma aproximadamente normal, con una desviación estándar igual 1,1 años. Si una muestra
aleatoria de 10 de tales pilas tiene una desviación estándar de 1.3 años. Utilice un nivel de
significancia de 0,05 para probar la afirmación del fabricante.

▪ H0 ; 2 = 1,21

H1 ; 2  1,21

▪ El nivel de significación se fija en 0,05

▪ Se trabaja con distribución 2 con n-1 grados de libertad.

▪ La prueba es bilateral, ya que, al no haber un valor de hipótesis alternativo, se


supone, diferente del propuesto en hipótesis nula. Es decir que habrá dos regiones
críticas o dos zonas de rechazo.
Los valores críticos ( X ) se obtienen de la distribución 210-1
2*

0,95

0,025 0,025

2,70 19,023

• Por lo tanto, la regla de decisión sería:

Rechazar si 2 < 2,70


Rechazar si 2 > 19,023

Estimación de parámetros y pruebas de hipótesis 27


No rechazar si 2,70  2 19,023

• Como el estadístico es 2 = (9) x1,69


1,21

2 = 12,57 cae en región de no rechazo

• Entonces la decisión estadística es no rechazar la hipótesis nula

• Es correcta la afirmación del fabricante de pilas, la varianza es 1,21

En la siguiente sección se examinarán una serie de pruebas de hipótesis, de dos


muestras, para medias poblacionales. En el desarrollo de los ejemplos se trabajará
con pruebas de dos colas o de dos regiones de rechazo

Prueba de hipótesis para diferencias de medias


poblacionales
Los conceptos sobre pruebas de hipótesis de una muestra desarrollados hasta aquí,
también se pueden extender a pruebas con dos muestras.
El experimento consiste en obtener dos muestras aleatorias independientes de
tamaño n1 y n2, respectivamente de dos poblaciones con medias 1 y 2 y varianzas
conocidas  12 y  22
La variable aleatoria Z, tiene distribución normal:

Z= ( X 1 − X 2 ) − ( 1 −  2 ) 0
 12  22
( )+( )
n1 n2

Las hipótesis en pruebas de diferencias de medias se pueden plantear de alguna de


estas formas.

o Para el caso de prueba bilateral


• H0 ; (1 −  2 ) = 0 ; (1 =  2 )

• H1 ; (1 −  2 ) 0 ; (1   2 )

o Para el caso de una prueba lateral derecha:

• H0 ; (1 −  2 )  0 ; (1   2 )

• H1 ; (1 −  2 ) > 0 ; (1   2 )

o En una prueba lateral izquierda:

• H0 ; (1 −  2 )  0 ; ( 1   2 )

• H1 ; (1 −  2 ) < 0 ; (1   2 )

Ejemplo Se lleva a cabo un experimento en que se comparan dos tipos de motores A y B. Se


mide el rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor

Estimación de parámetros y pruebas de hipótesis 28


tipo A y 75 con el motor tipo B. El rendimiento promedio de gasolina para el motor tipo A es de
36 millas por galón y para el motor tipo B de 42 millas por galón. Suponga que las desviaciones
estándar poblacionales son 6 y 8 para los motores A y B respectivamente
H0 ; (  A −  B ) = 0

H1 ; ( A −  B ) 0
▪ El nivel de significación es 0,05

▪ Los valores críticos Z* son –1,96 y 1,96

▪ Regla de decisión :

si Z < -1,96 Rechazo H0


si Z > 1,96 Rechazo H0
si –1,96  Z  1,96 No rechazo H0

▪ La estadística de prueba Z es:

Z= (36 − 42) = - 5,14


36 48
( )+( )
50 75

▪ Como la estadística Z es -5,14 cae en región de rechazo

▪ Entonces la decisión estadística es rechazar la hipótesis nula

▪ Esto quiere decir que hay diferencias significativas en los rendimientos


promedio de gasolina de los dos tipos de motores

En la mayoría de los casos, en las pruebas de dos medias, prevalece la situación que
no se conocen las desviaciones estándar de las poblaciones. Si se hacen
suposiciones de que las distribuciones son normales y que tienen la misma
desviación estándar σ1 = σ2 , se puede utilizar la prueba t combinada de dos
muestras.

La estadística de prueba está dada por:

( X 1 − X 2 ) − ( 1 −  2 )
t=
S p2 S p2
( )+( )
n1 n2
; donde

(n1 − 1) S12 + (n2 − 1) S 22


S p2 =
n1 + n2 − 2

Ejemplo De 100 recién nacidos en una clínica de la ciudad, una muestra aleatoria de 12 nenas
tiene un peso promedio de 2,90kgs con una desviación estándar de 0,40. Una muestra aleatoria
de 10 varones tienen un peso promedio 3.150 con una desviación estándar de 0.30 Se prueba
la hipótesis de que si hay diferencias en el peso promedio de ambos sexos. Utilice el nivel de
significancia del 5%
H0 ; ( 1 −  2 ) = 0
H1 ; (1 −  2 ) ≠ 0
▪ El nivel de significación es 0,05

▪ Los valores críticos t* = +/- 2,086 con 20 grados de libertad

▪ Regla de decisión :

si t < -2,086 o > 2,086 Rechazo H0

Estimación de parámetros y pruebas de hipótesis 29


si -2,086 < t < 2,086 No Rechazo H0

▪ La estadística de prueba t es:

t= (2,90 − 3,150) = -1.62


0,1285 0,1285
( )+( )
12 10

▪ La varianza unida, combinada o ponderada es

(11)(0.16) + (9)(0,09)
S p2 = = 0,1285
12 + 10 − 2

▪ Como la estadística t es – 1,62 cae en región de no rechazo


▪ Entonces la decisión estadística es no rechazar la hipótesis nula, los pesos
promedio no difieren

▪ Esto quiere decir que no se puede concluir que el desgaste promedio del
material 1 excede el del material 2 en más de dos unidades.

En caso de que las varianzas sean desconocidas y no se puede suponer que


𝝈𝟐𝟏 = 𝝈𝟐𝟐 , la estadística

( X 1 − X 2 ) − ( 1 −  2 )
t*=
S12 S 22
( )+( )
n1 n2
tiene una distribución t aproximada con grados de libertad aproximados

𝑆2 𝑆 2
( 1 + 2 )2
v=
𝑛1 𝑛2
𝑆2 𝑆2
−2
( 1⁄𝑛1 )2 ( 2⁄𝑛2 )2
+
𝑛1− 1 𝑛2− 1

Por lo tanto, se utiliza la estadística de prueba t* y n 1+n2-2 se sustituye por v en la


determinación de los grados de libertad para la prueba

Ejemplo Un fabricante de televisores prueba dos tipos de microcircuitos. Se obtuvieron los datos:

n1=15 𝑥̅ 1=24.2 𝑆12 =10

n2=10 𝑥̅ 2=23.9 𝑆22 =20

Se desea probar
Ho : µ1= µ2
H1 : µ1≠µ2

Las varianzas son desconocidas y no se está dispuesto a considéralas iguales

t*= 24.2 − 23.9 = 0,18


10 20
( )+( )
15 10

Estimación de parámetros y pruebas de hipótesis 30


10 20
( + )2
15 10
v = 10
( ⁄15)2 (20⁄10)2
−2 =16
+
16 11

como t*=0.18 ‹ t0.05;16=1,746 no se puede rechazar Ho : µ1= µ2

https://www.youtube.com/watch?v=yGelIc-H2ng
https://www.youtube.com/watch?v=tR_8mY2OVY8

Analisis de varianza (ANOVA)


El análisis de varianza (ANOVA) es una técnica en la que la variancia total de un
conjunto de datos se divide en dos o más componentes y cada uno de ellos asociados
a una fuente especifica de variación, de esta manera se puede determinar la magnitud
con la que contribuye cada uno a la variación total.
Al análisis de variancia se lo utiliza para estimar y probar hipótesis respecto de las
variancias de las poblaciones y de las medias de las poblaciones
Los fundamentos en los que se basa el análisis de varianza fueron desarrollados por
Ronald Fisher y la distribución F se denomina en su honor

Una suposición fundamental en la que se basa este análisis consiste en que las diversas
medias muestrales se obtienen a partir de poblaciones con distribución normal y con la
misma varianza 2; aunque si las muestras son lo suficientemente grandes no se
necesita el supuesto de normalidad.

El análisis de varianza está basado en una comparación de dos estimaciones diferentes


de la varianza, 2, de nuestra población total. Una estimación se trata de la varianza
entre las medias muestrales, y la otra estimación de la varianza de la población, está
determinada por la variación dentro de las muestras mismas.
Entonces comparamos estas dos estimaciones de la varianza de la población. Como
ambas son estimaciones de 2, deben tener un valor aproximadamente igual cuando la
hipótesis nula sea verdadera. Si la hipótesis nula no es verdadera, estas dos
estimaciones diferirán de manera considerable.

En estas pruebas se plantea como hipótesis nula que las medias poblacionales son
iguales y como hipótesis alternativa, que no todas las medias son iguales:
H0: 1 = 2 = 3 ….= k
H1: 1 , 2 , 3…., k no son todas iguales

Para la prueba se utiliza el coeficiente F

𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑛𝑡𝑟𝑒 𝑚𝑒𝑑𝑖𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠 𝑜 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠


F=
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑜 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠

Como resultado, el denominador y el numerador deben ser aproximadamente iguales


si la hipótesis nula es verdadera. Cuanto más cercano a 1 esté el cociente F, más nos
inclinamos a aceptar la hipótesis nula. Al contrario, conforme el cociente F crece
(ingresaría a zona de rechazo), nos inclinaremos más a rechazar la hipótesis nula y
a aceptar la alternativa.
La lógica básica que apoya el estadístico F., cuando las poblaciones no son las
mismas, la varianza entre columnas (derivada a partir de la varianza entre las medias
muestrales) tenderá a ser mayor que la varianza dentro de columnas (derivada a
partir de la varianza dentro de las muestras), y el valor de F tenderá a ser grande.
Esto nos conducirá a rechazar la hipótesis nula.

Estimación de parámetros y pruebas de hipótesis 31


Para llevar a cabo pruebas de hipótesis F debemos utilizar una tabla F de Snedecor,
en la cual las columnas representan el número de grados de libertad del numerador
y los renglones el número de grados de libertad del denominador. Existen tablas
separadas para cada nivel de significancia.

Resumiendo, los tres pasos del análisis de varianza son:

• Determinar una estimación de la varianza de la población a partir de


la varianza entre las medias de las muestras.
• Determinar una segunda estimación de la varianza de la población a
partir de la varianza dentro de las muestras.
• Comparar estas dos estimaciones. Si su valor es aproximadamente
igual, se acepta la hipótesis nula.

El primer paso en el análisis de varianza indica que debemos obtener una estimación
de la varianza poblacional a partir del cálculo de la varianza entre las medias
muestrales, esta estimación se la conoce como varianza entre columnas

∑(𝑥−𝑥̅ )2
Recuerde que la varianza de la muestra es: S2 =
𝑛−1

Ahora bien, como se trabaja con medias muestrales y una gran media, al sustituir
para el cálculo de la varianza entre medias muestrales, queda:

∑(𝑥̅ −𝑥̿ )2
𝑠𝑥̅2 = ; siendo k el número de muestras
𝑘−1
∑ 𝑥̅
𝑥̿ = (gran media)
𝑛

2
Recuerde que 2𝑥̅ = 𝑛
, por lo tanto, la varianza de la población queda

2 = 2𝑥̅ . 𝑛
Como no se cuenta con toda la información para utilizar esta ecuación, y aplicando
alguna estimación, en definitiva, para obtener la estimación de la varianza entre
columnas, se utilizará esta ecuación:

∑ 𝑛𝑗 (𝑥̅𝑗 −𝑥̿ )2

̂2𝑏 =
𝑘−1

donde ̂2𝑏 primera estimación de la varianza de la población, basada en la varianza


entre las medias de las muestras (la varianza entre columnas)

𝑛𝑗 tamaño de la j-esima muestra

̅𝑗
𝑥 media muestral de la j-esima muestra

̿
𝑥 gran media

k número de muestras

Estimación de parámetros y pruebas de hipótesis 32


El segundo paso en ANOVA requiere una segunda estimación de la varianza de la
población, basada en la varianza dentro de las muestras. En términos
estadísticos, se le puede llamar varianza dentro de columnas.
Podemos utilizar la siguiente ecuación para esta segunda estimación de la varianza.

𝑛 −1

̂2𝑤 = (𝑛𝑗−𝑘 )𝑠𝑗2
𝑡

donde ,


̂2𝑤 = varianza dentro de las muestras o dentro de columnas
𝑛𝑗 = tamaño de la j-esima muestra

𝑠𝑗2 = varianza muestral de la j-esima muestra


K = número de muestras
𝑛𝑡 = 𝑛𝑗 = tamaño de muestra total
Ejemplo
Se asignan aleatoriamente 16 estudiantes de un programa técnico a tres tipos distintos de métodos de
instrucción, los cuales pretenden desarrollar habilidad y rapidez en la resolución de problemas. En la tabla
se presentan los datos de los estudiantes, referidos a cantidades de problemas resueltos por hora, según
los distintos métodos. Nivel de significancia 5%

Método A 15 18 19 22 11
Método B 22 27 18 21 17
Método C 18 24 19 16 22 15

En este caso, la razón para utilizar análisis de varianza es decidir si estas tres muestras (una muestra es
el pequeño grupo de estudiantes instruidos por cualquier método) se tomaron de poblaciones (una
población es el número total de estudiantes que pudieron ser instruidos por ese método) que tienen las
mismas medias.
Debido a que estamos probando la habilidad y rapidez en la resolución de problemas de acuerdo con los
tres métodos, se debe determinar si las tres muestras, representadas por las medias muestrales, 𝑥̅1 = 17,
𝑥̅2 = 21 y 𝑥̅3 x =19, pudieron haberse tomado de poblaciones con la misma media, .

Un planteamiento formal de las hipótesis nula y alternativa que deseamos probar sería:
H0: 1 = 2 = 3
H1: 1 , 2 , y 3 no son todas iguales

Para obtener la varianza entre las medias muestrales o entre columnas, se presentan cálculos y tabla:

∑ 𝑥𝑖 304
𝑥̿ = = = 19
𝑛 16

O bien

∑ 𝑥̅ 𝑗 57
𝑥̿ = = = 19
𝑘 3

n ̅
𝒙 ̿
𝒙 ̅- 𝒙̿
𝒙 (𝒙
̅ − 𝒙̿ ) 𝟐
n.(𝒙
̅ − 𝒙̿ ) 𝟐

5 17 19 17-19=-2 4 5x4=20
5 21 19 21-19=2 4 5x4=20
6 19 19 19-19=0 0 6x0=0

2
∑ n. (𝒙
̅ − 𝑥̿ ) =40

∑ 𝑛𝑗 (𝑥̅ 𝑗 −𝑥̿ )2 40

̂2𝑏 = 𝑘−1
=2 = 20

Estimación de parámetros y pruebas de hipótesis 33


Varianza entre columna = 20

Para obtener la varianza dentro de las muestras o dentro de columnas se presentan cálculos de la varianza
de cada muestra

∑(𝑥−𝑥̅ )2 70
𝑠12 = = = 17,5
𝑛−1 5−1

∑(𝑥−𝑥̅ )2 62
𝑠22 = = = 15,5
𝑛−1 5−1

∑(𝑥−𝑥̅ )2 70
𝑠12 = = = 12
𝑛−1 6−1

𝑛 −1
Se aplica la ecuación: 
̂2𝑤 =  (𝑛𝑗−𝑘 ) 𝑠𝑗2
𝑡


̂2𝑤 = (13 ) 17,5 + (13 ) 15,5 + (13 ) 12
4 4 5


̂2𝑤 = 14,769 (varianza dentro de columnas)

̂2𝑏
 20
Siendo el coeficiente F F= =
̂2𝑤
 14,769

F = 1,354

Para buscar el valor F critico de la tabla se tiene:

El número de grados de libertad del numerador (en la parte GL 1 2 3 4 5


superior de la tabla)
= número de muestras – 1 1 161,45 199,50 215,71 224,58 230,16

= 3-1 2 18,51 19,00 19,16 19,25 19,30


=2 3 10,13 9,55 9,28 9,12 9,01

El número de grados de libertad en el denominador (en la 4 7,71 6,94 6,59 6,39 6,26

parte izquierda de la tabla) se puede obtener con la 5 6,61 5,79 5,41 5,19 5,05
ecuación: 6 5,99 5,14 4,76 4,53 4,39

 (nj-1) = nt-k = (5-1) + (5-1) + (6-1) = 13 7 5,59 4,74 4,35 4,12 3,97

8 5,32 4,46 4,07 3,84 3,69


Al ingresar a la tabla F para una significancia de 0.05, con 9 5,12 4,26 3,86 3,63 3,48
2 grados de libertad en el numerador y 13 en el
10 4,96 4,10 3,71 3,48 3,33
denominador, el valor critico que corresponde es 3,81 ,
este valor establece el límite superior de la región de 11 4,84 3,98 3,59 3,36 3,20
aceptación. Como el valor F calculado es 1.354, este, se 12 4,75 3,89 3,49 3,26 3,11
encuentra dentro de la región de aceptación, entonces se
13 4,67 3,81 3,41 3,18 3,03
acepta la hipótesis nula y se concluye que, según la
información de las muestras, no existen diferencias 14 4,60 3,74 3,34 3,11 2,96
significativas entre los tres métodos de instrucción

Recuerde que, con el método trabajado para la explicación, se han usado muestras
pequeñas, en la práctica deberían ser muestras más grandes; así mismo, en los
ejemplos planteados, se realizó un análisis de varianza de un solo factor

https://www.youtube.com/watch?v=YewLM8SO
SKE

Estimación de parámetros y pruebas de hipótesis 34


Prueba Ji cuadrado
Los procedimientos que se verán en esta sección implican la comparación de
frecuencias muestrales clasificadas en categorías de datos. La distribución Ji-
cuadrado se puede utilizar, entre otras, para pruebas de la independencia de dos
variables y pruebas de hipótesis sobre proporciones

Con el uso de una tabla de contingencia o de clasificación cruzada y la prueba Ji


cuadrado se puede probar la
independencia de dos variables
cualitativas
Las pruebas de independencia
implican dos variables categóricas y lo
que se prueba es la suposición de que
las dos variables son estadísticamente
independientes. Esto implica que el
saber la categoría en la que se clasifica
una observación con respecto a una
variable, no tiene ningún efecto sobre
la probabilidad de caer también en
algunas de las categorías de las otras
variables.

▪ Las hipótesis nula y alternativa se expresan:

H0 ; Hay independencia entre las variables (ninguna relación)


H1; Hay dependencia entre las variables (alguna relación)

▪ Se anotan las frecuencias observadas (fo) en una tabla de


contingencias. Mediante r se designa la cantidad de renglones o
filas de la tabla y mediante c la cantidad de columnas de la tabla

▪ Dada la hipótesis de independencia, la frecuencia esperada (f e)


correspondiente a cada celda de la tabla de contingencia debe ser
proporcional al total de frecuencias observadas de columnas y de
renglones.

La frecuencia esperada (fe) se determina como:

𝑓𝑐 𝑓𝑟
fe =
𝑛

▪ Los grados de libertad correspondiente a una prueba de


independencia es:

gl = (r-1)(c-1)

▪ Con el nivel de significación () y los grados de libertad (gl) se


obtiene el valor 2 crítico

▪ La estadística de prueba es:


( fo − fe) 2
X = 
2
fe
▪ Si la estadística de prueba X2 excede el valor crítico 2 se debe
rechazar la hipótesis nula de independencia de las variables.

Estimación de parámetros y pruebas de hipótesis 35


Ejemplo En la tabla se presentan las reacciones de socios varones y socios mujeres ante un proyecto
presentado por la comisión directiva del club. Con estos datos pruebe la independencia de esas variables
con un nivel de significación del 5%.

Socio
Reacción Varón Mujer Total
A favor 20 19 39
En contra 10 16 26
Total 30 35 65

H0 ; El sexo del socio y la reacción son independientes


H1; El sexo del socio y la reacción no son independientes

gl = (2-1)(2-1) = 1
valor crítico 2 (gl=1 ; =0,05) = 3,84

Se calculan las frecuencias esperadas para cada celda, los resultados se presentan en la tabla de abajo

fe = 30x39 = 18 fe = 35x39 = 21
65 65
30x 26
fe = = 12 fe = 35x 26 = 14
65 65

Socio
Reacción Varón Mujer Total
A favor 18 21 39
En contra 12 14 26
Total 30 35 65

La estadística de prueba es:


( fo − fe) 2 (20 − 18) 2 (19 − 21) 2 (10 − 12) 2 (16 − 14) 2
X2 =  = + + + = 1,03
fe 18 21 12 14

La estadística de prueba X2= 1,03 no excede el valor crítico 2 = 3,84.


Decisión: no se rechaza la hipótesis de independencia de las variables.
Conclusión: La reacción no tiene relación con el sexo de los socios.

https://www.youtube.com/watch?v=gHkMGcn2MsE

Estimación de parámetros y pruebas de hipótesis 36


Actividades de aprendizaje

2.1 El intendente afirma que el tiempo medio que tardan las ambulancias del servicio de emergencias de la
ciudad desde que recibe el pedido hasta llegar al lugar del hecho es de 12 minutos. Un periodista
sospecha que el tiempo en realidad es mayor, porque se trata de una ciudad muy grande y nunca
puede ser menor a 12 minutos. ¿Qué hipótesis nula y qué alternativa debe plantear? El periodista
obtiene el tiempo que tardaron las ambulancias en llegar al lugar del accidente utilizando los registros
de 44 accidentes, Si la media muestral obtenida fue de 15 minutos, la desviación estándar de 4
minutos ¿a qué conclusión se llega, con un nivel de significancia del 5%?

2.2 El gerente de crédito de una cadena de tiendas, afirma que el saldo mensual promedio de los clientes
con cuenta es de 30000 $. Para probar su afirmación, un auditor selecciona una muestra aleatoria de
100 cuentas y encuentra que el saldo promedio es de 35000 $ con una desviación estándar de 12500
$. Con un nivel de significación de 0,01, ¿A qué conclusiones llegaría el auditor?

2.3 Aceros Pimiango. S.A., fabrica barras de acero. El proceso de producción hace barras con una longitud
promedio de, cuando menos, 2,8 pies cuando el proceso funciona correctamente. Se selecciona una
muestra de 25 barras en la línea de producción. La muestra indica una longitud promedio de 2,43 pies
y una desviación estándar de 0,20 pies. La compañía desea determinar si la maquina necesita algún
ajuste.
a) Indique las hipótesis nula y alternativa
b) Si la compañía desea probar la hipótesis al nivel de significación de 0,05 ¿qué
decisión tomaría?

2.4 El gerente de personal de una empresa querría determinar la cantidad de tiempo que necesitan los
empleados para llegar a su trabajo. Se selecciona una muestra aleatoria de 12 empleados y se registra
el tiempo en minutos para llegar al trabajo, con los siguientes resultados:

15 30 50 60 25 65
45 90 75 50 50 20

Con nivel de significación de 0,01 ¿hay pruebas de que el tiempo de promedio de viaje de los empleados
es de menos de 60 minutos?

2.5 Los siguientes datos son de la circunferencia craneal (en centímetros) de 15 niños recién nacidos.

33.38 34.34 33.46 32.15 33.95


34.13 33.99 34.05 33.85 34.45
34.10 34.23 34.19 33.97 32.73

Se desea probar la hipótesis nula de que la circunferencia promedio es 34.5 contra la hipótesis alterna
que es menor a ese valor. Sea el nivel de significancia del 1 %

2.6 En una muestra de 49 adolescentes que se prestaron como sujetos para un estudio inmunológico, una
variable de interés fue la prueba del diámetro de reacción de la piel a un antígeno. La media de la
muestra y la desviación estándar fueron eritemas de 21 y 11 mm, respectivamente, ¿Es posible conducir
a partir de estos datos que la media de la población es menor que 30? Sea el nivel de significancia del 5
%. Obtenga la potencia de la prueba si el diámetro promedio verdadero fuera 25 mm.

2.7 Una maquina vendedora de refrescos está proyectada para despachar, cuando funciona correctamente
cuando menos 7 onzas de refresco por vaso con una desviación estándar de 0,2 onza. Si el estadístico
selecciona una muestra aleatoria de 16 vasos para un estudio especial y el estadístico está dispuesto a
tener un riesgo () de tipo I de 5 %, calcule la potencia de la prueba y la probabilidad de un error tipo II
() si la cantidad promedio de población despachada es:
a) 6,9 onzas por vaso
b) 6,8 onzas por vaso

2.8 En el problema anterior. Si el estadístico seleccionó una muestra aleatoria de 25 vasos, arrojando una
varianza de 0.2 onza y utilizó un riesgo () de 5 %, calcule la potencia de la prueba y la probabilidad de
un error tipo II () , si la población promedio despachada es: a) 6,9 onzas b) 6,8 onzas
Compare los resultados de ambos problemas

Estimación de parámetros y pruebas de hipótesis 37


2.9 Si una muestra aleatoria de tamaño n = 8 se usa para probar la hipótesis de que la media de una
población es 200 con una desviación estándar de 20, contra la hipótesis alternativa que la media es
diferente a 200 y  = 0,05. Determine la probabilidad de cometer el error tipo II cuando

a)  = 190 b)  = 185 c)  = 180 d)  = 175 e)  = 170

2.10 Los siguientes datos se refieren a los niveles de presión intraocular (en mm Hg) registrados en una
muestra de 21 individuos de edad avanzada:

14.5 12.9 14.0 16.1 12.0 17.5 14.1


12.9 17.9 12.0 16.4 24.2 12.2 14.4
17.0 10.0 18.5 20.8 16.2 14.9 19.6

¿Es posible conducir a partir de estos datos que la media de la población de la cual se extrajo la muestra
es mayor que 14? Sea nivel de significancia del 0.05.

2.11 Se plantea la hipótesis de que no más del 5% de las refacciones que se fabrican en un proceso de
manufactura tiene defectos. Para una muestra aleatoria de n = 100 refacciones, se encuentra que 10
están defectuosas. Pruebe la hipótesis nula al 5 % del nivel de significancia.

2.12 Una aerolínea afirma que solo el 6 % de todos los equipos perdidos nunca se encuentra. Si en una
muestra aleatoria, 17 de 200 artículos de equipaje nunca son encontrados, pruébese la hipótesis nula de
que p = 0,06 contra la hipótesis alternativa de que p > 0,06 con un nivel de significancia del 0,05.

2.13 Un estudio en 90 mujeres que habían dado a luz recientemente, elegidas al azar entre los registros de
un departamento de bienestar social, reveló que 27 de ellas tuvieron un problema de infección intraparto
0 posparto. Pruebe la hipótesis nula que dice que la proporción de la población con un problema de
infección intraparto 0 posparto es ≤ a 0.25. Sea el nivel de significancia de 0.05

2.14 La vida útil promedio de una muestra aleatoria de n = 10 focos, es de 4000 horas, con una desviación
estándar de 200 horas. En general, se asume que la vida útil de los focos tiene una distribución normal.
Suponga que, antes de obtener la muestra, se plantea la hipótesis de que la desviación estándar de la
población no es superior a 150. Trabaje con un nivel de significancia del 1 % para probar dicha hipótesis.

2.15 Empléese el nivel de significancia 0,01 para probar la hipótesis nula de que la desviación es 0,015
pulgadas para los diámetros de ciertos pernos contra la hipótesis alternativa de que la desviación difiere
de ese valor, suponiendo que una muestra de tamaño 15 produjo s2 = 0,00011.

2.16 Suponga que se plantea la hipótesis de que la desviación estándar del salario por hora de los
trabajadores a destajo en una determinada industria es 3000 $. Para una muestra de 15 trabajadores
elegidos al azar, se encuentra que la desviación estándar es de 2000 $. Se supone que las cifras de
ingresos de los trabajadores de la población tienen distribución normal. ¿Puede rechazarse la hipótesis
nula utilizando un nivel de significancia del 5 %

2.17 Con base en las especificaciones dadas por un ingeniero de proceso, se plantea la hipótesis de que la
desviación estándar de los diámetros de ciertas piezas no es mayor de 3 mm. Para una muestra de n =
12 piezas, se encuentra una desviación estándar de 4,2 mm. Se supone que la distribución de los
diámetros es aproximadamente norma. ¿Puede rechazarse la hipótesis nula que la desviación estándar
verdadera no es mayor de 3 mm. a un nivel de significancia del
a) 5 % y b) del 1%?

2.18 Se registraron los valores de la capacidad vital de una muestra de 10 pacientes con obstrucción crónica
severa de las vías respiratorias. La variancia de las 10 observaciones fue de 0.75. Pruebe la hipótesis
nula que indica que la variancia de la población es de 1.00. Sea a. =0.05.

2.19 Una investigación de dos tipos de equipo de fotocopiado reveló que 75 fallas del primer tipo de equipo
fueron reparadas en un tiempo promedio de 83,2, mientras que 75 fallas del equipo del segundo tipo
fueron reparadas en un tiempo promedio de 90,8 minutos. Se conoce que las desviaciones
estándares poblacionales son 19,3 y de 21,4 minutos, respectivamente.
Pruebe la hipótesis nula 1 - 2 = 0 (es decir que en promedio se tarda el mismo tiempo para reparar
cualquier tipo de equipo) contra la hipótesis alternativa de que 1 - 2  0
con un nivel de significancia de  = 0,05.

Estimación de parámetros y pruebas de hipótesis 38


2.20 Se desea probar que el sueldo promedio de varones y mujeres es el mismo, para el mismo puesto, en
empresas del sector. Si los datos revelan que 15 hombres, ganan en promedio 9000 pesos mensuales con
una desviación estándar de 400 pesos, mientras que 14 mujeres perciben en promedio 8000 pesos
mensuales con una desviación estándar de 500 pesos. Además, suponga que las poblaciones de donde se
tomaron las muestras tienen la misma varianza ¿qué puede concluirse con un nivel de significancia de
0,01?

2.21 En un programa de capacitación industrial, algunos aprendices son instruidos con el método A, el cual
consiste en instrucción mecanizada, y algunos son capacitados con el método B, que entraña también la
atención personal de un instructor. Si muestras aleatorias de tamaño 10 son tomadas de grandes grupos
de aprendices capacitados por cada uno de estos métodos, y las calificaciones que obtuvieron en una
prueba de aprovechamiento son:

Método A
71 75 65 69 73 66 68 71 74 68

Método B
72 77 84 78 69 70 77 73 65 75

Úsese un nivel de significancia de 0,05 para probar la afirmación de que hay diferencias en los
métodos. Supóngase que las poblaciones muestreadas pueden aproximarse con distribuciones
normales que tienen la misma variancia.

2.22 Se presentan datos sobre calificaciones de índice de destrucción pulmonar

No fumadores
18.1 6 10,8 11 7,7 17,9 8,5 13 18,9

Fumadores
16,6 13,9 11,3 26,5 17,4 15,3 15,8 12,3 18,6 12 24,1 16,5 21,8 16,3 23,4 18,8

Pruebe la hipótesis que hay diferencias en los índices de destrucción pulmonar debido al consumo de
cigarrillos. Los índices siguen una distribución aproximadamente normal, aunque no se conozcan las
variancias, se suponen iguales. Nivel de significancia 0.05

2.23 Realice la misma prueba del ejercicio anterior, pero considere, que las desviaciones estándar de las
poblaciones son diferentes

2.24 Una compañía constructora presenta 3 métodos de construcción. Se tomaron varios proyectos y los
datos reflejan la cantidad de mts cuadrados construidos en 30 días. Significancia 5%

Sistema A 55 60 63 56 59 55
Sistema B 57 53 64 49 62
Sistema C 66 52 61 57

a) Estime la varianza entre las medias muestrales


b) Estime la varianza dentro de las muestras
c) Calcule F y realice la prueba para ver si tienen la misma efectividad los tres sistemas

2.25 Se asignan en forma aleatoria 15 participantes de un programa técnico a tres distintos métodos de
instrucción. En la tabla se presentan las calificaciones del avance al término de la unidad de instrucción y
se presentan las calificaciones promedias. Pruebe que no hay diferencias entre los métodos de
instrucción con una significancia del 5 %

Método de Calificaciones de las pruebas


instrucción
A1 86 79 81 70 84
A2 90 76 88 82 89
A3 82 68 73 71 81

2.26 Se desea saber el grado de ansiedad respecto de ciertas enfermedades, realizándose un test que mide
el grado de ansiedad del individuo. Los resultados se dan en la tabla

Estimación de parámetros y pruebas de hipótesis 39


Enfermedad Grado de ansiedad
A 465563
B 2155464
C 75879355

¿Qué puede concluirse con 5% de significancia?

2.27 Se presentan los datos relacionados con la reacción de los estudiantes ante la ampliación de un
programa cultural colegial de acuerdo con la clase a la que pertenecen, en donde “división menor” indica
que se trata de un alumno de nuevo ingreso o que se encuentra en el segundo año, y la “división
superior” señala que los alumnos se encuentran en el tercero o cuarto año. Pruebe la hipótesis nula de
que la posición de clase y la reacción ante el programa cultural son variables independientes, utilizando
el nivel de significancia del 5 %

Clase
Reacción Menor Superior
A favor 40 38
En contra 20 32

2.28 Una empresa multinacional desea conocer si hay diferencias significativas en el grado de satisfacción de
los empleados según el país. Pruebe al 5% de significancia la hipótesis de que la satisfacción no depende
del país en la que se encuentran los empleados

Satisfacción
Reacción Alta Media Baja
España 500 300 100
Francia 700 350 150
Italia 650 200 150

Estimación de parámetros y pruebas de hipótesis 40


En Excel puede utilizar la función estadística PRUEBA.Z.N que devuelve el valor P
de una cola en una prueba Z.

Al ejecutar la función debe ingresar en:

Matriz: el rango de celdas de los datos frente a los que se ha de contrastar el parámetro
X: el valor del parámetro a comprobar
Sigma: la desviación estándar conocida de la población, si omite usa la desviación de la muestra

Estimación de parámetros y pruebas de hipótesis 41


Excel dispone de la función estadística PRUEBA.T.N. Devuelve la probabilidad
asociada con la prueba t de Student., para determinar la probabilidad de que dos
muestras puedan proceder de dos poblaciones subyacentes con igual media

Al ejecutar la función, ingrese en:


Matriz1: el primer conjunto de datos
Matriz2: el segundo conjunto de datos
Colas: el número de colas de la distribución
Tipo: es el tipo de prueba 1 (apareada) 2 (igual varianza) 3 (diferentes varianzas)

Estimación de parámetros y pruebas de hipótesis 42


Otra posibilidad que brinda Excel, es utilizar la herramienta Análisis de datos, allí
dispone de las funciones para análisis de datos: prueba Z para medias de dos
muestras, prueba t para datos apareados, prueba t con varianzas iguales, y prueba
t con varianza diferentes.

Ingresando a la herramienta Análisis de datos, ejecute la función para


análisis prueba z para medias de dos muestras,

Ingrese en la nueva ventana:


Rango para el primer conjunto de datos
Rango para el segundo conjunto de datos
Diferencia hipotética entre las medias
Varianza conocida del primer conjunto de datos

Estimación de parámetros y pruebas de hipótesis 43


Varianza conocida del segundo conjunto de datos
Nivel de significancia (alfa)

Ingresando a la herramienta Análisis de datos, ejecute la función para


análisis prueba t para medias de dos muestras emparejadas,

Ingrese en la nueva ventana:


Rango para el primer conjunto de datos
Rango para el segundo conjunto de datos
Diferencia hipotética entre las medias
Nivel de significancia (alfa)

Estimación de parámetros y pruebas de hipótesis 44


Ingresando a la herramienta Análisis de datos, ejecute la función para
análisis prueba t para dos muestras suponiendo varianzas iguales,

Ingrese en la nueva ventana:


Rango para el primer conjunto de datos
Rango para el segundo conjunto de datos
Diferencia hipotética entre las medias
Nivel de significancia (alfa)

Ingresando a la herramienta Análisis de datos, ejecute la función para


análisis prueba t para dos muestras suponiendo varianzas desiguales,

Estimación de parámetros y pruebas de hipótesis 45


Ingrese en la nueva ventana:
Rango para el primer conjunto de datos
Rango para el segundo conjunto de datos
Diferencia hipotética entre las medias
Nivel de significancia (alfa)

Excel, también dispone en la herramienta Analisis de datos, la función para análisis


Analisis de varianza de un factor

Estimación de parámetros y pruebas de hipótesis 46


En la nueva ventana debe ingresar:

El rango de los datos


Agrupación por filas o columnas
Nivel de significancia (alfa)

A continuación, la pantalla con los resultados del analisis

Estimación de parámetros y pruebas de hipótesis 47


Otras funciones de análisis de varianza que puede ejecutar son: Analisis de
varianza de dos factores con varias muestras por grupo y Analisis de
varianza de dos factores con una sola muestra por grupo.

Con Excel puede utilizar la función estadística PRUEBA.CHICUAD, que devuelve la


prueba de independencia, el valor de la distribución chi cuadrado para la estadística
y los grados adecuados de libertad

Estimación de parámetros y pruebas de hipótesis 48


En la nueva ventana debe ingresar:

Rango real: rango con datos observados para contrastar con los esperados
Rango esperado: rango de datos que contiene el resultado del producto de los totales de
filas y columnas con el total general

Estimación de parámetros y pruebas de hipótesis 49


Respuestas

Estimación de parámetros

1.1 a) 16 b)  = 7,25 ; insesgabilidad 1.19 ≥ 9604

1.2 a) 58,33 b) Md = 50 Me = 50 1.20 [0,016 ; 0,183]

1.3 [510,6 ; 569,4] 1.21 271 ; 214

1.4 [3.346.601 ; 3.503.399] 1.22 a) [0.6246 ; 0,7753] b) ≥ 292

1.5 [1935,6 ; 2064,4] 1.23 a) 15,96 b) 0,14 c) [15,87 ; 16,06]

1.6 [74,0353 ; 74,0366] 1.24 [0,023 ; 0,0539]

1.7 [0,9780 ; 1,0330] 1.25 [207725 ; 329045]

1.8 [6,47 ; 7,12] 1.26 0,8485

1.9 a) [1003,04 ; 1024,95] 1.27 ≥ 171


b) [999,60 ; 1028,39}
1.28 ≥ 209
1.10 [214,58 ; 245,41]
1.29 0,9982
1.11 a) [176,05 ; 179,94] b) ≥ 87
1.30 1,87
1.12 a) 4,74 b) [1512,19 ; 1527,80]
1.31 [8,219 ; 8,248]
1.13 16
1.32 [7,63 ; 8,36]
1.14 44
1.33 [0,008 ; 0,036]
1.15 [77,68 ; 84,51]
1.34 ≥385 ; ≥ 289
1.16 [0,056 ; 0,183]
1.35 ≥ 16590
1.17 [0,036 ; 0,106] [731 ; 2125]
1.36 [0,67 ; 2,50]
1.18 [0,9594 ; 0,9805]

Pruebas de hipótesis

2.1 Z= 4,97 Rechazo H0 2.9 a) 0,7070


b) 0,4358
2.2 Z=4 Rechazo H0 c) 0,1925
d) 0,0575
2.3 
a) H0 ;  2,8 H1 ;  < 2,8 e) 0,0112
b) Rechazo H0
2.10 T= 2,19 Rechazo H0
2.4 T = -1,84 No se rechaza la H0
2.11 Z = 2.29 Rechazo H0
2.5 T= -4,31 Rechazo H0
2.12 Z = 1,48 No se rechaza HO
2.6 Z= -5,72 Rechazo H0 1-β= 0,9378
2.13 Z= 1,09 No se rechaza HO
2.7 a) 1- = 0,6387  = 0,3612
b) 1- = 0,9907  = 0,0092
2.14 2 = 16 No se rechaza Ho

2.8 a) 1- = 0,8037  = 0,1962 2.15 2 = 6.84 No se rechaza H0


b) 1- = 0,9996  = 0,0003
c) Si n crece,  disminuye

Estimación de parámetros y pruebas de hipótesis 50


2.16 2 = 6.22 No se rechaza H0
2.23 t = 2,504 se rechaza H0
2.17 a) 2 = 23.52 Se rechaza H0
b) 2 = 23.52 No se rechaza H0 2.24 a) 4,5 b) 26 c) F=0,17 No se rechaza

2.18 2 = 6.75 No se rechaza H0 2.25 F=3,35 No se rechaza hipótesis

2.26 F=3,34 No se rechaza hipótesis


2.19 Z = -2,28 Rechazo H0
2.27 2 = 2,063 No se rechaza la hipótesis
2.20 t = 5,86 se rechaza H0
2.28 Se rechaza la hipótesis
2.21 t = 1.98 No se rechaza H0

2.22 t = 2,6579 se rechaza H0

Bibliografía

o RONALD WALPOLE - RAYMOND MYERS - SHARON MYERS. Probabilidad y Estadística para


Ingenieros. Sexta edición. Pearson Educación Latinoamérica. Prentice Hall. 1999. México
o WILLIAM W. HINES – DOUGLAS C MONTGOMERY. Probabilidad y Estadística para Ingeniería y
Administración. Tercera edición. CECSA. 1996. México
o LEONARD KAZMIER – ALFREDO DIAZ MATA. Estadística Aplicada a la Administración y a la
Economía. Segunda edición revisada. McGraw-Hill. Series Schaum. 1995. México
o CARLOS GARIBALDI. Aprender Estadística Aplicar Excel Tomar decisiones. Libryco. 2014.
Argentina
o PAULO ALFONSO LOPES. Probabilidad  Estadística. Conceptos, Modelos, Aplicaciones en Excel.
Pearson Educación. Prentice Hall. 2000. Colombia
o STEPHEN P. ROBBINS – DAVID A. DE CENZO. Fundamentos de administración. Conceptos y
Aplicaciones. Prentice Hall Hispanoamericana. 1996. México.
o MARK L. BERENSON – DAVID M. LEVINE. Estadística para administración y Economía. Concepto
y Aplicaciones. Prentice Hall. 1982. México
o WAYNE W. DANIEL. Bioestadística. Base para el análisis de las ciencias de la salud. Limusa. 2002

Webgrafía

Estimación de parámetros
https://www.youtube.com/watch?v=fpdZMHsTlIc https://www.youtube.com/watch?v=2wugQGs1GNY
https://www.youtube.com/watch?v=cMqgG_lBC2U https://www.youtube.com/watch?v=VQJpcYPfEI4
https://www.youtube.com/watch?v=QqaO9b2HdYQ

Pruebas de hipótesis
https://www.youtube.com/watch?v=5ZvKgnRVSjI https://www.youtube.com/watch?v=tR_8mY2OV
https://www.youtube.com/watch?v=QZkD1AH4dtU Y8
https://www.youtube.com/watch?v=M2O-kWEfxYI
https://www.youtube.com/watch?v=YewLM8SO
https://www.youtube.com/watch?v=ttMkW7HdIKU
https://www.youtube.com/watch?v=gHkMGcn2MsE
https://www.youtube.com/watch?v=mm_7RuYUGdM
https://www.youtube.com/watch?v=yGelIc-H2ng

Estimación de parámetros y pruebas de hipótesis 51

También podría gustarte