Notas Estadistciaa

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 81

Distribución normal

Variable continua: que sirve para contar como la edad.

Al graficar eso da la campana de Gauss

La integral de esa ecuación desde un punto o un valor que se le da a la variable a otro punto es el
área bajo la curva que hay debajo de la parte de la curva entre un punto al otro. Esa área es la
probabilidad de que la variable este entre esos dos valores.
La tabla normal de valores z son todas las integrales posibles.
Se supone que casi todos los datos están a 4 desviaciones estándar de la media, entonces por eso la
tabla normal de Z solo muestra valores hasta 4. Entonces si Z da más de 4, simplemente se dice que la
probabilidad que le corresponde es 0.5, que es lo máximo que mide la mitad de la gráfica.
Por ejemplo, la diferencia entre menor y menor igual no es mucha, así que se toman como igual.
Cuando diga que menor que, no hay que incluir todos los valores desde que la variable es 0 (cero) por
defecto, porque sería algo irreal, entonces sabiendo que a 4 desviaciones estándar de la media están
todos los datos, se le resta a la media 4 veces la desviación y se usa ese valor que dio como punto de
partida. Eso cuando se usa integral, si no, se usa la tabla y solo se le suma o resta 0.5 dependiendo del
tipo de tabla.
La probabilidad de un punto específico es 0 (cero) matemáticamente. Para solucionar ese problema,
se toma un rango alrededor de la media, uno muy pequeño, y calcular la probabilidad desde el punto
inferior hasta el superior establecidos. La probabilidad que dé, se multiplica por la cantidad de valores
que toma la variable y esa es la repuesta de un punto específico.
Ejercicio:
Media: 73 - Desviación estándar: 8
1 ¿Cuál es la probabilidad de obtener como máximo, una calificación de 91 puntos?
2 ¿Qué porcentaje de estudiantes alcanzaron calificación entre 65 y 89 puntos?
3 ¿Qué porcentaje de estudiantes tuvo como máximo 81 puntos?
4 ¿Qué porcentaje de estudiantes tuvieron como mínimo 68 puntos?
5 ¿Cuál es la calificación del examen final si solo el 5% de los estudiantes que pasaron la prueba
tuvieron calificaciones más altas? O sea, cual es la nota en donde comienzan el 5% de las calificaciones
más altas.
1) P(x<91)
91−73
z=
8
18
z=
8
z=2.25
P ( 73< x< 91 )=0.4875
P( x <73)=0.5
P ( x< 91 )=P ( 73< x< 91 )+ P (X <73)
P ( x< 91 )=0.9875
---------------------------------------------
4) P(68<x)
68−73
z=
8
5
z=
8
-------------------------------------------------------
z=0.625 --
P(73< x )=0.5
P ( 68< x< 73 )=0.23405
P ( 68< x )=P ( 73< x )+ P ( 68< x <73 )
P ( 68< x )=0.73405
Ejercicio
El tiempo de reacción para cierto experimento psicológico está distribuido normalmente con una
media de 20 segundos y una desviación estándar de 4 segundos.
a) ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción entre 25 y 30
segundos?
b) ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción que no sobrepase los
24 segundos?
c) ¿Qué porcentaje de personas tienen tiempo de reacción de como mínimo 14 segundos?
d) ¿Cuál es el tiempo de reacción de modo que solo el 1% de todas las personas reaccionen con
mayor rapidez?
e) ¿Cuál es el tiempo de reacción que cae en Q 2?
f) ¿Qué porcentaje de personas no sobrepasan los 16 segundos en reaccionar?
Respuesta.
a) P ( 25< x< 30 )

POR TABLA:
P ( μ < x< 30 )=P ( 20< x <30 )
30−20
z=
4
10
z=
4
z=2.5
- Para este Z la probabilidad es de P ( 20< x< 30 )=0.4938
P ( μ < x< 25 )=P ( 20< x <30 )
25−20
z=
4
5
z=
4
z=1.25
- Para este Z la probabilidad es de P ( 20< x< 25 )=0.3944

P ( 25< x< 30 )=P ( 20< x <30 )−P ( 20< x <25 )


P ( 25< x< 30 )=0.4938−0.3944
P ( 25< x< 30 )=0.0994=9.94 %
POR ECUACIÓN:
P ( 25< x< 30 )=0.09944=9.944 %
b) P ( x<24 )
POR TABLA:
P ( μ < x< 24 )=P ( 20< x <24 )
24−20
z=
4
4
z=
4
z=1
- Para este Z la probabilidad es de P ( 20< x< 24 ) =0.3413
P ( x< μ )=P ( x <20 )=0.5

P ( 25< x< 30 )=P ( 20< x <24 )+ P ( x <20 )


P ( 25< x< 30 )=0.3413+ 0.5
P ( 25< x< 30 )=0.8413
POR ECUACIÓN:
P ( 25< x< 30 )=0.841313

c) P ( 14< x )
POR TABLA:
P ( 14< x < μ )=P ( 14< x<20 )

z=¿ 14−20∨ ¿ ¿
4
6
z=
4
z=1.5
- Para este Z la probabilidad es de P ( 14< x <20 )=0.4332
P ( μ < x )=P ( 20< x )=0.5

P ( 25< x< 30 )=P ( 14< x <20 ) + P ( 20< x )


P ( 25< x< 30 )=0.4332+0.5
P ( 25< x< 30 )=0.9332
POR ECUACIÓN:
P ( 25< x< 30 )=0.93316

d) Velocidad x m de reacción donde comienza el 1% de las reacciones más veloces.


P ( μ< x < x m )=0.5−0.01

P ( μ< x < x m )=0.49

La anterior probabilidad, según la tabla, corresponde a un valor de z=2.325


En la ecuación para hallar el valor z se encuentra la variable velocidad, en consecuencia, solo hay que
despejar x m para el valor de z=2.325, una desviación estándar de σ =4 y la media de μ=20
z=2.325
x m−20
2.325=
4
2.325 ( 4 ) +20=x m

x m=29.3

Para comprobar, usando el método de integración, se calcula la probabilidad de que la velocidad de


reacción sea 20<x<29.3, la cual debe dar 0.49 que es igual a 0.5 – 0.01.
P ( 20< x< 29.3 )=0.489966 ≅ 0.49

e) x (Q2)

Sencillo, Q 2 corresponde al 50% de las probabilidades y se encuentra situado justo en el mismo lugar
de la media μ. Por consiguiente, como ya conocemos la media μ=20, Q 2=20 .

f) P ( x<16 )%
POR TABLA:
P ( x< μ )=P ( x <20 )=0.5
P ( 16< x < μ )=P ( 16< x <20 )

z=¿ 16−20∨ ¿ ¿
4
4
z=
4
z=1
- Para este Z la probabilidad es de P ( 16< x <20 )=0.3413

P ( x<16 )=P ( x<20 )−P ( 16< x <20 )


P ( x<16 )=0.5−0.3413
P ( x<16 )=0.1587=15,87 %
POR ECUACIÓN:
P ( x<16 )=0.15862
Junio 6
Distribuciones muestrales
Distribución muestral de proporciones: es el conjunto de las proporciones que se toma de distintas
muestras cuando la variable es cualitativa.
Distribución muestral de media: es el conjunto de medias de las muestras.
Error muestral de la media: todas las medias de cada muestra en la vida real son distintas
aunque deberían ser iguales en teoría. Esa diferencia entre esas medias es el error.
Se escoge la media y no otra medida de tendencia central porque:
- El sesgo es cero o no hay error, ya que la media poblacional es igual a la media de las medias
de las muestras (sumar las medias de todas las muestras y dividir entre la cantidad de
muestras).
- Además si yo cambio los individuos de una muestra a otra se mantiene la media.
- También si la muestra se aumenta o disminuye, sigue teniendo la misma media.
Desviación estándar de la distribución muestral de media o error estándar de la media: diferencia
entre las medias.
σ ( x́)=

La media de medias es igual a la media poblacional.


La probabilidad o área bajo la curva de gauss se halla así:

En este caso no se usa desviación poblacional sino error estándar de la media y no se usa un valor x
sino una media X́ i .
Ejercicio:
Media poblacional = μ( x )
Desviación poblacional = σ ( x)
μ ( x )=368
σ ( x )=15
n=25
a) P ( 365< x́< 368 )

z=¿ 365−368∨ ¿ ¿
15
√ 25
3
z=
3
z=1
Para esa z la probabilidad según la tabla es de P=0.3414
Entonces P ( 365< x́< 368 )=0.3414
Usando la ecuación de integración:
b) A qué porcentaje pertenece la probabilidad anterior
34.14%
c) P(0.475)= x́
El valor de z para esta probabilidad es z=1.96
Que media corresponde a z=1.96
x́−μ ( x )
1.96=
σ ( x́ )
x́−368
1.96=
15
√25
x́−368
1.96=
3
1.96 ( 3 ) +368=−x́
373.88= x́ Superior
368−1.96 (3 )=x́
362.12= x́ Inferior

Ejercicio
Las bolsas de papel para mercado que su resistencia sigue una distribución normal con una media
poblacional de 5 L/P^2 y una desviación estándar poblacional de 1 L/P^2.
Preguntas
a) ¿Qué proporción de las bolsas producidas tienen resistencia entre 5 y 5.5 L/P^2?
b) ¿Qué proporción de las bolsas producidas tienen resistencia máxima de 5.1 L/P^2?
c) ¿Qué proporción de las bolsas producidas tienen resistencia mínima 4.5 L/P^2?
d) Si ahora seleccionamos al azar muestras de tamaño 16 bolsas ¿Qué le sucedería a las
preguntas anteriores?
e) ¿Qué es más probable que ocurra?
a. un valor individual sobre 5.5 L/P^2
b. media muestral por encima de 5.25 L/P^2 en una muestra de tamaño 4
c. media muestral por encima de 5.1 L/P^2 en una muestra de tamaño 25

a) P(5< x <5.5)
5.5−5
z=
1
z=0.5
Para este valor de z hay una probabilidad según la tabla de P=0.1915
P ( 5< x< 5.5 )=0.1915
Por ecuación de integral:
P ( 5< x< 5.5 ) ≅ 0.19146

b) P ( x<5.1 )
P ( x<5.1 ) =P ( x <5 ) + P ( 5< x <5.1 )
P ( x<5 )=0.5
P ( 5< x< 5.1 )=¿ ?
5.1−5
z=
1
z=0.1
Para este valor de z hay una probabilidad de P=0.0398
P ( 5< x< 5.1 )=P ( x <5 )+ P ( 5< x <5.1 )
P ( 5< x< 5.1 )=0.5+0.0398
P ( 5< x< 5.1 )=0.5398
Por ecuación de integral:
P ( x<5.1 ) ≅ 0.53983

c) P ( 4.5< x )
P ( 4.5< x )=P ( 4.5< x<5 )+ P ( 5< x )
P ( 4.5< x <5 ) =?

z=¿ 4.5−5∨ ¿ ¿
1
z=0.5
Para este valor de z hay una probabilidad según la tabla de P=0.1915
P ( 4.5< x )=P ( 4.5< x<5 )+ P ( 5< x )
P ( 4.5< x )=0.1915+ 0.5
P ( 4.5< x )=0.6915
Por ecuación de integral:
P ( 4.5< x ) ≅ 0.69143

d) Deviaciones muestrales

1)P(5< x́ <5.5)
5.5−5
z=
1
√16
z=2
Para este valor de z hay una probabilidad según la tabla de P=0.4772
P ( 5< x́< 5.5 )=0.4772
Por ecuación de integral:
P ( 5< x́< 5.5 ) ≅ 0.47725

2) P ( x́<5.1 )
P ( x́<5.1 ) =P ( x́ <5 ) + P ( 5< x́ <5.1 )
P ( x́<5 )=0.5
P ( 5< x́< 5.1 )=¿ ?
5.1−5
z=
1
√16
z=0.4
Para este valor de z hay una probabilidad de P=0.1554
P ( 5< x́< 5.1 )=P ( x <5 )+ P ( 5< x <5.1 )
P ( 5< x́< 5.1 )=0.5+0.1554
P ( 5< x́< 5.1 )=0.6554
Por ecuación de integral:
P ( x́<5.1 ) ≅ 0.53983

3)P ( 4.5< x́ )
P ( 4.5< x́ )=P ( 4.5< x́<5 )+ P ( 5< x́ )
P ( 4.5< x́ <5 ) =?

z=¿ 4.5−5∨ ¿ ¿
1
√ 16
z=2
Para este valor de z hay una probabilidad según la tabla de P=0.4772
P ( 5< x́ )=0.5
P ( 4.5< x́ )=P ( 4.5< x́<5 )+ P ( 5< x́ )
P ( 4.5< x́ )=0.4772+ 0.5
P ( 4.5< x́ )=0.9772
Por ecuación de integral:
P ( 4.5< x́ ) ≅ 0.97722

e) ¿Qué es más probable?


1) P ( x=5.5 ) ≅ P ( 5.49< x <5.51 )
P ( 5.49< x<5.51 ) =P ( x <5.51 )−P ( x <5.49 )
P ( x<5.51 ) =?
5.51−5
z=
1
z=0.51
Para este valor de z=0.51 la probabilidad es de P( x <5.51)=0.195
P ( x<5.49 )=?
5.49−5
z=
1
z=0.49
Para este valor de z=0.49 la probabilidad es de P( x <5.49)=0.1879
Volviendo a la ecuación aproximada a la original:
P ( 5.49< x<5.51 ) =P ( x <5.51 )−P ( x <5.49 )
P ( 5.49< x<5.51 ) =0.195−0.1879
P ( 5.49< x<5.51 ) =0.0071
Volviendo a la ecuación original:
P ( x=5.5 ) ≅ P ( 5.49< x <5.51 )
P ( x=5.5 ) ≅ 0.0071

2) P ( 5.25< x́ )
P ( 5.25< x́ )=P (5< x́ ) −P ( 5< x́<5.25 )
P ( 5< x́ )=0.5
P ( 5< x́< 5.25 )=?
5.25−5
z=
1
√4
z=0.5
Para este valor de z=0.5 hay una probabilidad según la tabla de P ( 5< x́< 5.25 )=0.1915
P ( 5.25< x́ )=P (5< x́ ) −P ( 5< x́<5.25 )
P ( 5.25< x́ )=0.5−0.1915
P ( 5.25< x́ )=0.3085
3) P ( 5.1< x́ )
P ( 5.1< x́ ) =P ( 5< x́ ) −P ( 5< x́ <5.1 )
P ( 5< x́ )=0.5
P ( 5< x́< 5.1 )=?
5.1−5
z=
1
√25
z=0.5
Para este valor de z=0.5 hay una probabilidad según la tabla de P ( 5< x́< 5.1 )=0.1915
P ( 5.1< x́ ) =P ( 5< x́ ) −P ( 5< x́ <5.1 )
P ( 5.1< x́ ) =0.5−0.1915
P ( 5.1< x́ ) =0.3085
Por función de densidad da igual.

Conclusión: Al comparar las probabilidades de los escenarios 1, 2 y 3 con probabilidades de 0.0071,


0.3085 , y 0.3085 respectivamente se concluye que el escenario con mayor probabilidad es tanto el
segundo (mayor a 5.25) como el tercero (mayor a 5.1). Aunque sería lógico pensar que es más
probable el caso 3 porque incluye más datos, la conclusión demuestra lo importante que es el tamaño
de la muestra, pues por ser una muestra tan pequeña 4 bolsas la probabilidad se vio distorsionada. De
hecho si se hubiese usado una muestra de 25 en el segundo caso la probabilidad sería de 0.1056.
<

Distribución proporcional.
La media ahora es la proporción, es decir el valor de la mitad. Esto es para variables cualitativas.

Por función de densidad es similar al caso anterior.


Ejercicio
a) Pd =0.1
P(0.09< P¿¿ d< 0.1)=? ¿

z=¿ 0.09−0.1∨ ¿ ¿
0.1 ( 1−0.1 )
√ 400
0.01
z=
0.1(0.9)
√ 400
z=0.667
Para ese valor de z=0.667hay una proporción de P=0.2486
P(0.09< P¿¿ d< 0.1)=0.2486 ¿
Por función de densidad:
P(0.09< P¿¿ d< 0.1)=0.2475¿
Ejercicio
Suponga que se va a realizar una prueba de mercado en la cual los estudiantes probarán 2 marcas
diferentes de refresco. Su tarea es identificar correctamente la marca probada.
Si se seleccionan muestras aleatorias de 200 estudiantes, si se supone que esos no tienen capacidad
para distinguir entre las dos marcas, calcular la proporción de:
a) ¿Qué proporción de las muestras obtendrán entre el 50 y 60% de identificaciones correctas?
b) ¿Qué proporción de las muestras obtendrán como máximo el 55% de identificaciones correctas?
c) ¿Qué proporción de las muestras obtendrán como mínimo el 48% de identificaciones correctas?
d) ¿Dentro de que límites simétricos del porcentaje de la población se encontrará el 90% de
porcentajes de las muestras?
e) ¿Cuál es la probabilidad de obtener un porcentaje de muestra de identificaciones correctas que
exceda el 65%?
f) ¿Qué es más probable que ocurra?
f1) más de un 60% de identificaciones correctas en una muestra de 200
f2) más del 55% de identificaciones correctas en una muestra de 1000
RESPUESTAS

a) P ( 0.5< Ps < 0.6 )


0.6−0.5
z=
0.5 ( 1−0.5 )
√ 200
z=2.83
Para este valor de z=2.83 la proporción es de P=0.4977
P ( 0.5< x <0.6 )=0.4977

b) P ( Ps <0.55 )
P ( Ps <0.55 )=P ( Ps<0.5 )+ P( 0.5< Ps<0.55)
P ( Ps <0.5 )=0.5
P ( 0.5< Ps<0.55 ) =?
0.55−0.5
z=
0.5(1−0.5)
√ 200
0.55−0.5
z=
0.03536
z=1.414
Para este valor de z=1.414 hay una proporción de P=0.4207
P ( Ps <0.55 )=P ( Ps<0.5 )+ P ( 0.5< Ps< 0.55 )
P ( Ps <0.55 )=0.5+0.4207
P ( Ps <0.55 )=0.9207

c)P ( 0.48< Ps )
P ( 0.48< Ps )=P ( 0.5< Ps )+ P (0.48< Ps<0.5)
P ( 0.5< Ps )=0.5
P(0.48< Ps< 0.5)=?
z=¿ 0.48−0.5∨ ¿ ¿
0.5(1−0.5)
√ 200
0.02
z=
0.03536
z=0.5656
Para este valor de z=0.5656 hay una proporción de P=0.2123
P ( 0.48< Ps )=P (0.5< x)+ P( 0.48< x< 0.5)
P ( 0.48< Ps )=0.5+0.2123
P ( 0.48< Ps )=0.7123

d) P ( Ps=? )=0.45
P=0.45
¿Qué valor corresponde a esa proporción?
z=1.645
Ps−0.5
z=
0.03536
1.645 ( 0.03536 ) +0.5=Ps
0.5582=Pss
Psi=−1.645 ( 0.03536 ) +0.5
Psi=0.4418

e) P ( 0.65< Ps )
P ( 0.65< Ps )=P ( 0.5< Ps )−P ( 0.5< PS<0.65 )
P ( 0.5< Ps )=0.5
P ( 0.5< Ps<0.65 ) =?
0.65−0.5
z=
0.5 ( 1−0.5 )
√ 200
0.15
z=
0.03536
z=4.24268 ≅ 4.24
Para este valor z ≅ 4.24 hay una proporción de P ( 0.5< Ps<0.65 ) ≅ 0.5
P ( 0.65< Ps )=P ( 0.5< Ps )−P ( 0.5< PS<0.65 )
P ( 0.65< Ps ) ≅ 0.5−0.5
P ( 0.65< Ps ) ≅ 0 ≅ 0 %

f) ¿Qué es más probable?


Primer caso:
P ( 0.6< Ps ) - Para una muestra de 200
P ( 0.6< Ps ) =P ( 0.5< Ps )−P ( 0.5< PS<0.6 )
P ( 0.5< Ps )=0.5
P ( 0.5< Ps<0.6 )=?
0.6−0.5
z=
0.5 ( 1−0.5 )
√ 200
0.1
z=
0.03536
z=2.828 ≅ 2.83
Para este valor z ≅ 2.83 hay una proporción de P ( 0.5< Ps<0.6 )=0.4977
P ( 0.6< Ps ) =P ( 0.5< Ps )−P ( 0.5< PS<0.6 )
P ( 0.6< Ps ) =0.5−0.4977
P ( 0.6< Ps ) =0.0023=0.23 %

Segundo caso:
P ( 0.55< Ps ) - Para una muestra de 1000
P ( 0.55< Ps )=P ( 0.5< Ps )−P ( 0.5< PS<0.55 )
P ( 0.5< Ps )=0.5
P ( 0.5< Ps<0.55 ) =?
0.55−0.5
z=
0.5 ( 1−0.5 )
√ 1000
0.05
z=
0.0158
z=3.1622 ≅ 3.16
Para este valor z ≅ 3.16 hay una proporción de P ( 0.5< Ps<0.55 ) =0.4992
P ( 0.55< Ps )=P ( 0.5< Ps )−P ( 0.5< PS<0.55 )
P ( 0.55< Ps )=0.5−0.4992
P ( 0.55< Ps )=0.0008=0.08 %

¿Qué es más probable?


1) P ( 0.6< Ps ) =0.0023=0.23 %
2) P ( 0.55< Ps )=0.0008=0.08 %
En conclusión, es más probable que haya una proporción mayor al 60% para una muestra de 200
personas que una proporción mayor al 55% para una muestra de 1000 personas.
<

Estimaciones
Sirve para hacer una aproximación a un parámetro (poblacional) mediante un estadístico. Es una
aproximación a la realidad.
Tipos:
Estimación puntual: Es simplemente asumir que la media muestral es igual a la poblacional.
Estimación por intervalo:
Tipos de intervalo:
Cerrado: incluye el límite inferior y el superior. [ , ]
Abierto: no incluye el límite inferior y el superior. ( , )
Mixtos: incluye uno solo de los límites y el otro no. [ , ) o ( , ]
Confianza: es el área bajo la curva en el que se espera que caigan ciertas medidas. Se mide con
el nivel de confianza y se representa con (1-). Este puede ser de (1-)=90% o (1-)=95% por
ejemplo. Significa que se espera que al menos el 90 o 95% de las muestras caigan en el área que
se espera.
Para cada nivel de confianza hay un límite superior e inferior que determina dos valores z.

Teorema del límite central (TLC): busca hacer que una población no
normal se parezca a una normal:
a) Si la población es normal, pues se conoce el error muestral, la distribución muestral sigue
siendo normal.
b) Si la población es simétrica (no se conoce el error muestral) recurrimos al tamaño de la
muestra.
1) si la muestra tiene un tamaño mayor o igual a 30 sigue siendo una distribución normal y se
usa z.
2) si la muestra es menor a 30 se usa t-student.
Trabajo final:
Técnicas de muestreo. Estas pueden ser:
- Muestreo probabilístico.
- Muestreo no probabilístico.
De cada una hay que estudiar:
- Decir para que sirve que es, etc.
- Hablar de 4 técnicas de este tipo de muestreo, con sus características, si se determina en forma
proporcional o no proporcional, entre otros.
- Hacer un ejemplo por cada técnica que demuestre como permite dar solución a distintos
problemas.

Se supone que debe tener una extensión entre 15 y 25 páginas y se hace de a parejas.
Para usar el FPC se debe conocer la población y la muestra es el 5% o más de la población.
<

Características de t-student:
La suma del área de sus colas es mayor al área de su vientre en el caso.
Se usa grado de libertad: restarle 1 a la muestra.
Se utiliza la desviación muestral.
La ecuación de esto es:

Para cada nivel de confianza de por ejemplo 90% (0.90) queda en las colas un área bajo la curva
sobrante, cada cola sería de 0.45, el sobrante a cada lado sería de 0.05. Si se tiene una muestra de
n=20 por ejemplo, el grado de libertad sería n-1=19. Con esos dos datos en la tabla de t-student
hallamos un valor de 1.7291. Con 98% sería un valor t-student de 2.5395 a la izquierda y a la derecha.
t-student
Ejercicio

n=50
desviación=0.02
x raya=0.995
EN RESUMEN LA ESTIMACION SIRVE PARA HALLAR UN PARAMETRO
POBLACIONAL O MAS REALISTA A PARTIR DE ESTADISTICOS O DATOS DE
MUESTRAS OFRECIENDO UN INTERVALO EN EL QUE ESTÉ ESA MEDIA
POBLACIONAL CON UN 90, 95, 98%, ENTRE OTROS, DE CONFIANZA.
SE USA EL TLC PARA SABER QUE ECUACION USAR DEPENDIENDO DEL
TAMAÑO DE LA MUESTRA

Estimación para proporciones.

Ejercicio
Un auditor estatal de seguros quiere determinar la proporción de reclamaciones que
una compañía de seguros médicos paga a los dos meses de recibir la reclamación. Se
seleccionó una muestra aleatoria de 200 reclamantes y se determinó que a 80 se les
pagó dentro de los dos meses de la recesión de la reclamación.
1. Estime un intervalo de confianza del 90, 95 y 99% de la proporción real de la
reclamación pagadas dentro de los dos meses.
2. ¿Qué le sucedería a la pregunta anterior si aumentamos 50 reclamantes y
mantenemos que 80 se les sigue pagando dentro de los dos meses de la recesión
de la reclamación?
3. Suponga que la población en estudio es de 1500 ¿Qué le sucedería a los ítems
anteriores?
4. El director de publicidad de una cadena de restaurantes quisiera estimar la
proporción de estudiantes de secundaria que están familiarizados con cierto
anuncio transmitido por radio y televisión el mes anterior. Una muestra aleatoria
de 400 estudiantes de secundaria mostró que 160 de ellos no conocían el
anuncio. Estime intervalos de confianza del 90 y 99% de la proporción real de la
población de estudiantes de secundaria que sí conocen el anuncio.
Respuestas:
1. Valores z para:
( 1−α )=90 % -> z=1.645

( 1−α )=95 %-> z=1.96

( 1−α )=99 % -> z=2.575

Ps=0.4

 Intervalo ( 1−α )=90 %

0.4 ( 1−0.4 ) 0.4 ( 1−0.4 )


0.4−1.645 (√ 200 )
< P<0.4 +1.645 (√ 200 )
0.343< P< 0.457

 Intervalo ( 1−α )=95 %

0.4 ( 1−0.4 ) 0.4 ( 1−0.4 )


0.4−1.96 (√ 200 )< P< 0.4+1.96 (√ 200 )
0.332< P<0.468
0.317< P< 0.483

 Intervalo ( 1−α )=99 %

0.4 ( 1−0.4 ) 0.4 ( 1−0.4 )


0.4−2.575 (√ 200 )
< P< 0.4+2.575 (√ 200 )
0.311< P< 0.489

2. Para una muestra de 250 -> Ps=80/250=0.32

 Intervalo ( 1−α )=90 %

0.4 (1−0.4 ) 0.4 ( 1−0.4 )


0.32−1.645 (√ 250 )
< P<0.32+1.645 (√ 250 )
0.2706< P< 0.3693

 Intervalo ( 1−α )=95 %

0.4 ( 1−0.4 ) 0.4 ( 1−0.4 )


0.32−1.96 (√ 250 )
< P<0.32+1.96 (√ 250 )
0.2612< P<0.3788
0.345< P< 0.456

 Intervalo ( 1−α )=99 %

0.4 (1−0.4 ) 0.4 ( 1−0.4 )


0.32−2.575 (√ 250 )
< P<0.32+2.575 (√ 250 )
0.2428< P< 0.3973

3. Población de 1500
n=200
 Intervalo ( 1−α )=90 %

0.4 ( 1−0.4 ) 1500−200 0.4 ( 1−0.4 ) 1500−200


0.4−1.645 (√ 200 )( √ 1500−1 )
< P<0.4+1.645 (√ 200 ) (√ 1500−1 )
0.347< P< 0.453

 Intervalo ( 1−α )=95 %

0.4 ( 1−0.4 ) 1500−200 0.4 ( 1−0.4 ) 1500−200


0.4−1.96 (√ 200 )( √ 1500−1 )
< P<0.4+ 1.96 (√ 200 )(√ 1500−1 )
0.337< P< 0.463

 Intervalo ( 1−α )=99 %

0.4 ( 1−0.4 ) 1500−200 0.4 (1−0.4 ) 1500−200


0.4−2.575 (√ 200 )( √ 1500−1 )
< P<0.4+ 2.575 (√ 200 )(√ 1500−1 )
0.317< P< 0.483
n=250

 Intervalo ( 1−α )=90 %

0.4 ( 1−0.4 ) 1500−250 0.4 ( 1−0.4 ) 1500−250


0.4−1.645 (√ 250 )( √ 1500−1 )
< P<0.4+1.645 (√ 250 ) (√ 1500−1 )
0.353< P< 0.447

 Intervalo ( 1−α )=95 %

0.4 ( 1−0.4 ) 1500−250 0.4 ( 1−0.4 ) 1500−250


0.4−1.96 (√ 250 )( √ 1500−1 )
< P<0.4+ 1.96 (√ 250 )(√ 1500−1 )
0.345< P< 0.456

 Intervalo ( 1−α )=99 %

0.4 ( 1−0.4 ) 1500−250 0.4 (1−0.4 ) 1500−250


0.4−2.575 (√ 250 )( √ 1500−1 )
< P<0.4+ 2.575 (√ 250 )(√ 1500−1 )
0.327< P< 0.473

4. Cadena de restaurantes
n=400
P=1-0.4
P=0.6

 Intervalo ( 1−α )=90 %

0.6 ( 1−0.6 ) 0.6 ( 1−0.6 )


0.6−1.645 (√ 400 )
< P< 0.6+1.645 (√ 400 )
0.56< P< 0.64

 Intervalo ( 1−α )=99 %

0.6 ( 1−0.6 ) 0.6 ( 1−0.6 )


0.6−2.575 (√ 400 )
< P< 0.6+2.575 (√ 400 )
0.537< P< 0.66

TAREA: ¿Cómo determinar el tamaño de muestra para medias y proporciones tanto


para poblaciones finitas como infinitas?

<

Determinación de Tamaño de muestras:


Para determinar el tamaño de la muestra se hace un procedimiento diferente para poblaciones finitas
e infinitas. Más información en el archivo de Word.
Error muestral=e=μ− x́

Ejercicio:

z=1.96
σ =400
e=50
z2 σ 2
n=
e2
( 400¿¿ 2)
n=1.962 ¿
50 2
n=¿246

Ejercicio:

z=1.645
P=0.5
e=0.04

z 2 p (1− p)
n=
e2

1.6452 (0.5(1−0.5))
n=
0.042
n=¿423
Colectivamente exhaustivos es que la suma de los elementos suman una probabilidad
de 1.
Mutuamente excluyentes es que los dos sucesos no tienen intersección, solo hay
probabilidad de que tenga éxito el uno o el otro, pero no los dos.

Más ejercicios:
1. Un grupo de consumidores quisiera estimar las cuentas del consumo de energía eléctrica mensual
promedio en el mes de Julio para hogares unifamiliares en la ciudad de Nueva York en el año de
1990. Sobre la base de los estudios realizados en otras ciudades, se supone que la variabilidad
promedio fue alrededor de US$ 25. Al grupo le interesaría saber la cuenta promedio para el mes de
julio dentro de una escala alrededor de los US$ 5 del promedio real de la cuenta de consumo de
energía eléctrica. Para realizar este estudio se estableció una confianza del 99%. Que tamaño de
muestra se necesitaría para esta investigación.
2. El representante de una gran cadena de tiendas de ferretería se interesaba en comprobar las
afirmaciones hechas por el fabricante de un producto para derretir el hielo, quien informaba que
lo derretía en temperaturas tan bajas como 15° F. La cadena de tiendas compró para su
distribución un embarque de 400 bolsas de 5 libras. El representante quería saber con una
confianza del 95% en una escala de más o menos 0.05 que proporción de bolsas del producto para
derretir el hielo realizarían este trabajo tal como lo afirmaba el fabricante.
a. ¿Cuantas bolsas necesita probar el representante?
b. Si en realidad el representante comprobó 50 bolsas, de las cuales 42 cumplieron con su
trabajo como se afirmaba, construya usted el intervalo de confianza del 95% para la
proporción de la población que realizará el trabajo como se afirma.
Respuestas:
1. z=2.575
σ =25
e=0.05

z2 σ 2
n=
e2
( 25¿¿ 2)
n=2.5752 ¿
52
n=166

2.
a. z=1.96
P=0.5
e=0.05
N=400

z 2 p (1− p)
n0 =
e2

1.96 2( 0.5(1−0.5))
n0 =
0.052
n0 =¿385

n0 N
N=
n 0+ ( N −1 )
385∗400
N=
385+(400−1)
N=197

b. n=50
Ps=0.84
N=400
z=1.96
e=0.0519

0.84−( 1.96∗0.0519 ) (√ 400−50


400−1 ) < P<0.84+ ( 1.96∗0.0519 ) (
400−50
√ 400−1 )
0.745< P< 0.935

<
<
<
<

Hasta aquí el primer corte


<
<
<
<

Prueba de hipótesis con muestras


La hipótesis nula H 0 es la que me ofrecen como cierta y es la que yo analizaré. La hipótesis nula se da
con parámetros, nunca con estadísticos o medidas muestrales. Las hipótesis deben incluir un igual o
un mayor igual o un menor igual. Si no considero que es verdadera esa H 0 entonces yo planteo una
hipótesis alternativa H 1. Con la hipótesis alternativa o del investigador se conoce el número de colas.
La hipótesis nula plantea por ejemplo el tamaño de una muestra, la alternativa dice que es lo
contrario. Si H 1 dice que la media no es igual sino diferente al valor planteado por la h. nula entonces
la alternativa será de dos colas en la campana de gauss. Si dice la alternativa que no es menor o igual
sino mayor, entonces ocupa la cola derecha mientras que la nula ocupaba la izquierda. Si la
alternativa niega que sea mayor o igual entonces sugiere que es menor y se posiciona en una cola
izquierda.

A la región de rechazo (pues voy a rechazar H 0) o H 1 se le llama α y a la región de aceptación que es la


α
de H 0 o hipótesis nula se le llama 1−α. Si α es de dos colas a cada una se la llama . 1−α +α da toda el
2
área bajo la curva.
En la mitad va el valor de la hipótesis nula. El valor crítico corresponde al punto o limite que separa
las dos regiones y está DENTRO de la región de aceptación. En el ejemplo de la foto anterior es 4.5.

Errores:
 Error tipo 1 o α : rechazar erróneamente una hipótesis que sí era cierta, no se debió rechazar.
La probabilidad de rechazar algo que es cierto o la probabilidad de caer en el error 1 se le llama nivel
de significancia, de significado o significación. Se expresa en porcentaje. Con ese nivel de significancia
se determina el tamaño de las colas en porcentaje, y por supuesto se calcula el rango de la región de
aceptación. Por ejemplo, si el nivel de significancia es del 5% entonces el área de rechazo suma un
total del 5% y el área de aceptación suma un total del 95%. Si son dos colas, cada una queda de 0.475
para la región de aceptación y de 0.025 para la región de rechazo.

 Error tipo 2 o β : NO rechazar erróneamente una hipótesis que no era cierta y se debió rechazar.
Esta se puede controlar con un tamaño de muestra. La probabilidad de no rechazar una hipótesis nula
que era errónea se le llama potencia de prueba y se expresa en porcentaje.

Pasos para hacer una prueba de hipótesis:


1. Expresar H 0 en términos estadísticos.
2. Expresar H 1 en términos estadísticos.
3. Seleccionar el nivel de significancia α.
4. Seleccionar el tamaño de la muestra.
5. Determinar la distribución estadística a usar: Z o t-student.
6. Determinar las regiones de rechazo.
7. Calcular el valor estandarizado ya sea Z o t-student.
8. Observar si el estadístico calculado cae en la región de rechazo o de aceptación.
9. Plantear la regla de decisión: decir en que rango se rechaza o se acepta la hipótesis nula usando
unión por ejemplo.
10. Dar la respuesta según la regla de decisión.

Ejercicio:

Respuesta:
H 0=μ (x )=75.000.000

H1≠ H0

H 1= X́=83.400 .000
s=23.065.000
n=100
α =0.05
α
=0.025
2
1−α=0.95
1−α
=0.475
2
P=0.475=¿ z=1.96

z=¿ X́ −μ∨ ¿ ¿
s
√n
z=¿ 83.400 .000−75.000.000∨ ¿ ¿
23.065 .000
√ 100
z=3.6419

Regla de decisión:
 La H 0 será aceptada si z ≤ 1.96
 La H 1será aceptada si z ≥ 1.96
Respuesta:
Siendo el valor estandarizado de z=3.6419 mayor que 1.96, cayendo en la región de
rechazo, se decide rechazar la hipótesis nula que considera μ( x )=75.000 .000.

Otra solución:
z∗s
+ μ= X́
√n
1.96∗23.065 .000
75.000 .000+ = X́
√ 100
79.520 .740= X́
1.96∗23.065.000
75.000 .000− = X́
√ 100
70.479 .260= X́

La hipótesis nula esta por fuera de estos límites pues es mayor a 79.520 .740= X́ .
La diferencia en este método es establecer para la hipótesis nula los límites en términos
reales del ejercicio, es decir establecer los límites de la media de la hipótesis nula.
Usando la ecuación z.
Ejercicio prueba de hipótesis:
H 0 :μ=200

σ =16
α =0.01
H 1 : μ ≠ 200

H 1 : μ=203.5

n=50
1−α=1−0.01=0.99
Dos colas :
1−α 0.99
= =0.495
2 2
Se usará el valor estandarizado Z pues se conoce la desviación estándar poblacional.
Para esta probabilidad hay un valor de z=2.575

Método de valores críticos:


Regla de decisión:
 Se aceptará la hipótesis nula si −2.575 ≤ z ≤2.575
 Se rechazará la hipótesis nula si z ←2.575∪2.575< z
Cálculo del valor z para la media muestral.
203.5−200
z=
16
√ 50
z=1.547
Siguiendo la regla de decisión se acepta la hipótesis nula porque el valor z de la media muestral
hallada 203.5 cae dentro de la región de aceptación pues −2.575<1.547< 2.575.
Método de los valores reales.
2.575∗16
+200= X́ s
√ 50
X́ s=205.827
−2.575∗16
+200= X́ i
√ 50
X́ i =194.173

Regla de decisión:
 Se aceptará la hipótesis nula si 194.173 ≤ X́ ≤ 205.827
 Se rechazará la hipótesis nula si X́ <194.173 ∪ 205.827< X́
Siguiendo la regla de decisión se acepta la hipótesis nula porque la media muestral hallada 203.5 cae
dentro de la región de aceptación pues 194.173<203.5<205.827.

Más ejercicios:
H 0 :μ=16

σ =0.15
α =0.05
n=50
H 1 : 16 < μ

H 1 : μ=16.04

1−α=1−0.05=0.95
La capana de Gauss es de una cola donde el área de acpetacion es del 95 %
Se usará el valor estandarizado Z pues se conoce la desviación estándar poblacional.
Para esta probabilidad hay un valor de z=1.645

Método de valores críticos:


Regla de decisión:
 Se aceptará la hipótesis nula si z ≤ 1.645
 Se rechazará la hipótesis nula si 1.645< z
Cálculo del valor z para la media muestral.
16.04−16
z=
0.15
√ 50
z=1.886
Siguiendo la regla de decisión se rechaza la hipótesis nula porque el valor z de la media muestral
hallada 16.04 cae dentro de la región de rechazo pues 1.645<1.886.
Método de los valores reales.
1.645∗0.15
+16= X́
√ 50
X́ =16.035
Regla de decisión:
 Se aceptará la hipótesis nula si X́ ≤ 16.035
 Se rechazará la hipótesis nula si 16.035< X́
Siguiendo la regla de decisión se rechaza la hipótesis nula porque la media muestral hallada 16.04
cae dentro de la región de rechazo pues 16.035<16.04.

Potencia de prueba:
Valor crítico o límite del área de aceptación: X́ =16.035
H 1: X́ =16.04

Potencia de prueba (PP%):


PP=¿ ¿∗100

|16.035−16.04|
PP=
( 0.15
√50
)
−0.05 ∗100

PP=0.0948−0.05∗100
PP=0.0448∗100
PP=4.48 %
Otra manera:
PP=¿ ¿∗100

Ejercicio de la guía:
Respuesta:
H 0 :2.8≤ μ

n=25
H 1 : μ< 2.8

H 1 : μ=2.43

s=0.2
α =0.05
La curva de Gauss es de una cola con la región de rechazo a la izquierda.
Se utilizará el valor estandarizado t-student porque no se conoce la desviación estándar poblacional y
la muestra es menor a 30.
Para este nivel de significancia y un grado de libertad n−1=24 hay t n−1=1.7109

Método de valores críticos:


Regla de decisión:
 Se aceptará la hipótesis nula si 1.7109 ≤t n−1
 Se rechazará la hipótesis nula si t n−1<1.7109
Cálculo del valor estadístico de la prueba:
X́−μ
t n−1=
s
√n
2.43−2.8
t n−1=
0.2
√25
t n−1=−9.25

Teniendo en cuenta la regla de decisión, se rechaza la hipótesis nula, pues el valor estadístico de
prueba hallado a partir de la media muestral 2.43 cae por fuera de la región de aceptación ya que
−9.25<1.7109.

Método de valores reales


Calculo del límite real de la región de aceptación de la hipótesis nula despejando de la media muestral
( X́ ¿ de la ecuación de t-student cuando t n−1=1.7109.

X́−μ
t n−1=
s
√n
t n−1∗s
+ μ= X́
√n
1.7109∗0.2
+2.8= X́
√ 25
X́ =2.868
Regla de decisión:
 Se aceptará la hipótesis nula si 2.868 ≤ X́
 Se rechazará la hipótesis nula si X́ < 2.868

Teniendo en cuenta la regla de decisión, se rechaza la hipótesis nula, pues la media muestral hallada
2.43 cae por fuera de la región de aceptación ya que 2.43<2.868.

Potencia de prueba:
Otra manera es la siguiente:
PP=¿ ¿∗100
PP=¿
PP=(|1.7109+ 9.25|)∗100
PP=10.9609∗100
PP=1096.09

Prueba de hipótesis para proporciones


Ejercicio:
H 0 :P ≤ 10 %

H 1 : 10 % < P

n=100
14
Ps = =0.14=14 %
100
α =0.01

Método de valores críticos:


Regla de decisión:
 Se aceptará la hipótesis nula si z ≤ 2.325
 Se rechazará la hipótesis nula si 2.325< z
P s−P
z=
P ( 1− p )
√ n
0.14−0.1
z=
0.1 ( 0.9 )
√ 100
z=1. 3́
Con base en la regla de decisión se acepta la hipótesis nula pues 1. 3́<2.325 .

Método de valores reales


P s−P
z=
P ( 1− p )
√ n

P ( 1−p )
z∗
√ n
+ P=P s

0.1 ( 0.9 )
2.325∗
√ 100
+ 0.1=Ps

Ps =0.16975 ≅ 0.17

Regla de decisión:
 Se aceptará la hipótesis nula si Ps ≤ 0.17
 Se rechazará la hipótesis nula si 0.17 ¿ Ps

Teniendo en cuenta la regla de decisión, se acepta la hipótesis nula, pues la proporción hallada del
14% cae dentro de la región de aceptación ya que 0.14 <0.17

Otro ejercicio:
De acuerdo a la revista promedios, las ventas de bebidas gaseosas alcanzaron 38 mil millones de
dólares durante el año de 1987. Suponga que una muestra aleatoria de 200 personas. Tomada en el
año de 1988 señaló que 52 personas prefirieron la marca coca cola clásica a nivel mundial que otros
refrescos. Al nivel de significación del 1% es probable que hubiera cambiado la proporción de la
preferencia comparada con el mercado de 1987. La preferencia en el año de 1987 por la marca coca
cola del 39%.

H 0 :P=39 %
H 1 : P=26 %

n=200 => Dos colas


52
Ps = =0.26=26 %
200
α =0.01
1−α=0.99

Método de valores críticos:


Regla de decisión:
 Se aceptará la hipótesis nula si – 2.575< z<2.575
 Se rechazará la hipótesis nula si z <−2.575 ∪2.575< z
P s−P
z=
P ( 1− p )
√ n
0.26−0.39
z=
0.39 ( 0.61 )
√ 200
z=−3.77
Con base en la regla de decisión se rechaza la hipótesis nula pues −3.77←2.575 .

Método de valores reales


P s−P
z=
P ( 1− p )
√ n

P ( 1−p )
√z∗
n
+ P=P ss

0.39 ( 0.61 )
( √
2.575∗
200 )
+0.39=Pss

Pss ≅ 0.479

P ( 1−p )
−z∗
√ n
+ P=P si

0.39 ( 0.61 )
(−2.575∗
√ 200 )
+ 0.39=Pss
Psi ≅ 0.301

Regla de decisión:
 Se aceptará la hipótesis nula si 0.301< Ps < 0.479
 Se rechazará la hipótesis nula si Ps <0.301 ∪ 0.479< P s

Teniendo en cuenta la regla de decisión, se rechaza la hipótesis nula, pues la proporción hallada del
26% cae fuera de la región de aceptación ya que 0.26< 0.301

Pruebas de hipótesis 2
Para prueba de hipótesis de diferencia de dos medias. En el caso de tener dos colas, lo que sucede es
que la hipótesis nula corresponde a decir que la diferencia entre el estadístico de ambas muestras es
cero, muestras que la alternativa dice que esa diferencia es diferente de cero. En otras palabras la
primera dice que el estadísticos es igual en ambas poblaciones y la segunda que el estadístico es
diferente.
Cuando se trata de un caso de una sola cola, hay una desigualdad; una hipótesis es que la diferencia es
mayor o menor a cero y la otra la contradice.
Si se conocen ambas desviaciones estándar, entonces las poblaciones tienen una distribución normal;
se usa z.

Si no es normal, es decir, no se conocen las desviaciones poblacionales, se usa la siguiente fórmula de


acuerdo al TLC.
TLC: cuando las poblaciones tienen muestras que suman más de 120 o exactamente 120 se usa z. Si
suman las muestras menos de 120 entonces se usa t.
Cuando se usa z:

Cuando se usa t:

CASO 1
Casos de prueba de hipótesis 2.

Ejercicio CASO #1: Aquí dice que se consideran iguales la varianzas.


Planta a:
n A =25

X́ A =366.35
σ A =16.71

Planta b:
n B=20

X́ B=369.74
σ B=14.2

H 0 :μ A=μ B

H 1: μ A ≠ μB

Tiene dos colas.


α =0.01
1−α
=0.495
2
Para esta probabilidad hay un valor z de 2.575
Regla de decisión:
 La diferencia de medias será cero si −2.575< z <2.575
 La diferencia de medias será distinta de cero si z ←2.575∪2.575< z

Cálculo del estadístico de prueba:


366.35−369.74−0
z=
(16.71)2 (14.2)2
√ 25
+
20
z=−0.7354
Conclusión
Según la regla de decisión se concluye que la diferencia de medias es aproximable a cero, es decir, que
las medias NO son notablemente distintas pues el estadístico de prueba está dentro de la región de
aceptación. Así que se acepta la hipótesis nula pues −2.575<−0.7354

EN EL NUMERADOR DE LA ECUACION DEL ESTADISTICO DE PRUEBA LA


DIFERENCIA DE LAS MEDIAS POBLACIONALES ES CERO CUANDO EL EJERCICIO
PRESENTA DOS COLAS.

Otro ejercicio:

Respuesta:
Máquina A:
n A =25

X́ A =375
σ A =110

Máquina B:
n B=25
X́ B=362
σ B=125

Paso 1
H 0 :μ A=μ B

Paso 2
H 1: μ A ≠ μB

Tiene dos colas. Entonces al tener dos colas el nivel de significancia alfa se divide en 2. Lo que origina
que cada cola va a valer 0.025.
Paso 3
α =0.05
α
=0.025 Área en las colas de la campana de Gauss.
2
1−α
=0.475 Área en la región de no rechazo de la campana de Gauss.
2
Para esta probabilidad hay un valor z=1.96
Paso 4
n A =n B=25

Paso 5
Se utilizará la distribución normal Z.
Paso 6
Determinamos las regiones de rechazo y de no rechazo.

Paso 7
375−362−0
z= =0.39
2 2

√ (110) (125)
25
+
25
Paso 8
−1.96<−0.39<1.96
Paso 9
Regla de decisión:
 La diferencia de medias será cero si −1.96< z <1.96 . No se rechaza a H 0.
 La diferencia de medias será distinta de cero si z ←1.96∪ 1.96< z. Se rechaza a H 0.

z=valor estadistico de prueba

Rechazamos a H 0 si z es mayor que 1.96 o si z es menor a -1.96. De lo contrario no rechazamos.


Paso 10
Respuesta: no rechazamos a H 0: la media de la maquina A es igual a la media de la maquina B.
Conclusión
Según la regla de decisión se concluye que la diferencia de medias es aproximable a cero, es decir, que
las medias NO son notablemente distintas pues el estadístico de prueba está dentro de la región de
aceptación. Así que se acepta la hipótesis nula pues −1.96<0.39< 1.96. En otras palabras, las dos
máquinas de interés producen bombillos con la misma calidad o tienen igual vida media útil.

Otro ejercicio:
Respuesta:
Máquina antigua (a): maquina 2
n a=100

X́ a=65
σ a=10

Máquina nueva (n): máquina 1


n n=100

X́ n=72
σ n=9

Paso 1
H 0 :μ a ≥ μn

Paso 2
H 1 : μ a< μ n => 0< μ n−μ a

Tiene una cola. La cola, que está a la derecha vale 1% ó 0.01.


Paso 3
α =0.01
1−α=0.99 Área en la región de no rechazo de la campana de Gauss.
Para esta probabilidad hay un valor z=2.325
Paso 4
n A =n B=100

Paso 5
Se utilizará la distribución normal Z.
Paso 7
72−65−0
z= =5.2
(10)2 (9)2
√ +
100 100
Paso 8
2.325<5.2
Paso 9
Regla de decisión:
 La diferencia de medias será cero si z <2.325. No se rechaza a H 0.
 La diferencia de medias será distinta de cero si 2.325< z . Se rechaza a H 0.

z=valor estadistico de prueba

Rechazamos a H 0 si z es mayor que 2.325. De lo contrario no rechazamos.


Paso 10
Conclusión
Según la regla de decisión se concluye que la diferencia de medias es considerable, es decir, que las
medias son notablemente distintas pues el estadístico de prueba está fuera de la región de aceptación.
Así que se rechaza la hipótesis nula pues 2.325<5.2 . En otras palabras, la máquina nueva produce
rotores más resistentes que la antigua.
CASO 2
Es de poblaciones pareadas o relacionadas si
a) La variable tiene condiciones idénticas en ambas poblaciones.
b) Se repiten los experimentos en idénticas condiciones.
c) El objeto de estudio se analiza desde dos perspectivas.

 Primero debo calcular las diferencias entre todos los datos


 Luego sumo esas diferencias y las divido entre n para sacar la media de las diferencias

Ejercicio:
Respuesta:
n=8
−18
D́=
8
D́=−2.25
2
( ∑ D i)
2
∑ D− i
n
S2D=
n−1
324
50−
8
S2D=
7

S2D=1.357
2
√S D =1.165

α =0.01
Es una cola izquierda
1−α=0.99
Para esta área bajo la curva hay un límite t=2.998
Marca desconocida (1)
Marca conocida (2)
H 0=μ 1 ≥ μ 2

H 1=μ1 < μ2
Distribución t-student

Regla de decisión:
 No se rechaza la hipótesis nula si −2.998 ≤ t
 Se rechaza la hipótesis nula si t ←2.998
Estadístico de prueba:
−2.25
t n−1=
1.165
√8
t n−1=−5.46

Conclusión:
Se decide rechazar la hipótesis nula porque −5.46←2.998. Se concluye que el precio de la marca
desconocida es menor que la conocida.
Otro ejercicio:
Supóngase que una fábrica de zapatos quisiera probar el material para las suelas. Para cada par de
zapatos se utilizó el nuevo material en un zapato y el antiguo en otro zapato. Después de cierto tiempo
se seleccionó una muestra aleatoria de 10 pares de zapatos y se midió el desgaste es una escala de 1 a
10 con los siguientes resultados.
Material (número Material nuevo Material D D2
del par) antiguo
1 2 4 -2 4
2 4 5 1 1
3 5 3 2 4
4 7 8 -1 1
5 7 9 -2 4
6 5 4 1 1
7 9 7 2 4
8 8 8 0 0
9 8 5 3 9
10 7 6 1 1
Total 3 29

Al nivel de significancia 0.05 ¿hay alguna evidencia de que el desgaste promedio sea más alto en el
material nuevo que para el material antiguo?
Respuesta:
n=10
3
D́=
10
D́=0.3
2
( ∑ D i)2
∑ D− i
n
S2D=
n−1
9
29−
10
S2D=
9

S2D=3.123
2
√S D =1.767

α =0.05
Marca antigua (2)
Marca nueva (1)
H 0=μ 1 ≤ μ 2

H 1=μ1 > μ2
El caso presenta una gráfica de 1 cola a la derecha.
Para esta área bajo la curva hay un límite t=1.8331
Distribución t-student

Regla de decisión:
 Se acepta la hipótesis nula si t ≤ 1.8331
 Se rechaza la hipótesis nula si t >1.8331
Estadístico de prueba:
0.3
t n−1=
1.767
√ 10
t n−1=0.5369

Conclusión:
Se decide aceptar la hipótesis nula porque 0.5369<1.8331. Se concluye que el desgaste con el material
antiguo es mayor o igual al desgaste con el material nuevo.
Caso 3:
La idea es saber si hay diferencia en las varianzas de dos poblaciones o si son iguales.
 Primero se calcula la media de cada muestra.
 Luego se saca la varianza de cada muestra.
 Registro el tamaño de muestra.
 Se utiliza la distribución Fischer.
 Luego se calcula el valor crítico superior con los tamaños de muestra en la tabla.
 Después calculo el valor crítico inferior que corresponde al inverso multiplicativo del
valor crítico superior alternando el tamaño de las muestras al buscar en la tabla.
 Finalmente, se calcula el estadístico de prueba y se mira si cae en la región de
rechazo o aceptación de la hipótesis nula.
Respuesta:
Caja registradora (1)
X́ =121
S=945
Departamento (2)
X́ =89.17
S=17.37
H 0 :s 1=s2

H 1 : s1 ≠ s2

α =0.05
1−α
=0.475
2
n1 =7

n2 =6

Buscando en la tabla el valor critico superior es 6.98 y el valor critico inferior es (1/5.99)=1.167
Regla de decisión:
 Se aceptará la hipótesis nula si 1.167< f <6.98
 Se rechazará la hipótesis nula si f <1.167 ∪6.98<f

Estadístico de prueba:
945
F=
17.37
F=54.4
Conclusión:
Finalmente se decide rechazar la hipótesis nula porque el estadístico de prueba de las varianzas de las
muestras queda por fuera de la región de aceptación limitada por (1.167,6.98), pues es mucho mayor
al límite superior. Dado lo anterior, se concluye que las varianzas de ambas poblaciones, de acuerdo a
las muestras tomadas, son muy considerablemente distintas.

Ejercicio 2:

Respuesta:
Marca desconocida (1)
X́ 1 =9
S1=1.71

n1 =8

Marca conocida (2)


X́ 2 =11.25
S2=1.07

n2 =8
H 0 :S 1=S2

H1: S1≠ S2

α =0.01
α
=0.005
2
Para este nivel de significancia se tiene una límite superior de 7.5 y un límite inferior de (1/7.5)=0.132

Regla de decisión:
 Se aceptará la hipótesis nula si 0.132< F< 7.5
 Se rechazará la hipótesis nula si F< 0.132∪ 7.5< F

Estadístico de prueba:

S 21
F= 2
S2

1.71
F=
1.07
F=1.598

Conclusión:
Se decide aceptar la hipótesis nula, pues el estadístico de prueba 1.598 para las varianzas está dentro
de la región de aceptación:0.132<1.598<7.5 Por tanto se concluye que las varianzas de ambas
poblaciones tienen una diferencia tan insignificante que se pueden considerar iguales.
Caso 4:
Se usa para muestras normalmente pequeñas, menores a 30. Se usa el estadístico t’, aunque es el
mismo que t:

 Si hay una muestra de al menos 30 se puede usar z.


Para hallar los valores críticos:

Con el + se halla el valor critico superior mientras que con – se halla el valor critico inferior.
 t 1es el valor t hallado con el nivel de significancia y n1 −1.
 t 2es el valor t hallado con el nivel de significancia y n2 −1.
s21
 w 1es el peso promedio de variabilidad de la población 1: w 1=
n1
s22
 w 2es el peso promedio de variabilidad de la población 1: w 2=
n2
Ejercicio:
α =0.05
α
=0.025
2
Caja registradora (1)
X́ =121

S2=945
n=7
t 1=2.4469

w 1=135

Departamento (2)
X́ =89.17

S2=17.37
n=6
t 2=2.5706

w 2=2.895

H 0 :μ 1=μ2

H 1: μ1≠ μ2

t 1 w 1+ t 2 w 2
t s=
w 1+ w 2
2.4469∗135+ 2.5706∗2.895
t s=
135+2.895
t s=2.4495

−2.4469∗135+2.5706∗2.895
t i=
135+2.895
t i=−2.4495

Regla de decisión
 Se aceptará la hipótesis nula si −2.45<t <2.45
 Se rechazará la hipótesis nula si t ←2.45∪ 2.45<t
Estadístico de prueba
121−89.17
t '=
945 17.37
√ 7
+
6

t ' =2.71
Conclusión:
Se rechaza la hipótesis nula porque el estadístico de prueba es mayor al valor crítico superior. Así que
las medias de ambas poblaciones son notablemente distintas.

Ejercicio 2:
α =0.05
Caja registradora (1)
X́ =121

S2=945
n=7
t 1=1.9432

w 1=135

Departamento (2)
X́ =89.17

S2=17.37
n=6
t 2=2.015

w 2=2.895

H 0 :μ 1 ≤ μ2

H 1 : μ 1> μ 2

t 1 w 1+ t 2 w 2
t s=
w 1+ w 2
1.9432∗135+2.015∗2.895
t s=
135+ 2.895
t s=1.945

Regla de decisión
 Se aceptará la hipótesis nula si t ≤ 1.945
 Se rechazará la hipótesis nula si 1.945<t
Estadístico de prueba
121−89.17
t '=
945 17.37
√ 7
+
6

t ' =2.71
Conclusión:
Se rechaza la hipótesis nula porque el estadístico de prueba es mayor al valor crítico. Así que las
medias de ambas poblaciones son notablemente distintas. Se concluye que se vender más hojas de
afeitar en la caja registradora.

Otro ejercicio:
A continuación se presentan las edades de 25 vendedores de automóviles y de otros 25 en Europa.
E.E.U.U Europa
23 43
56 35
25 34
38 35
36 31
63 26
30 48
48 45
26 44
32 23
25 30
34 36
44 30
30 24
36 29
22 27
56 47
27 38
39 33
38 37
32 40
30 41
26 33
30 40
33 28

Tomando un nivel de significado de α =0.1habría evidencia de alguna diferencia en la edad promedio


entre los vendedores de EEUU y Europa.
 Primero se hace el caso 3.
Respuesta:
EEUU (1)
X́ =35.16

S2=117.22
n=25
Europa (2)
X́ =35.08

S2=51.16
n=25
H 0 :s 1=s2

H 1 : s1 ≠ s2

α =0.05
α
=0.025
2

Buscando en la tabla el valor critico superior es 2.03 y el valor critico inferior es (1/2.03)=0.4926
Regla de decisión:
 Se aceptará la hipótesis nula si 0.4926< f <2.03
 Se rechazará la hipótesis nula si f <0.4926 ∪2.03<f

Estadístico de prueba:
117.22
F=
51.16
F=2.29

Conclusión:
Finalmente se decide rechazar la hipótesis nula porque el estadístico de prueba 2.2377 de las
varianzas de las muestras queda por fuera de la región de aceptación limitada por 0.4926< f <2.03,
pues el estadístico es mayor al límite superior. Dado lo anterior, se concluye que las varianzas de
ambas poblaciones, de acuerdo a las muestras tomadas, son considerablemente distintas.

 Ahora se hace el caso 4.

AQUÍ ESTAN LOS PASOS QUE ME DIJO CAMILA


Ejercicio: Estados unidos (1) Europa (2).
Paso 1
H 0 :μ 1=μ2

Paso 2
H 1: μ1≠ μ2

Paso 3
α =0.1
α
=0.05
2
Paso 4
n1 =n2=25

Paso 5
Distribución t’
Paso 6
Valores críticos:
t 1 w 1+t 2 w2
t a=
w 1+ w 2
1.7109∗4.689+1.7109∗4.689 2.05
t s=
4.689+2.05
t s=1.7109

−1.7109∗4.689+1.7109∗4.689 2.05
t i=
4.689+2.05
t i=−1.7109

Paso 7
Estadístico de prueba
35.16−35.08
t '=
117.22 51.16
√ 25
+
25

t ' =0.031

Paso 8
−1.7109<0.031<1.7109
Paso 9
Regla de decisión
 Se aceptará la hipótesis nula si −1.7109<t <1.7109
 Se rechazará la hipótesis nula si t <1.7109∪ 1.7109<t
Paso 10
Conclusión:
Se acepta la hipótesis nula porque el estadístico de prueba está en medio de los valores críticos. Así
que las medias de ambas poblaciones son aproximadamente iguales, es decir, los vendedores de autos
en estados unidos y en Europa tienen la misma edad.
NOTAS ESTADÍSTICA 2

Prueba de hipótesis III. Diferencia de proporciones.

Método 1. Distribución normal Z.


 Para dos poblaciones y para una o dos colas.
 El estadístico de prueba es:

 El significado de esas variables es:


Ejercicio:
Respuesta:
H 0 :P 1=P2

H 1 : P1 ≠ P 2

α =0.1
1−α
=0.45
2
Para esta probabilidad hay un valor crítico z=1.645 y z=−1.645

Regla de decisión
 Se acepta la hipótesis nula si −1.645 ≤ z ≤1.645
 Se rechaza la hipótesis nula si z ←1.645∪1.645< z

Estadístico de prueba
x 1+ x 2
Ṕ=
n1 +¿n ¿
2

Ṕ=0.1
x1
Ps 1=
n1
Ps 1=0.095

x2
Ps 2=
n2
Ps 2=0.105

( Ps 1−P s 2) −( P1−P2 )
z=
1 1
√ Ṕ ( 1− Ṕ )
( +
n1 n2 )
z=−0.3334
Conclusión
Se acepta la hipótesis nula. No hay diferencia significativa entre las cajas reprocesadas en las plantas
A y B.

Otro ejercicio:
Un investigador de mercados quería estudiar el efecto de una campaña de publicidad para la marca A
de refresco de cola, para determinar si la proporción de quienes preferían la marca A Aumentará
como resultado de la campaña. Se seleccionó una muestra aleatoria de 200 personas y señalaron su
preferencia por la marca A o la marca B, antes del inicio de la campaña de publicidad y después de su
terminación.
Al nivel de significación del 5% la proporción de quienes prefieren la marca A ¿Es más alta al final de
la campaña que al inicio?
Una posible alternativa

A. Antes de la publicidad: si p. 101/110 0.92 no p. 9/110 0.082


B. Antes de la publicidad: si p. 22/90 0.24 no p. 68/90 0.76
a. Después de la publicidad: si p. 101/123 0.82 no p. 22/123 0.179
b. Después de la publicidad: si p. 9/77 0.117 no p. 68/77 0.88
Otra posible alternativa a la tabla

A Antes: 101/123 0.82


B Antes: 22/123 0.179
A Después: 9/77 0.117
B Después: 68/77 0.883

Respuesta:
Datos
n1 =123

n2 =77

x 1=éxitos de A antes de=101

x 2=éxitos de B despuésde=9

H 0 :P 1 ≥ P2

H 1 : P1 < P2

α =0.05
1−α
=0.475
2
Para esta probabilidad hay un valor crítico z=−1.96

Regla de decisión
 Se acepta la hipótesis nula si −1.96 ≤ z
 Se rechaza la hipótesis nula si z ←1.96

Estadístico de prueba
x 1+ x 2
Ṕ=
n1 +¿n ¿ 2

Ṕ=0.55+++++0.615
x1
Ps 1=
n1
Ps 1=0.821++++0.918

x2
Ps 2=
n2
Ps 2=0.117+++++0.244

( Ps 1−P s 2) −( P1−P2 )
z=

√ Ṕ ( 1− Ṕ )
( n1 + n1 )
1 2

z=9.738+++++9.7453
Conclusión
No se rechaza la hipótesis nula. No hay diferencia significativa entre las cajas reprocesadas en las
plantas A y B.

Método 2.1 Ji-cuadra do o Chi-cuadrado. Para dos poblaciones.


Sirve solo para problemas con dos colas, aunque su cálculo se hace mediante una cola.
La curva de Gauss de Ji-cuadrado es como si dobláramos por la mitad la distribución z.
Por ello los valores críticos de Ji-cuadrado para dos poblaciones son los cuadrados de
los valores de z. Igualmente el estadístico de prueba de Ji-cuadrado es el cuadrado del
estadístico de prueba z.
* Primero construyo la tabla de contingencia donde se comparan las frecuencias observadas y las
teóricas.
nc nr
* F t= nr =total renglón; n c =total columna ; nt =tamaño de muestra
nt

* Para calcular los grados de libertad le resto a los renglones uno (-1) y le resto a las columnas uno (-1)
y el producto de ambos resultados son los grados de libertad.

* Estadístico de prueba:
2
2 ( F o −F t )
X =∑
Ft
Ejercicio anterior con el nuevo método:

Respuesta:
H 0 :P 1=P2

H 1 : P1 ≠ P 2

α =0.1
Tabla de contingencia

Resultados PLANTA A PLANTA B TOTAL


VALOR VALOR VALOR VALOR
OBSERVADO TEÓRICO OBSERVADO TEÓRICO
NECESITAN
REPROCESARSE 19 20 21 20 40
NO NECESIRTAN
REPROCESARSE 181 180 179 180 360
TOTAL 200 200 400
nc nr
En rojo: F t F t=
nt

Valores críticos:
( c−1 ) ( r−1 )=1∗1=1
Para un grado de libertad hay un valor crítico según la tabla X 2 =2.706
Regla de decisión
 Se acepta la hipótesis nula si X 2 ≤ 2.706
 Se rechaza la hipótesis nula si 2.706< X 2
Estadístico de prueba
2
2 ( F o −F t )
X =∑
Ft

X 2 =0.11 1́=z=0.333 2
Fo Ft (Fo-Ft) (Fo-Ft)^2 ((Fo-Ft)^2)/ Ft
19 20 -1 1 0,05
21 20 1 1 0,05
181 180 1 1 0,005555556
179 180 -1 1 0,005555556
Suma de ((Fo-Ft)^2)/ Ft 0,111111111

Conclusión
Se acepta la hipótesis nula. No hay diferencia significativa entre las cajas reprocesadas en las plantas
A y B. El resultado con este método fue igual al anterior.

Método 2.2 Ji-cuadrado o Chi-cuadrado. Para más de dos poblaciones.


En este caso no se cumple que los cuadrados de z son los valores de Ji-cuadrado.
Respuesta:
H 0 :P 1=P2=P3

H 1 : En P1 , P2 , P 3 al menos una es diferente o P1=P2 ∪ P1=P 3 ∪ P2=P3

α =0.01
Valores críticos:
( c−1 ) ( r−1 )=2∗1=2
Para dos grados de libertad hay un valor crítico según la tabla X 2 =9.21
Tabla de contingencia:

nc nr total de lacolumna∗total delrenglón


En rojo: F t F t= =
nt total de la muestra tomada

Regla de decisión
 Se acepta la hipótesis nula si X 2 ≤ 9.21
 Se rechaza la hipótesis nula si 9.21< X 2
Estadístico de prueba
2
2 ( F o −F t )
X =∑
Ft
2
X =24.643
Fo Ft (Fo-Ft) (Fo-Ft)^2 ((Fo-Ft)^2)/ Ft
61 48,91 12,09 146,1681 2,988511552
45 39,657 5,343 28,547649 0,719864059
48 65,433 -17,433 303,909489 4,644590482
13 25,1 -12,1 146,41 5,833067729
15 20,343 -5,343 28,547649 1,403315588
51 33,567 17,433 303,909489 9,05381741
Suma de ((Fo-Ft)^2)/ Ft 24,64316682

Conclusión
Se rechaza la hipótesis nula. Se concluye que hay una diferencia significativa de la proporción de casas
con chimeneas entre al menos una población con respecto a las otras dos poblaciones.

Ejercicio:
El director de un centro comercial quiere saber si hay alguna diferencia en la proporción de mujeres
compradoras a distintas horas durante la semana. Se seleccionaron muestras aleatorias de 300 compradores de
día, 300 que compran de noche y 400 que compran en fines de semana.
Los resultados se muestran en la siguiente tabla:
Fines de
Género Día Noche semana
Hombre 90 125 85 300
Mujer 210 175 215 600
Total 300 300 300 900

1. Al nivel de significancia del 5% ¿Habría alguna diferencia en la proporción de damas que compran en
diferentes momentos de la semana?
2. ¿Qué le sucedería a la prueba de hipótesis si aumentamos el nivel de significancia al 10%?

Respuesta:
1. 5%
H 0 :P 1=P2=P3

H 1 : En P1 , P2 , P 3 al menos una es diferente o P1=P2 ∪ P1=P 3 ∪ P2=P3

α =0.05
Valores críticos:
( c−1 ) ( r−1 )=2∗1=2
Para dos grados de libertad hay un valor crítico según la tabla X 2 =5.991
Tabla de contingencia:
nc nr total de la columna∗total delrenglón
En rojo: F t F t= =
nt total de la muestra tomada

Regla de decisión
 Se acepta la hipótesis nula si X 2 ≤5.991
 Se rechaza la hipótesis nula si 5.991< X 2

Estadístico de prueba
2
2 ( F o −F t )
X =∑
Ft
X 2 =54.86
ESTE VALOR HAY QUE CORREGIRLO PERO EL
PROCESO ESTA BIEN . EN LA TABLA HAY
QUE CORREGIR UN 300

Fo Ft (Fo-Ft) (Fo-Ft)^2 ((Fo-Ft)^2)/ Ft


90 120 -30 900 7,5
210 180 30 900 5
125 120 5 25 0,208333333
175 180 -5 25 0,138888889
185 120 65 4225 35,20833333
215 180 35 1225 6,805555556
      Estadistico 54,86111111

Conclusión
Se rechaza la hipótesis nula. Se concluye que hay una diferencia significativa entre las proporciones de
mujeres que compran en cada categoría de tiempo establecida, al menos una proporción es diferente a
las demás.

2. 10%
H 0 :P 1=P2=P3

H 1 : En P1 , P2 , P 3 al menos una es diferente o P1=P2 ∪ P1=P 3 ∪ P2=P3

α =0.1
Valores críticos:
( c−1 ) ( r−1 )=2∗1=2
Para dos grados de libertad hay un valor crítico según la tabla X 2 =4.605
Tabla de contingencia:

nc nr total de la columna∗total delrenglón


En rojo: F t F t= =
nt total de la muestra tomada

Regla de decisión
 Se acepta la hipótesis nula si X 2 ≤ 4.605
 Se rechaza la hipótesis nula si 4.605< X 2

Estadístico de prueba
2
2 ( F o −F t )
X =∑
Ft
2
X =54.86

Fo Ft (Fo-Ft) (Fo-Ft)^2 ((Fo-Ft)^2)/ Ft


90 120 -30 900 7,5
210 180 30 900 5
125 120 5 25 0,208333333
175 180 -5 25 0,138888889
185 120 65 4225 35,20833333
215 180 35 1225 6,805555556
      Estadistico 54,86111111

Conclusión
Se rechaza la hipótesis nula. Se concluye que hay una diferencia significativa entre las proporciones de
mujeres que compran en cada categoría de tiempo establecida, al menos una proporción es diferente a
las demás.

METODO ANOVA
LUEGO SE BUSCA EL VALOR CRITICO EN LA TABLA F CON LOS GRADOS DE
LIBERTAD c-1 PARA EL NUMERADOR Y n-c PARA EL DENOMINADOR.
Ejercicio:
Respuesta:
En Excel los ejercicios.
Otro ejercicio:
Una organización de consumidores tiene interés en determinar si hay alguna diferencia en la vida
promedio de cuatro marcas diferentes de pilas para radios de transistores. Se probó una muestra
aleatoria de 4 pilas de cada marca con los siguientes resultados en horas.

Marca 1 Marca 2 Marca 3 Marca 4


12 14 21 14
15 17 19 21
18 12 20 25
10 19 23 20

A un nivel de significación del 5% habría alguna diferencia en la vida promedio de estas cuatro marcas
de pilas para transistores. Si es así cual sería la mejor pila.
Respuesta:
Método Anova:
H 0 :μ 1=μ2=μ3 =μ4

H 1 : al menos una de las medias es diferente a las demás

Valores críticos:
Numerador: c−1=4−1=3
Denominador: n−c=16−4=12
F (3,12)=2.75

Estadístico de prueba:
SST =276
SSW =136.5
SSB=139.5
139.5
MSB= =46.5
3
136.5
MSW = =11.375
12
46.5
F= =4.088
11.375

Conclusión:
Se decide rechazar la hipótesis nula porque el estadístico de prueba es mayor que el valor críticos
establecido para un valor de significancia 0.05. Al menos una de las baterías tiene significativamente
menor duración que las otras.
Para hallar la diferente:

c
nj ’=
∑ inversos multiplicativos

También podría gustarte