GRUPAL Estadistica Unidad 2 Tarea3
GRUPAL Estadistica Unidad 2 Tarea3
GRUPAL Estadistica Unidad 2 Tarea3
CONOCIMIENTO DE LA UNIDAD 2
Presentado por:
Presentado a:
TUTORA
INFERENCIA ESTADISTICA
NOVIEMBRE DE 2019
INTRODUCCION
En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar un
valor poblacional. Pero una estimación puntual es un solo valor y se requiere un intervalo
de valores a esto se denomina intervalo de confianza y se espera que dentro de este intervalo se
encuentre el parámetro poblacional buscado. También se utiliza una estimación mediante un
intervalo, el cual es un rango de valores en el que se espera se encuentre el parámetro poblacional
Este tema delimita los contenidos de la unidad 2, del curso inferencia estadística. También
diferencia los dos núcleos temáticos más importantes prueba de hipótesis y análisis de varianza.
La finalidad de la Inferencia estadística es obtener información sobre características desconocidas
de las poblaciones (generalmente cuantificadas por parámetros) a partir de características
conocidas de las muestras (generalmente cuantificadas por estadísticos). Incluir poblaciones
completas de individuos en la investigación suele ser impracticable, y por ello se suele trabajar
con grupos pequeños generalizando los resultados mediante las técnicas de Estadística
Inferencial.
OBJETIVO GENERAL:
OBJETIVOS ESPECIFICOS
Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba, para
verificar si la afirmación es razonable se usan datos.
La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
Tipos de errores
Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de la
Ho o de la Ha, puede incurrirse en error:
ERROR TIPO I : se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía
ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α
ERROR TIPO II: se denota con la letra griega β se presenta si la hipótesis nula es aceptada
cuando de hecho es falsa y debía ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisión equivocada.
En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.
Para que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma que minimice los
errores de decisión. En la práctica un tipo de error puede tener más importancia que el otro, y así
se tiene a conseguir poner una limitación al error de mayor importancia. La única forma de
reducir ambos tipos de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser
posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta β, depende de la
diferencia entre los valores supuesto y real del parámetro de la población. Como es más fácil
encontrar diferencias grandes, si la diferencia entre la estadística de muestra y el correspondiente
parámetro de población es grande, la probabilidad de cometer un error de tipo II, probablemente
sea pequeña.
El estudio y las conclusiones que obtengamos para una población cualquiera, se habrán apoyado
exclusivamente en el análisis de una parte de ésta. De la probabilidad con la que estemos
dispuestos a asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra requerida. Las
contrastaciones se apoyan en que los datos de partida siguen una distribución normal
Existe una relación inversa entre la magnitud de los errores α y β: conforme a aumenta, β
disminuye. Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. Lo
ideal sería establecer α y β.En la práctica se establece el nivel α y para disminuir el Error β se
incrementa el número de observaciones en la muestra, pues así se acortan los límites de confianza
respecto a la hipótesis planteada. La meta de las pruebas estadísticas es rechazar la hipótesis
planteada. En otras palabras, es deseable aumentar cuando ésta es verdadera, o sea, incrementar
lo que se llama poder de la prueba (1- β) La aceptación de la hipótesis planteada debe
interpretarse como que la información aleatoria de la muestra disponible no permite detectar la
falsedad de esta hipótesis.
Tipos de prueba
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200
H0 : µ ≥ 200 H0 : µ ≤ 200
En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación estándar (σ)
poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba
es z y se determina a partir de:
En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional
desconocida se utiliza el valor estadístico t.
Se establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones
en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los
valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la
suposición de que la hipótesis nula es verdadera, es muy remota
Distribución muestral del valor estadístico z, con prueba de una cola a la derecha
Valor crítico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la
región en la que no se rechaza la hipótesis nula.
En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con
el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en
una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis
nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no
debería haberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis nula se
acepte cuando debería haberse rechazado (error de tipo II).
Ejemplo
Datos:
Solución: Se trata de un problema con una media poblacional: muestra grande y desviación
estándar poblacional desconocida.
Ho: μ═350
Ha: μ≠ 350
α═0.05
De los datos determinamos: que el estadístico de prueba es t, debido a que el numero de muestras
es igual a 30, conocemos la media de la población, pero la desviación estándar de la población es
desconocida, en este caso determinamos la desviación estándar de la muestra y la utilizamos en la
formula reemplazando a la desviación estándar de la población.
Calculamos la desviación estándar muestral y la media de la muestra empleando Excel, lo cual se
muestra en el cuadro que sigue.
Columna1
Media 372.8
Mediana 381
Moda 405
Curtosis 0.36687081
Rango 234
Mínimo 276
Máximo 510
Suma 11184
Cuenta 30
Los análisis de varianza, también llamados ANOVA, por sus siglas en inglés, son una colección
de métodos para comparar múltiples medias de diferentes grupos.
Por otro lado, en cada comparación la hipótesis nula es que las dos muestras provienen de la
misma población, por lo tanto, cuando se hayan realizado todas las comparaciones, la hipótesis
nula es que todas las muestras provienen de la misma población y, sin embargo, para cada
comparación, la estimación de la varianza necesaria para el contraste es distinta, pues se ha hecho
en base a muestras distintas.
El método que resuelve ambos problemas es el anova, aunque es algo más que esto: es un método
que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseño de
experimentos y, de alguna manera, es la base del análisis multivariante.
1) Una llamada varianza dentro de los grupos (ya que sólo contribuye a ella la varianza dentro de
las muestras), o varianza de error, o cuadrados medios del error, y habitualmente representada
por MSE (Mean Square Error) o MSW (Mean Square Within) que se calcula como la media de
las k varianzas muéstrales (cada varianza muestral es un estimador centrado de α 2 y la media
de k estimadores centrados es también un estimador centrado y más eficiente que todos
ellos). MSE es un cociente: al numerador se le llama suma de cuadrados del error y se representa
por SSE y al denominador grados de libertad por ser los términos independientes de la suma de
cuadrados.
2) Otra llamada varianza entre grupos (sólo contribuye a ella la varianza entre las distintas
muestras), o varianza de los tratamientos, o cuadrados medios de los tratamientos y representada
por MSA o MSB (Mean Square Between). Se calcula a partir de la varianza de las medias
muéstrales y es también un cociente; al numerador se le llama suma de cuadrados de los
tratamientos (se le representa por SSA) y al denominador (k-1) grados de libertad.
F se usa para realizar el contraste de la hipótesis de medias iguales. La región crítica para dicho
contraste es F > F(k-1,(n-1)k)
Algunas propiedades
X 1 =245.953.33 μ X 1 =274.046.67
Los valores críticos para Z: -1.96 < Z < 1.96.
Calculamos el intervalo.
Para Z1 =−1.96, X́ CR =μ ± Z σ X́
x́ 1 CR=245.953.33
Para Z1 =1.96, X́ CR =μ ± Z σ X́
x́ 1 CR=260.000+ 14.046.67
x́ 1 CR=274.046.67
Para rechazar la hipótesis nula, la media muestral debe tener un valor inferior a $245.953.33 o
mayor a $274.046.67.
H 0 : μ = $260.000, se rechaza si la media no pertenece al intervalo determinado por
[245.953.33; 274.046.67].
Cuando se determina el valor de la media muestral, se transforma en unidades estandarizadas
Z, para comparar con los valores críticos Z.
X́−μ
Z=
σ x́
Si la media muestral es X́ =240.000 se debe determinar si se acepta o se rechaza la hipótesis
nula.
X́−μ 240.000−260.000
Z= = =−2.7906
σ x́ 7166.67
Como este valor se encuentra en la región de rechazo;
2.- La media de llenado de las cajas de un cereal determinado en una empresa de empacados
es de 368 gr. El proceso es tan rápido que en algunas cajas hay excesos y en otras hay faltante.
Supóngase que en una muestra de 25 cajas la desviación estándar de la población es de 15 gr.
Y la media muestral es de 372.5 gr. Se rechaza o se acepta la prueba de hipótesis nula,
teniendo en cuenta un nivel de significancia del 5%. Es equivalente al Intervalo de confianza
del 95%.
1. La hipótesis nula. H 0 : μ =
La hipótesis alternativa. H 1 : μ ≠ .
σ
σ x́ = =¿
√n
Para Z1 =¿, X́ CR =μ ± Z σ X́
Para Z2 =¿, X́ CR =μ ± Z σ X́
X́−μ
Z= =¿
σ x́
Con un nivel de significancia de 0.05, el tiempo de espera medio para despachar una orden se ha
modificado durante el último mes con respecto a su valor de la media poblacional de 4.5 min.
P1: La hipótesis nula dice que la media poblacional de atención a los clientes en un pedido no ha
cambiado con relación a su valor previo.
H 0 :μ=4.5
H 1 : μ ≠ 4.5
σ 1.2
σ x́ = = =0.24
√ n √ 25
X́−μ 5.1−4.5
Z= = =2.5
σ x́ 0.24
P6: Como Z = 2.5 y se encuentra fuera del intervalo de los valores críticos, existe una evidencia
de que el tiempo de espera al pedir una orden se ha modificado con respecto a su valor de la
media poblacional de 4.5 min. El tiempo de espera es mayor.
CONCLUSIÓN: Es necesario que la empresa realice ajustesinternos para poder mantener o bajar
el promedio de atención en sus clientes en las órdenes de pedido.
4.-Solucionar los problemas 10.1, 10.3, 10.4, 10.6, 10.7, 10.17, 10.18, 10.24,
10.43 y 10.44 del libro: Wackerly, D.D. and Mendenhall, W. and Scheaffer,
R.L. (2009), Estadística Matemática Con Aplicaciones, Séptima Edición
Ejercicio 10.1
Se le conoce como a y b a los valores que debemos estimar o que se desean encontrar conocidas
como: hipótesis nula e hipótesis de investigación.
Ejercicio 10.3
Un investigador ha preparado un nivel de dosis de droga que según él, inducirá el sueño en 80%
de las personas que sufren de insomnio. Después de examinar la dosis, pensamos que lo dicho
por él respecto a la efectividad de la dosis es exagerado. En un intento por refutar su dicho,
administramos la dosis prescrita a 20 personas que padecen de insomnio y observamos Y, el
número de individuos a quienes la dosis induce el sueño. Deseamos probar la hipótesis H0: p = .8
contra la alternativa, Ha: p < .8. Suponga que se usa la región de rechazo {y ≤ 12}.
Ejercicio 10.4
Ejercicio 10.6
Nos interesa probar si una moneda está o no balanceada, con base en el número de caras Y en 36
tiros de la moneda. (H0: p = .5 contra Ha: p ≠ .5). Si usamos la región de rechazo |y − 18| ≥ 4,
a. ¿cuál es el valor de a?
b. El valor de b si p = .7?
1.- Un auditor desea probar el supuesto de que el valor promedio de todas las cuentas por
cobrar en una empresa determinada es de $260.000, tomando una muestra de 36 cuentas y
calculando la media muestral. Desea rechazar el valor supuesto de $260.000 solo si la media
muestral lo contradice en forma clara, por lo que se debe dar el beneficio de la duda.
Determinar los valores críticos de la media muestral para probar la hipótesis, con un nivel de
significancia del 5%, si la desviación estándar es 𝜎 = $43.000.
σ 43.000
σ x́ = = =7166.67
√ n √36
Para Z1 =1.96, X́ CR =μ ± Z σ X́
x́ 1 CR=260.000+ ( 1.96 ) (7166.67)
x́ 1 CR=260.000+ 14.046.67
x́ 1 CR=274.046.67
Los valores críticos de la media: 245.953.33 < μ < 274.046.67
6. Para rechazar la hipótesis nula, la media muestral debe tener un valor inferior a
$245.953.33 o mayor a $274.046.67.
H 0 : μ = $260.000, se rechaza si la media no pertenece al intervalo determinado por
[245.953.33; 274.046.67].
7. Cuando se determina el valor de la media muestral, se transforma en unidades
estandarizadas Z, para comparar con los valores críticos Z.
X́−μ
Z=
σ x́
8. Si la media muestral es X́ =240.000 se debe determinar si se acepta o se rechaza la
hipótesis nula.
X́−μ 240.000−260.000
Z= = =−2.7906
σ x́ 7166.67
Como este valor se encuentra en la región de rechazo;
Z = -2.7906 No pertenece a -1.96 < Z < 1.96
Se rechaza la hipótesis nula y se acepta la alternativa:
H 1 : μ ≠ $260.000.
2.- La media de llenado de las cajas de un cereal determinado en una empresa de empacados
es de 368 gr. El proceso es tan rápido que en algunas cajas hay excesos y en otras hay faltante.
Supóngase que en una muestra de 25 cajas la desviación estándar de la población es de 15 gr.
Y la media muestral es de 372.5 gr. Se rechaza o se acepta la prueba de hipótesis nula,
teniendo en cuenta un nivel de significancia del 5%. Es equivalente al Intervalo de confianza
del 95%.
6. La hipótesis nula. H 0 : μ =
La hipótesis alternativa. H 1 : μ ≠ .
σ
σ x́ = =¿
√n
Para Z1 =¿, X́ CR =μ ± Z σ X́
Para Z2 =¿, X́ CR =μ ± Z σ X́
X́−μ
Z= =¿
σ x́
P1: La hipótesis nula dice que la media poblacional de atención a los clientes en un pedido no ha
cambiado con relación a su valor previo.
H 0 :μ=4.5
H 1 : μ ≠ 4.5
σ 1.2
σ x́ = = =0.24
√ n √ 25
P6: Como Z = 2.5 y se encuentra fuera del intervalo de los valores críticos, existe una evidencia
de que el tiempo de espera al pedir una orden se ha modificado con respecto a su valor de la
media poblacional de 4.5 min. El tiempo de espera es mayor.
CONCLUSIÓN: Se deben realizar ajustes dentro de la empresa para poder mantener o bajar el
promedio de atención en sus clientes en las órdenes de pedido.