Objetivos
Objetivos
Objetivos
Objetivo 2: Construir
estadísticas de pruebas pertenecientes a una determinada distribución para poder concluir si se
rechaza o no cierta hipótesis de interés. 1 Introducción En esta unidad de aprendizaje
analizaremos uno de los objetivos fundamentales en un estudio estadístico para determinar el
mínimo nivel de incertidumbre a través de los conceptos básicos y aplicación de pruebas de
hipótesis. Esto se hace con el fin de encontrar herramientas útiles a la hora de tomar decisiones
acerca de una sospecha o duda razonable que se tenga en un estudio de investigación. Nuestro
interés se centrará entonces en la construcción de estadísticas de prueba pertenecientes a una
determinada distribución para luego compararla con valores de la tabla en una distribución
conocida y mirar si se rechaza o no cierta hipótesis de interés. 2 Conceptos Básicos En casos donde
se tengan experimentos con múltiples resultados basados en eventos aleatorios y la finalidad sea
la toma de una decisión, es de mayor interés el buen planteamiento de una hipótesis. Con base a
esto, la estrategia natural es decidirse por uno de los experimentos en cuestión. Así el
establecimiento de la regla de decisión delimitara la región de rechazo y con ello las
probabilidades de errores a la hora de la toma de decisiones. A continuación veremos los
conceptos básicos involucrados en el estudio de las pruebas de hipótesis para entender mejor la
aplicación de esta técnica de inferencia estadística. 2.1 Hipótesis Estadística Una hipótesis
estadística es una afirmación o conjetura acerca de una distribución de una o más variables
aleatorias. Ejemplo 1: Si 𝑋 sigue una distribución exponencial de parámetro 𝜆 una hipótesis podría
ser la afirmación “𝜆 = 0.3”, análogamente si 𝑋 sigue una distribución 𝑁(𝜇, 𝜎 2 ) una hipótesis
podría ser la afirmación “𝜇 > 1”. 2.2 Tipos de Hipótesis 2.2.1 Hipótesis simple Una hipótesis se dice
simple si se especifica por completo la probabilidad en cuestión. “Cuando se tengan experimentos
con múltiples resultados basados en eventos aleatorios y la finalidad sea la toma de una decisión,
conviene el planteamiento de una hipótesis” “Se trata de una afirmación o conjetura acerca de
una distribución de una o más variables aleatorias” Hipótesis Estadística 04 ASTURIAS
CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitaria.
Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida.
Todos los derechos reservados. 2.2.2 Hipótesis compuesta Una hipótesis se dice compuesta si no
se especifica por completo la probabilidad en cuestión. Ejemplo 2: Si 𝑋 sigue una distribución
exponencial de parámetro 𝜆 una hipótesis podría ser la afirmación “𝜆 = 0.3” es una hipótesis
simple, en contraste si 𝑋 sigue una distribución 𝑁(𝜇, 𝜎 2 ) una hipótesis podría ser la afirmación “𝜇
> 1” se trata de una hipótesis compuesta. En general para la teoría de las pruebas de hipótesis se
maneja el siguiente esquema: 𝐻0 : Hipótesis nula vs 𝐻1 : Hipótesis Alternativa En donde las
hipótesis nula y alternativa pueden ser simples o compuestas. 2.3 Prueba de Hipótesis Una prueba
de hipótesis es una regla para decidir si no se rechaza la hipótesis nula o se rechaza en favor de la
hipótesis alternativa. Nótese que no está bien afirmar “se acepta la hipótesis nula” debido a que
se hace es una conclusión con base a la información que se extrae de la muestra, en consecuencia
lo que se tiene es que la muestra seleccionada no arroja información suficiente para rechazar la
hipótesis nula, teniendo en cuenta que todo depende de la calidad de la muestra y de los errores
de muestreo. 2.4 Tipos de Errores Al realizar una prueba de hipótesis se pueden cometer errores.
Al rechazo de la hipótesis nula cuando ésta es verdadera se le conoce como error tipo I, y a la
probabilidad de cometer este primer tipo de error se le denota por la letra 𝛼. En cambio, al no
rechazo de la hipótesis nula cuando ésta es falsa recibe el nombre de error tipo II, y a la
probabilidad de cometer este segundo tipo de error se le denota por la letra 𝛽. Estas definiciones
de errores se resumen en la siguiente tabla: 𝐻0 Cierta 𝐻0 Falsa Rechazar 𝐻0 Error tipo I con
probabilidad 𝛼 Decisión correcta No rechazar 𝐻0 Decisión correcta Error tipo II con probabilidad 𝛽
Tabla 1: Tipos de errores “La prueba de hipótesis ayuda a decidir si no se rechaza la hipótesis nula
o si se rechaza en favor de la hipótesis alternativa” “Esquema para la teoría de las pruebas de
hipótesis” Hipótesis Estadística 05 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica
preparada por Asturias Corporación Universitaria. Su difusión, reproducción o uso total o parcial
para cualquier otro propósito queda prohibida. Todos los derechos reservados. 2.5 Región Crítica y
Nivel de Significación Se le llama región critica a la región de rechazo de 𝐻0 , y a la probabilidad de
cometer el error tipo I, esto es 𝛼, se le llama tamaño de la región critica. A esta probabilidad se le
conoce también con el nombre de nivel de significancia. 3 Pruebas para la Media de una
Distribución Normal Sea 𝒙𝟏,𝒙𝟐, …, 𝒙𝒏 una muestra aleatoria de población media 𝝁 desconocida y
varianza 𝝈 𝟐 conocida. Sabemos que 𝒙̅ tiene distribución 𝑵(𝝁, 𝝈 𝟐 √𝒏 ) por tanto: 𝑥̅− 𝜇 𝜎 2 √𝑛 ⁄
~𝑁(0,1) Sea 𝝁𝟎 un número real particular. Deseamos probar las hipótesis 𝑯𝟎: 𝝁 = 𝝁𝟎 contra 𝑯𝟏:
𝝁 ≠ 𝝁𝟎 El problema es encontrar una regla para decidir cuándo rechazar 𝑯𝟎 en favor de 𝑯𝟏 con
base en los datos de la muestra 𝒙𝟏, 𝒙𝟐,…, 𝒙𝒏. Cuando 𝑯𝟎 es cierta, esto es, cuando 𝝁 es
efectivamente 𝝁𝟎, tenemos que 𝑿~𝑵(𝝁𝟎, 𝝈 𝟐 √𝒏 ) y por lo tanto: 𝑥̅− 𝜇0 𝜎 2 √𝑛 ⁄ ~𝑁(0,1) La
estadística 𝒁 = 𝒙̅−𝝁𝟎 𝝈𝟐 √𝒏 ⁄ es una medida natural de la distancia entre 𝒙̅ ,un estimador de 𝝁, y
su valor esperado 𝝁𝟎 cuando 𝑯𝟎 es cierta. Es entonces razonable rechazar 𝑯𝟎 cuando la variable
𝒁 sea grande. Es por ello que tomamos como criterio de decisión rechazar 𝑯𝟎 cuando |𝒁| ≥ 𝒌,
para cierta constante 𝒌. ¿Cómo encontramos el número 𝒌? En una tabla de la distribución normal
podemos encontrar un valor 𝒛𝜶/𝟐 tal que 𝑷(|𝒁| ≥ 𝒛𝜶/𝟐) = 𝜶, en donde 𝜶 lo determina la persona
que lleva a cabo la prueba de hipótesis, típicamente 𝜶 = 𝟎. 𝟏. Véase el Gráfico 1. Este valor 𝒛𝜶/𝟐
es precisamente la constante 𝒌 buscada pues con ello se logra que la región de rechazo sea de
tamaño 𝜶. A la variable aleatoria 𝒁 se le llama la estadística de la prueba, y la prueba se denomina
prueba de dos colas pues la región de rechazo consta de las dos colas de la distribución normal
que se muestran en el Gráfico 1. Llevar a cabo esta prueba de hipótesis consiste en usar los datos
de la muestra para encontrar el valor de 𝒁, |𝒁| ≥ 𝒛𝜶/𝟐, entonces se rechaza 𝑯𝟎, en caso contrario
no se rechaza 𝑯𝟎. Similarmente se definen las pruebas a cola inferior y superior para valores
extremos. “Región crítica es la región de rechazo de 𝐻0 y el tamaño de la región crítica es la
probabilidad de cometer el error tipo I” Hipótesis Estadística 06 ASTURIAS CORPORACIÓN
UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitaria. Su difusión,
reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los
derechos reservados. Gráfico 1: Región de rechazo a dos colas Gráfico 2: Región de rechazo a cola
inferior Gráfico 3: Región de rechazo a cola superior 3.1 Prueba de Dos Colas para µ Para probar
esta hipótesis en primera instancia se tiene en cuenta que existen dos zonas de rechazo en ambas
colas como se muestra en el Gráfico 1 y en segunda instancia se calcula el estadístico de prueba 𝑍
y se compara con los valores críticos 𝑍 en la tabla, así tenemos que el valor en mención viene dado
por: 𝑍 = 𝑥̅− 𝜇𝐻 𝜎 √𝑛 ⁄ “Suponemos dos zonas de rechazo para probar esta hipótesis” Hipótesis
Estadística 07 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias
Corporación Universitaria. Su difusión, reproducción o uso total o parcial para cualquier otro
propósito queda prohibida. Todos los derechos reservados. En donde 𝑥̅es el valor de la media
muestral, 𝜇𝐻 es el valor de la media poblacional bajo la hipótesis nula y 𝜎 2 /√𝑛 es el error
estándar de la distribución muestral. Cuando se desconoce 𝜎 se utiliza su respectiva estimación, la
desviación estándar muestral 𝑠 y 𝑍 se vuelve: 𝑍 = 𝑥̅− 𝜇𝐻 𝑠 √𝑛 ⁄ Ejemplo 3: Se supone que una
empresa embotelladora de bebidas gaseosas de que la media poblacional es de 16 onzas y
seleccionan un nivel de significancia del 5%. Debido al planteamiento del problema el conjunto de
hipótesis queda como sigue: 𝐻0 : 𝜇 = 16 𝐻1 : 𝜇 ≠ 16 Si la empresa embotelladora toma una
muestra de 𝑛 = 50 botellas con una media de 𝑥̅= 16.357 onzas y una desviación estándar de 𝑠 =
0.866 onzas, tenemos que 𝑍 = 16.357 − 16 0.866 √50 = 2.91 Ahora comparando 𝑍 con los valores
críticos de 𝑧 de la tabla que son ±1.96. La regla de decisión sería: no se rechaza la hipótesis nula sí
−1.96 ≤ 𝑍 ≤ 1.96. Se rechaza si 𝑍 < −1.96 o 𝑍 > 1.96. Luego como 𝑍 = 2.91 > 1.96 se rechaza la
hipótesis nula a un nivel de significancia del 5% en favor de la hipótesis alternativa. 3.2 Pruebas de
Una Cola para µ En contraste con el anterior caso, en este solo se está interesado en una de las
dos colas de la distribución. Como se muestra en los Gráficos 2 y 3 respectivamente. Ejemplo 4: En
una reunión informativa para una oficina corporativa, el gerente de un importante hotel, reporto
que el número promedio de habitaciones alquiladas por noche es de por lo menos 212. Uno de los
funcionarios corporativos cree que esta cifra puede estar sobreestimada. Una muestra de 150
noches produce una media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones.
Si estos resultados sugieren que el gerente ha inflado su reporte, será amonestado severamente.
A un nivel del 1% ¿Cuál es el destino del gerente? La afirmación del gerente de que 𝜇 ≥ 212 lleva el
signo igual y por tanto se toma la siguiente hipótesis nula 𝐻0 : 𝜇 ≥ 212 vs 𝐻1 : 𝜇 < 212 Luego 𝑍 =
201.3 − 212 45.5 √150 = −2.88 Hipótesis Estadística 08 ASTURIAS CORPORACIÓN UNIVERSITARIA®
Nota Técnica preparada por Asturias Corporación Universitaria. Su difusión, reproducción o uso
total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados. La
regla de decisión es: No rechazar 𝐻0 sí 𝑍 ≥ −2.33. Rechazar sí 𝑍 < −2.33. Entonces el valor 𝑍 =
−2.88 claramente está en la zona de rechazo lo que indica que el gerente podría estar en serios
problemas.