Estadistica y Probabilidades s13 Rosario 2020 I
Estadistica y Probabilidades s13 Rosario 2020 I
Estadistica y Probabilidades s13 Rosario 2020 I
GUÍA DE APRENDIZAJE
SEMANA N°13
3 DESARROLLO .....................................................................................................................................4
5 GLOSARIO .........................................................................................................................................12
2
1 INTRODUCCIÓN.
Las pruebas de hipótesis junto a los intervalos de confianza constituyen dos enfoques fundamentales de la
inferencia estadística, es decir a ese proceso de estudiar muestras y usar la información obtenida en estas y obtener
conclusiones acerca de la población
El proceso de inferencia estadística a partir de las pruebas de hipótesis se basa en hacer suposiciones respecto a
características o fenómenos de interés en una población (o varias poblaciones) y tomando una muestra
representativa de datos de esa población (muestra aleatoria), de manera que estos datos muestrales sirvan para
contrastar la validez de nuestra hipótesis.
Las hipótesis formuladas suponen la elección entre dos opciones, una opción llamada nula y la otra llamada alterna;
a la luz de un estadístico calculado a partir de los datos recolectados en una muestra aleatoria, se elegirá una de
ambas opciones
Es indispensable que el ingeniero aplique correctamente aplique los intervalos de confianza y las pruebas de
hipótesis para estimar parámetros y probar supuestos acerca de ellos, etc.
En esta sesión de aprendizaje, aprenderemos a tomar decisiones mediante pruebas de Hipótesis, con sus
respectivas reglas, para tal fin además de las guía de aprendizaje semanal, contarán con materiales
complementarios como capítulos de libros, problemas resueltos, que servirán para reforzar el aprendizaje.
2 CONTENIDO TEMÁTICO
Intervalos de confianza para la proporción poblacional
Intervalos de confianza para la diferencia de proporciones
Pruebas de Hipótesis
3
3 DESARROLLO
3.1 INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL (𝝅)
Para hallar los intervalos de confianza para la proporción poblacional usaremos la estadística Z para muestras
grandes (𝒏 ≥ 𝟑𝟎). Entonces los límites de confianza serán
Fórmula:
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
[𝒑 − 𝑍1−𝛼 ∗ √ ≤ 𝜋 ≤ 𝒑 + 𝑍1−𝛼 ∗ √ ]
2 𝑛 2 𝑛
𝑝(1 − 𝑞) 𝑁−𝑛
=√ ∗√
𝑛 𝑁−1
Ejemplo:
En una muestra aleatoria de 600 compradores de un centro comercial, se encontró que 360 están a favor de que
se construya un ascensor adicional.
Calcule e interprete un intervalo del 95% de confianza para la proporción verdadera de compradores que quieren
que se construya un ascensor adicional.
Solución
4
Datos Población Datos Muestra
No hay datos. 𝑛 = 600
𝑥 360
𝑝= = = 0.6
𝑛 600
𝑁𝐶 = 1 − 𝛼 = 0.95
𝛼 = 0.05
Reemplazamos:
𝑍 0.05
(1− )
2
𝑍(0.975) = 𝟏. 𝟗𝟔
Reemplazamos en la fórmula
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
[𝒑 − 𝑍1−𝛼 ∗ √ ≤ 𝝅 ≤ 𝒑 + 𝑍1−𝛼 ∗ √ ]
2 𝑛 2 𝑛
Interpretación: con un 95% de confianza la verdadera proporción (porcentaje) de compradores que quieren que
se construya un segundo ascensor en el centro comercial, se encuentra entre 0.561 y 0.639 ó (56.1% y 63.9%)
Ejemplo:
De un área de la ciudad en la que habitan 500 familias se extrae una muestra aleatoria de 50 familias,
obteniéndose los siguientes datos sobre el número de hijos por familia:
Solución:
5
Datos Población Datos Muestra
𝑁 = 500 𝑛 = 50
𝑥 30
𝑝= = = 0.6
𝑛 50
𝑁𝐶 = 1 − 𝛼 = 0.90
𝛼 = 0.1
Reemplazamos:
𝑍 0.1
(1− )
2
𝑍(0.95) = 𝟏. 𝟔𝟒𝟓
Reemplazamos en la fórmula y aumentamos el factor de corrección
Interpretación: con un 90% de confianza la verdadera proporción (porcentaje) de familias con menos de 2 hijos
se encuentra entre 56,9% y 63,1%
6
Para hallar los intervalos de confianza para la diferencia de proporción poblacional usaremos la estadística Z
para muestras grandes (𝒏𝟏 ≥ 𝟑𝟎)𝒚 (𝒏𝟐 ≥ 𝟑𝟎). Entonces los límites de confianza serán
Fórmula
Nota
En caso de que las poblaciones 𝑁1 𝑦 𝑁2 fueran finitas, se debe corregir aumentando el factor de corrección.
p1 (1 − p1 ) 𝑁1 − 𝑛1 p2 (1 − p2 ) 𝑁2 − 𝑛2
=√ ( )+ ( )
n1 𝑁1 − 1 n2 𝑁2 − 1
Ejemplo:
Una empresa de estudios de mercado quiere estimar las proporciones de hombre y mujeres que conocen un
producto promocionado a escala nacional, en una muestra aleatoria de 100 hombres y 200 mujeres se determina
que 20 hombres y 60 mujeres están familiarizados con el artículo indicado.
a) Calcular el intervalo de confianza de 95% para la diferencia de proporciones de hombres y mujeres que
conocen el producto
b) Son iguales las proporciones de hombres y mujeres que conocen el producto?
Solución
𝑍(0.975) = 𝟏. 𝟗𝟔
7
Reemplazamos en la fórmula
Interpretación: con el 95% de confianza, la diferencia de proporciones verdadera de hombres y de mujeres que
conocen el producto, está entre -0.2009 y 0.0009
La hipótesis comienza con una suposición, denominada hipótesis, que hacemos entorno a un parámetro(𝜃) de la
población, principalmente sobre:
media( 𝝁)
varianza (𝝈𝟐 )
proporción (𝛑)
Reunimos datos muéstrales, producimos estadísticos de la muestra y con esta información decidimos la
probabilidad de que el parámetro supuesto de la población sea correcto.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población:
Es el status quo o estado actual (lo que se cree hasta el momento, o la que asegura que no hay diferencias en la
población. Es la hipótesis de no efecto
Es lo opuesto a la hipótesis nula; representa el cambio en la población que el investigador espera sea verdadero.
𝐻0 ∶ 𝜇 ≥ 𝜇0
𝐻1 ∶ 𝜇 < 𝜇0
8
PRUEBA UNILATERAL DERECHA
𝐻0 ∶ 𝜇 ≤ 𝜇0
𝐻1 ∶ 𝜇 > 𝜇0
𝐻0 ∶ 𝜇 = 𝜇0
𝐻1 ∶ 𝜇 ≠ 𝜇0
𝐻0 ∶ 𝜇 ≥ 𝜇0 𝐻0 ∶ 𝜇 ≤ 𝜇0 𝐻0 ∶ 𝜇 = 𝜇0
𝐻1 ∶ 𝜇 < 𝜇0 𝐻1 ∶ 𝜇 > 𝜇0 𝐻1 ∶ 𝜇 ≠ 𝜇0
9
2. Especificación del nivel de significación 𝛼 = 1% . 2% . 5% 𝑒𝑡𝑐
5. Realización de cálculos
6. Toma de decisiones
4 ACTIVIDAD Y EVALUACION
4.1 Actividad N° 1 : Reforzamiento
1. De un total de 2800 estudiantes aspirantes a ingresar a una universidad, se quiere estimar la proporción de
aspirantes que nacieron en la ciudad sede de la universidad, para lo cual se toma una muestra de 144, de
los cuales 108 nacieron en la ciudad sede. Calcule el intervalo con un nivel de confianza del 95%.
2. Supongamos que se hizo una encuesta a una muestra de 80 estudiantes universitarios de una ciudad A
sobre el concepto que les merecía la asignatura de estadística y se encontró que el 75% la consideraron
muy útil, mientras que otra encuesta hecha a 120 estudiantes universitarios de una ciudad B el 70% la
consideraron como una asignatura muy útil. Se pide calcular el intervalo de confianza con un nivel del
99% para la diferencia entre las proporciones
3. Se quiere conocer la proporción de clientes de un supermercado que utilizan vales de consumo. Para tal
efecto se toma una muestra aleatoria de 500 clientes la cual presenta una proporción de utilización de vales
de consumo del 68%. Se pide estimar la proporción para la totalidad de los clientes del supermercado con
un nivel de confianza del 99%.
4. De una muestra aleatoria de 200 comparendos por infracciones de tránsito, 84 de ellos se debieron al uso
del celular por parte del conductor sin el uso de manos libres mientras el vehículo estaba en marcha.
Construya un intervalo de confianza del 95% para la proporción real por el uso indebido del celular.
5. Una muestra aleatoria de 5000 obreros de una ciudad arrojó que 188 de ellos eran hombres que vivían en
unión libre. Calcular el intervalo de confianza del 90% para la verdadera proporción de éste tipo de unión
entre la totalidad de obreros de la ciudad.
6. En una muestra de 1000 casas en una determinada ciudad, se encuentra que 228 de ellas tienen calefacción
eléctrica. Encuentre el intervalo de confianza de 99% para la proporción de hogares en esta ciudad, que
tiene ese tipo de calefacción.
7. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar
la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las
pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan
en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores
de discos compactos de la población que no pasarían todas las pruebas.
10
4.2 Evaluacion de la Actividad N° 1 :
Rubrica para evaluar la resolución de problemas propuestos
Calificación
4 Muy bueno 3 Bueno 2 Regular 1 Malo
Categoría
11
5 GLOSARIO
5.1 Siglas
5.2 Glosario
- Intervalo de confianza: es una técnica de estimación utilizada en inferencia estadística que permite acotar
un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una
determinada probabilidad).
- Nivel de confianza: Nos va a informar en qué porcentaje de casos nuestra estimación acierta. Los niveles
habituales son el 95% y el 99% etc.
- Error Tipo I. Rechazo de una hipótesis nula cuando es verdadera
- Error Tipo II. Aceptación de una hipótesis nula cuando es falsa.
- Nivel de Significancia. Valor que indica el porcentaje de los valores muestrales que se halla fuera de
ciertos límites, suponiendo que la hipótesis nula sea correcta, esto es, la probabilidad de rechazarla cuando
es verdadera.
- Grados de Libertad. Número de valores de una muestra que podemos especificar libremente, una vez que
sepamos algo de ella.
- Hipótesis. Suposición, o conjetura, que se hace sobre un parámetro de la población.
- Hipótesis Estadística. Es una afirmación o conjetura acerca de una o más poblaciones.
6 REFERENCIAS BIBLIOGRÁFICAS
Córdova Zamora Manuel (2009) “Estadística descriptiva y Probabilidades para ingenieros” Edit MACRO
EIRL.Lima - Perú
Ávila Acosta Roberto (1997).”Estadística elemental”. Editorial Estudios y Ediciones.R.A Lima - Perú.
García Oré Celestino (2011). ” Estadística Descriptiva y Probabilidades para ingenieros”.Edit. MACRO
EIRL. Lima-Perú
12