Unidad 4. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES - Unidad 5. INTERVALOS DE CONFIANZA PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 44

Sesión 2

Unidad 4.
DISTRIBUCIONES DE
PROBABILIDAD PARA
VARIABLES
Materia: Probabilidad y estadística

Docente: Dr. Ramón Cabello Ruíz


22 de marzo de 2024
Reglas de convivencia durante la sesión

• Identifícate con tu nombre completo, si no lo registraste deberás salir


de la sesión y reincorporarte con este dato.
• Deberás dirigirte con respeto, compromiso y entusiasmo.
• Mantén cerrado el micrófono.
• En caso de dudas, levanta la mano y espera a que te cedan la palabra.
• Toma notas o apuntes, ya que esta presentación es de uso exclusivo
de la Institución.
• Ante cualquier acto de indisciplina, y por respeto a los asistentes, el
docente tiene la facultad de deshabilitar audio, chat y pizarra, retirar a
la persona que cometa faltas e incluso dar por concluida la sesión.
• En caso de que sea un acto recurrente, se tomarán medidas con base
en el Reglamento General para Estudiantes de Tipo Superior.
Integridad Académica

Un espacio que involucra la puesta en escena de los


valores de la institución, el respeto y las acciones que
favorecen la comunicación y el trabajo de una
comunidad.

Asociada con diversas tareas específicas: la calidad de las


actividades académicas, pero también se suscribe a través
de códigos, reglamentos, normas y por supuesto, un alto
sentido de responsabilidad y respeto.
Nuestros valores institucionales son…

Integridad en el actuar

Responsabilidad social

Actitud de servicio

Cumplimiento de promesas

Calidad de ejecución
Objetivo de la sesión

Identificar la mejor distribución de probabilidad acorde al contexto en que


se encuentre el problema a resolver.
Distribución de
probabilidad normal

• La distribución de probabilidad más usada para describir


variables aleatorias continuas es la distribución de
probabilidad normal.
• La distribución normal tiene gran cantidad de aplicaciones
prácticas, en las cuales la variable aleatoria puede ser el
peso o la estatura de las personas, puntuaciones de
exámenes, resultados de mediciones científicas,
precipitación pluvial u otras cantidades similares.
• La distribución normal también tiene una importante
aplicación en inferencia estadística. En estas aplicaciones, la
distribución normal describe qué tan probables son los
resultados obtenidos de un muestreo
Curva normal
Curva normal

Las siguientes son observaciones importantes acerca de las características de las distribuciones normales.

1. Toda la familia de distribuciones normales se diferencia por medio de dos parámetros: la media μ y la
desviación estándar σ.

2. El punto más alto de una curva normal se encuentra sobre la media, la cual coincide con la mediana y
la moda.

3. La media de una distribución normal puede tener cualquier valor: negativo, positivo o cero. A
continuación, se muestran tres distribuciones normales que tienen la misma desviación estándar, pero
diferentes medias. (10, 0 y 20).
Curva normal
Curva normal

• 4. La distribución normal es simétrica, siendo la forma de la curva


normal al lado izquierdo de la media, la imagen especular de la forma
al lado derecho de la media. Las colas de la curva normal se extienden
al infinito en ambas direcciones y en teoría jamás tocan el eje
horizontal. Dado que es simétrica, la distribución normal no es
sesgada; su sesgo es cero.
• 5. La desviación estándar determina qué tan plana y ancha es la curva
normal. Desviaciones estándar grandes corresponden a curvas más
planas y más anchas, lo cual indica mayor variabilidad en los datos. A
continuación, se muestran dos curvas normales que tienen la misma
media pero distintas desviaciones estándar.
Curva normal
Distribución de probabilidad normal estándar

• Una variable aleatoria que tiene una distribución normal con una media cero y
desviación estándar de uno tiene una distribución normal estándar. Para
designar esta variable aleatoria normal se suele usar la letra 𝑧. En la figura se
muestra la gráfica de la distribución normal estándar. Esta distribución tiene el
mismo aspecto general que cualquier otra distribución normal, pero tiene las
propiedades especiales, 𝜇 = 0 y 𝜎 = 1.
Distribución de probabilidad normal estándar

• Dado que 𝜇 = 0 y 𝜎 = 1, la fórmula de la función de densidad de


probabilidad normal estándar es una versión más simple de la función
de densidad
El problema de la empresa Grear Tire
• Para una aplicación de la distribución de probabilidad normal, suponga que
Grear Tire Company ha fabricado un nuevo neumático que será vendido
por una cadena nacional de tiendas de descuento. Como este neumático
es un producto nuevo, los directivos de Grear piensan que la garantía de
duración será un factor importante en la aceptación del neumático. Antes
de finalizar la póliza de garantía, los directivos necesitan información
probabilística acerca de x=duración del neumático en número de millas.
• De acuerdo con las pruebas realizadas al neumático, los ingenieros de
Grear estiman que la duración media en millas es 𝜇 = 36500 𝑚𝑖𝑙𝑙𝑎𝑠 y que
la desviación estándar es 𝜎 = 5000
• ¿cuál es la probabilidad de que la duración de los neumáticos sea superior
a 40000 millas?
El problema de la empresa Grear Tire
• Observe que en la parte inferior de la
figura el valor 𝑥 = 40000 en la
distribución normal de Grear Tire
corresponde a 𝑧 = 0.70 en la
distribución normal estándar.
𝑥 − 𝜇 40000 − 36500
𝑧= = = 0.7
𝜎 5000
Mediante la tabla de probabilidad
normal estándar (Tablas de distribución
1) se encuentra que el área bajo la curva
normal estándar a la 𝑧 = 0.70 es
0.7580 . De manera que 1.000 −
0.7580 = 0.2420 es la probabilidad de
que 𝑧 sea mayor a 0.70 y por tanto de
que 𝑥 sea mayor a 40000. Entonces
24.2% de los neumáticos durará más de
40000 millas.
El problema de la empresa Grear Tire
(Geogebra)
El problema de la empresa Grear Tire

• Ahora suponga que Grear está considerando una garantía que dé un


descuento en la sustitución del neumático original si éste no dura lo que
asegura la garantía. ¿Cuál deberá ser la duración en millas especificada en
la garantía si Grear desea que no más de 10% de los neumáticos alcancen
la garantía?
El problema de la empresa Grear Tire

• De acuerdo con la figura, el


área bajo la curva a la
izquierda de la cantidad
desconocida de millas para
la garantía debe ser 0.10. De
manera que primero se debe
encontrar el valor de 𝑧 que
deja un área de 0.10 en el
extremo de la cola izquierda
de la distribución normal
estándar (Tablas de
distribución 2).
El problema de la empresa Grear Tire
• Según la tabla de probabilidad normal estándar 𝑧 = −1.28 deja un área de
0.10 en el extremo de la cola izquierda. Por tanto, 𝑧 = −1.28 es el valor de
la variable aleatoria normal estándar que corresponde a las millas de
duración deseadas para la garantía en la distribución normal de Grear Tire.
Para hallar el valor de 𝑥 que corresponde a 𝑧 = −1.28, se tiene:

𝑥−𝜇
𝑧=
𝜎

𝑥 = 𝑧 ∙ 𝜎 + 𝜇 = −1.28 5000 + 36500 = 30100


Por tanto, una garantía de 30100 millas cumplirá con el requerimiento de que
aproximadamente 10% de los neumáticos sean aptos para la garantía
El problema de la empresa Grear Tire
(Geogebra)
Actividad(es) a entregar

Actividad 5 – ponderación 5%

Fecha límite de entrega: 08 de abril 03:00 horas


Sesión 2
Unidad 5. INTERVALOS DE
CONFIANZA

Materia: Probabilidad y estadística

Docente: Dr. Ramón Cabello Ruíz


22 de marzo de 2024
Objetivo de la sesión

Seleccionar los intervalos de confianza que mejor describan al fenómeno a


analizar.
Estimación por intervalo

• El objetivo de la estimación por intervalo es aportar información de


qué tan cerca se encuentra la estimación puntual, obtenida de la
muestra, del valor del parámetro poblacional.
Media poblacional: 𝝈 conocida

• Con objeto de obtener una estimación por intervalo para la media


poblacional, se necesita la desviación estándar poblacional 𝜎 o la desviación
estándar muestral 𝑠 para calcular el margen de error. En la mayor parte de los
casos, no se conoce 𝜎 y para calcular el margen de error se emplea 𝑠. Sin
embargo, en algunas ocasiones, se cuenta con una gran cantidad de datos
anteriores (históricos) que se pueden usar para calcular la desviación
estándar poblacional antes de tomar la muestra.
Intervalos de confianza

Los intervalos de confianza son un concepto importante en estadísticas que se utiliza para
estimar el rango probable de valores de un parámetro desconocido de una población,
basándose en una muestra de datos. Estos intervalos proporcionan una medida de la
incertidumbre asociada a una estimación y permiten cuantificar la confianza que se tiene
en esa estimación.

Un intervalo de confianza se compone de dos valores numéricos, uno inferior y otro


superior, y se expresa con un nivel de confianza asociado. El nivel de confianza es una
probabilidad que indica cuán seguro se está de que el intervalo contiene el verdadero
valor del parámetro de interés. El nivel de confianza más comúnmente utilizado es del
95%, pero también se pueden utilizar niveles de confianza diferentes, como el 90% o el
99%, dependiendo de la necesidad y la tolerancia al riesgo.
Intervalos de confianza

1 2 3 4 5 6

Los intervalos de Población: Los intervalos Muestra: Se toma una Error estándar: El error Distribución de Nivel de confianza: Indica la
confianza se construyen de confianza se utilizan muestra aleatoria de la estándar mide la probabilidad: Los probabilidad de que el
utilizando técnicas para hacer inferencias población de interés y se variabilidad esperada de intervalos de confianza intervalo de confianza
estadísticas y se basan en sobre parámetros de una calculan estadísticas la estadística muestral. se construyen asumiendo capture el verdadero valor
del parámetro. Un nivel de
la distribución de población. Por ejemplo, muestrales, como la Cuanto mayor sea el que la estadística
confianza del 95%, por
probabilidad de la se puede estimar el media o la proporción. tamaño de la muestra, muestral sigue una ejemplo, significa que si
estadística muestral. Aquí promedio, la proporción menor será el error distribución de repites el proceso de
hay algunos conceptos o la desviación estándar estándar y, por lo tanto, probabilidad conocida, muestreo y construcción
clave relacionados con de una población. más estrecho será el como la distribución del intervalo muchas veces,
los intervalos de intervalo de confianza. normal o la t- el 95% de las veces el
confianza: distribución. intervalo contendrá el valor
verdadero del parámetro.
ESTIMACIÓN POR INTERVALO DE UNA MEDIA
POBLACIONAL: σ CONOCIDA

• Construya un intervalo de confianza de 95%, la media muestral es 𝑥ҧ = 82, 𝜎 =


20 y el tamaño de la muestra es 𝑛 = 100.
• Solución:
El coeficiente de confianza 1 − 𝛼 = 0.95, por lo tanto, 𝛼 = 0.05. En la tabla de
la distribución normal estándar aparece que un área de 𝛼 Τ2 = 0.05Τ2 = 0.025.
Por lo que buscamos 𝑧𝛼Τ2 en la tabla 2 y corresponde a −1.96
ESTIMACIÓN POR INTERVALO DE UNA MEDIA
POBLACIONAL: σ CONOCIDA

• Datos:
𝑥ҧ = 82,
𝜎 = 20
𝑛 = 100
𝑧𝛼Τ2 = 1.96
20
82 ± 1.96
100

82 ± 3.92
ESTIMACIÓN POR INTERVALO DE UNA MEDIA
POBLACIONAL: σ CONOCIDA

• Por tanto, el margen de error es 3.92 y el intervalo de confianza de 95% va de


82 − 3.92 = 78.08 a 82 + 3.92 = 85.92.
• Aunque a menudo se usa un nivel de confianza de 95%, también suelen usarse
otros niveles de confianza como 90% y 99%. En la tabla se muestran los valores
de 𝑧𝛼Τ2 correspondientes a los niveles de confianza más utilizados.
ESTIMACIÓN POR INTERVALO DE UNA MEDIA
POBLACIONAL: σ CONOCIDA

• A partir de estos valores y de la expresión que usamos anteriormente, el intervalo de


confianza de 90% en el ejemplo anterior es:

20
82 ± 1.645
100

82 ± 3.29
Por tanto, para 90% de confianza, el margen de error es 3.29 y el intervalo de confianza
es 82 − 3.29 = 78.71 a 82 + 3.29 = 85.29.
ESTIMACIÓN POR INTERVALO DE UNA MEDIA
POBLACIONAL: σ CONOCIDA

• De manera similar, el intervalo de confianza de 99% es


20
82 ± 2.576
100

82 ± 5.15
Por tanto, para 99% de confianza, el margen de error es 5.15 y el intervalo de
confianza es 82 − 5.15 = 76.85 a 82 + 5.15 = 87.15.
ESTIMACIÓN POR INTERVALO DE UNA MEDIA
POBLACIONAL: σ CONOCIDA

• Al comparar los resultados para los niveles de 90%, 95% y 99% de confianza, es
claro que, para tener mayor grado de confianza, el margen de error y con esto la
amplitud del intervalo de confianza debe ser mayor
Etapa 2 Proyecto integrador

2. Ahora considera que la empresa de cupcakes empezará a industrializar su


producción, por lo tanto, se requerirá establecer muestreos de gramaje de
cada cupcake. Elabora los cálculos necesarios para poder determinar los
intervalos de confianza para llevar a cabo un muestreo con un error máximo
del 5% en gramaje de cupcakes que no tengan una variación mayor del 2% del
peso total de cada cupcake.
Etapa 2 Proyecto integrador

• Solución:
• Primero se debe calcular el tamaño de la muestra mediante:

2 2
𝑧𝛼Τ2 𝜎
𝑛=
𝐸2
Los datos con los que se cuenta son:
𝑥ҧ = 50.24
𝜎 = 0.68
Obtendremos el nivel de confianza
𝑧𝛼Τ2 = 1.96
Etapa 2 Proyecto integrador

• Ahora obtendremos el margen de error:


𝐸 = 0.02 0.68 = 0.0136
Por lo tanto, el tamaño de la muestra es:

2 2
𝑧𝛼Τ2 𝜎 1.96 2 0.68 2
𝑛= 2
= 2
= 9604
𝐸 0.0136
Con ese dato, procedemos a obtener los intervalos de confianza:

0.68
50.24 ± 1.96
9604

50.24 ± 0.013
Etapa 2 Proyecto integrador

3. Considera y desarrolla ahora este nuevo escenario: Elabora los cálculos


necesarios para poder determinar los intervalos de confianza para llevar a cabo
un muestreo con un error máximo del 5% en gramaje de cupcakes que no
tengan una variación mayor del 10% del peso total de cada cupcake.
Etapa 2 Proyecto integrador

• Solución:
• Primero se debe calcular el tamaño de la muestra mediante:

2 2
𝑧𝛼Τ2 𝜎
𝑛=
𝐸2
Los datos con los que se cuenta son:
𝑥ҧ = 50.24
𝜎 = 0.68
Obtendremos el nivel de confianza
𝑧𝛼Τ2 = 1.96
Etapa 2 Proyecto integrador

• Ahora obtendremos el margen de error:


𝐸 = 0.1 0.68 = 0.068
Por lo tanto, el tamaño de la muestra es:

2 2
𝑧𝛼Τ2 𝜎 1.96 2 0.68 2
𝑛= 2
= 2
= 384
𝐸 0.068
Con ese dato, procedemos a obtener los intervalos de confianza:

0.68
50.24 ± 1.96
384

50.24 ± 0.068
Actividad(es) a entregar

Actividad 6 – ponderación 15%

Fecha límite de entrega: 08 de abril 03:00 horas


Actividad(es) a entregar

Actividad 6 – ponderación 10%

Fecha límite de entrega: 08 de abril 03:00 horas


¿Alguna duda?
Referencias

Bencardino, C. M. (2012). Estadística y muestreo (Décima tercera ed.) [Versión electrónica]. Recuperado de
https://bibliotechnia.com.mx/Busqueda/resumen/6448_1326276

INEGI Informa. (Productor). (9 de marzo de 2012). INEGI - Cápsula Telesecundaria – Estadística. [Archivo de video]. Recuperado de
https://www.youtube.com/watch?v=lafbJaizJJY

Leandro, G. (Productor). (31 de agosto de 2017). Estadística prueba de hipótesis - parte 1 conceptos[Archivo de video]. Recuperado de
https://www.youtube.com/watch?v=5ZvKgnRVSjI

Leandro, G. (Productor). (3 de septiembre de 2017). Estadística prueba de hipótesis - parte 3 procedimiento [Archivo de video]. Recuperado de
https://www.youtube.com/watch?v=QZkD1AH4dtU

Leandro, G. (Productor). (4 de septiembre de 2017). Estadística prueba de hipótesis - parte 4 muestras pequeñas[Archivo de video]. Recuperado
de https://www.youtube.com/watch?v=M2O-kWEfxYI
¡Gracias!
“Por siempre responsable de lo que se ha cultivado”

©Universidad del Valle de México, 2021. Todos los derechos reservados. Queda totalmente
prohibido difundir, comunicar o publicar esta grabación y presentación a través de Internet
o de cualquier otro medio equivalente.

También podría gustarte