Y que tan normal es?
En una tabla de frecuencias los datos se pueden presentar
En una tabla de frecuencias los datos se pueden presentar en forma de
La "curva de campana" es una distribución normal.
Y el histograma amarillo muestra algunos datos que
la siguen de cerca, pero no perfectamente (lo cual es habitual).
A menudo se le llama "Curva de Campana"
porque parece una campana
Muchas cosas siguen de cerca una Distribución Normal:
alturas de personas
tamaño de las cosas producidas por máquinas
errores en las mediciones
presión arterial
resultados en una prueba
La distribución de la edad de jubilación para los jugadores de la NFL se distribuye normalmente . Con una media de
33 años y una desviación estándar de unos 2 años. Un histograma de esta distribución muestra una forma de campana
clásica:
Está bien documentado que el peso al nacer de los recién nacidos se distribuye normalmente
con una media de unas 7.5 libras.
El histograma del peso al nacer de los bebés recién nacidos en los EE. UU. Muestra una forma de
campana que suele tener la distribución normal:
Desviaciones estándar
La Desviación Estándar es una medida de la dispersión de los números (lee esa página para
obtener detalles sobre cómo calcularla).
Cuando nosotros calculamos la desviación estándar encontramos que generalmente:
Ejemplo: 95% de los estudiantes en la escuela tienen entre 1.1m y 1.7m de altura.
Suponiendo que estos datos se distribuyen normalmente, ¿puede calcular la media y
la desviación estándar?
La media está a medio camino entre 1.1m y 1.7m:
Media = (1.1m + 1.7m) / 2 = 1.4m
95% indica 2 desviaciones estándar a cada lado de la media (un total de 4 desviaciones
estándar), entonces:
1 desviación estándar = (1.7m-1.1m) / 4
= 0.6m / 4
= 0.15m
Y este es el resultado:
Es bueno conocer la desviación estándar, porque podemos decir que cualquier valor es:
probable que esté dentro de 1 desviación estándar (68 de cada 100 deben estarlo)
muy probable que esté dentro de 2 desviaciones estándar (95 de cada 100 deben
estarlo)
casi con seguridad está dentro de las 3 desviaciones estándar (997 de 1000 deberían
estarlo)
Puntuación estándar o tipificada
El número de desviaciones estándar de la media también se denomina "puntuación estándar o tipificada", "unidad
tipificada", "variable estandarizada o normalizada" o "valor-z"
Ejemplo: En esa misma escuela una de tus amigas mide 1.85m.
Puedes ver en la curva de
campana que 1.85m está a 3
desviaciones estándar de la
media de 1.4, entonces:
La altura de tu amiga tiene
una "valor-z" de 3.0
También es posible calcular a cuántas desviaciones estándar está 1.85 de la media
¿A qué distancia está 1.85 de la media?
Está a 1.85 − 1.4 = 0.45m de la media
No todos las graficas de frecuencias son desviaciones normal estándar, para ello hay que convertir
Un valor en un puntaje estándar (Valor Z), para ello:
primero resta la media,
luego divide por la desviación estándar
A este proceso se le llama estandarización
Podemos tomar cualquier
Distribución Normal y
convertirla a la
Distribución Normal
Estándar.
Ejemplo: Tiempo de Viaje
Una encuesta del tiempo de viaje diario tuvo estos resultados (en minutos): 26, 33, 65, 28, 34, 55, 25, 44, 50, 36, 26, 37, 43, 62,
35, 38, 45, 32, 28, 34
La Media es de 38.8 minutos y la Desviación Estándar es de 11.4 minutos Convierta los valores en valores-z ("puntajes
estándar").
Para convertir 26:
primero resta la media: 26 − 38.8 = −12.8,
luego divide por la desviación estándar: −12.8/11.4 = −1.12
Entonces 26 está a −1.12 Desviaciones Estándar de la media
Aquí están las tres primeras conversiones.
Valor Original Operaciones
Puntaje Estándar
(valor-z)
26 (26-38.8) / 11.4 = −1.12
33 (33-38.8) / 11.4 = −0.51
65 (65-38.8) / 11.4 = +2.30
... ... ...
Y aquí están gráficamente:
La fórmula del valor-z que hemos estado usando es:
z es el "valor-z" (Puntaje Estándar)
x es el valor a estandarizar
μ ('mu") es la media
σ ("sigma") es la desviación estándar
¿Por que estandarizar? Nos puede ayudar a tomar desiciones sobre los
datos y es la forma actual de garantizar la mejora continua de acuerdo a
Ejemplo: El profesor Luis está revisando una prueba.
Aquí están los resultados de los estudiantes (de un máximo de 60 puntos):
20, 15, 26, 32, 18, 28, 35, 14, 26, 22, 17
La mayoría de los estudiantes ni siquiera obtuvieron 30 de 60, y la mayoría
reprobará.
La prueba debe haber sido realmente difícil, por lo que el profesor decide estandarizar
todos los puntajes y decide que solo reprobarán las personas a más de 1 desviación
estándar por debajo de la media.
La media es 23, y la desviación estándar es 6.6, y estos son los puntajes estándar:
Z(0.45)=(20 – 23) / 6.6 = -3 / 6.6 = -0.45 ; Z(15)=(15 - 23) / 6.6 = -8 / 6.6 = -1.21
-0.45, -1.21, 0.45, 1.36, -0.76, 0.76, 1.82, -1.36, 0.45, -0.15, -0.91
Ahora solo dos estudiantes reprobarán (los inferiores a −1 desviación estándar)
También hace la vida mas fácil por que se puede aplicar una tabla para estos cálculos.
La tabla de la distribución normal presenta los valores de probabilidad para una variable estándar Z, con media igual a 0 y
varianza igual a 1.
Para usar la tabla, siempre debemos estandarizar la variable por medio de la expresión:
Supongamos un conjunto de personas con edad promedio 25 años y desviación
estándar 3,86. Nuestro valor de interés (x) es 30 años. El valor de Z correspondiente será:
Este valor de Z nos dice que la edad de 30 años está a 1,29 desviaciones estándar sobre el promedio.
Ahora bien, la tabla de la distribución normal, entrega valores de probabilidad para los distintos valores de Z.
Tu puntaje en una prueba reciente estuvo 0.5 desviaciones estándar por
encima del promedio, ¿cuántas personas obtuvieron puntajes más bajos que tú?
Entre 0 y 0.5 es 19.1%
Menos de 0 es 50% (mitad izquierda de la curva)
Entonces el total menor que tú es:
50% + 19.1% = 69.1%
¿Cómo se usa la tabla de Z? Lo averiguaremos con un valor concreto: ¿cuál es la probabilidad de encontrar un valor de Z menor
o igual a 1,96?
Vamos a la tabla y familiaricémonos con algunas de sus características.
▪ En la primera columna de la tabla aparece el entero y primer decimal del valor de Z, vemos que los valores van desde -3,4 a
3,3. En la primera fila (arriba),
aparece el segundo decimal del valor de Z y, como es lógico, hay 10 números (0,00 a 0,09).
▪ Entonces, para nuestro valor de Z = 1,96 buscaremos 1,9 en la primera columna de la tabla y 0,06 en la primera fila de la tabla.
Trazaremos líneas perpendiculares desde esos valores y llegaremos a un número en el cuerpo de la tabla (véase la tabla más
abajo, que tiene marcadas las dos perpendiculares de
las que hablamos. El número que encontramos y que está destacado es: 0,9750.
Por lo tanto, la probabilidad asociada a Z=1,96 es 0,9750, es
decir, la probabilidad de encontrar un valor de Z menor o igual a
1,96 es 0,9750.
En nuestro ejemplo anterior, con la edad 30 años, vemos que el
valor Z = 1,29 tiene una probabilidad asociada de 0,9014.
Entonces, la probabilidad de
encontrar una persona con edad de 30 años o menos, en este
grupo humano, es
0,9014.
Un ejemplo práctico: su empresa empaca azúcar en bolsas de 1 kg
Cuando pesas una muestra de bolsas obtienes estos resultados:
1007g, 1032g, 1002g, 983g, 1004g, ... (cien mediciones)
Media = 1010g
Desviación Estándar = 20g
Algunos valores son inferiores a 1000 g ... ¿puedes arreglar eso?
La distribución normal de sus medidas se ve así:
Es algo aleatorio, por lo que no podemos evitar que las bolsas tengan menos de 1000 g,
pero podemos intentar reducirlo bastante.
✔ Vamos a ajustar la máquina para que 1000 g esté a −3 desviaciones estándar:
De la curva de campana grande arriba vemos que 0.1% son menos. Pero tal vez eso es demasiado pequeño.
✔ a −2.5 desviaciones estándar: Por debajo de 3 es 0.1% y entre 3 y 2.5 desviaciones estándar es 0.5%, juntas eso es 0.1% +
0.5% = 0.6% (una buena opción, creo)
Entonces, ajustemos la máquina para que tenga 1000g a −2.5 desviaciones estándar de
la media.
Ahora, podemos ajustarla para:
aumentar la cantidad de azúcar en cada bolsa (lo que cambia la media), o hacerlo más preciso (lo que reduce la desviación
estándar) Probemos ambas opciones.
AJUSTAR LA CANTIDAD MEDIA EN CADA BOLSA
La desviación estándar es de 20g, y
necesitamos 2.5 de ellas:
2.5 × 20g = 50g
Entonces la máquina debería promediar 1050g,
así:
AJUSTAR LA PRECISIÓN DE LA MÁQUINA
O podemos mantener la misma media (de 1010 g), pero
entonces necesitamos que 2.5 desviaciones estándar sean
iguales a 10g:
10g / 2.5 = 4g
Entonces, la desviación estándar debería ser 4g, así:
(¡Esperamos que la máquina sea tan precisa!)
https://www.youtube.com/watch?v=3y_SshjmW50