La Normal
La Normal
La Normal
Una variable aleatoria continua X es uno aquello puede suponer un número infinito de valores dentro de
cualquier intervalo dado. La probabilidad que X caídas dentro de cualquier intervalo está dada por el área
bajo la distribución de probabilidad (o función de densidad) dentro de aquel intervalo. El área total
(probabilidad) bajo la curva es 1 (ve Prob. 3.31).
La distribución normal es una distribución de probabilidad continua y la mayoría de generalmente utilizado
distribución en análisis estadístico (ve Prob. 3.32). La curva normal es simétrico sobre su media. Extiende
indefinidamente en ambas direcciones, pero la mayoría del área (probabilidad) es agrupado alrededor de la
media (ve Fig. 3-4); 68.26% del área (probabilidad) bajo la curva normal está incluida dentro una desviación
estándar de la media (i.e., dentro µ ± 1σ), 95.44% dentro µ ± 2σ, y 99.74% dentro µ ± 3σ.
Fig. 3-4
La distribución normal estándar es una distribución normal con un malo de 0 y una desviación estándar de 1
(i.e., µ = 0 y σ = 1). Cualquier distribución normal (X escala en Fig. 3-4) puede ser convertido a una
distribución normal estándar por dejar µ = 0 y expresando desviaciones de en unidades de desviación
estándar (z escala).
Para encontrar probabilidades (áreas) para los problemas que implican la distribución normal, primero
convertimos el X valor a su correspondiente z valor, como sigue:
Entonces miramos arriba del valor z en Aplicación. 3. Esto da la proporción del área
(probabilidad) incluido bajo la curva entre el malo y que z valor.
EJEMPLO 12. El área (probabilidad) bajo la curva normal estándar entre z ¼ 0 y z ¼ 1:96 está obtenido por
mirar arriba del valor de 1.96 en Aplicación. 3. Movemos abajo la columna z en la mesa a 1.9 y entonces a
través hasta que estemos debajo de la columna encabezada 0.06. El valor que conseguimos es 0.4750. Esto
significa que 47.50% del área total (de 1, o 100%) bajo las mentiras de curva entre z = 0 y z = 1:96 (el área
sombreada en la figura por encima de la mesa). Debido a simetría, el área entre z = 0 y z = -1.96 (no dado en
la tabla) es también 0.4750, o 47.50%.
EJEMPLO 13. Supone que X es una variable aleatoria normalmente distribuida con µ = 10 y σ 2 = 4 y
queremos encontrar la probabilidad de X suponiendo un valor entre 8 y 12. Primero calculamos los valores z
que corresponden a los valores X de 8 y 12 y entonces miramos arriba de estos valores z en Aplicación. 3:
EJEMPLO 14. Supone otra vez que X es una variable aleatoria normalmente distribuida con µ = 10 y σ 2 = 4.
La probabilidad que X supondrá un valor entre 7 y 14 puede ser encontrado como sigue:
y
Para z1 = -1.5, miramos a 1.50 en Aplicación 3. Y se consigue 0.4322. Para z2 = 2, conseguimos 0.4772.
P(7 ˂ X ˂ 14) = 0.4332 + 0.4772 = 0.9104, o 91.04% (ver Fig. 3-5)
Por tanto la probabilidad de X asume un valor más pequeño que 7 o más grande que 14 (el área sin sombra
de cola en Fig. 3-5) es 1 – 0.9104 = 0.0896, 8.96%. La distribución normal aproxima la distribución binomial
cuándo n ≥ 30 y ambos np > 5 y n(1 – Þ) > 5, y aproxima la Distribución Poisson cuándo λ = 10 (ve Probs. 3.37
y 3.38). Otra distribución de probabilidad continua es la distribución exponencial (ve Prob. 3.39). Teorema
Chebyshev, o desigualdad, declara que a toda costa de la forma de una distribución, la proporción de las
observaciones o el área que cae dentro de K desviaciones estándares de la media es al menos 1 – 1/K2, para
K ≥ 1 (ve Probs. 3.40 y 3.72).
Fig. 3-5
(a) Una variable continua es una aquello puede suponer cualquier valor dentro de cualquier
intervalo dado. Una variable continua puede ser medida con cualquier grado de exactitud
sencillamente por utilizar unidades más pequeñas y más pequeñas de medida. Por ejemplo, si
decimos que un proceso de producción toma 10h, esto significa en cualquier lugar entre 9.5 y
10.4 h (10h redondeados a la hora más cercana). Si utilizamos minutos como la unidad de
medianamente, podríamos haber dicho que el proceso de producción toma 10h y 20 min. Esto
significa en cualquier lugar entre 10h y 19.5 min y 10h y 20.4 min, y tan encima. El tiempo es así
una variable continua, y así que es peso, distancia, y temperatura.
(a) Una distribución de probabilidad continua refiere a la gama de todos los valores posibles que un
valor aleatorio continuo puede suponer, junto con las probabilidades asociadas. La distribución
de probabilidad de una continua la variable aleatoria es a menudo llamada una función de
densidad de la probabilidad, o sencillamente una función de probabilidad. Está dado por una
curva lisa tal que el área total (probabilidad) bajo la curva es 1. Desde una variable aleatoria
continua puede suponer un número infinito de valores dentro de cualquier intervalo dado, la
probabilidad de un valor concreto es 0. Aun así, podemos medir la probabilidad que una variable
aleatoria continua X supone cualquier valor dentro de un intervalo dado (dice, entre X1 y X 2) por
el área bajo la curva dentro de aquel intervalo:
(c) El valor esperado, o media, y la varianza para distribuciones de probabilidad continua puede ser
derivada por la sustitución de ∫ para Σ y f(X) para P(X) a la fórmula para el valor esperado y varianza
para distribuciones de probabilidad discreta [Eqs. (3.19) y (3.20)]:
3.32 (a) ¿Qué es una distribución normal? (b) ¿Cuál es su utilidad? (c) ¿Qué es la distribución normal
estándar? ¿Cuál es su utilidad?
(a) La distribución normal es una función probabilidad continua que tiene forma de campana,
simétrica sobre la media, y mesocurtico. A medida que nos alejamos de la media en ambas
direcciones, la curva normal se acerca al eje horizontal (pero nunca lo toca del todo). La ecuación
de la función de probabilidad normal está dada por
(a) La distribución normal es la más utilizada de todas las distribuciones de probabilidad en el análisis
estadístico. Muchas distribuciones encontradas en la naturaleza y en la industria son normales.
Algunos ejemplos, el IQs (cociente de inteligencia), pesos, alturas de un numero grande de personas
y las variaciones en dimensiones de un numero grande de partes que produjo una máquina. La
distribución normal a menudo puede ser utilizada para aproximar otras distribuciones, como las
binomiales y el de Poisson (ve Probs. 3.37 y 3.38). Las distribuciones de medias y proporciones
muestrales son a menudo normales, independientemente de la distribución de la población
parental.
(b) La distribución normal estándar es una distribución normal con µ = 0 y σ 2 = 1. Cualquier distribución
normal (definido por un valor particular para µ y σ 2) puede ser transformado por una distribución
normal estándar dejando µ = 0 y expresando desviaciones en unidades de desviación estándar. A
menudo podemos encontrar áreas (probabilidades) convirtiendo los valores de X en valores de z
correspondientes [esto es, z = (X - µ)/σ] y buscando estos valores de z en la aplicación 3.
3.33 Encuentra el área bajo la curva normal estándar (a) entre z ± 1, z ± 2, y z ± 3; (b) de z = 0 a z = 0.88; (c)
de z = 1.60 a z = 2.55; (d) a la izquierda de z = -1.60; (e) a la derecha de z = 2.55; (f) a la izquierda de z
= -1.60 y a la derecha de z = 2.55.
(a) El área (probabilidad) incluido bajo la curva normal estándar entre z = 0 y z = 1 está obtenido
para buscar el valor de 1.0 en Aplicación. 3. Esto se logra moviendo hacia abajo la columna z en
la tabla a 1.0 y luego a través hasta que estemos debajo de la columna encabezada .00. El valor
que conseguimos es 0.3413. Esto significa que 34.13% del área total (de 1, o 100%) debajo de
curva se encuentra z = 0 y z = 1.00. Debido a simetría, el área entre z = 0 y z = -1 es también
0.3413, o 34.13%. Por tanto, el área entre z = 1 y z = -1 es 68.26% (ve Fig. 3-4). De modo
parecido, el área entre z = 0 y z = 2 es 0.4772, o 47.72% (buscamos z = 2.00 en la tabla), de modo
que el área entre z = ±2 es 95.44% (ve Fig. 3-4). El área entre z ± 3 = 99.74% (ve Fig. 3-4). Nota
que en la tabla sólo da detalles de los valores de z hasta 2.99 porque el área bajo de la curva
exterior de z ± 3 es insignificante.
(b) El área entre z = 0 y z = 0.88 está obtenido por buscar 0.88 en la tabla. Esto es 0.3106.
(c) El área entre z = 0 y z = 1.60 está obtenido por buscar z = 1.60 en la tabla. Esto es 0.4452.
El área entre z = 0 y z = 2.55 está obtenido por encontrar z = 2.55 en la tabla. Esto es 0.4946.
Por ello el área bajo la curva normal estándar de z = -1.60 y z = 2:55 igual a 0.4452 más 0.4946.
Esto es 0.9398, o 93.98% (ve Fig. 3-11). En todos los problemas de esta naturaleza es útil
dibujar la figura.
(d) Sabemos que el área total bajo la curva normal es igual a 1. Debido a simetría, 0.5 del áreas se
encuentra a ambos lados de µ = 0. Desde entonces 0.4452 extiende de z = 0 a z = -1 .60, 0.5 –
0.4452 = 0.0548, o 5.48%, es el área en la cola izquierda, a la izquierda de -1.60 (ve Fig. 3-11).
(e) 0.5 – 0.4946 = 0.0054, o 0.54%, es el área en la cola correcta, a la derecha de z = 2.55 (Fig. 3-11).
( f) El área a la izquierda de z = -1.60 y a la derecha de z = 2.55 es igual a 1 0:9398 (ve parte c). Esto
es 0.0602, o 6.02% del total.
Fig. 3-11
3.34 Se sabe que la vida útil de las bombillas se distribuye normalmente con µ = 100 h y σ = 8 h. ¿Cuál es la
probabilidad que una bombilla elegida al azar tenga un tiempo de vida entre 110 y 120 horas de
quema?
Se nos pide encontrar P(110 ˂ X ˂ 120) donde X se refiere al tiempo medido en horas de tiempo de
combustión. Dado µ = 100 h y σ = 8 h, y dejando X 1 = 110 h y X 2 = 120 h, conseguimos:
y
Por ello queremos el área (probabilidad) entre z1 = 1.25 y z 2 = 2.50 (el área sombreada en Fig. 3-12).
Buscamos a z 2 = 2.50 en Aplicación. 3, conseguimos 0.4938. Esto es el área de z = 0 a z 2 = 2:50.
Buscamos a z 1 = 1.25, conseguimos 0.3944. Esto es el área de z = 0 a z 1 = 1.25. Restando 0.3944 de
0.4938, conseguimos 0.0994, o 9.94%, para el área sombreada que d P(110 < X < 120).
Fig. 3-12
3.35 Supone que los ingresos familiares son normalmente distribuidos con µ = $16,000, y σ = $2000. ¿Cuál
es la probabilidad que una familia elegida al azar tenga unos ingresos: (a) Entre $15,000 y $18,000?
(b) Bajo $15,000? (c) Por encima de $18,000? (d) Por encima de $20,000?
Por ello queremos el área (probabilidad) entre z1 = -0.5 y z 2 = 1 (el área sombreada en Fig. 3-13).
Buscamos a z =0:5 en Aplicación. 3, conseguimos 0.1915 para el área de z = 0 a z = -0:5.
Buscamos
z = 1, conseguimos 0.3413 para el área de z = 0 a z = 1. Así, P($15,000 ≤ X ≤ $18,000) = 0.1915 +
0.3413 = 0.5328, o 53.28%.
Higo. 3-13
(b) P(X ˂ $15,000) = 0.5 – 0.1915 = 0.3085 o 30.85% (el área sin sombrear en la cola izquierda, Fig. 3-
13).
(c) P(X ˃ $18,000) = 0.5 – 0.3413 = 0.1587 o 15.87% (el área sin sombrear en la cola derecha, Fig. 3-
13)
(d) X = $20,000 correspondiente a z = ($20,000 - $16,000)/ $2000 = 2. Por tanto, P(X ˃ $20,000) = 0.5
– 0.4772 = 0.0228, o 2.28%
3.36 Las calificaciones en el examen de mitad de periodo en una sección estadística grande se distribuye
normalmente con una media de 78 y una desviación estándar de 8. El profesor quiere dar la
calificación de A para el 10% del alumnado. ¿Cuál es el punto de calificación más bajo que se puede
designar con una A a medio plazo?
En este problema tenemos que encontrar el grado de punto tal aquello 10% del alumnado tendrá
calificaciones más altos. Esto implica encontrar el punto de calificación X tal aquello 10% del área
bajo la curva normal será a la derecha de X (el área sombreada en Fig. 3-14). Desde el área total bajo
la curva a la derecha de 78 es 0.5, el área sin sombrear en la Fig. 3-14 a la derecha de 78 tiene que ser
0.4. Tenemos que mirar al cuerpo de Aplicación. 3 para el valor más cercano a 0.4. Esto es 0.3997, el
cual corresponde al valor de z de 1.28. El valor X (el punto de calificación) aquello corresponde al
valor de z de 1.28 está obtenido por sustituir los valores conocidos como z = (X - µ) /σ y solucionando
para X:
Esto da 1024 = X - 78. Por tanto X = 78 + 10.24 = 88.24, o 88 al número entero más cercano.
Higo. 3-14
3.37 La experiencia indica que el 30% de las personas que ingresan a una tienda hace una compra.
Utilizando (a) la distribución binomial y (b) la aproximación normal al binomio, encuentre la
probabilidad de que la 30 personas que ingresan a la tienda, 10 o más haran una compra.
(a) Aquí n = 30, p = 0.3, y 1 - p = 0.7 y nos piden encontrar P(X ≥ 10). Utilizando Aplicación. 1 (la tabla
de probabilidades binomiales)
De z = 0.20, conseguimos 0:0793 (de Aplicación. 3). Esto significa que 0.0793 del área bajo la
curva normal estándar se encuentra desde z = 0 a z = 0.20. Por tanto, P(X ≥ 9.5) = 0.5 – 0.0793 =
0.4207 (la aproximación normal). Cuando n deviene incluso más grande, la aproximación
deviene incluso más cercana. [Si no habíamos tratado el número de personas como variable
continua, habríamos encontrado que P(X ≥ 10) = 0.34 y la aproximación no hubiera sido tan
cercana].
3.38 Un proceso de producción produjo 10 elementos defectuosos por hora. Encontrar la probabilidad de
que 4 o menos elementos son defectuosos fuera de la producción de una hora aleatoriamente
escogida que utiliza (a) la distribución de Poisson y (b) la aproximación normal del Poisson.
(a) Aquí λ = 10 y nos piden encontrar P(X ≤ 4), donde X es el número de elementos defectuosos de la
producción de una hora aleatoriamente escogida. El valor de e -10 de Aplicación. 2 es 0.00005.
Por tanto
(b) Tratando a los elementos como continuos [ve Prob. 3.37(b)], nos piden encontrar P(X ≤ 4.5),
donde X es el número de elementos defectuosos, µ = λ = 10 y σ = √ λ = √ 10 ≡ 3.16. Así:
Para z = 1.74 en Aplicación. 3, conseguimos 0.4591. Esto significa que 0.5 - 0.4591 = 0:0409 del
área (probabilidad) Bajo la curva normal estándar se encuentra a la izquierda de z = -1.74. Por
ello P(X ≤ 4.5) = 0.0409, o 4.09%. Cuando deviene más grande, conseguimos una mejor
aproximación. [Si no habíamos tratado el número de elementos defectuosos como variable
continua, habríamos encontrado que P(X ≤ 4) = 0.287.]
3.39 Si los acontecimientos o los éxitos siguen una distribución de Poisson, podemos determinar la
probabilidad que el primer acontecimiento ocurre dentro de un periodo designado de tiempo, P(T ≤
t), por la distribución de probabilidad exponencial. Porque estamos tratando tiempo, el exponencial
es una distribución de probabilidad continua. Esto está dado por
Dónde λ es el número medio de ocurrencias para el intervalo de interés y e λ puede ser obtenido de
Aplicación. 2. El valor esperado y la varianza son:
(a) Para la declaración de Prob. 3.29, encontrar la probabilidad de que comience en un punto
aleatorio en el tiempo, los clientes se detengan en la bomba de gasolina dentro de una hora media.
(b) ¿Cuál es la probabilidad que ninguno cliente se detenga en la bomba de gasolina dentro de una
hora media? (c) ¿Cuál es el valor esperado y varianza de la distribución exponencial, donde la
variable continua es tiempo T?
(a) Ya que un promedio de 6 clientes se detienen en la bomba por hora, λ = promedio 3 clientes por
hora media. La probabilidad que el primer cliente parará dentro de la primera hora media es
(b) La probabilidad que ninguno cliente se detenga en la bomba dentro de una hora media es
(c) E(T) = 1/λ = 1/6 ≡ 0.17 h por carro, y var T = 1/λ 2 = 1/36 ≡ 0.03 h por carro al cuadrado. La
distribución exponencial también puede usar calcular el tiempo entre dos acontecimientos
sucesivos.
3.40 El nivel medio de la escolarización para una población es de 8 años y la desviación estándar es 1 año.
¿Cuál es la probabilidad que un individual aleatoriamente seleccionado de la población tenga entre 6
y 10 años de escolarización? Menos de 6 años o más de 10 años?
Ya que no nos han dicho la forma de la distribución, podemos utilizar el teorema de Chebyshev, el
cual aplica a cualquier distribución. Con µ = 8 años y σ = 1 año, 6 años de escolarización es 2
desviaciones estándares abajo y 10 años de escolarización es 2 desviaciones estándares encima.
Utilizando el teorema de Chevyshev o desigualdad obtenemos
Por tanto, la probabilidad que el individuo haya tenido menos de 6 o más de 10 años de
escolarización es 25%.
6.64 De las fórmulas de (a) la probabilidad de que la variable continua X caiga entre, X 1 y X 2 , (b) la
distribución normal, (c) el valor esperado y la varianza de la distribución normal, y (d) la distribución
normal estándar, (e) ¿Cuál es la media y la varianza de la distribución normal estándar?
Rpts.
6.65 Encuentre el área bajo la curva estándar (a) dentro de z ± 1.64 (b) dentro de z = ±1.96 (c) dentro de z =
±2.58 (d) entre z = 0.90 y z = 2.10 (e) a la izquierda de z = 0.90 (f) a la derecha de z = 2.10 (g) a la
izquierda de z = 0.90 y a la derecha de z = 2.10.
Rpts.
6.66 Una variable aleatoria es normalmente distribuida con µ = 67 y σ= 3. ¿Cuál es la probabilidad que esta
variable aleatoria asuma un valor (a) Entre 67 y 70? (b) Entre 60 y 70? (c) Entre 60 y 65? (d) Abajo
60? (e) encima 65?
Rpts. (a) 0.3413, o 34.13%, (b) 0.8334, (c) 0.2415, (d) 0.0099, (e) 0.7486
3.67 El peso medio de un grupo grande de personas es 180 lb y la desviación estándar es 15 lb. Si los pesos
son normalmente distribuidos, encontrar la probabilidad que una persona elegida al azar del grupo
pesará (a) entre 160 y 180 lb, (b) encima 200 lb, (c) abajo 150 lb.
3.69 Experiencias pasadas indican que el 60% de los estudiantes que ingresan a la universidad
obtienen sus títulos. Usando, (a) la distribución binomial (b) la aproximación normal de la
binomial, encuentre la probabilidad de que de los 30 estudiantes seleccionados al azar de la clase
entrante, más de 20 reciban sus titulaciones.
Rpts. (a) 0.1762 (b) 0.1762
3.70 Un promedio de 10 carros por minuto pasa a través de una cabina de peaje durante la hora pico.
Usando, (a) la distribución de Poisson y (b) la aproximación normal de Poisson, encuentra la
probabilidad de que pasen menos de 6 carros.
Rpts. (a) 0.0749 o 7.49%, (b) 0.0778 o 7.78%
3.71 Un proceso de fabricación en el promedio de dos artículos defectuosos por hora, ¿Cuál es la
probabilidad de que después de un artículo defectuoso: (a) pasara una hora antes del siguiente
artículo defectuoso, (b) una media hora pasara? (c) quince minutos pasara? (d) ¿Cuál es el valor
esperado y la desviación estándar de esta distribución?
Rpts. (a) 0.13534 o 13.53%, (b) 0.36788, (c) 0.60653, (d) E(T) = σ = 1/λ = 0.5h por articulo
defectuoso
3.73 Conforme al teorema de Chevyshev, ¿al menos que proporción de las observaciones se
encuentran dentro de (a) 1.5 desviación estándar de la media (b) 2.5 desviación estándar de la
media?