UNIDAD III Estadistica I PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 31

Unidad III Elaborado por: Ing.

Erick Murillo Vélez


Dpto. Matemáticas UNI-RUPAP

UNIDAD III: VARIABLES ALEATORIAS Y SUS DISTRUBUCIONES

Introducción
El campo de la estadística se dedica a la realización de inferencias acerca de las
poblaciones y sus características. Los resultados de los experimentos que se llevan
a cabo están sujetos a la casualidad. Consideremos el experimento de lanzar 2
monedas su espacio muestral es S = {cc, cs, sc, ss}. Con frecuencia es muy
importante asignarle al resultado una descripción numérica, si el interés está en el
número de caras, entonces a cada uno de los puntos del espacio muestral se la
asigna un valor: 0, 1 ó 2. Estos valores son, por supuesto, cantidades aleatorias
determinadas por resultado del experimento. Estos valores pueden considerarse
como valores que asume la variable aleatoria (VA), X, el número de caras obtenidas
en los dos lanzamientos.
Definición: Una variable aleatoria es una función que asocia un número real a cada
elemento del espacio muestral. Se utilizará una letra mayúscula para designar una
VA y su correspondiente letra minúscula para cada uno de sus valores.
Ejemplo: Se sacan dos pelotas en sucesión, sin reemplazo, de una caja que
contiene 4 pelotas rojas y 3 negras. Defina X como numero de pelotas rojas
entonces:

Espacio Muestral x
RR 2
RN 1
NR 1
NN 0

Definición: Si un espacio muestral contiene un número finito de posibilidades o una


secuencia interminable con tantos elementos como números naturales existen, se
llama espacio muestral discreto. Una variable aleatoria que se asocia a este tipo de
espacio muestral se llama variable aleatoria discreta (VAD). Ejemplo: Número de
accidentes que suceden en un día en Managua

Definición: Si un espacio muestral contiene un número infinito de posibilidades


igual al número de puntos en un segmento de línea, se llama espacio muestral
continuo. Una variable aleatoria que se asocia a este tipo de espacio muestral se
llama variable aleatoria continua (VAC). Ejemplo: El contenido de una botella en
mililitros.
Las VAC representan datos medidos como alturas, pesos, temperaturas, distancias
o períodos de vida; mientras que las VAD representan datos que se cuentan, tales
como número de artículos defectuosos de una muestra, número de accidentes en
un determinado punto, etc.

1
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD.

Con mucha frecuencia es conveniente representar con una fórmula todas las
probabilidades de una VAD. Dicha fórmula, necesariamente, debe ser una función
de los valores numéricos de x, y se representa por f(x). Por lo tanto se escribe f(x)
= P(X = x). Al conjunto de pares ordenados (x, f(x)) se llama función de probabilidad
o distribución de probabilidad de la VAD X.
Propiedades:
El conjunto de pares ordenados (x, f(x)) es una distribución de probabilidad de la
VAD X si, para cada resultado posible x se cumple que:
1. f(x)  0 , para todo x
2.  f ( x)  1
x
3. P(X = x) = f(x)

Ejemplo
Un embarque de 8 televisores similares que se envía a una distribuidora contiene 3
aparatos defectuosos. Si una persona realiza una compra aleatoria de 2 televisores,
encuentre la distribución de probabilidad para el número de televisores defectuosos.
X: Número de televisores defectuosas compradas por la persona.
x = 0, 1, 2
Ahora encontramos lo siguiente:
 3  5 
  
f (0) = P(X = 0) =    
0 2 10
, o sea la probabilidad de no obtener ningún
8  28
 
 2
televisor defectuoso. De manera similar se encuentran para cuando x = 1 y x = 2.
 3  5 
  
f(1) = P(X = 1) =    
1 1 15
8  28
 
 2
 3  5 
  
f(2) = P(X = 2) =    
2 0 3
8  28
 
 2

La distribución de probabilidad es:

2
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

10
 28 si x  0

 15
f(x)   si x 1
 28
3
 28 si x  2

Su grafica lo podemos expresar como un histograma o un polígono de
probabilidades
f(x)

15/28

10/28

3/28

0 1 2 x

También podemos expresar la distribución de probabilidad mediante una fórmula:


 3  5 
  
 x  2  x 
f ( x)  P( X  x) 
 28
 
2 
FUNCIÓN DE DISTRIBUCIÓN ACUMULADA:
En muchos problemas en los cuales se desea calcular la probabilidad de que el valor
observado de la variable aleatoria X sea menor que o igual a algún número real x, para esto
usamos la función de distribución acumulada (FDA)
La FDA F(x) de una VAD X, cuya distribución de probabilidad es f(x), es:

F ( x)  P( X  x)   f (t ) , para - < x < 


tx

Para el ejemplo anterior la FDA es:


10
F(0) = f(0) =
28

3
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

10 15 25
F(1) = f(0) + f(1) =  
28 28 28
10 15 3
F(2) = f(0) + f(1) + f(2) =   1
28 28 28

Entonces:
0 para x <0

10/28 para 0  x < 1


F(x) =
25/28 para 1  x < 2

1 para x  2

Su gráfica es:

25/28

0 1 2

En este ejemplo utilicemos la función de distribución acumulada para calcular:


a) P(X  1) = F(1) = 25/28
b) P(X < 1), como la variable aleatoria es discreta y no incluye a 1, entonces
tomamos el valor anterior o sea P(X < 1) = P(X  0) = F(0) = 10/28
c) P(X > 1), en esta caso no conocemos que esta a la derecha de 1 entonces usamos
la regla del complemento o sea P(X > 1) = 1 – P(X  1) = 1 – F(1) = 1 – 25/28 =
3/28

FUNCION DE DENSIDAD.
Una VAC tiene una probabilidad de cero de asumir cualquiera de sus valores
exactamente. Consecuentemente, su distribución de probabilidad no pude darse de
forma tabular. Por ejemplo considérese una VA cuyos valores son las alturas de

4
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

todas las personas mayores de 21 años de edad. Entre cualquiera de dos valores
163.5 y 164.5 cm hay un número infinito de alturas. Es remota la probabilidad de
seleccionar una persona al azar que tenga una altura exactamente de 164 cm.
Se tendrán que utilizar probabilidades para varios intervalos de VAC, tales como
P(a < X < b), P(X > c).
La función de densidad de una VAC se representa por medio de una fórmula que
debe ser una función de valores numéricos de la VAC X. Se expresa como f(x).

Propiedades

La función f(x) es una función de densidad para la VAC X, definida en el conjunto


de los números reales, si:

1. f(x)  0 para x  R


2. 
f ( x)dx  1

b
3. P (a  X  b)   f ( x)dx
a

Ejemplo:
Suponga que el error en la temperatura de reacción, en C, para un experimento
controlado de laboratorio es una VAC X, que tiene la función de densidad siguiente:

x2
para –1 < x < 2
3
f(x) =
0 en otro lugar

Verifique que es una función de densidad y calcule P(0 < X < 1)

a) f(x)  0 para x  R.

 x2
2
b) 
f ( x)dx  
1 3
dx  1

1 x2 1
c) P(0  X  1)   dx 
0 3 9

5
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

FUNCIÓN DE DISTRIBUCIÓN ACUMULADA


La FDA F(x) para una VAC X con función de densidad f(x) es:
x
F ( x)  P ( X  x)   f (t )dt , para - < x< 

Ejemplo:
Encuentre la FDA para el ejemplo anterior
x x t
2
x3  1
F ( x)   f (t )dt   dt  por lo tanto
 1 3 9

0 x  -1

x3  1
F(x) = -1  x < 2
9

1 x2

Usando la función de distribución acumulada P(a < X < b) = F(b) – F(a)

ESPERANZA MATEMÁTICA O VALOR ESPERADO


En el capítulo I se definió el concepto de media aritmética o valor promedio X  , de
una serie de datos como la suma de todos los datos, divididos por el número de
datos. Ahora podemos calcular el valor promedio de una variable aleatoria X
(discreta o continua) que tiene una distribución de probabilidad, en el caso discreto
o una función de densidad en el caso continuo, por medio de una fórmula, la cual
tiene el mismo significado numérico que un promedio aritmético.
La esperanza o valor medio de una variable aleatoria X es de especial importancia
en estadística debido a que determina el lugar donde se centra la distribución de
probabilidad.
Definición
Sea X una variable aleatoria discreta con distribución de probabilidad f(x). La
media o valor esperado de X es:

  E ( X )   xf ( x)
x
Sea X una variable aleatoria continua con función de densidad f(x). La media o
valor esperado de X es:

  E ( X )   f ( x)dx


Ejemplo:

Encuentre la esperanza matemática para los ejemplos anteriores

6
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

 10   15   3  21
μ  E(X)   xf(x)  (0)   (1)   (2)   = 0.75
x  28   28   28  28

  x2  1
1
  E ( X )   f ( x)dx   x dx 

0 
3  12
VARIANZA Y COVARIANZA
Para obtener una descripción adecuada de una distribución de probabilidad, es
necesario caracterizar la variabilidad de la distribución, ya que el valor esperado no
nos proporciona dicha información.
Supongamos que tenemos dos variables aleatorias discretas con la misma media 
= 2 y que difieren en su variabilidad o dispersión de sus observaciones alrededor
del valor medio, a como se muestra en los siguientes gráficos.

x x
1 2 3 0 1 2 3 4

La medición más importante de una variable aleatoria X se obtiene calculando la


variabilidad o varianza a como se muestra a continuación.
Definición
La varianza de una variable aleatoria X discreta con distribución de probabilidad
f(x) y media  está dada por:

 
V(x) =  2  E  X      ( x   ) 2 f ( x)
2

La varianza de una variable aleatoria X continua con función de densidad f(x) y


media  está dada por:
  
V(x)  2  E  X      ( x   ) 2 f ( x)dx
2


En cualquiera de los casos anteriores la raíz cuadrada positiva de la varianza , se


llama desviación estándar.
Ejemplos:
1) Encontrar la varianza para los ejemplos anteriores
Solución
21
Para el caso discreto tenemos que;  = , entonces
28

 
2 2 2
 21   10   21   15   21   3 
  E X   
2 2
  ( x   ) f ( x)   0      1       2    
2

x  28   28   28   28   28   28 

7
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

1
Para el caso continuo tenemos que;  = , entonces:
12

   x2 
2
 1
1

  E X   
347
  ( x   ) f ( x)dx    x    dx 
2 2 2

0
 12   3  6480

Teorema
La varianza de una variable aleatoria X (discreta o continua):
2 = E(X2) - 2

Teorema de Chebyshev
Si una variable aleatoria tiene una varianza o desviación estándar pequeña,
esperaríamos que la mayoría de los valores se agrupen alrededor de la media. Por
lo tanto, la probabilidad de que una variable aleatoria tome un valor dentro de cierto
intervalo alrededor de la media es mayor que para una variable aleatoria similar con
una desviación estándar mayor. Gráficamente tenemos

Teorema de Chebyshev
La probabilidad de que cualquier variable aleatoria X tome un valor dentro de k
desviaciones estándar de la media es de al menos 1 – 1/k2. Es decir,
P (μ −kσ < X < μ +kσ) ≥ 1 −1/k2

Para k = 2 el teorema establece que la variable aleatoria X tiene una probabilidad


de al menos 1-1/22 = 3/4 de caer dentro de dos desviaciones estándar a partir de la
media; es decir, que tres cuartas partes o más de las observaciones de cualquier
distribución se localizan en el intervalo μ ± 2σ.
Ejemplo
Una variable aleatoria X tiene una media μ = 8, una varianza σ2 = 9 y una distribución
de probabilidad desconocida. Calcule
a) P (−4 < X < 20),
b) P (|X −8| ≥ 6).
Solución
a) P (−4 < X < 20) = P [8−(4)(3 ) < X < 8 +(4)(3)] ≥ 15/16 .
b) P (|X−8| ≥ 6) = 1−P (|X −8| < 6) = 1−P (−6 < X −8 < 6)
= 1−P [8−(2)(3 ) < X < 8 +(2)(3)] ≤1/4

Problemas propuestos
1. Clasifique las siguientes variables aleatorias como discretas o continuas:
X: Número de clientes que llegan a una tienda en una hora

8
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Y: El tiempo que toma jugar un partido de béisbol


M: Cantidad de miel producida por una colmena anualmente
N: Número de huevos que pone mensualmente una gallina.
L: Número de llamadas que recibe una central telefónica en un dia.

2. Determine el valor de c para forma que cada una de las siguientes funciones
sirva como distribución de probabilidad de la variable aleatoria discreta X:
a) f(x) = c(x2 + 4) para x = 0, 1, 2, 3
 2  3 
b) f ( x)  c    para x = 0, 1, 2
 x  3  x 
3. Encuentre la distribución de probabilidad para el número de discos de jazz cuando
4 discos se seleccionan al azar de una colección que consiste de 5 discos de jazz,
2 música clásica y 3 de música romántica. Exprese el resultado como una fórmula.
Construya la función de distribución acumulada. Calcule E(x) Y V(x)

4. De una caja que contiene 4 pelotas negras y dos verdes se seleccionan tres de
ellas en sucesión sin reemplazo. Encuentre la distribución de probabilidad para el
número de pelotas verdes.
5. Repita el ejercicio 4 pero ahora con reemplazo.
6. Encuentre la función de distribución acumulada para el ejercicio 5 y utilícela
para calcular:
a) P(X  2)
b) P(X < 1)
c) P(X > 1)
d) Calcule E(x) y V(x)

7. Considere la siguiente función de densidad:

k x 0  x  1
f(x)  
0 en otra parte

a) Calcule el valor de k
b) Encuentre la función de distribución acumulada F(x) y utilícela para
calcular P(0.5 < X < 0.7)
c) Calcule E(x) y V(x)
8. Una variable aleatoria X tiene una media μ = 10 y una varianza σ2 = 4. Utilice el
teorema de Chebyshev para calcular
a) P(|X −10| ≥3);
b) P(|X −10| < 3);
c) P(5 < X < 15);

9
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

VARIABLES ALEATORIAS CONJUNTAS


Anteriormente se definieron variables aleatorias asociadas a un espacio muestral
en una sola dimensión en los que se registraban los resultados de un experimento
como los valores asumidos por una variable aleatoria única, sin embargo habrán
situaciones donde puede ser preferible registrar los resultados simultáneos de
varias variables.
En nuestro estudio consideraremos la ocurrencia de 2 variables aleatorias (discretas
o continuas), para representar sus valores por medio de una función f(x, y).

DISTRIBUCION DE PROBABILIDAD CONJUNTA


Definición
La función f(x, y) es una distribución de probabilidad conjunta de las variables
aleatorias discretas X y Y si:
i) f(x, y)  0 para toda (x, y)
ii)  f ( x, y) 1
x y

iii) P(X = x, Y = y) = f(x, y)


Para toda región del plano xy, P[(X, Y)  A] =   f ( x, y)
A
Ejemplo
Se seleccionan al azar 2 libros de un estante que contiene 3 novelas, 2 revistas y 3
libros de poemas. Si X es el número de novelas seleccionadas y Y el de las revistas,
encuentre:
a) la distribución de probabilidad conjunta (x, y)
b) P[(x, y)  A] , donde A es la región {(x, y)/ x + y  1}

a) Tenemos que encontrar los posibles pares de valores (x, y), estos son:
(0, 0), (0, 1), (1, 0), (1, 1), (0, 2) y (2, 0). Vale la pena mencionar que pares ordenados
como (1, 2) no son posibles en este experimento por que estamos seleccionando
solo dos libros y la suma de (x, y) tiene que ser menor o igual 2. Ahora encontramos
la distribución de probabilidad conjunta para los posibles valores de X y Y.
f(0, 0) = P(X = 0, Y = 0) o sea la probabilidad de no obtener ni una y ni una revista
o sea los dos tienen que ser libros de poemas, o sea :
 3  2  3 
   
f(0, 0) = P(X = 0, Y = 0) =     
0 0 2 3
, de manera similar encontramos los
8  28
 
 2
demás pares ordenados.
 3  2  3 
   
f(1, 0) = P(X = 1, Y = 0) =     
1 0 1 9
8  28
 
 2

10
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

 3  2  3 
   
f(2, 0) = P(X = 2, Y = 0) =     
2 0 0 3
,
8  28
 
 2
 3  2  3 
   
f(0, 1) = P(X = 0, Y = 1) =      ,
0 1 1 3
8  14
 
 2
 3  2  3 
   
f(1, 1) = P(X = 1, Y = 1) =      ,
1 1 0 3
8  14
 
 2
 3  2  3 
   
f(0, 2) = P(X = 0, Y = 2) =     
0 2 0 1
,
8  28
 
 2
Según los cálculos anteriores podemos expresar la distribución conjunta de
probabilidad por medio de la siguiente formula. f(x, y) = P(X = x, Y = y) =
 3  2  3 
   
 x  y  2  x  y  ,
8 
 
 2

La suma de todos los resultados es igual a 1 y estos se presentan en la siguiente


tabla de doble entrada:

f(x, y) x Totales por


0 1 2 fila
0 3/28 9/28 3/28 15/28
y 1 3/14 3/14 3/7
2 1/28 1/28
Totales por
5/14 15/14 3/28 1
columna

b) P[(x, y)  A] = P(X + Y  1) = f(0, 0) + f(0, 1) + f(1, 0) = 3/28 + 3/14 + 9/28 = 9/14

11
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

FUNCION DE DENSIDAD CONJUNTA


Definición
La función f(x, y) es una función de densidad conjunta de las variables aleatorias
continuas X y Y si:
i) f(x, y)  0 para toda (x, y)
 
ii)   f ( x, y )  1
 

iii) P[(X, Y)  A] =  f ( x, y)dxdy Para cualquier región A del plano.


A
Ejemplo:
Dos variables aleatorias continuas tienen la siguiente función de densidad
conjunta:
2
 (2 x  3 y ), 0  x  1, 0  y  1
f ( x, y )   5

0 en otra parte
1) Verifique la condición 2 para que sea una función de densidad conjunta
2) Calcule P[(X, Y)  A], donde A es la región {(x, y)/ 0 < x < ½ , ¼ < y < ½ }
Solución:
  1 1
2
1)   f ( x, y )dxdy    (2 x  3 y )dxdy  1
  0 0
5
1/ 2 1/ 2
2 13
2) P[(X, Y)  A] = P(0 < X < ½ , ¼ < Y < ½ ) =
1/ 4 0
5  
(2 x  3 y )dxdy 
160
DISTRIBUCIONES MARGINALES DE DOS VARIABLES ALEATORIAS
Definición:
Las distribuciones marginales de X y Y están dadas por:
Caso Discreto:
g ( x )   f ( x, y ) y h ( y )   f ( x, y )
y x

Caso continuo:
 
g ( x)   f ( x, y)dy

y h( y )   f ( x, y)dx

O sea dada la distribución de probabilidad conjunta para el caso discreto, la
distribución marginal g(x) se obtiene al sumar f(x, y) sobre los valores de Y, o sea
son los totales por columnas la tabla de doble entrada. De la misma forma la
distribución marginal h(y) se obtiene al sumar f(x, y) sobre los valores de X, o sea
son los totales por fila de la tabla de doble entrada. Para el caso continuo las sumas
se sustituyen por integrales.
Ejemplos
Encuentre las distribuciones marginales para los dos ejemplos anteriores.
Solución:
Caso discreto

12
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Para encontrar g(x) se tiene que:


2
3 3 1 5
P(X = 0) = g(0) =  f (0, y)  f (0,0)  f (0,1)  f (0,2)  28  14  28  14
y 0
2
9 3 15
P(X = 1) = g(1) =  f (1, y)  f (1,0)  f (1,1)  f (1,2)  28  14  0  28
y 0
2
3 3
P(X = 2) = g(2) =  f (2, y)  f (2,0)  f (2,1)  f (2,2)  28  0  0  28
y 0

Los cuales son los totales por columna de la tabla de doble entrada. De manera
similar se encuentra h(y) y las distribuciones marginales pueden escribirse como:

x 0 1 2 y 0 1 2

g(x) 5/14 15/24 3/28 g(x) 15/28 3/7 1/28

También podemos generalizar el concepto de esperanza matemática para el caso


de dos variables aleatorias X y Y.
Definición
Sean X y Y variables aleatorias discretas con distribución de probabilidad conjunta
f(x,y). El valor esperado de la variable aleatoria g(X, Y) es:
V(x) = μ g(X, Y)  Eg(X, Y)   g(x, y)f(x, y)
x y

Definición
Sean X y Y variables aleatorias continuas con función de densidad conjunta f(x, y).
La media o valor esperado de la variable aleatoria g(X, Y) es:
 
V(x) = μ g(X,Y)  Eg(X, Y)    g(x, y)f(x, y)dxdy
 

Ejemplos:
1) Sean X y Y las variables aleatorias discretas del ejemplo anterior, calcular el valor
esperado de g(X, Y) = XY
Solución
Por la definición anterior
2 2
E ( XY )   xyf ( x, y ) = (0)(0)f(0,0) + (0)(1)f(0,1) + (0)(2)f(0,2) + (1)(0)f(1,0)
x 0 y 0

+ (1)(1)f(1,1) + (2,0)f(2,0) = f(1,1) = 3/14


2) Calcule E(X + Y) , para
2
 (2 x  3 y ), 0  x  1, 0  y  1
f ( x, y )   5

0 en otra parte

13
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

2( x  y )(2 x  3 y )
1 1
Se tiene que: E  X  Y    
7
dxdy 
0 0
5 6
Para los casos anteriores nótese que si g(X, Y) = X se tiene que:

  xf ( x, y )   xg ( x) (Caso discreto)
 x y x

E( X )  
  

 
xf ( x, y )dxdy   xg ( x)dx (Caso continuo)


donde g(x) es la distribución marginal de X.


De manera similar se define:

  yf ( x, y )   yh( y ) (Caso discreto)
 x y x

E (Y )  
  

   yh( y)dx
yf ( x , y )dxdy  (Caso continuo)


donde h(y) es la distribución marginal de y.

Teorema
Sea X una variable aleatoria discreta con distribución de probabilidad f(x), la
varianza de la variable aleatoria g(X) está dado por:
  
 g2( X )  E g ( X )   g ( X ) 2   g ( x)   g ( X ) 2 f ( x) 
x
Sea X una variable aleatoria continua con función de densidad f(x), la varianza de
la variable aleatoria g(X) está dado por:

   g ( x)   

 g2( X )  E g ( X )   g ( X ) 2  g(X )
2
f ( x)dx

COVARIANZA
La covarianza es entre dos variables aleatorias(discretas o continuas) es una
medida de la naturaleza de la asociación entre las dos. El signo de la covarianza
indica la relación entre las dos variables dependientes es positiva o negativa. La
cual se calcula de la siguiente forma.
Definición
Sean X y Y dos variables aleatorias discretas con distribución de probabilidad
conjunta f(x, y), entonces la covarianza de X y Y es:
 XY  E( X   X )(Y  Y )   ( x   X )( y   Y ) f ( x, y )
x y

Sean X y Y dos variables aleatorias continuas con función de densidad conjunta


f(x, y), entonces la covarianza de X y Y es:
 
 XY  E( X   X )(Y  Y )    (x   X )( y  Y ) f ( x, y)dxdy
 

14
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Analicemos el signo de la covarianza para obtener la relación entre las variables. Si


los valores grandes de X resultan en valores de Y , X - X positivo frecuentemente
resultará en Y - Y positivo obtendremos una covarianza tenderá a ser positiva, o si
los valores pequeños de X resultan en valores pequeños de Y, X - X negativo
resultará frecuentemente en valores negativos de Y - Y obteniendo también una
covarianza positiva . Por otro lado, si los valores grandes de X resultan en valores
pequeños de Y la covarianza será negativa. Cuando X y Y son estadísticamente
independientes, puede demostrarse que la covarianza entre las dos variables es
cero, pero lo contrario generalmente no es cierto o sea dos variables pueden tener
covarianza cero y aun así no ser estadísticamente independientes.
Otra forma de calcular la covarianza es por el siguiente teorema
Teorema
La covarianza de dos variables aleatorias (discretas o continuas) con medias X y
Y respectivamente está dado por:
XY = E(XY) - X Y
Problemas propuestos
1. Determine los valores de c, tales que las siguientes funciones representen
distribuciones de probabilidad conjunta de las variables aleatorias X y Y:
a) f (x, y) = cxy, para x = 1, 2, 3; y = 1, 2, 3;
b) f (x, y) = c |x - y|, para x = -2, 0, 2; y = -2, 3.
2. De un saco de frutas que contiene 3 naranjas, 2 manzanas y 3 plátanos se
selecciona una muestra aleatoria de 4 frutas. Si X es el número de naranjas y Y el
de manzanas en la muestra, calcule
a) la distribución de probabilidad conjunta de X y Y;
b) P[(X, Y) ∈ A], donde A es la región dada por {(x, y) | x + y ≤ 2}.
c) Calcule las distribuciones marginales
d) Calcule E(xy) y V(xy)
e) Calcule E(x) y E(y)
f) Calcule la covarianza
3. Un restaurante de comida rápida opera tanto en un local que da servicio en el
automóvil, como en un local que atiende a los clientes que llegan caminando. En un
día elegido al azar, represente las proporciones de tiempo que el primero y el
segundo local están en servicio con X y Y, respectivamente, y suponga que la
función de densidad conjunta de estas variables aleatorias es

f (x, y) = 2/3(x + 2y), 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,


0, en otro caso.

a) Calcule la densidad marginal de X.


b) Calcule la densidad marginal de Y.
c) Calcule la probabilidad de que el local que da servicio a los clientes que llegan en
automóvil esté lleno menos de la mitad del tiempo.

15
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

4. Se supone que cada rueda trasera de un avión experimental se llena a una presión
de 40 libras por pulgada cuadrada (psi). Sea X la presión real del aire para la rueda
derecha y Y la presión real del aire de la rueda izquierda. Suponga que X y Y son
variables aleatorias con la siguiente función de densidad conjunta:

f (x, y) = k (x2 + y2 ), 30 ≤ x < 50, 30 ≤ y < 50,


0, en otro caso.
a) Calcule k.
b) Calcule P(30 ≤ X ≤ 40 y 40 ≤ Y < 50).
c) Calcule la probabilidad de que ambas ruedas no contengan la suficiente cantidad
de aire.
d) Calcule la covarianza

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD


Introducción:
Con frecuencia, las observaciones que se generan en diferentes experimentos
estadístico tienen el mismo tipo de comportamiento en términos generales. En
consecuencia, las VAD que se asocian con estos experimentos pueden describirse,
esencialmente, por la misma distribución de probabilidad y por lo tanto se
representan por una sola fórmula.

DISTRIBUCION BINOMIAL
Frecuentemente un experimento consiste de n ensayos repetidos, cada uno con
dos posibles resultados que pueden llamarse éxito o fracaso(ejemplos). Este
proceso se conoce como Proceso de Bernoulli y cada intento se llama
experimento de Bernoulli.
Proceso de Bernoulli
Tiene las siguientes características:
1. El experimento consiste en n intentos repetidos
2. Los resultados de cada uno de los intentos pueden clasificarse como un éxito o
un fracaso.
3. La probabilidad de éxito, representada por p, pertenece constante para todos los
intentos.
4. Los intentos repetidos son independientes(o sea con reemplazo).

Ejemplo:
Considérese el conjunto de experimentos de Bernoulli donde 3 artículos se
seleccionan aleatoriamente de un proceso de manufactura; se inspeccionan y se
clasifican como defectuoso (D) y no defectuoso(N). Un artículo defectuoso se
considera como un éxito. El número de éxitos es una VA que asume los valores de
0 a 3. Los ocho posibles resultados y sus correspondientes valores de X son:

16
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Resultado .x
NNN 0
NDN 1
NND 1
DNN 1
NDD 2
DND 2
DDN 2
DDD 3

DISTRIBUCION BINOMIAL
Definición
Un experimento de Bernoulli puede resultar en un éxito con probabilidad p y en un
fracaso con probabilidad q = 1 – p. Entonces la distribución de probabilidad de la VA
binomial X, el número de éxitos en n experimentos independientes, es:
 n
b( x; n, p)    p x q n  x , x = 0, 1, 2, . . . ,n.
 x
Ejemplo:
La probabilidad de que una cierta clase de componentes pase con éxito una
determinada prueba de impacto es de ¾. Encuentre la probabilidad de que
exactamente 2 de los siguientes 4 componentes que se prueban pasen la prueba.
X: Número de componentes que pasan la prueba
p = 3/4
q=¼

3   4  3   1 
2 2
 27
P(x = 2) = b 2;4,        
 4   2  4   4  128

2) La probabilidad de que un paciente se recupere de una rara enfermedad de


sangre es 0.4. Si se sabe que 15 personas han contraído esta enfermedad, cual es
la probabilidad de que:
a) sobrevivan exactamente 5 personas
b) Como máximo 3 personas sobrevivan
c) Menos de 6 personas sobrevivan
d) al menos 10 sobrevivan
e) Mas de 4 personas sobrevivan
Solución
Definimos X: Número de personas que sobreviven y p = 0.4 , q = 0.6, nuestra
distribución es:
15
b( x;15,0.4)   0.4 x 0.615 x , x = 0, 1, 2, . . . ,15.
x 

15
a) P(X = 5) =  0.4 5 0.6155  0.1859
5 

17
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

b) P(X ≤ 3) = F(3) = 0.0905. Valor de tabla


c) P(X < 6) = P(X ≤ 5) = F(5) = 0.4032
d) P(X  10) = 1 – P(X < 10) = 1 – P(X  9) = 1 – 0.9662 = 0.0338
e) P(X > 4) = 1 – P(X ≤ 4) = 1 - F(4) = 1 - 0.2173 = 0.7827

La media y la varianza de la distribución binomial b(x ; n, p) están dadas por:


 = np y  = npq

DISTRIBUCIÓN BINOMIAL NEGATIVA


Considérese el experimento en el cual las propiedades sean las mismas que
aquellas indicadas para un experimento binomial, con la excepción de que los
intentos se repetirán hasta conseguir un número determinado de éxitos. Por lo tanto
en vez de encontrar la probabilidad de éxitos en n intentos, donde n es fijo, ahora
se está interesado en la probabilidad de que el k-ésimo éxito ocurra en el x-ésimo
intento. En este caso estamos ante una distribución binomial negativa. Por ejemplo
si se aplica un medicamento que se sabe es confiable nos interesa encontrar la
probabilidad de que el quinto paciente que experimente alivio sea el séptimo que lo
recibe.
Definición
Si ensayos independientes repetidos pueden dar como resultado un éxito con
probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de
probabilidad de la variable aleatoria X, el número del ensayo en el que ocurre el k-
ésimo éxito, es:
 x  1 x x  k
b* (x ; k, p) =   p q , x = k, k + 1, k + 2, . . .
 k  1
Ejemplo
En una serie de campeonato de beisbol, el equipo que gane 4 de 7 juegos será el
ganador. Suponga que los equipos A y B se enfrentan en los juegos de campeonato
y que el equipo A tiene una probabilidad de 0.55 de ganarle al equipo B.
a) .Cual es la probabilidad de que el equipo A gane la serie en 6 juegos?
b) .Cual es la probabilidad de que el equipo A gane la serie?
Solución
 5
a) b∗ (6; 4, 0.55) =  (0.55) 6 (0.45) 64 = 0.1853.
 3
b) P(el equipo A gana la serie de campeonato) es
b∗(4; 4, 0.55) +b∗(5; 4, 0.55) +b∗(6; 4, 0.55) +b∗(7; 4, 0.55)
= 0.0915 + 0.1647 + 0.1853 + 0.1668 = 0.6083.

Distribución Hipergeométrica
La manera más simple de ver la diferencia entre la distribución binomial y la
distribución hipergeométrica consiste en observar la forma en que se realiza el
muestreo. Los tipos de aplicaciones de la distribución hipergeométrica son muy
similares a los de la distribución binomial. Nos interesa el cálculo de probabilidades
para el número de observaciones que caen en una categoría específica. Sin
embargo, la distribución binomial requiere que los ensayos sean independientes.

18
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Por otro lado, la distribución hipergeométrica no requiere independencia y se basa


en el muestreo que se realiza sin reemplazo. Las aplicaciones de la distribución
hipergeométrica se encuentran en muchos campos, sobre todo en el muestreo de
aceptación, las pruebas electrónicas y los controles de calidad.

En general, nos interesa la probabilidad de seleccionar x éxitos de los k artículos


considerados éxitos y n – x fracasos de los N – k artículos que se consideran
fracasos cuando una muestra aleatoria de tamaño n se selecciona de N artículos.
Esto se conoce como un experimento hipergeométrico; es decir, aquel que posee
las siguientes dos propiedades:
1. De un lote de N artículos se selecciona una muestra aleatoria de tamaño
n sin reemplazo.
2. k de los N artículos se pueden clasificar como éxitos y N – k se clasifican
como fracasos.
El número X de éxitos de un experimento hipergeométrico se denomina variable
aleatoria hipergeométrica. En consecuencia, la distribución de probabilidad de la
variable hipergeométrica se conoce como distribución hipergeométrica, y sus
valores se denotan con h(x; N, n, k), ya que dependen del número de éxitos k en el
conjunto N del que seleccionamos n artículos.
Definición
La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número
de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos,
en los que k se denomina éxito y N – k fracaso, es:

(𝑘 𝑁−𝑘
𝑥 )( 𝑛−𝑥 )
h(x; N, n, k) = , donde x = 0, 1, 2, …, n
(𝑁
𝑛)
Ejemplo
Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se
consideran inaceptables. El procedimiento para obtener muestras del lote consiste
en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un
componente defectuoso. ¿Cual es la probabilidad de, que en la muestra, se
encuentre exactamente un componente defectuoso, si en todo el lote hay 3
defectuosos?
Solución
Si utilizamos la distribución hipergeométrica con n = 5, N = 40, k = 3 y x = 1,
encontramos que la probabilidad de obtener un componente defectuoso es
(3)(37)
1 4
P( X = 1) h(1; 40, 5, 3) = 40 = 0.3011
( )
5

Distribución de Poisson
Los experimentos que producen valores numéricos de una variable aleatoria X, el
número de resultados que ocurren durante un intervalo de tiempo determinado o en
una región específica, se denominan experimentos de Poisson. El intervalo de
tiempo puede ser de cualquier duración, como un minuto, un día, una semana, un
mes o incluso un año. Un experimento de Poisson se deriva del proceso de
Poisson y tiene las siguientes propiedades:

19
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

1. El número de resultados que ocurren en un intervalo o región específica es


independiente del número que ocurre en cualquier otro intervalo de tiempo o región
del espacio disjunto.
2. La probabilidad de que ocurra un solo resultado durante un intervalo de tiempo
muy corto o en una región pequeña es proporcional a la longitud del intervalo o al
tamaño de la región, y no depende del número de resultados que ocurren fuera de
este intervalo de tiempo o región.
3. La probabilidad de que ocurra más de un resultado en tal intervalo de tiempo corto
o que caiga en tal región pequeña es insignificante.

Definición
La distribución de probabilidad de la variable aleatoria de Poisson X, la cual
representa el número de resultados que ocurren en un intervalo de tiempo dado o
región específicos es:
𝑒 −𝜆 𝜆𝑥
p(x ; λ) = 𝑥! , x = 0, 1, 2, . . . ,
donde λ es el número promedio de resultados por unidad de tiempo, distancia, área
o volumen y e = 2.7182

Ejemplo
Durante un experimento de laboratorio el número promedio de partículas radiactivas
que pasan a través de un contador en un milisegundo es 4. .Cual es la probabilidad
de que entren en un milisegundo
a. 6 partículas al contador
b. Como máximo 5 partículas
c. Al menos 7 partículas

Solución:
Al usar la distribución de Poisson con λ = 4, tenemos
𝑒 −4 4𝑥
p(x ; 4) = 𝑥!
𝑒 −4 46
a. P(X = 6) = 6! = 0.1042
b. P(X ≤ 5) = F(5) = 0.7851
c. P(X ≥ 7) = 1 – P(X >7) = 1 – P(X≤6) = 1 – F(6) = 1 – 0.8893 = 0.1107

Aproximación de la Binomial a ala Poisson


Sea X una variable aleatoria binomial con distribución de probabilidad b(x; n, p).
Cuando n → ∞, p → 0, y  = np permanece constante, entonces
b(x; n, p) → p(x; ).

Ejemplo
En un proceso de fabricación donde se manufacturan productos de vidrio ocurren
defectos o burbujas, lo cual ocasionalmente hace que la pieza ya no se pueda
vender. Se sabe que, en promedio, 1 de cada 1000 artículos producidos tiene una
o más burbujas. ¿Cuál es la probabilidad de que una muestra aleatoria de 8000
tenga menos de 7 artículos con burbujas?

20
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Solución
Se trata básicamente de un experimento binomial con n = 8000 y p = 0.001. Como
p es muy cercana a cero y n es bastante grande, haremos la aproximación con la
distribución de Poisson utilizando  = (8000)(0.001) = 8.
Por lo tanto, si X: el número de burbujas, tenemos
P (X < 7) = P(X ≤ 6) = 0.3134.

Problemas propuestos
1. Al probar cierta clase de neumático para camión en un terreno accidentado, se
encuentra que el 25% de los camiones no completan la prueba de recorrido sin
ponchaduras. De los siguientes 15 camiones probados, calcule la probabilidad de
que:
a) de 3 ponchaduras;
b) menos de 4 tengan ponchaduras;
c) más de 5 tengan ponchaduras.
d) Al menos 10 camiones no tengan ponchaduras

2. Se sabe que 60% de los ratones inoculados con un suero quedan protegidos
contra cierta enfermedad. Si se inoculan 5 ratones, calcule la probabilidad de que
a) ninguno contraiga la enfermedad
b) menos de 2 contraigan la enfermedad
c) más de 3 contraigan la enfermedad
d) Como máximo 3 no contraigan la enfermedad

3. Para evitar la detección en la aduana, un viajero coloca 6 comprimidos con


narcóticos en una botella que contiene 9 píldoras de vitamina que aparentemente
son similares. Si el oficial de la aduana selecciona 3 de las tabletas al azar para su
análisis. ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión ilegal
de narcóticos?

4. De un lote de 10 misiles, se seleccionan 4 al azar y se disparan. Si el lote que


contiene 3 misiles defectuosos que no pueden dispararse. ¿Cuál es la probabilidad
de que
a) los 4 puedan dispararse?
b) a lo sumo fallen 2?

5. La probabilidad de que una persona que vive en cierta ciudad tenga un perro es
de 0.3. Calcule la probabilidad de que la décima persona entrevistada al azar en
esa ciudad sea la quinta que tiene un perro.

6. En cierto crucero ocurren, en promedio, 3 accidentes de tránsito al mes. ¿Cuál


es la probabilidad de que en cualquier determinado mes en este crucero
a) ocurran exactamente 5 accidentes?
b) ocurran menos de 3 accidentes?
c) ocurran al menos 2 accidentes?
d) ¿Cuál es la probabilidad de que ocurran como máximo 1 accidente en 15
días.
21
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

7. Un escritor de libros comete, en promedio, dos errores de procesamiento de texto


por página en el primer borrador de su libro. .Cual es la probabilidad de que en la
siguiente página cometa
a) 4 o más errores?
b) ningún error?

8. Se sabe que la probabilidad de que un estudiante de secundaria apruebe un


examen de admisión en una universidad es de 0.004. De los siguientes 1875
estudiantes que se hacen el examen de admisión, calcule la probabilidad de que
a) exactamente 10 aprueben examen
b) menos de 5 aprueben el examen
c) como máximo 8 aprueben el examen

9. La probabilidad de que una persona muera al contraer una infección viral es de


0.001. De los siguientes 4000 infectados con el virus. ¿Cuál es la probabilidad de
que mueran:
a) al menos 5
b) menos de 6
c) a lo sumo 3

22
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Distribuciones continuas de probabilidad

Distribución Normal
La distribución de probabilidad continua más importante en todo el campo de la
estadística es la distribución normal. Su gráfica, denominada curva normal, es la
curva con forma de campana, la cual describe de manera aproximada muchos
fenómenos que ocurren en la naturaleza, la industria y la investigación. Por ejemplo,
las mediciones físicas en áreas como los experimentos meteorológicos, estudios de
la precipitación pluvial y mediciones de partes fabricadas a menudo se explican más
que adecuadamente con una distribución normal.

Definición
La función de densidad de la variable aleatoria X normal con media µ y varianza 2
es:
(𝑥−𝜇)2
1 −
n(x: µ, ) = 𝑒 2𝜎2 para -∞ ≤ x ≤∞
√2𝜋𝜎
con  = 3.1416…. y e = 2.7182….. y su grafica es

La cual tiene las siguientes propiedades:


1. La moda, que es el punto sobre el eje horizontal donde la curva tiene su
máximo, ocurre en x = 
2. La curva es simétrica alrededor de su eje vertical donde se tiene la media .
3. La curva tiene sus puntos de inflexión en x =   , es cóncava hacia arriba
si  -  < X <  + , y es cóncava hacia arriba en cualquier otro punto.
4. La curva se acerca al eje horizontal en forma asintótica en cualquiera de las
dos direcciones, alejándose de ella.
5. El área total bajo la curva y arriba del eje horizontal es igual a 1.

Cálculo de Probabilidades
Áreas bajo la Curva Normal
La función de densidad de una variable aleatoria continua está construida de tal
modo que el área bajo la curva, limitada por los dos puntos x = x1 y x = x2, es igual
a la probabilidad de que la variable aleatoria X asuma un valor entre x = x1 y x = x2.
Para la curva normal tenemos:
x2 x2
 ( x   ) /  2
1
1
P( x1  X  x2 )   n( x;  ,  )dx   e 2 dx
x1 2  x1

que representa el área sombreada:

23
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

El problema es la dificultad de resolver la integral planteada, entonces es posible


transformar todas las observaciones de cualquier variable aleatoria X normal en un
nuevo conjunto de observaciones de una variable aleatoria normal Z con media cero
x
y varianza 1. Esto es posible por medio de la transformación: z  , como

estamos buscando la probabilidad entre x = x1 y x = x2 , la variable aleatoria Z caerá
x  x 
entre los valores correspondientes z1  1 y z2  2 , en consecuencia
 
puede escribirse:
x z z
 ( x   ) /  2
1 1
1 2
1 2  2 z2 2

2  x1 2 z1  n( z;0,1)dz  P( z1  Z  z 2 )


P( x1  X  x2 )  e 2
dx  e dz 
z1

donde Z es una variable aleatoria normal con media cero y varianza 1.


Definición
La distribución de una variable aleatoria normal con media cero y varianza 1 se
llama distribución normal estándar.
A continuación se presentan gráficamente las distribuciones original y transformada.

Los valores de la normal estándar están tabulados en la tabla No., la cual


proporciona el área bajo la curva normal P(Z  z) = F(z) o sea la función de
distribución acumulada.
Ejemplo
Dada una distribución normal con  = 50 y  = 10, encuentre la probabilidad de
que X:
a) esté entre 45 y 62
b) sea menor que 52
c) sea menor que 55
d) encuentre el valor de x que tiene 45% del área a la izquierda
e) encuentre el valor de x que tiene un 14% del área a la derecha
Solución
Tenemos una variable aleatoria normal n(x; 50, 10)

24
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

a) Nos preguntan por P(45 < X < 62), encontramos los valores de z
correspondientes a x1 = 45 y x2 = 62, de la siguiente manera:
x   45  50 x   62  50
z1  1   0.5 y z 2  2   1.2
 10  10
por lo tanto
P(45 < X < 62) = P(-0.5 < Z < 1.2) = F(-0.5) – F(1.2) utilizando la tabla tenemos
= 0.8849 – 0.3085 = 0.5764
Gráficamente:

-0.5 0 1.2
52  50
b) Encontremos el valor de z   0.2 , entonces:
10
P(X < 52) = P(Z < 0.2) = F(0.2) =
Gráficamente

0 0.2
55  50
c) b) Encontremos el valor de z   0.5 , entonces:
10
P(X > 55) = 1 - P(X < 55) = 1 - F(0.5) = 0.6915
Gráficamente

0 0.5

25
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

d) Gráficamente tenemos:

-z 0
Tenemos que encontrar en el cuerpo de la tabla normal z = -0.12, ahora x = µ + z
= 50 + (-0.12)(10) = 48.8
e) Graficamente

0 z
Tenemos que encontrar en el cuerpo de la tabla normal z, pero con el complemeto
de 0.14 0 sea 0.86 ya que en la tabla tenemos el valor acumulado, o sea z = 1.09,
ahora x = µ + z = 50 + (1.09)(10) = 60.9

Aplicaciones de la Distribucion Normal.


Una empresa de material eléctrico fabrica bombillas de luz cuya duración, antes de
quemarse, se distribuye normalmente con una media igual a 800 horas y una
desviación estándar de 40 horas. Calcule la probabilidad de que una bombilla se
queme
a) entre 778 y 834 horas.
b) en más de 810 horas
c) en menos de 790 horas

Solución
µ = 800 horas y  = 40 horas, tenemos una distribución normal n(x: 800, 40)
a) P(778 ≤ X ≤ 834) = P(-0.55 ≤ Z≤ 0.85) = F(0.85) – F(-0.55) = 0.8023 – 0.2912
= 0.5111
𝑥1 −𝜇 778−800 𝑥2 −𝜇 834−800
Calculamos z1 = = = −0.55 y z2 = = = 0.85
𝜎 40 𝜎 40

b) P(X > 810) = 1 – P(X ≤ 810) = 1 – P(Z≤0.25) =1 – F(0.25) = 1 – 0.5987 =


0.4014
𝑥−𝜇 810−800
Calculamos z = = = 0.25
𝜎 40

c) P(X < 790) = P(Z≤ -0.25) = F(-0.25) = 0.4013

26
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

790−800
Calculamos= = −0.25
40

Aproximación de la Binomial a la Normal


La distribución binomial se aproxima bien por medio de la normal en problemas
prácticos cuando se trabaja con la función de distribución acumulativa. Ahora
plantearemos un teorema que nos permitirá utilizar áreas bajo la curva normal para
aproximar propiedades binomiales cuando n es suficientemente grande.

Si X es una variable aleatoria binomial con media μ = np y varianza σ2 = npq,


𝑥−𝑛𝑝
entonces la forma limitante de la distribución de z = 𝑛𝑝𝑞 conforme n → ∞, es la

distribución normal estándar n(z; 0, 1).

Ejemplo
Un paciente que padece una rara enfermedad de la sangre tiene 0.4 de probabilidad
de recuperarse. Si se sabe que 100 personas contrajeron esta enfermedad, ¿cuál
es la probabilidad de que sobrevivan menos de 30?

Solución
Tenemos una distribución normal con n =100, p 0.4 y q = 0.6, como n es grande
aproximamos a la normal con µ = np = 100(0.4) = 40 y 𝜎 = √100(0.4)(0.6) = 4.89
Nos preguntan por P(X < 30) = P(Z ≤ -2.04) = 0.0207
𝑥−𝑛𝑝 30−40
Calculamos z = 𝑛𝑝𝑞 = 4.89 = −2.04

Distribución ji cuadrada

La VA continua X tiene una distribución ji cuadrada, v grados de libertad, si su


función de densidad está dada por:

1 v 1  x
v
x 2
e 2
, x>0
2 2 ( v )
2
f(x) =
0 en otro lugar

donde v es un entero positivo.

Su grafica es:

27
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Teorema de Limite Central (Distribución muestral de medias)

Si X es la media de una muestra aleatoria de tamaño n tomado de una población


con media  y varianza finita 2, entonces la forma límite de la distribución de:

X 
Z

n
cuando n  , es la distribución normal n(z; 0, 1)

Ejemplo

Una empresa de material eléctrico fabrica bombillas que tienen una duración que
se distribuye aproximadamente en forma normal, con media de 800 horas y
desviación estándar de 40 horas. Calcule la probabilidad de que una muestra
aleatoria de 16 bombillas tenga una vida promedio de menos de 775 horas.
Solución
La distribución muestral de𝑋̅ será aproximadamente normal, con 𝜇𝑥̅ = 800 y𝜎𝑥̅ =
40
= 10 10.
√16

P(𝑋̅ < 775) = P(Z < -2.5) = 0.0062


𝑥̅ −𝜇 775−800
Calculamos z=𝜎 = 10 = −2.5
⁄ 𝑛

(n  1) S 2
Distribución muestral de
2
Si S2 es la varianza de una muestra aleatoria de tamaño n tomada de una población
(n  1) S 2
normal que tiene varianza 2, entonces el estadístico X 2  , tiene
2
distribución ji cuadrada con v = n – 1 grados de libertad.

28
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

Distribución t student
Sea Z una VA normal y V una VA con distribución ji cuadrada con v grados de
libertad. Si Z y V son independientes, entonces la distribución de la VA T, donde:
Z
T
V
v
Se conoce como distribución t student con v grados de libertad.
Esta distribución se parece a la distribución de Z en que ambas son simétricas a la
media cero, las dos tienen forma de campana. Su grafica es:

Distribución F de Fisher
Sean U y V dos variables aleatorias independientes que tienen distribuciones ji
cuadrada con v1 y v2 grados de libertad, respectivamente. Entonces la distribución
U
v1
de la variable aleatoria F  , se conoce como distribución de F de Fisher con
V
v2
v1 y v2 grados de libertad.
Su grafica es:

Problemas propuestos
1. Dada una distribución normal estándar, calcule el área bajo la curva que esta
a) a la izquierda de z = –1.39; b) a la derecha de z = 1.96;
c) entre z = –2.16 y z = – 0.65; d ) a la izquierda de z = 1.43;
e) a la derecha de z = – 0.89; f ) entre z = – 0.48 y z = 1.74.

2. Dada una distribucion normal estándar, calcule el valor de k tal que


a) P(Z > k) = 0.2946; b) P(Z < k) = 0.0427; P(−0.93 < Z < k) = 0.7235.

29
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

3. Dada una distribución normal con μ = 30 y σ = 6, calcule


a) el área de la curva normal a la derecha de x = 17;
b) el área de la curva normal a la izquierda de x = 22;
c) el área de la curva normal entre x = 32 y x = 41;
d ) el valor de x que tiene 80% del área de la curva normal a la izquierda;
e) los dos valores de x que contienen 75% central del área de la curva normal.

4. Dada la variable X normalmente distribuida con una media de 18 y una desviación


estándar de 2.5, calcule
a) P(X < 15);
b) el valor de k tal que P(X < k) = 0.2236;
c) el valor de k tal que P(X > k) = 0.1814;
d ) P(17 < X < 21).

5. Las barras de pan de centeno que cierta panadería distribuye a las tiendas locales
tienen una longitud promedio de 30 centímetros y una desviación estándar de 2
centímetros. Si se supone que las longitudes están distribuidas normalmente, .que
porcentaje de las barras son
a) más largas que 31.7 centímetros?
b) de entre 29.3 y 33.5 centímetros de longitud?
c) más cortas que 25.5 centímetros?

6. Un investigador informa que unos ratones a los que primero se les restringen
drásticamente sus dietas y después se les enriquecen con vitaminas y proteínas
vivirán un promedio de 40 meses. Si suponemos que la vida de tales ratones se
distribuye normalmente, con una desviación estándar de 6.3 meses, calcule la
probabilidad de que un ratón determinado viva
a) más de 32 meses;
b) menos de 28 meses;
c) entre 37 y 49 meses.

7. El diámetro interior del anillo de un pistón terminado se distribuye normalmente


con una media de 10 centímetros y una desviación estándar de 0.03 centímetros.
a) .Que proporción de anillos tendrá diámetros interiores que excedan 10.075
centímetros?
b) .Cual es la probabilidad de que el anillo de un pistón tenga un diámetro interior
de entre 9.97 y 10.03 centímetros?
c) .Por debajo de que valor del diámetro interior caerá el 15% de los anillos de
pistón?

8. Un paciente tiene 0.9 de probabilidad de recuperarse de una operación de


corazón delicada. De los siguientes 100 pacientes que se someten a esta operación,
¿cuál es la probabilidad de que
a) sobrevivan entre 84 y 95 inclusive?
b) sobrevivan menos de 86?

30
Unidad III Elaborado por: Ing. Erick Murillo Vélez
Dpto. Matemáticas UNI-RUPAP

9. La cantidad de tiempo que le toma al cajero de un banco con servicio en el


automóvil atender a un cliente es una variable aleatoria con una media μ = 3.2
minutos y una desviación estándar σ = 1.6 minutos. Si se observa una muestra
aleatoria de 64 clientes, calcule la probabilidad de que el tiempo medio que el cliente
pasa en la ventanilla del cajero sea
a) a lo sumo 2.7 minutos;
b) mas de 3.5 minutos;
c) al menos 3.2 minutos pero menos de 3.4 minutos

31

También podría gustarte