6 - SUMA DE V.A.Y T.C.L

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 17

Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

5- SUMA DE VARIABLES ALEATORIAS Y TEOREMA


CENTRAL DEL LÍMITE

5.1 – Suma de variables aleatorias independientes

Cuando se estudiaron las variables aleatorias bidimensionales se habló de una función de variable
aleatoria bidimensional. En particular se nombró la suma de n variables aleatorias, pero no se dijo
nada sobre la distribución de esa v.a. suma.
Es a menudo importante saber cuál es la distribución de una suma de variables aleatorias indepen-
dientes.
Consideramos algunos ejemplos en el caso discreto

1- Suma de variables aleatorias independientes con distribución Poisson

X ~ P(λ1 ) ; Y ~ P (λ2 ) ; X y Y independientes ⇒ X + Y ~ P(λ1 + λ2 )


Dem.)
Consideramos el evento {X + Y = n} como unión de eventos excluyentes
{X = k , Y = n − k } 0 ≤ k ≤ n , entonces
n n n
λ1k λ2 n − k
P ( X + Y = n) = ∑ P( X = k ,Y = n − k ) =∑ P( X = k )P(Y = n − k ) =∑ e λ
k =0 k =0 k =0
− 1

k!
e − λ2
(n − k )!
=

X e Y independientes

n
λ1 k λ 2 n− k e − ( λ1 + λ2 ) n
n! e − (λ1 + λ2 )
= e − (λ1 + λ2 ) ∑ = ∑ λ k
λ n−k
= (λ1 + λ2 )n
k! (n − k )! k = 0 k!(n − k )!
1 2
k =0 n! n!

Binomio de Newton

O sea X+Y tiene distribución Poisson con parámetro λ1 + λ 2

2- Suma de variables aleatorias binomiales independientes

X ~ B(n1 , p) ; Y ~ B(n2 , p) ; X y Y independientes ⇒ X + Y ~ B(n1 + n2 , p)

Dem.)
Nuevamente consideramos el evento {X + Y = k } como unión de eventos excluyentes
{X = i, Y = k − i} 0 ≤ i ≤ n1 , entonces
n1 n1 n1
n   n 
P( X + Y = k ) = ∑ P( X = i, Y = k − i ) =∑ P( X = i ) P(Y = k − i ) =∑  1  p i (1 − p ) n1 −i  2  p k −i (1 − p ) n2 − k +i =
i =0 i=0 k =0  i  k − i
X e Y independientes
n1
 n  n 
= p k (1 − p) n1 + n2 −k ∑  1  2 
i = 0  i  k − i 

r
En la expresión anterior si j > r entonces   = 0
 j

149
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

n1
 n1  n2   n1 + n 2 
Por último usamos la siguiente identidad combinatoria ∑  i  k − i  =  
i =0     k 
Y entonces

 n +n 
P( X + Y = k ) =  1 2  p k (1 − p ) n1 + n2 − k
 k 
O sea X+Y tiene distribución binomial con parámetros n1 + n 2 y p

Observación: en los dos casos anteriores se puede generalizar el resultado a n variables aleatorias
independientes, usando el principio de inducción completa, es decir
1- Si X 1 , X 2 ,..., X n son n variables aleatorias independientes donde X i ~ P(λi ) para todo
n n
i = 1,2,..., n entonces ∑X i =0
i ~ P (∑ λi )
i=0

2- Si X 1 , X 2 ,..., X n son n variables aleatorias independientes donde X i ~ B (ni , p ) para todo


n n
i = 1,2,..., n entonces ∑X i =0
i ~ B ( ∑ ni , p )
i =0

Suma de variables aleatorias normales independientes

Si X e Y son dos variables aleatorias continuas independientes con densidades g(x) y h(y) respecti-
vamente se puede probar (no lo demostraremos aquí) que la v.a. Z = X + Y tiene densidad dada

por f X +Y ( z ) = ∫ g ( z − y )h( y)dy
−∞
Usando esto se puede demostrar el siguiente importante resultado:

Si X e Y son variables aleatorias independientes donde X ~ N µ1 , σ 1 ( 2


) y Y ~ N (µ ,σ ) enton-
2 2
2

(
ces X + Y ~ N µ1 + µ 2 , σ 1 + σ 2
2 2
)

Por inducción completa se puede generalizar este resultado a n variables:

Si X 1 , X 2 ,..., X n son n variables aleatorias independientes donde X i ~ N ( µ i , σ i2 ) para todo


n n n
i = 1,2,..., n entonces ∑X
i =0
i ~ N (∑ µ i , ∑ σ i2 )
i =0 i =1

De lo anterior y del hecho que X ~ N µ , σ 2 ( ) ⇒ aX + b ~ N(aµ + b, a 2σ 2 ) tenemos:

Si X 1 , X 2 ,..., X n son n variables aleatorias independientes donde X i ~ N ( µ i , σ i2 ) para todo


n n n
i = 1,2,..., n entonces ∑a X
i =0
i i ~ N (∑ ai µ i , ∑ ai2σ i2 ) donde a1 , a 2 ,..., a n son números reales
i =0 i =1

150
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

n
Se dice que ∑a X
i =0
i i es una combinación lineal de variables aleatorias.

Ejemplos:
1- La envoltura de plástico para un disco magnético está formada por dos hojas. El espesor de cada
una tiene una distribución normal con media 1.5 milímetros y desviación estándar de 0.1 milí-
metros. Las hojas son independientes.
a) Determine la media y la desviación estándar del espesor total de las dos hojas.
b) ¿Cuál es la probabilidad de que el espesor total sea mayor que 3.3 milímetros?

Solución: Sean las variables aleatorias


X: “espesor de la hoja 1” e Y: “espesor de la hoja 2”
Entonces X ~ N( 1.5,0.12 ) ; Y ~ N( 1.5,0.12 ) y X e Y independientes
a) Si definimos la v.a. Z: “espesor total de las dos hojas” , entonces Z = X + Y
Por lo tanto Z ~ N( 1.5 + 1.5, 0.12 + 0.12 ) es decir Z ~ N( 3, 0.02)
En consecuencia E ( Z ) = 3 , σ Z = V ( Z ) = 0.02
b) Se pide calcular P ( Z > 3.3)
 Z − 3 3. 3 − 3   3.3 − 3 
P ( Z > 3.3) = P >  = 1 − Φ  = 1 − Φ (2.12132 ) = 1 − 0.983 = 0.017
 0.02 0.02   0.02 

2-Tengo tres mensajes que atender en el edificio administrativo. Sea Xi : “ el tiempo que toma el i-
ésimo mensaje” (i = 1, 2 ,3), y sea X4 : “ el tiempo total que utilizo para caminar hacia y desde el
edificio y entre cada mensaje”. Suponga que las Xi son independientes, normalmente distribui-
das, con las siguientes medias y desviaciones estándar:
µ1 = 15 min, σ 1 = 4, µ 2 = 5, σ 2 = 1, µ 3 = 8, σ 3 = 2, µ 4 = 12, σ 4 = 3
Pienso salir de mi oficina precisamente a las 10.00 a.m. y deseo pegar una nota en mi puerta que
dice “regreso a las t a.m.” ¿A qué hora t debo escribir si deseo que la probabilidad de mi llegada
después de t sea 0.01?

Solución: Definimos la v.a. Z: “tiempo transcurrido desde que salgo de mi oficina hasta que re-
greso”, entonces T = X 1 + X 2 + X 3 + X 4
 4 4

Por lo tanto T ~ N  ∑ µ i , ∑σ 2
i  , y se pide hallar t tal que P (T > t ) = 0.01
 i =1 i =1 
4 4

∑µ
i =1
i = 15 + 5 + 8 + 12 = 50 y ∑σ
i =1
i
2
= 4 2 + 12 + 2 2 + 3 2 = 30

 t − 50   t − 50 
Entonces P (T > t ) = 1 − Φ  = 0.01 , es decir Φ  = 0.99
 30   30 
t − 50
Buscando en la tabla de la normal = 2.33 ⇒ t = 2.33 × 30 + 50 = 62.7619
30

3- El ancho del marco de una puerta tiene una distribución normal con media 24 pulgadas y des-
viación estándar de 1/8 de pulgada. El ancho de la puerta tiene una distribución normal con me-
dia 23.875 de pulgadas y desviación estándar de 1/16 de pulgadas. Suponer independencia.
a) Determine la distribución, la media y la desviación estándar de la diferencia entre el ancho
del marco y de la puerta.

151
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

b) ¿Cuál es la probabilidad de que la diferencia entre el ancho del marco y de la puerta sea ma-
yor que ¼ de pulgada?.
c) ¿Cuál es la probabilidad de que la puerta no quepa en el marco?.

Solución: Sean las variables aleatorias


X: “ancho del marco de la puerta en pulgadas”
Y: “ancho de la puerta en pulgadas”
Entonces X ~ N( 24, (1/8) 2 ) , Y ~ N( 23.875, (1/16) 2 ) , X e Y independientes
a) Se pide la distribución de X-Y , E ( X − Y ) , σ X −Y = V ( X − Y )
E ( X − Y ) = E ( X ) − E (Y ) = 24 − 23.875 = 0.125
2 2
1  1  5 5
V ( X − Y ) = V ( X ) + V (Y ) =   +   = ∴ σ X −Y =
 8   16  256 16
  5  
2

Por lo tanto X − Y ~ N 0.125,   
  
  16  
b) Se pide la probabilidad P( X − Y > 1 / 4)
 
 
 0.25 − 0.125  2 5
P ( X − Y > 1 / 4) = 1 − Φ = 1 − Φ  = 1 − Φ (0.8944) = 1 − 0.8133 = 0.1867

 5  5
   
 16 
c) Si la puerta no entra en el marco entonces se da el evento {X < Y } o equivalentemente
{X − Y < 0}, por lo tanto
 
 
 0 − 0.125   2 5 2 5
P ( X − Y < 0) = Φ = Φ −  = 1 − Φ


 5  = 0.1867
 5  5
     
 16 

4- Supongamos que las variables aleatorias X e Y denotan la longitud y el ancho en cm, respecti-
vamente, de una pieza.
Supongamos además que X e Y son independientes y que X ~ N(2 , 0.12 ) , Y ~ N(5 , 0.22 ).
Entonces Z = 2X + 2Y es una v.a. que representa el perímetro de la pieza.
Calcular la probabilidad de que el perímetro sea mayor que 14.5 cm.

( )
Solución: tenemos que Z ~ N 2 × 2 + 2 × 5, 2 2 × 0.12 + 2 2 × 0.2 2 , o sea Z ~ N (14, 0.2 )
La probabilidad pedida es P( Z > 14.5) , entonces
 14.5 − 14   5
P( Z > 14.5) = 1 − Φ  = 1 − Φ  = 1 − Φ (1.1180 ) = 1 − 0.8810 = 0.119

 0.2   2 

5- Si se aplican dos cargas aleatorias X 1 y X 2 a una viga voladiza como se muestra en la figura si-
guiente, el momento de flexión en 0 debido a las cargas es a1 X 1 + a 2 X 2 .
a) Suponga que X 1 y X 2 son v.a. independientes con medias 2
y 4 KLbs respectivamente, y desviaciones estándar 0.5 y
1.0 KLbs, respectivamente.

152
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

Si a1 = 5 pies y a 2 = 10 pies, ¿cuál es el momento de flexión esperado y cuál es la desviación


estándar del momento de flexión?
b) Si X 1 y X 2 están normalmente distribuidas, ¿cuál es la probabilidad de que el momento de
flexión supere 75 KLbs?

Solución: Sea la v.a. Z: “momento de flexión en 0”, entonces Z = 5 X 1 + 10 X 2


Por lo tanto
a) E ( Z ) = 5E ( X 1 ) + 10E ( X 2 ) = 5 × 2 + 10 × 4 = 50
65 65
V (Z ) = 5 2 × 0.5 2 + 10 2 × 12 = 25 × 0.25 + 10 × 1 = ∴σZ =
4 4
 65 
b) Si X 1 y X 2 están normalmente distribuidas, entonces Z ~ N  50, 
 4
Por lo tanto
 
 
 75 − 50   10 65 
P( Z > 75) = 1 − Φ = 1 − Φ  = 1 − Φ (6.20 ) ≈ 1 − 1 = 0
 65  13 
   
 4 

Promedio de variables aleatorias normales independientes

Si X 1 , X 2 ,..., X n son n variables aleatorias independientes donde X i ~ N ( µ , σ 2 ) para todo


n

∑X
i =1
i
i = 1,2,..., n entonces la v.a. X = tiene distribución normal con
n
σ2
media µ y varianza
n

∑X
i =1
i
Dem.) Notar que X = es un caso particular de combinación lineal de variables aleatorias
n
1
donde a i = para todo i = 1,2,..., n
n
Además en este caso µ i = µ y σ i = σ 2 para todo i = 1,2,..., n
2

n n
1 1 1
Por lo tanto, X tiene distribución normal con esperanza ∑
i =1 n
µ i = ∑
i =1 n
µ = nµ = µ
n
y varian-

za
2 2 2
n
1 2 n
1 2 1 σ2
∑  
i =1  n 
σ i = ∑  
i =1  n 
σ =  
n
n σ 2
=
n
 σ2 
Es decir, X ~ N  µ , 
 n 
Observación: a X se lo llama promedio muestral o media muestral

153
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

Ejemplos:
1) El diámetro interno de un anillo de pistón seleccionado al azar es una v.a. con distribución nor-
mal con media 12 cm y desviación estándar de 0.04 cm.
a) Si X es el diámetro promedio en una muestra de n = 16 anillos, calcule P (11.99 ≤ X ≤ 12.01)
b) ¿Qué tan probable es que el diámetro promedio exceda de 12.01 cuando n = 25 ?

Solución:
a) Sean las variables aleatorias X i : “diámetro del anillo i” i = 1,2,...,16
( )
Entonces X i ~ N 12, 0.042 para cada i.
 2 
Por lo tanto X ~ N 12, 0.04  . Entonces
 16 
 

11.99 − 12 X − 12 12.01 − 12
P (11.99 ≤ X ≤ 12.01) = P ( ≤ ≤ )=
0.04 2 0.04 2 0.04 2
16 16 16
   
   
   
= φ

12.01 − 12  − φ
 
11.99 − 12
() ( )
 = φ 1 − φ − 1 = 2φ (1) − 1 =

0.04 2 0.04 2
   
 16   16 
   
= 2 × 0.8413 − 1 = 0.6826

 2 
b) En este caso X ~ N 12, 0.04  , entonces
 25 
 
 
 
 12.01 − 12 
P ( X > 12.01) = 1 − φ  2
 = 1 − φ (1.25) = 1 − 0.8944 = 0.1056
 0.04 
 25 
 

2) Una máquina embotelladora puede regularse de tal manera que llene un promedio de µ onzas
por botella. Se ha observado que la cantidad de contenido que suministra la máquina presenta una
distribución normal con σ = 1 onza. De la producción de la máquina un cierto día, se obtiene una
muestra de 9 botellas llenas (todas fueron llenadas con las mismas posiciones del control operati-
vo) y se miden las onzas del contenido de cada una.
a) Determinar la probabilidad de que la media muestral se encuentre a lo más a 0.3 onzas de la
media real µ para tales posiciones de control
b) ¿Cuántas observaciones deben incluirse en la muestra si se desea que la media muestral esté a
lo más a 0.3 onzas de µ con una probabilidad de 0.95?

154
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

Solución:
a) Sean las variables aleatorias X i : “contenido en onzas de la botella i” i = 1,2,...,9
Entonces X i ~ N (µ ,1) para cada i.
 1
Por lo tanto X ~ N  µ ,  . Se desea calcular
 9
 
 0. 3 X −µ 0.3 
P( X − µ ≤ 0.3) = P(−0.3 ≤ X − µ ≤ 0.3) = P − ≤ ≤ =
 σ σ σ 
 n n n
   
 0.3 X −µ 0.3   X −µ 
= P − ≤ ≤  = P  − 0. 9 ≤ ≤ 0.9  = Φ (0.9) − Φ (−0.9) =
 σ σ σ   σ 
 n n n   n 
= 2Φ(0.9) − 1 = 0.6318

b) Ahora se pretende que


P( X − µ ≤ 0.3) = P( −0.3 ≤ X − µ ≤ 0.3) = 0.95
Entonces
   
 − 0.3 X − µ 0.3   X −µ 
P( X − µ ≤ 0.3) = P ≤ ≤  = P − 0.3 n ≤ ≤ 0.3 n  = 0.95
σ σ σ   1 
 n n n   n 
Mediante la tabla de la acumulada de la normal estándar se tiene que

 
 
P − 0.3 n ≤
X −µ
1
( ) ( )
≤ 0.3 n  = 2Φ 0.3 n − 1 = 0.95 ⇒ Φ 0.3 n = 0.975 ⇒ 0.3 n = 1.96 ( )
 
 n 

2
 1.96 
O sea n ≈   = 42.68
 0.3 
Si tomamos n = 43 , entonces P( X − µ ≤ 0.3) será un poco mayor que 0.95

5.2 - Teorema central del límite

Acabamos de ver que la suma de un número finito n de variables aleatorias independientes que
están normalmente distribuidas es una variable aleatoria también normalmente distribuida. Esta
propiedad reproductiva no es exclusiva de la distribución normal. En efecto, por ejemplo, ya vimos
que existen variables aleatorias discretas que la cumplen, es el caso de la Poisson y la Binomial.
En realidad, la propiedad que le da a la distribución normal el lugar privilegiado que ocupa entre
todas las distribuciones es el hecho de que la suma de un número muy grande, rigurosamente un
número infinito numerable, de variables aleatorias independientes con distribuciones arbitrarias
(no necesariamente normales) es una variable aleatoria que tiene, aproximadamente, una distribu-
ción normal. Este es, esencialmente, el contenido del

155
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

Teorema central del límite (T.C.L.):


Sean X 1 , X 2 ,..., X n variables aleatorias independientes con E ( X i ) = µ y V ( X i ) = σ 2 para todo
i = 1,2 ,..., n , es decir independientes idénticamente distribuidas
n
S − nµ
Sea la v.a. S n = ∑ X i y sea Z n = n .
i =1 nσ 2
 S n − nµ  1
z 2

Entonces lim P(Z n ≤ z ) = Φ ( z ) , esto es lim P


−x
 
≤ z = ∫ e 2
dx
n →∞ n →∞
 nσ
2
 2 π −∞

Dem.) sin demostración

Observaciones:
 n  n  n  n
1- Notar que E (S n ) = E  ∑ X i  = ∑ E ( X i ) = nµ y V (S n ) = V  ∑ X i  = ∑ V ( X i ) = nσ 2
 i =1  i =1  i =1  i =1
S − nµ
Por lo tanto Z n = n es la v.a. S n estandarizada
nσ 2
 S n − nµ 
   
 S n − nµ   n   X −µ
2- Notar que P ≤ z  = P ≤ z  = P  , por lo tanto también se puede
 n σ 2
 n σ 2
 σ 
   n 
 n 
enunciar el Teorema central del límite de la siguiente forma

Sean X 1 , X 2 ,..., X n variables aleatorias independientes con E ( X i ) = µ y V ( X i ) = σ 2 para todo


i = 1,2 ,..., n , es decir independientes idénticamente distribuidas
1 n
Sea la v.a. promedio muestral X = ∑ X i y sea Z n = X − µ .
n i =1 σ
n
X −µ  1
z 2

Entonces lim P(Z n ≤ z ) = Φ ( z ) , esto es lim P


−x
≤ z  = ∫e 2
dx
σ n 2π
n →∞ n →∞
 −∞

Donde Z n = X − µ es el promedio muestral estandarizado


σ
n
3- Aunque en muchos casos el T.C.L. funciona bien para valores de n pequeños , en particular
donde la población es continua y simétrica, en otras situaciones se requieren valores de n más
grandes, dependiendo de la forma de la distribución de las X i . En muchos casos de interés prácti-
co, si n ≥ 30 , la aproximación normal será satisfactoria sin importar cómo sea la forma de la dis-
tribución de las X i . Si n < 30 , el T.C.L. funciona si la distribución de las X i no está muy alejada
de una distribución normal

4- Para interpretar el significado del T.C.L., se generan (por computadora) n valores de una v.a.
exponencial con parámetro λ = 0.5 , y se calcula el promedio de esos n valores. Esto se repite 1000
veces, por lo tanto tenemos 1000 valores de la v.a. X .

156
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

Hacemos un histograma de frecuencias de X , esto es, tomamos un intervalo (a, b) donde


“caen” todos los valores de X , y lo subdividimos en intervalos más chicos de igual longitud. La
frecuencia de cada subintervalo es la cantidad de valores de X que caen en dicho subintervalo.
Se grafican estas frecuencias obteniéndose los gráficos siguientes que se pueden considerar una
aproximación a la verdadera distribución de X .
Se observa que a medida que aumenta el valor de n los gráficos se van haciendo más simétricos,
pareciéndose a la gráfica de una distribución normal.

150
n=2 80
n=5
60
100
40

50
20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1 2 3 4 5 6 7 8 91011121314151617181920212223242526272829303132

40
50
n = 30
40 n = 15 30

30
20
20
10
10

1 2 3 4 5 6 7 8 91011121314151617181920212223242526272829 1 2 3 4 5 6 7 8 9 10 11121314 1516171819 202122

Ejemplos:
1- Supóngase que 30 instrumentos electrónicos D1, D2, ......,D30, se usan de la manera siguiente: tan
pronto como D1 falla empieza a actuar D2. Cuando D2 falla empieza a actuar D3, etc. Supóngase
que el tiempo de falla de Di es una v.a. distribuida exponencialmente con parámetro λ = 0.1 por
hora. Sea T el tiempo total de operación de los 30 instrumentos. ¿Cuál es la probabilidad de que T
exceda 350 horas?

Solución:
Si X i : “tiempo de falla del instrumento Di ” i = 1,2,...,30
Entonces X i ~ Exp ( 0 . 1 ) para i = 1,2,...,30
30
El tiempo total de operación de los 30 instrumentos es T = ∑ X i , donde
i =1

 30
 1
E (T ) = E  ∑ X i  = 30 × E ( X i ) = 30 × = 300
 i =1  0.1
157
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

 30  1
V (T ) = V  ∑ X i  = 30 × V ( X i ) = 30 × 2 = 3000
 i =1  0.1
T − 300
Entonces por T.C.L. ~ N(0,1) aproximadamente pues n = 30
3000
La probabilidad pedida es
 T − 300 350 − 300   350 − 300 
P(T > 350) = P >  ≈ 1 − Φ  = 1 − Φ (0.9128) = 1 − 0.81859 = 0.18141
 3000 3000   3000 

T.C.L.

2- Suponga que el consumo de calorías por día de una determinada persona es una v.a. con media
3000 calorías y desviación estándar de 230 calorías. ¿Cuál es la probabilidad de que el promedio
de consumo de calorías diario de dicha persona en el siguiente año (365 días) sea entre 2959 y
3050?

Solución:
Definimos las variables aleatorias
X i : “cantidad de calorías que una persona consume en el día i” i = 1,2,...,365
Se sabe que E ( X i ) = 3000 y V ( X i ) = 230 2
1 365 σ 2 230 2
Si X = ∑
365 i =1
X i entonces E ( X ) = 3000 y V ( X ) =
n
=
365
La probabilidad pedida es
 
 2959 − 3000 X − 3000 3050 − 3000 
P (2959 ≤ X ≤ 3050 ) = P ≤ ≤ ≈
 230 230 230 
 365 365 365 
T.C.L.
   
 3050 − 3000   2959 − 3000 
≈ Φ  − Φ 230  = Φ(4.15) − Φ(− 3.40 ) ≈ 1 − 0 = 1
 230   
 365   365 

Aplicaciones del Teorema central del límite

Aproximación normal a la distribución binomial


El Teorema central del límite se puede utilizar para aproximar las probabilidades de algunas varia-
bles aleatorias discretas cuando es difícil calcular las probabilidades exactas para valores grandes
de los parámetros.
Supongamos que X tiene una distribución binomial con parámetros n y p. Para calcular P( X ≤ k )
k
debemos hacer la suma P( X ≤ k ) = ∑ P( X = i ) o recurrir a las tablas de la F.d.a. , pero para valo-
i=0
res de n grandes no existen tablas, por lo tanto habría que hacer el cálculo en forma directa y mu-
chas veces es laborioso.
Como una opción podemos considerar a X como suma de variables aleatorias más simples, especí-
ficamente, si definimos

158
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

1 si en la í − ésima repetición de ε ocurre éxito



Xi =  i = 1,2,..., n
0 caso contrario

entonces cada X i se la puede considerar B(1, p ) , y además X 1 , X 2 ,..., X n son independientes
n
Podemos escribir X = X 1 + X 2 + ... + X n = ∑ X i y si n es grande entonces X tendrá aproxima-
i =1
damente una distribución normal con parámetros np y np (1 − p ) , es decir
X − nµ X − n. p
Zn = = ≈ N (0,1) si n es lo suficientemente grande
nσ 2
n. p (1 − p )

Observaciones:
1- La aproximación normal a la distribución binomial funciona bien aun cuando n no sea muy
grande si p no está demasiado cerca de cero o de uno. En particular la aproximación normal a la
binomial es buena si n es grande , np > 5 y n(1 − p ) > 5 , pero es más efectivo aplicar esta aproxi-
mación cuando np > 10 y n(1 − p ) > 10

2- Corrección por continuidad.


Acabamos de ver que si X∼B(n,p) entonces, para n suficientemente grande, podemos considerar
que aproximadamente es X∼ N [n. p ,n. p (1 − p )] . El problema que surge de inmediato si deseo cal-
cular, por ejemplo, la probabilidad de que X = k (con k alguno de los valores posibles 0,1,2,…,n)
es que la binomial es una distribución discreta y tiene sentido calcular probabilidades como
P( X = k ) mientras que la normal es una distribución continua y, en consecuencia, P( X = k ) = 0
puesto que para una variable aleatoria continua la probabilidad de que ésta tome un valor aislado
 1 1
es cero. Esto se resuelve si se considera P( X = k ) ≈ P k − ≤ X ≤ k + 
 2 2
También se puede usar esta corrección para mejorar la aproximación en otros casos, específica-
mente en lugar de P( X ≤ k ) calculamos
 1
P ( X ≤ k ) ≈ P X ≤ k + 
 2
 1
Y en lugar de P( X ≥ k ) ≈ P X ≥ k − 
 2
En los gráficos siguientes se muestra para diferentes valores de n y p cómo aproxima la distribu-
ción N (np, np (1 − p )) a la distribución B (n, p )

0.175 0.2
0.15
n = 25
p = 0.7 n = 15
0.15
0.125 p = 0.5
0.1
0.1
0.075

0.05
0.05
0.025

5 10 15 20 25 2 4 6 8 10 12 14

159
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

0.35
0.08
0.3 n =15 n = 100
0.25 p = 0.9 p = 0.7
0.06
0.2

0.15 0.04

0.1
0.02
0.05

5 10 15 20 50 60 70 80 90 100

0.4
0.1

0.08
n = 150 n = 10
0.3
p = 0.1 p = 0.1
0.06
0.2
0.04

0.1
0.02

20 40 60 80 100 120 140 2 4 6 8 10

Ejemplos:
1- Sea X∼ B(25,0.4). Hallar las probabilidades exactas de que X ≤ 8 y X = 8 y comparar estos
resultados con los valores correspondientes encontrados por la aproximación normal.

Solución:
De la tabla de la F.d.a. de la binomial encontramos P( X ≤ 8) = 0.274
Y P( X = 8) = P( X ≤ 8) − P( X ≤ 7) = 0.274 − 0.154 = 0.120
Ahora usamos la aproximación normal
 X − np 8.5 − 10 
P( X ≤ 8) ≈ P ( X ≤ 8.5) = P ≤  ≈ Φ (− 0.61) = 0.2709
 np (1 − p ) 25 × 0 . 4 × 0 .6 
 
corrección por continuidad

Observar que el valor aproximado está muy cercano al valor exacto para P( X ≤ 8) = 0.274

 7.5 − 10 X − 10 8.5 − 10   X − 10 
P( X = 8) ≈ P(7.5 ≤ X ≤ 8.5) = P ≤ ≤  = P − 1.02 ≤ ≤ −0.61 =
 6 6 6   6 
= 0.2709 − 0.1593 = 0.1170

Nuevamente este valor aproximado está muy cerca del valor real de P( X = 8) = 0.120

160
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

2- Suponga que el 10% de todos los ejes de acero producidos por cierto proceso están fuera de
especificaciones, pero se pueden volver a trabajar (en lugar de tener que enviarlos a la chatarra).
Considere una muestra aleatoria de 200 ejes y denote por X el número entre ellos que estén fuera
de especificaciones y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproximada) de que X
sea
a) a lo sumo 30?
b) menos de 30?
c) entre 15 y 25 (inclusive)?

Solución:
Sea la v.a. X: “número de ejes fuera de especificaciones”
Entonces X ~ B ( 200, 0.1) , además np = 200 × 0.1 = 20 > 5 y n(1 − p ) = 200 × (1 − 0.1) = 180 > 5

Por lo tanto podemos aplicar la aproximación normal a la binomial


a) la probabilidad pedida es P ( X ≤ 30)
 X − np 30.5 − 20   30.5 − 20 
P ( X ≤ 30) ≈ P ( X ≤ 30.5) = P ≤ ≈ Φ  = Φ (2.474 ) = 0.993244
 np (1 − p ) 18    18 

b) La probabilidad pedida es P ( X < 30)
Al ser X una v.a. discreta con distribución binomial P ( X < 30) = P ( X ≤ 29)
 29.5 − 20 
P ( X ≤ 29) ≈ P ( X ≤ 29.5) ≈ Φ  = Φ(2.2391) = 0.98745
 18 
c)
 25.5 − 20   14.5 − 20 
P (15 ≤ X ≤ 25) ≈ P (14.5 ≤ X ≤ 25.5) ≈ Φ  − Φ  =
 18   18 
= Φ (1.2963) − Φ (− 1.2963) = 2Φ(1.2963) − 1 = 2 × 0.90147 − 1 = 0.80294

3- El gerente de un supermercado desea recabar información sobre la proporción de clientes a los


que no les agrada una nueva política respecto de la aceptación de cheques. ¿Cuántos clientes ten-
dría que incluir en una muestra si desea que la fracción de la muestra se desvíe a lo más en 0.15 de
la verdadera fracción, con probabilidad de 0.98?.
Solución:
Sea X: “número de clientes a los que no les agrada la nueva política de aceptación de cheques”
Entonces X ~ B(n, p ) donde p es desconocido y es la verdadera proporción de clientes a los que

no les agrada la nueva política de aceptación de cheques. El gerente tomará una muestra de n clien-
X X
tes para “estimar” p con X = ya que X = es la proporción de clientes a los que no les
n n
agrada la nueva política de aceptación de cheques en la muestra de n clientes. Si no se toman a
X
todos los clientes, entonces X = no será igual a p.
n
X
La pregunta es cuál debe ser n para que X = se aleje del verdadero p en menos de 0.15 con
n
(
probabilidad 0.98 por lo menos, o sea para que P X − p ≤ 0.15 ≥ 0.98 )
Entonces planteamos
 − 0.15n 
( )
P X − p ≤ 0.15 = P (− 0.15 ≤ X − p ≤ 0.15) = P
 np (1 − p )

X − np

0.15n ≈
 np (1 − p ) np (1 − p ) 
T.C.L.
161
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

 0.15n     
≈ Φ  − Φ − 0.15n  = 2Φ 0.15n  − 1 ≥ 0.98
 np (1 − p )   np (1 − p )   np (1 − p ) 
     

 0.15n  0.98 + 1
Por lo tanto Φ ≥ = 0.99
 np(1 − p )  2
 

0.15n 0.15 n 0.15 n


Además = ≥ = 0.3 n
np (1 − p) p (1 − p ) 0.5(1 − 0.5)

2
 2.33 
Entonces debe cumplirse que 0.3 n ≥ 2.33 o sea n ≥   = 60.3211
 0.3 

O sea se debe tomar una muestra de al menos 61 clientes

Aproximación normal a la distribución Poisson

Se puede probar aplicando Teorema central del límite que

X −λ
Si X ~ P(λ ) entonces para λ suficientemente grande tiene aproximadamente distribu-
λ
ción N (0,1)

X −λ
Es decir para λ suficientemente grande ≈ N (0,1)
λ
En la práctica si λ ≥ 30 la aproximación es buena.

Observación: la demostración es sencilla si λ es igual a un número natural n pues, si considera-


mos las variables aleatorias X i ~ P(1) con i = 1,2,..., n independientes, entonces ya sabemos que
n
 n  n


i =1
X i ~ P  ∑1 , es decir
 i =1 
∑Xi =1
i ~ P ( n)
n
Pero además por T.C.L. si n es grande ∑X
i =1
i tiene aproximadamente distribución normal con pa-

rámetros nµ = n × 1 = n y nσ 2 = n × 1 = n
n
O sea la distribución de ∑X i =1
i que es exactamente Poisson con parámetro n, se puede aproximar

X −n
con una N (n, n) , por lo tanto ≈ N (0,1) aproximadamente para valores de n suficientemente
n
grandes
En los gráficos siguientes se muestra para diferentes valores de λ cómo aproxima la distribución
N (λ , λ ) a la distribución P (λ )

162
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

0.05 0.2
λ = 50
0.04 λ =3
0.15
0.03
0.1
0.02

0.01 0.05

20 40 60 80 100 5 10 15 20 25 30

Ejemplo:
El número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil tiene una
distribución de Poisson con parámetro λ = 50. ¿Cuál es la probabilidad aproximada de que:
a) entre 35 y 70 infracciones se expidan en un día en particular?
b) el número total de infracciones expedidas durante una semana de 5 días sea entre 225 y 275?

Solución:
Sea X: “número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil”
Entonces X ~ P (λ ) donde λ = 50
X − 50
Como λ = 50 entonces ≈ N (0,1) (aproximadamente)
50
a) la probabilidad pedida es
 70 − 50   35 − 50 
P(35 ≤ X ≤ 70 ) ≈ Φ  − Φ  = Φ(2.8284 ) − Φ (− 2.12132 ) =
 50   50 
= 0.997599 − 0.017 = 0.9805
b) Sea Y: “número total de infracciones expedidas durante una semana de 5 días”
Entonces Y ~ P(λ ) donde λ = 50 × 5 = 250
La probabilidad pedida es
 275 − 250   225 − 250 
P(225 ≤ Y ≤ 275) ≈ Φ  − Φ  = Φ (1.5811) − Φ (− 1.5811) =
 250   250 
= 2Φ(1.5811) − 1 = 2 × 0.94295 − 1 = 0.8859

163
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

Práctica
Suma de variables aleatorias - Teorema central del límite.

1) Un hueco cilíndrico es perforado con un bloque de acero y se fabrica un pistón cilíndrico que
quepa en el hueco. El diámetro del hueco es una v.a. X con distribución normal con media 20 cm
y desviación estándar 0.01 cm. El diámetro del pistón es una v.a. Y con distribución normal con
media 19.90 cm y desviación estándar 0.02 cm. La holgura es otra v.a. Z y es la mitad de la
diferencia entre los diámetros.
Si X e Y son independientes, ¿cuál es la probabilidad de que la holgura sea menor que 0.08 cm?

2) Un componente en forma de U esta formado por tres piezas A, B y C. La figura ilustra el com-
ponente.
La longitud de A tiene una distribución normal con media
de 10 mm y desviación estándar de 0.1 mm. El espesor de
las piezas B y C esta distribuido normalmente con media
de 2 mm y desviación estándar de 0.05 mm. Suponga que
todas las dimensiones son independientes.
a) Determine la media y la desviación estándar de la
longitud del hueco D.
b) ¿Cuál es la probabilidad de que el hueco D sea menor que 5.9 mm?.

3) La v.a. X, que representa el número de cerezas en una tarta, tiene la siguiente distribución de probabili-
dad
x 4 5 6 7

a) Encuentre E ( X ) y V ( X ) P(X = x) 0.1 0.4 0.3 0.2


b) Encuentre la esperanza y la
varianza del número de cerezas promedio en 40 tartas
c) Encuentre la probabilidad aproximada de que el número promedio de cerezas en 40 tartas sea menor
que 5.5.

4) Supóngase que se tiene cierto número de voltajes, Vi, i = 1, 2,.......,20, que se reciben en lo que
20
se llama un “sumador”. Sea V la suma de los voltajes recibidos, es decir V = ∑V
i =1
i . Cada una

de las variables aleatorias Vi está distribuida uniformemente en el intervalo (0, 10) en voltios.
Hallar la probabilidad de que el voltaje de entrada sobrepase los 105 voltios.

Observación: Supongamos que se tienen n variables aleatorias X1, X2,........,Xn , independientes y


con la misma distribución de probabilidad. Se dice que X1, X2,........,Xn forman una muestra
aleatoria de tamaño n.

5) La resistencia a la ruptura de un remache tiene un valor medio de 10000 lb/pulg2 y


una desviación estándar de 500 lb/pulg2.
a) ¿Cuál es la probabilidad de que la resistencia media a la ruptura de la muestra, para una
muestra aleatoria de 40 remaches, sea entre 9900 y 10200?
b) Si el tamaño muestral hubiera sido 15 en lugar de 40, ¿podría calcularse la probabilidad
pedida en la parte a) a partir de la información dada?

164
Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli

6) Se sabe que la dureza Rockwell de pernos de cierto tipo tiene un valor medio de 50 y desvia-
ción estándar de 1.5.
a) Si la distribución es normal, ¿cuál es la probabilidad de que la dureza muestral media para
una muestra aleatoria de 9 pernos sea por lo menos 52?
b) ¿Cuál es la probabilidad (aproximada) de que la dureza muestral media para una muestra
aleatoria de 40 pernos sea al menos 52?

7) Suponga que la densidad del sedimento (g/cm) de un espécimen seleccionado al azar de cierta
región está normalmente distribuida con media 2.65 y desviación estándar 0.85.
a) Si se selecciona una muestra aleatoria de 25 especímenes, ¿cuál es la probabilidad de que
la densidad promedio de sedimento muestral sea a lo sumo 3.00?. ¿Y entre 2.65 y 3.00?
b) ¿Qué tan grande se requeriría un tamaño muestral para asegurar que la primera probabili-
dad de la parte a) sea por lo menos 0.99?.

8) Suponga que X es una v.a. binomial con n = 100 y p = 0.1.


a) Calcular la probabilidad exacta de que X sea menor que 4.
b) Aproxime la probabilidad de que X sea menor que 4 y compare el resultado con el
del inciso a).
c) Aproxime la probabilidad de que 8 < X < 12.

9) Suponga que el 10% de todos los ejes de acero producidos por cierto proceso están fuera de
especificaciones, pero se pueden volver a trabajar (en lugar de tener que enviarlos a la chata-
rra). Considere una muestra aleatoria de 200 ejes y denote por X el número entre ellos que es-
tén fuera de especificaciones y y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproxi-
mada) de que X sea
a) a lo sumo 30?
b) menos de 30?
c) entre 15 y 25 (inclusive)?

d) Se procede a detener el funcionamiento de una máquina para repararla si en una muestra


aleatoria de 100 artículos de la producción diaria de la máquina se encuentran por lo menos
15% de artículos defectuosos. (Suponga que la producción diaria consta de un gran número
de artículos). Si realmente la máquina produce solo 10% de artículos defectuosos, encuen-
tre la probabilidad de que se pare la máquina un día dado.

e) El gerente de un supermercado desea recabar información sobre la proporción de clientes a


los que no les agrada una nueva política respecto de la aceptación de cheques. ¿Cuántos
clientes tendría que incluir en una muestra si desea que la fracción de la muestra se desvíe a
lo más en 0.15 de la verdadera fracción, con probabilidad de 0.98?.
Responder utilizando Teorema central del límite.

165

También podría gustarte