3 Distribuciones Discretas

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 27

Probabilidad y Estadística

à !
x
n i
p (1 − p)n−i
X
P (X ≤ x) =
i =0 i
µX = np
σ2X = np(1 − p)

Variables Aleatorias Discretas


y algunas

Distribuciones de Probabilidad
Raúl D. Katz

Pablo A. Sabatinelli
2013
VARIABLES ALEATORIAS DISCRETAS

Índice
1. Variable aleatoria 3
1.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2. Función de probabilidad puntual 5


2.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3. Función de probabilidad acumulada 7


3.1. Ejemplos y observaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2. Propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

4. Esperanza matemática de una variable aleatoria discreta 9


4.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2. Propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

5. Variancia de una variable aleatoria discreta 11


5.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.2. Propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

6. Distribución binomial 12
6.1. Esperanza matemática y variancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
6.1.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
6.2. Propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

7. Distribución de Poisson 15
7.1. Esperanza matemática y variancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
7.2. La distribución de Poisson como caso límite de la distribución Binomial . . . . . . . . . 16
7.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

8. Distribución geométrica 18
8.1. Esperanza matemática y variancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
8.2. Período de retorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

9. Distribución binomial negativa 19


9.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

10.Distribución hipergeométrica 20
10.1.Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

11.Miscelánea de problemas 21

12.Soluciones 25

Raúl Katz - Pablo Sabatinelli 2


VARIABLES ALEATORIAS DISCRETAS

1. Variable aleatoria
Un estudiante está interesado en conocer la probabilidad de aprobar un examen que consta de 3
preguntas de opción múltiple, contestando cada pregunta al azar. El examen se aprueba con al menos
dos respuestas correctas. Por otra parte, cada pregunta consta de cuatro opciones, una sola de las
cuales es correcta. El estudiante escribe todas las formas posibles en que puede responder de manera
correcta (C ) o incorrecta (I ) las tres preguntas, en un diagrama de árbol como el que se muestra.
C
b

b
C
I
b

b
C
C

Luego escribe el conjunto S formado por todos los posibles re-


b

I
b

sultados (espacio muestral asociado a la experiencia de observar


b

la secuencia correcto-incorrecto en una serie de tres preguntas)


b

C
b

I
b

I
b

C
b

I
b

I
b

S = {(I , I , I ), (I , I ,C ), (I ,C , I ), (C , I , I ), (I ,C ,C ), (C , I ,C ), (C ,C , I ), (C ,C ,C )} .
La terna ordenada (C , I ,C ), por ejemplo, representa haber contestado bien a las preguntas 1 y 3, y
respondido incorrectamente la pregunta 2, en cambio la terna (C ,C , I ) representa haber contestado
bien a las preguntas 1 y 2, y respondido incorrectamente la pregunta 3. En ambos casos, se respon-
dieron bien a 2 preguntas. En total, hay tres formas diferentes de contestar bien a dos preguntas:
(I ,C ,C ), (C , I ,C ), (C ,C , I ). El estudiante encuentra útil asociar a cada elemento de S , la cantidad de
respuestas correctas que representa.

X
S X (S )
(I , I , I ) 0
(I , I ,C )
(I ,C , I )
1
(C , I , I )
(I ,C ,C )
(C , I ,C ) 2
(C ,C , I )
(C ,C ,C ) 3

Surge así la función X que a cada elemento de S le hace corresponder la cantidad de respuestas co-
rrectas que representa.

Calcular P ({(I , I , I )}), por ejemplo, equivale a calcular P (X = 0). Entonces resulta
¡ 3 ¢3 27
P (X = 0) = P ({(I , I , I )}) = 4 = 64 .
¡ 3 ¢2
P (X = 1) = P ({(I ,C , I ), (C , I , I ), (I , I ,C )}) = 3 · 14 · 4 = 27
64 .

La suma P (X = 0) + P (X = 1) determina la probabilidad de no aprobar el examen. ¿Por qué?

Le proponemos calcular P (X = 2) + P (X = 3). ¿Qué representa esta suma?

El estudiante, para resolver el problema, asoció a cada elemento del espacio muestral un número.
Como veremos más adelante, funciones de este tipo, que se conocen como variables aleatorias, faci-
litarán la resolución de problemas de probabilidad.

Raúl Katz - Pablo Sabatinelli 3


VARIABLES ALEATORIAS DISCRETAS

Una variable aleatoria es una función que asigna a cada elemento del espa-
cio muestral un número real.

La función X , definida por el estudiante, es una variable aleatoria. A la imagen de S por X , que
simbolizamos R X , la llamamos recorrido de la variable aleatoria X , y está formado por todos los
valores que asume la variable aleatoria X . En el ejemplo, R X = {0, 1, 2, 3}. El conjunto R X es el espacio
muestral asociado a la experiencia de observar la cantidad de respuestas correctas sobre un total de
tres preguntas. El conjunto R X es finito y por lo tanto, decimos que la variable aleatoria X es discreta.

Una variable aleatoria es discreta si su recorrido es un conjunto finito o infi-


nito numerable (susceptible de ser contado). Si el recorrido es un intervalo
real, la variable aleatoria se dice continua.

1.1. Ejemplos
1. Una fábrica produce lámparas de bajo consumo que para su distribución son envasados en
cajas de 25 unidades cada una. El encargado del control de calidad de la producción, selecciona
una caja al azar y registra la cantidad de lámparas que, al probarlas, no encienden. Sea

X 1 : ‘cantidad de lámparas que no encienden en una caja de 25 lámparas’.

En este caso
R X 1 = {0, 1, 2, . . . , 25} ,
y por lo tanto la variable aleatoria X 1 es discreta.

2. En una cola de un supermercado se registra la cantidad de artículos que compra un cliente


elegido al azar. Sea

X 2 : ‘cantidad de artículos que compra un cliente elegido al azar’.

En este caso
R X 2 = N = {1, 2, . . .} ,
y por lo tanto la variable aleatoria X 2 es discreta.

3. Se registra, en un día elegido al azar, el número de servicios demandados en un cuerpo de


bomberos. Sea

X 3 : ‘cantidad de llamados registrados en un día elegido al azar’.

En este caso
R X 3 = N0 = {0, 1, 2, . . .} ,
y por lo tanto la variable aleatoria X 3 es discreta.

4. Se registra la cantidad de artículos que produce una máquina hasta que se descompone. Sea

X 4 : ‘cantidad de artículos que produce una máquina elegida al azar hasta que se descompone’.

En este caso
R X 4 = N0 = {0, 1, 2, . . .} ,
y por lo tanto la variable aleatoria X 4 es discreta.

5. Se observa el tiempo que transcurre hasta que una componente de una máquina falla. Sea

Raúl Katz - Pablo Sabatinelli 4


VARIABLES ALEATORIAS DISCRETAS

X 5 : ‘tiempo que transcurre hasta que una componente elegida al azar falla’.

En este caso
R X 5 = R+
0 = [0, +∞),

y por lo tanto la variable aleatoria X 5 es continua.

6. Se fracciona cemento en bolsas de 50 kg. Sea

X 6 : ‘peso de una bolsa de cemento elegida al azar’.

En este caso
R X 6 = R+
0 = [0, +∞),

y por lo tanto la variable aleatoria X 6 es continua.

7. Se registra el consumo de combustible de un colectivo que realiza el recorrido Rosario-Santa


Fe. Sea

X 7 : ‘consumo de combustible, en litros, para uno de esos viajes elegido al azar’.

En este caso
R X 7 = R+
0 = [0, +∞),

y por lo tanto la variable aleatoria X 7 es continua.

8. Ciertas especificaciones requieren que el espesor de las hojas de aluminio para latas estén entre
8 y 11 milésimos de pulgada. Sea

X 8 : ‘espesor de una hoja de aluminio para latas elegida al azar’.

En este caso
R X 8 = R+
0 = [0, +∞),

y por lo tanto la variable aleatoria X 8 es continua.

2. Función de probabilidad puntual


La siguiente tabla muestra los valores que asume la variable aleatoria X : ‘cantidad de respuestas co-
rrectas en un examen de tres preguntas de opción múltiple’, con sus correspondientes probabilidades;
éstas fueron calculadas en la introducción.

P (X = x)

x P (X = x) 27
64
27
64

0 27/64

1 27/64

2 9/64 9
64
3 1/64
1
64

0 1 2 3 x
Esta correspondencia es una función que llamaremos función de probabilidad puntual.

Raúl Katz - Pablo Sabatinelli 5


VARIABLES ALEATORIAS DISCRETAS

Sea X una variable aleatoria y R X su recorrido. La función que a cada va-


lor de la variable le hace corresponder la probabilidad de que la variable X
asuma ese valor, se denomina función de probabilidad puntual asociada a
la variable aleatoria X . En símbolos

pX : RX → [0, 1]
x 7→ p X (x) = P (X = x)

El símbolo P (X = x) se lee ‘probabilidad de que la variable aleatoria X asuma el valor x’.

Si p X es una función de probabilidad, entonces cumple que

1. p X (x) ≥ 0, ∀x ∈ R X .
X
2. p X (x) = 1.
x∈R X

A los pares ordenados x, p X (x) con x ∈ R X , como a su representación gráfica, la llamamos indistin-
¡ ¢

tamente distribución de probabilidad de la variable aleatoria X .

2.1. Ejemplos
1. La siguiente tabla corresponde a la distribución de probabilidad de la variable aleatoria D: ‘de-
manda diaria de un artículo en un negocio’.
P (D = d )

d P (D = d ) 0.4 b

0 0.1 0.3 b

1 0.3
0.2 b

2 0.4
3 0.2 0.1 b

0 1 2 3 d
La probabilidad de que se demanden en un día elegido al azar a lo sumo 2 artículos es

P (D = 0) + P (D = 1) + P (D = 2) = 0.1 + 0.3 + 0.4 = 0.8.

¿Cómo cree que se determinaron las probabilidades de la tabla?

2. La probabilidad de que una variable aleatoria Y asuma valores en el conjunto {0, 1, 2} está da-
da por la fórmula P (Y = y) = y/3, con y = 0, 1, 2. Esta función es una función de probabilidad
puntual porque

a) cada probabilidad es no negativa:

p Y (0) = P (Y = 0) = 0 ≥ 0,

1
p Y (1) = P (Y = 1) = ≥ 0,
3
2
p Y (2) = P (Y = 2) = ≥ 0;
3
b) la suma de las probabilidades con que la variable aleatoria Y asume cada valor de su re-
corrido es 1:
X 1 2
p Y (y) = p Y (0) + p Y (1) + p Y (2) = 0 + + = 1.
y∈R y 3 3

Raúl Katz - Pablo Sabatinelli 6


VARIABLES ALEATORIAS DISCRETAS

3. Función de probabilidad acumulada


En algunas ocasiones resulta necesario calcular la probabilidad de que una variable aleatoria asuma
un valor menor o igual a un cierto valor dado. Esto motiva la siguiente definición.

Sea X una variable aleatoria discreta con recorrido R X y función de proba-


bilidad p X . La función F X tal que

F X : R → [0, 1]
x 7→ F X (x) = P (X ≤ x) ,

la denominamos función de distribución acumulada de la variable aleatoria


X.

Es decir, F X (x), representa la probabilidad de que la variable aleatoria X asuma un valor menor o
igual que x, para cada x ∈ R X . En símbolos
X
P (X ≤ x) = p X (t ).
t ≤x
t ∈ RX

3.1. Ejemplos y observaciones


1. La distribución de probabilidad de la variable aleatoria Y : ‘cantidad de imperfecciones que
se encuentran en un cable de 40 metros que viene en rollos de ancho uniforme’ está dada en
la siguiente tabla. A partir de esta distribución calculamos algunos valores de la función de
distribución acumulada.
F Y (−1) = P (Y ≤ −1) = 0, ¿por qué?
y P (Y = y) F Y (1) = P (Y ≤ 1) = p Y (0) + p Y (1) = 0.41 + 0.37 = 0.78.
0 0.41
1 0.37 F Y (1.3) = P (Y ≤ 1.3) = p Y (0) + p Y (1) = 0.41 + 0.37 = 0.78.
2 0.16
F Y (4) = P (Y ≤ 4) = p Y (0)+p Y (1)+p Y (2)+p Y (3)+p Y (4) = 0.41+0.37+
3 0.05
0.16 + 0.05 + 0.01 = 1.00.
4 0.01
F Y (y) = 1.00 cualquiera sea y ≥ 4.

F Y (y)
1.00 + b b

0.94 + b

0.78 + b

0.41 + b

y
| | | | | |
0 1 2 3 4 5
Gráfica de la función de distribución acumulada

Observe que F Y (3) − F Y (2) = P (Y = 3). ¿Por qué?

Raúl Katz - Pablo Sabatinelli 7


VARIABLES ALEATORIAS DISCRETAS

2. Cualquiera sea la variable aleatoria U , su función de probabilidad acumulada FU verifica

a) 0 ≤ FU (u) ≤ 1, para u ∈ R.
b) FU es no decreciente en R.
c) FU es discontinua en cada punto u donde P (U = u) > 0.

3.2. Propuesta
1. Considere la variable aleatoria X : ‘cantidad de cerámicos defectuosos en una caja de 100 uni-
dades’, con la siguiente distribución de probabilidad:

x P (X = x)
0 t
1 0.05
2 0.03
3 0.02
4 o más 0.00

a) Calcule el valor de t .
b) Explique cómo cree que se obtuvieron las probabilidades de la tabla.
c) ¿Cuál es la probabilidad de que al elegir una caja al azar, la misma contenga a lo sumo un
cerámico defectuoso?
d) ¿Cuál es la probabilidad de que al elegir una caja al azar, la misma contenga por lo menos
un cerámico defectuoso?
e) Grafique la función de distribución acumulada para la variable aleatoria X .

2. La función de distribución acumulada para la variable aleatoria W : ‘cantidad de veces por se-
mana que un proceso de producción necesita recalibrarse’ verifica
a) ¿Cuál es la probabilidad de que en una semana elegida
al azar, el proceso requiera recalibrarse 1 vez?

w FW (w) b) ¿Cuál es la probabilidad de que en una semana elegi-


0 0.15 da al azar, el proceso requiera recalibrarse a lo sumo 2
1 0.55 veces?
2 0.85 c) ¿Cuál es la probabilidad de que en una semana elegida
3 0.98 al azar, el proceso requiera recalibrarse por lo menos 5
4 1.00 veces?

d) Grafique la función de probabilidad puntual asociada


a la variable aleatoria W .
3. Considere la variable R: ‘número de bacterias por cm3 en una muestra de agua contaminada’,
cuya función de probabilidad es

2r e −2
P (R = r ) = p R (r ) = , r = 0, 1, 2, . . . .
r!
a) ¿Cuál es la probabilidad de que no haya bacterias en una muestra de 1 cm3 ?
b) ¿Cuál es la probabilidad de que haya a lo sumo 2 bacterias en una muestra de 1 cm3 ?
c) ¿Cuál es la probabilidad de que haya por lo menos 3 bacterias en una muestra de 1 cm3 ?
d) Analice si la siguiente afirmación es verdadera o falsa.

F R (6) − F R (2) = P (2 ≤ R ≤ 6) .

Raúl Katz - Pablo Sabatinelli 8


VARIABLES ALEATORIAS DISCRETAS

4. Esperanza matemática de una variable aleatoria discreta


En su momento hemos expresado la media aritmética (calculada sobre los datos de una muestra) de
la siguiente forma
1X k X k ni Xk
x= xi ni = xi = x i f r (x i ) , (1)
n i =1 i =1 n i =1
donde

x i son los diferentes valores de la variable X en la muestra,

n i es la frecuencia absoluta correspondiente al valor x i en la muestra,

n = ki=1 n i , es decir el tamaño de la muestra,


P

f r (x i ) es la frecuencia relativa del valor x i en la muestra.

Hemos visto también que para n → +∞ la frecuencia relativa correspondiente al valor x i tiende a la
probabililidad de ocurrencia de ese valor. Es decir

f r (x i ) −−−−−→ p X (x i ) , (2)
n→+∞

donde p X (x i ) = P (X = x i ). De (1) y (2)

k k
x i f r (x i ) −−−−−→ µ X =
X X
x= x i p X (x i ) .
n→+∞
i =1 i =1

¿Cuál es el significado del valor de µ X generado a partir de este límite especial? Se trata de la media
aritmética calculada en la población. Esta población está formada por todas las observaciones posi-
bles de la variable aleatoria X . El valor µ X se genera a partir de la media aritmética x para n tendiendo
a infinito.

Sea X una variable aleatoria discreta con recorrido R X y p X su función


de probabilidad asociada. Definimos esperanza matemática de la variable
aleatoria X o media poblacional de la variable aleatoria X y la notamos in-
distintamente E (X ) o µ X al número

E (X ) = µ X =
X
xp X (x).
x∈R X

Si R X es infinito numerable, la suma de la definición es una serie numérica. En tal caso, la esperanza
de la variable existe si la serie es absolutamente convergente.

4.1. Ejemplos
1. Sea X : ‘número que se obtiene al lanzar un dado equilibrado’. Su recorrido es R X = {1, 2, 3, 4, 5, 6}
y su función de probabilidad puntual es p X (x) = 16 , cualquiera sea x ∈ R X . Entonces

6 1 1 1 1 1 1
µX =
X
xp X (x) = 1 · + 2 · + 3 · + 4 · + 5 · + 6 · = 3.5.
k=1 6 6 6 6 6 6

Si realizamos un gran número de tiradas de un dado equilibrado en condiciones uniformes y


calculamos la media aritmética de los valores observados, obtendremos en general una media
aritmética próxima a 3.5.

2. La longitud de un mensaje (medido en cantidad de caracteres) que llega a un centro es una


variable aleatoria Y con la siguiente distribución de probabilidad.

Raúl Katz - Pablo Sabatinelli 9


VARIABLES ALEATORIAS DISCRETAS

y P (Y = y)
6 0.15
7 0.20
8 0.40
9 0.25

Entonces
µY = 6 · 0.15 + 7 · 0.20 + 8 · 0.40 + 9 · 0.25 = 7.75 caracteres.
Si registramos la longitud de un gran número de mensajes recibidos en un centro, la media
aritmética de esos valores en general será próxima a 7.75 caracteres.

Observaciones:

1. En ninguno de los ejemplos el valor de la esperanza matemática corresponde a un valor ob-


servable, es decir no forma parte del recorrido de la variabla aleatoria. ¿Esto es siempre así?
Explique.

2. El equivalente mecánico de la esperanza matemática de una variable aleatoria es el centro de


gravedad de una distribución de masas.

4.2. Propuesta
1. En relación al ejercicio 2 de la página 8 le pedimos que calcule e interprete la esperanza mate-
mática.

2. En la unidad Introducción a la Probabilidad, se tienen los datos correspondientes a 400 tiradas


de un dado equilibrado. La media aritmética correspondiente al tercer grupo de 100 observa-
ciones es 3.5000 mientras que la media aritmética correspondiente al grupo de 400 observacio-
nes es 3.5125. La media aritmética calculada sobre una muestra de tamaño 100 se encuentra
más próxima a la esperanza matemática que la calculada sobre una muestra de mayor tamaño.
Encuentre una explicación de este hecho.

3. Sea X la variable aleatoria ‘número que se obtiene al arrojar un dado equilibrado de color azul’
e Y la variable aleatoria ‘número que se obtiene al arrojar un dado equilibrado de color rojo’.
Consideramos la variable aleatoria M correspondiente al mayor valor que se obtiene al tirar los
dados rojo y azul. Su distribución de probabilidad está dada por la siguiente tabla.

m P (M = m)
1 1/36

2 3/36

3 5/36

4 7/36

5 9/36

6 11/36

a) ¿Cuál es el recorrido de M ?
b) Verifique las probabilidades de la tabla.
c) Calcule E (M ).
d) Ubique el valor obtenido en la gráfica de la distribución de probabilidad de M .
e) Repita el ejercicio con la variable aleatoria que corresponde al menor valor que se obtiene
al tirar los dados rojo y azul.

Raúl Katz - Pablo Sabatinelli 10


VARIABLES ALEATORIAS DISCRETAS

5. Variancia de una variable aleatoria discreta


En su momento hemos expresado la variancia muestral de la siguiente forma.

1 X k ¡ ¢2 n X k ¡ ¢2 n i n X k ¡ ¢2
s2 = xi − x ni = xi − x = x i − x f r (x i ) . (3)
n − 1 i =1 n − 1 i =1 n n − 1 i =1

También hemos visto que para n → +∞ la frecuencia relativa correspondiente al valor x i tiende a la
probabililidad de ocurrencia de ese valor. Relacionando estas dos condiciones, resulta

n X k ¡ ¢2 k ¡ ¢2
s2 = x i − x f r (x i ) −−−−−→ σ2X = x i − µ X p X (x i ) .
X
n − 1 i =1 n→+∞
i =1

¿Cuál es el significado del valor de σ2X generado a partir de este límite especial? Se trata de la variancia
calculada en la población. Esta población está formada por todas las observaciones posibles de la
variable aleatoria X . El valor σ2X se genera a partir de la variancia muestral s 2 para n tendiendo a
infinito.

Sea X una variable aleatoria discreta con recorrido R X y p X su función de


probabilidad asociada. Se define variancia de una variable aleatoria X y la
notamos indistintamente V (X ) o σ2X al número
¢2
V (X ) = σ2X = x − µX
X ¡
p X (x) .
x∈R X

La variancia de una variable aleatoria cuantifica la variación, en la población, de los valores de la va-
riable respecto de su media. Si la variable asume valores alejados de la media con alta probabilidad,
entonces la variancia resultará grande.
p
El valor de V (X ) está expresado en unidades al cuadrado de X . Esto motiva a considerar V (X ) = σ X
que llamamos desvio estándar de la variable aleatoria X .
Así como interpretamos la esperanza matemática de una variable aleatoria como el centro de grave-
dad de una distribución de masas, la variancia puede interpretarse como el momento de inercia de
esa distribución de masas.

5.1. Ejemplo
Sea X : ‘número que se obtiene al lanzar un dado equilibrado’. La variancia de X es

1 1 1 1 1 1
σ2X = (1 − 3.5)2 + (2 − 3.5)2 + (3 − 3.5)2 + (4 − 3.5)2 + (5 − 3.5)2 + (6 − 3.5)2 = 2.916.
6 6 6 6 6 6
La desviación estándar es p
σX = 2.916 ≈ 1.707.

5.2. Propuesta
1. Ordene de menor a mayor las variancias correspondientes a las variables aleatorias X 1 , X 2 y
X 3 con recorrido común R cuyas distribuciones de probabilidad se muestran en los siguientes
gráficos, que tienen la misma escala.

X1 X2 X3

Raúl Katz - Pablo Sabatinelli 11


VARIABLES ALEATORIAS DISCRETAS

2. Verifique que para el ejemplo 2 de la página 9, el desvio estándar es aproximadamente 0.994


caracteres.

3. Argumente por qué la variancia puede interpretarse como la esperanza matemática de una va-
riable aleatoria comparando las definiciones correspondientes. ¿Cuál es esa variable aleatoria?
Complete eligiendo una de las siguientes opciones

E (X − E (X )), E (X − E (X ))2 , E X 2 − E (X ) .
¡ ¢ ¡ ¢

V (X ) = .

6. Distribución binomial
Llamamos ensayo de Bernoulli a toda experiencia aleatoria en relación a la cual observamos si ocurre
un suceso A, o si ocurre A. Los siguientes son ejemplos de ensayos de Bernoulli.

1. Observamos si la respuesta dada a una pregunta respondida al azar es o no correcta. En este


caso podríamos considerar A: ‘la respuesta es correcta’, A: ‘la respuesta es incorrecta’.

2. Observamos si el tiempo hasta la falla o duración de una componente elegida al azar de un


proceso de producción es o no mayor a 1000 horas. En este caso podríamos considerar A: ‘una
componente dura más de 1000 horas’, A: ‘una componente dura a lo sumo 1000 horas’.

3. Por un canal se transmite un dígito binario y se observa si el número transmitido es 0 o 1. En


este caso podríamos considerar A: ‘se transmite un 0’, A: ‘se transmite 1’.

En relación al ejemplo introductorio, de responder al azar una pregunta de opción múltiple, nos in-
teresó observar si la respuesta dada es o no correcta. También en este caso se trata de un ensayo de
Bernoulli. Veamos algunas condiciones que se cumplen al realizar las tres repeticiones del ensayo.

El suceso A: ‘la respuesta a una pregunta es correcta’ tiene una probabilidad que permanece
invariante o constante en cada ensayo. Cada pregunta tiene 4 respuestas de las cuales una es la
correcta P (A) = 1/4 en cada ensayo.

Los ensayos son independientes. La respuesta dada a una pregunta no influye en la respuesta
dada a cualquier otra pregunta.

Bajo tales condiciones definimos la variable aleatoria X : ‘cantidad de respuestas correctas sobre un
total de 3’ y se obtuvo la distribución de probabilidad asociada a dicha variable aleatoria X . Nos pro-
ponemos generalizar ese resultado particular tratado en el ejemplo introductorio.

Consideremos un ensayo de Bernoulli en relación al cual se observa si ocurre o no, un determinado


suceso A, cuya probabilidad de ocurrencia es p = P (A). Realizamos n repeticiones independientes
del ensayo bajo el supuesto de que P (A) permanece constante en cada ensayo. En tales condiciones
consideramos la variable aleatoria Y : ‘cantidad de veces que ocurre el suceso A en las n repeticiones
independientes’. Para la variable aleatoria así definida resulta R Y = {0, 1, 2, . . . , n}. ¿Cuál es la distribu-
ción de probabilidad de la variable aleatoria Y así definida? Para contestar la pregunta razonamos de
la siguiente manera.

Si al realizar n repeticiones de un ensayo de Bernoulli el suceso A ocurre en los primeros k ensayos y


A en los n − k ensayos restantes, es decir, cuando ocurre la secuencia

|A A {z
A · · · A} |A A {z
A · · · A}
k veces n − k veces
| {z }
n veces

Raúl Katz - Pablo Sabatinelli 12


VARIABLES ALEATORIAS DISCRETAS

entonces la variable aleatoria Y asume el valor k. La recíproca no es cierta. La variable aleatoria puede
tomar el valor k, pero no darse necesariamente esta secuencia. Podría haber ocurrido por ejemplo

|A A {z
A · · · A} |A A {z
A · · · A}
n − k veces k veces
| {z }
n veces

o tal vez haberse intercalado los sucesos A y A, etc. Cualquiera de las secuencias dadas tiene una pro-
¢n−k
babilidad de ocurrencia igual a p k 1 − p . Para determinar la probabilidad P (Y = k) necesitamos
¡

conocer de cuántas formas diferentes se puede presentar k veces el suceso A en n ensayos indepen-
dientes de Bernoulli. Usando análisis combinatorio podemos deducir que la respuesta es nk . Además
¡ ¢

las diferentes secuencias son mutuamente excluyentes (no pueden presentarse simultáneamente dos
secuencias diferentes).

Sea A un suceso con probabilidad p. Entonces, la variable aleatoria Y : ‘can-


tidad de veces que se presenta el suceso A en n repeticiones independientes’
tiene un comportamiento o distribución binomial con parámetros n y p. En
símbolos Y ∼ B n, p ; es decir
¡ ¢

à !
n k
p Y (k) = P (Y = k) = p (1 − p)n−k , para k = 0, 1, 2, . . . , n.
k

Observemos que podemos considerar la variable aleatoria Z : ‘cantidad de veces que se presenta A en
n repeticiones independientes de un ensayo de Bernoulli’. Obviamente Z también tiene distribución
binomial pero con parámetros n y (1− p) y verifica que Y + Z = n. En consecuencia P (Y = k) = P (Z =
n − k). A continuación se presentan algunas distribuciones binomiales con diferentes valores para n
y p. ¿Por qué las distribuciones binomiales con p = 0.50 son simétricas?
X ∼ B(5, 0.1) X ∼ B(5, 0.5) X ∼ B(5, 0.95)
P (X = x)

P (X = x)
0.59 b
0.773 b

P (X = x)
5 b
16

5 b
32

1 b
32
0 1 2 3 4 5 x 0 1 2 3 4 5 x x
0 1 2 3 4 5

X ∼ B(10, 0.1) X ∼ B(10, 0.5) X ∼ B(10, 0.95)


P (X = x)
P (X = x)
0.387 b 0.599 b

P (X = x)
0.246 b

0 1 2 3 4 5 6 7 8 9 10 x 0 1 2 3 4 5 6 7 8 9 10 x 0 1 2 3 4 5 6 7 8 9 10 x

X ∼ B(20, 0.1) X ∼ B(20, 0.5) P (X = x)


X ∼ B(20, 0.95)
P (X = x)
P (X = x) 0.3585 b

0.270 b

0.176 b

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 x

Las distribuciones binomiales con p 6= 0.50 no son simétricas. Sin embargo, a medida que se aumenta

Raúl Katz - Pablo Sabatinelli 13


VARIABLES ALEATORIAS DISCRETAS

el tamaño de la muestra o número de ensayos, n, las distribuciones cambian su forma. Observe que
la distribución binomial con parámetros n = 40 y p = 0.2 es razonablemente simétrica a pesar de que
0.2 < 0.5. Más adelante veremos una explicación teórica de esto.

P (X = x)

0.156 b

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 x

6.1. Esperanza matemática y variancia


Consideremos la variable aleatoria X con distribución binomial con parámetros n y p. A partir de la
definición de esperanza matemática de una variable aleatoria discreta, resulta
à !
n n k
p (1 − p)n−k = · · · = np.
X
E (X ) = k
k=0 k

A partir de la definición de variancia de una variable aleatoria discreta resulta


à !
n ¡ ¢2 n k
p (1 − p)n−k = · · · = np(1 − p).
X
V (X ) = k − np
k=0 k

En síntesis

Sea X ∼ B(n, p). Entonces

E (X ) = np, V (X ) = np(1 − p).

6.1.1. Ejemplo

La probabilidad de que el vapor se condense en un tubo de aluminio de cubierta delgada a 10 atm de


presión es 0.40. Se prueban 12 tubos de ese tipo y bajo esas condiciones, elegidos al azar.

Definimos X : ‘cantidad de tubos que condensan el vapor a 10 atm de presión, en una muestra de 12
tubos’. Entonces X ∼ B(12, 0.40). Según lo visto,

E (X ) = 12 × 0.40 = 4.8 tubos,


p p
σX = V (X ) = 12 × 0.40 × 0.6 ≈ 1.697 tubos.
Es decir, si tomamos sucesivas muestras de 12 tubos con estas características y en cada una de ellas,
registramos la cantidad de tubos que condensan vapor, obtendremos en general valores distintos. La
media aritmética de estos valores es un número en general cercano a 4.8 tubos.
El valor 1.697 cuantifica la variación de la cantidad de tubos de aluminio que condensan vapor res-
pecto de la esperanza matemática de 4.8 tubos.
En este problema, el coeficiente de variación es aproximadamente 35 %; es decir, el desvío estándar
representa el 35 % de la esperanza matemática.

Raúl Katz - Pablo Sabatinelli 14


VARIABLES ALEATORIAS DISCRETAS

6.2. Propuesta
1. Un sistema está formado por 10 componentes conectadas en paralelo. Las componentes que
conforman el sistema provienen de un proceso del cual se conoce que 95 % de las mismas so-
breviven el instante t . Suponga que las componentes funcionan en forma independiente.

a) Calcule la probabilidad de que el sistema funcione después del instante t .


b) Calcule la probabilidad que por lo menos nueve de las diez componentes sobreviven el
instante t .

2. A un centro llegan dos tipos de mensajes: alta prioridad y prioridad normal. El 40 % de los men-
sajes son de alta prioridad. Al centro llegan, en forma independiente, seis mensajes. Calcule la
probabilidad de que:

a) haya la misma cantidad de mensajes de alta prioridad que de baja prioridad;


b) dos de los seis mensajes sean de alta prioridad;
c) los dos primeros mensajes sean de alta prioridad;
d) sólo los dos primeros sean de alta prioridad.

3. En la fabricación de una pieza ocurren en forma independiente dos tipos de fallas: abolladuras
y roturas. La probabilidad de que una pieza presente una abolladura es 0.05 y la probabilidad
de que presente rotura es 0.08. Halle la probabilidad de que al tomar 8 piezas al azar

a) a lo sumo una tenga ambos defectos;


b) menos de 2 tengan algún defecto.

7. Distribución de Poisson
Decimos que una variable aleatoria X tiene una distribución de Poisson con parámetro λ > 0 y nota-
mos X ∼ P (λ) cuando
λk e −λ
P (X = k) = k = 0, 1, 2, . . . , n, . . . .
k!
Una variable con distribución de Poisson es discreta porque su recorrido es infinito numerable (N0 ).
Se puede probar que
X λk e −λ
+∞
= 1.
k=0 k!

1. La cantidad de llamadas telefónicas que recibe un centro de atención al cliente de una de-
terminada empresa tiene una distribución de Poisson con λ = 5 llamadas por minuto. Sea Y :
‘cantidad de llamadas por minuto que recibe el centro de atención al cliente’. La probabilidad
de que se reciban 2 llamadas en un minuto es

52 e −5
P (Y = 2) = = 0.084.
2!

2. El número de burbujas de aire en una placa de vidrio sigue un proceso de Poisson con λ = 0.4
burbujas por cada m2 . Sea X : ‘cantidad de burbujas de aire por metro cuadrado en una placa
de vidrio’. La probabilidad de encontrar una burbuja en un metro cuadrado es

0.41 e −0.4
P (X = 1) = = 0.268.
1!

Raúl Katz - Pablo Sabatinelli 15


VARIABLES ALEATORIAS DISCRETAS

3. El número de bacterias por centímetro cúbico en un líquido es una variable aleatoria W con
distribución de Poisson y λ = 4 bacterias por cada cm3 . La probabilidad de encontrar al menos
una bacteria es
X 4k e −4
+∞
P (W ≥ 1) = .
k=1 k!

A los fines del cálculo resulta más efectivo pensar

40 e −4
P (W ≥ 1) = 1 − P (W = 0) = 1 − = 1 − e −4 ≈ 0.9817.
0!

7.1. Esperanza matemática y variancia


De la definición de esperanza y variancia de una variable aleatoria discreta, resulta para una variable
aleatoria X con distribución de Poisson con parámetro λ
+∞ λk e −λ +∞ λk e −λ
(k − λ)2
X X
E (X ) = k y V (X ) = .
k=0 k! k=0 k!

Se puede probar que E (X ) = V (X ) = λ.

7.2. La distribución de Poisson como caso límite de la distribución Binomial


Hemos presentado formalmente la distribución de Poisson. En lo que sigue deduciremos esta distri-
bución a partir de la distribución Binomial.

Se tiene un alambre de longitud L, dispuesto como muestra la figura.


b b b b b ··· b b

0 l1 l2 l3 l4 l n−1 ln = L

El alambre presenta imperfecciones. Notamos con X l : ‘cantidad de imperfecciones que presenta el


alambre en el intervalo [0, l )’ y consideramos los siguientes supuestos

Independencia. Las variables aleatorias X l 1 , X l 2 − X l 1 , X l 3 − X l 2 , . . . ,X l n − X l n−1 , que representan la


cantidad de imperfecciones en los intervalos disjuntos [0, l 1 ), [l 1 , l 2 ), [l 2 , l 3 ), . . . , [l n−1 , l n ) res-
pectivamente, son independientes, cualesquiera sean l 1 < l 2 < . . . < l n en el intervalo [0, L]. Es
decir, que una variable asuma un valor no afecta la probabilidad de que otra variable asuma un
valor de su recorrido.

Homogeneidad. Las variables X l y X s+l − X s tienen la misma ley o distribución de probabilidad si


ambos intervalos están contenidos en el intervalo [0, L] (los intervalos [0, l ) y [s, s + l ) están
contenidos en [0, L]). Coloquialmente, la distribución del número de imperfecciones en una
sección de alambre depende únicamente de la longitud de la sección y no de su ubicación.
Observemos que la variable X s+l − X s corresponde a la variable X l trasladada desde el origen
al punto que se encuentra a una distancia s del origen.

Dividimos el alambre de longitud L en n secciones de igual amplitud (con n convenientemente gran-


de) y agregamos a las anteriores nuevas hipótesis

La probabilidad de que en cada sección (de longitud L/n ) haya una imperfección es proporcio-
nal a la longitud de la sección. En particular
³ ´ L
P XL =1 =α .
n n

La probabilidad de que en cada sección (de longitud L/n) haya más de una imperfección es
aproximadamente 0.

Raúl Katz - Pablo Sabatinelli 16


VARIABLES ALEATORIAS DISCRETAS

Bajo los supuestos realizados, podemos considerar que estamos en presencia de n ensayos indepen-
dientes de Bernoulli (cada ensayo consiste en observar si una sección presenta una o ninguna imper-
fección) porque en cada sección puede haber cuanto mucho 1 imperfección (es decir, 1 o ninguna
imperfección). Además la probabilidad de encontrar 1 imperfección en cada sección es constante
(en cada caso vale α nL ). Consideramos la variable Y : ‘cantidad de secciones de longitud L/n sobre un
total de n secciones, que presentan 1 imperfección’. Y ∼ B n, α nL o equivalentemente
¡ ¢

L k L n−k
à !µ
n
¶ µ ¶
P (Y = k) = α 1−α , k = 0, 1, 2, . . . , n.
k n n

Observemos que la probabilidad de que haya k secciones con una imperfección es aproximadamente
igual a la probabilidad de que en un alambre de longitud L haya k imperfecciones. Cuando n → +∞
las probabilidades se igualan.

L k L n−k
à !µ
n
¶ µ ¶
lı́m P (Y = k) = lı́m α 1−α
n→+∞ n→+∞ k n n
n(n − 1)(n − 2) · · · (n − k + 1) (αL)k L n−k
µ ¶
= lı́m 1 − α
n→+∞ nk k! n
k µ ¶n µ
n n − 1 n − k + 1 (αL) L L −k

= lı́m · ··· 1−α 1−α
n→+∞ n n n k! n n
(αL)k −αL
= e = P (X L = k) .
k!

El razonamiento anterior es cierto para todo k entero no negativo. En consecuencia, X L tiene una
distribución de Poisson con parámetro λ = αL. Como la esperanza de una variable con distribución
de Poisson de parámetro λ es igual al propio λ, resulta que E (X L ) = αL o equivalentemente α = E (X L)
L ;
es decir, α representa la media poblacional de imperfecciones por unidad de longitud.

7.3. Ejemplos
1. La cantidad de bacterias que aparecen en el agua se distribuyen según una ley de Poisson a
razón de 2 bacterias/cm3 .

a) ¿Cuál es la probabilidad de que en una muestra de 3 cm3 haya por lo menos 1 bacteria?
b) ¿Cual es la probabilidad de que en una muestra de 5 cm3 no haya bacterias?

Definimos la variable X v : ‘cantidad de bacterias por cada v cm3 ’. Entonces X 3 ∼ P (λv = 2 × 3 = 6).
Luego
60 e −6
P (X 3 ≥ 1) = 1 − P (X 3 = 0) = 1 − ≈ 0.9975.
0!
X 5 ∼ P (λv = 2 × 5 = 10). Luego

100 e −10
P (X 5 = 0) = ≈ 4.5 × 10−5 .
0!

2. La probabilidad de que una viga falle por compresión 0.02. ¿Cuál es la probabilidad de que en
una muestra de 100 vigas fallen a lo sumo 4 vigas?

Llamamos X : ‘cantidad de vigas que fallan por compresión en una muestra aleatoria de 100
vigas’ Entonces X ∼ B(100, 0.02). Luego
à !
4 100
0.02i 0.98100−i ≈ 0.9491.
X
P (X ≤ 4) =
i =0 i

Raúl Katz - Pablo Sabatinelli 17


VARIABLES ALEATORIAS DISCRETAS

Si aproximamos el cálculo utilizando una distribución de Poisson, resulta para la misma varia-
ble aleatoria pero ahora con una distribución de Poisson de parámetro λ = E (X ) = 100×0.02 = 2

X 4 2i e −2
P (X ≤ 4) = ≈ 0.9473.
i =0 i !

8. Distribución geométrica
Consideremos el experimento de lanzar un dado equilibrado hasta que se presenta por primera vez
el número cuatro. Sea la variable aleatoria X : ‘cantidad de lanzamientos realizados hasta que el nú-
mero cuatro aparece por primera vez’. Por ejemplo, si la secuencia de resultados del lanzamientos del
dado es: 3,2,1,3,5,4 entonces la variable aleatoria X asume el valor 6 porque el número 4 aparece por
primera vez en el 6º lanzamiento.
Una variable aleatoria así definida sólo puede asumir valores enteros positivos y por lo tanto se trata
de una variable aleatoria discreta.

Nos interesa calcular con qué probabilidad la variable aleatoria X asume cada valor de su recorrido;
es decir, queremos determinar su distribución de probabilidad. Para esto, razonamos de la siguiente
manera.

1. La variable aleatoria X asume el valor 1 siempre y cuando el número 4 aparezca en el primer


lanzamiento. Por lo tanto P (X = 1) = 61 .

2. La variable aleatoria X asume el valor 2 siempre y cuando en el primer lanzamiento no aparezca


el número 4 pero aparezca en el 2º lanzamiento. Por lo tanto P (X = 2) = 65 × 16 , donde 65 es la
probabilidad de que no aparezca el 4 en el primer lanzamiento.

3. La variable aleatoria X asume el valor 3 siempre y cuando no aparezca el número 4 en los pri-
meros dos lanzamientos, y recién lo haga en el tercer lanzamiento. Por lo tanto P (X = 3) =
5 5 1
6 × 6 × 6.

4. · · ·

5. En general X asume el valor k siempre y cuando en los primeros k −1 lanzamientos no aparezca


¡ ¢k−1 1
el número 4 y recién aparezca en el k-ésimo lanzamiento. Por lo tanto P (X = k) = 65 × 6.
¡ 5 ¢k−1
Cuando una variable aleatoria X asume los valores 1, 2, . . . , k, . . . con P (X = k) = 6 · 16 decimos que
X tiene una distribución geométrica con parámetro p = 61 .
Veamos las condiciones que se cumplen en las consideraciones realizadas.

1. Se parte de un ensayo de Bernoulli, es decir, de una experiencia aleatoria en relación a la cual


se observa si ocurre el suceso A: ‘se obtiene un 4’ o si ocurre A: ‘no se obtiene un 4’.

2. Se realizan repeticiones independientes del ensayo hasta que el suceso A se presenta por pri-
mera vez.

3. La probabilidad del suceso A permanece constante en cada ensayo.

En general

1. Se parte de una experiencia aleatoria en relación


³ ´ a la cual interesa observar si ocurre un cierto
suceso A, con P (A) = p o si ocurre A, con P A = 1 − p (ensayo de Bernoulli).

2. Se realizan repeticiones independientes del ensayo hasta que el suceso A se presenta por pri-
mera vez.

Raúl Katz - Pablo Sabatinelli 18


VARIABLES ALEATORIAS DISCRETAS

3. La probabilidad del suceso A permanece constante en cada ensayo,

Bajo estas consideraciones se define la variable aleatoria X : ‘cantidad de ensayos que se realizan hasta
que el suceso A se presenta por primera vez’. Calculamos la probabilidad de que la variable aleatoria
X asuma el valor k; es decir, que el suceso A se presente por primera vez en el k-ésimo ensayo.
³ ´k−1
P (X = k) = P (A A A
| {z }· · · A A) = P A P (A) = (1 − p)k−1 p.
k − 1 veces

Sea X la variable aleatoria definida como ‘cantidad de ensayos indepen-


dientes de Bernoulli que se realizan hasta que el suceso A se presenta por
primera vez’, y sea P (A) = p. Entonces X tiene una distribución geométrica
con parámetro p y

P (X = k) = p(1 − p)k−1 , k = 1, 2, . . . .

Bajo estas condiciones notamos X ∼ G (p).

8.1. Esperanza matemática y variancia


Cuando X ∼ G (p) se puede probar que
+∞ 1
kp(1 − p)k−1 =
X
E (X ) = .
k=1 p

En el caso de la variancia, se puede probar que


+∞ ¶2
1 1−p
µ
p(1 − p)k−1 =
X
V (X ) = k− .
k=1 p p2

8.2. Período de retorno


Sea el suceso A: en un año el caudal para una sección específica de un río es de por lo menos 100
m3 /s y consideremos la variable aleatoria X : ‘cantidad de años que transcurren hasta que el suceso
A ocurre por primera vez, o se repite por primera vez desde la última vez que ocurrió’. La variable
X asume el valor 1 si dentro del 1º año ocurre el suceso A por lo menos una vez desde la última vez
que haya ocurrido. La variable X asume el valor 2 si dentro del 1º año no ocurre el suceso A desde la
última vez que haya ocurrido y sí lo hace durante el 2º año.

Bajo el supuesto de que los caudales ocurren año tras año de manera independiente entonces la va-
riable aleatoria X tiene una distribución geométrica con parámetro p = P (A) y por lo tanto E (X ) =
1/P (A). Si P (A) = 0.02 entonces E (X ) = 50 años. Este valor se conoce por periodo de retorno de un cau-

dal de por lo menos 100 m3 /s. y representa el tiempo medio en años entre la presentación del suceso
A. Esto no implica que no puedan producirse, por ejemplo, en dos años consecutivos, caudales de
por lo menos 100 m3 /s, aunque la probabilidad de ocurrencia sea muy baja.

9. Distribución binomial negativa


Esta distribución, también conocida como distribución de Pascal, es una generalización de la dis-
tribución geométrica. La variable con distribución geométrica se define como ‘cantidad de ensayos
independientes que se realizan hasta que el suceso A se presenta por primera vez’; en el caso de una
distribución binomial negativa, la variable se define como ‘cantidad de ensayos que se realizan hasta
que el suceso A se presenta por r -ésima vez’.

Raúl Katz - Pablo Sabatinelli 19


VARIABLES ALEATORIAS DISCRETAS

Para deducir la ley de probabilidad de una variable aleatoria X con distribución binomial negativa,
razonamos a partir de este ejemplo.

Sea X : ‘cantidad de veces que se lanza un dado equilibrado hasta que el número 6 se presenta por
cuarta vez’. En primer lugar, destacamos que el menor valor que puede asumir X es 4 (porque son
necesarios como mínimo 4 tiradas para que el número 6 aparezca por cuarta vez.)
¿Cuál es la probabilidad de que en el octavo lanzamiento, el número 6 aparezca por cuarta vez? Para
responder, observamos que en los primeros 7 lanzamientos debe aparecer tres veces el número 6, y
en el octavo lanzamiento aparecer el 6 por cuarta vez.
La probabilidad de que en 7 lanzamientos aparezca 3 veces el número 6 es

7 1 3 5 4
à !µ ¶ µ ¶
¿por qué?
3 6 6

En consecuencia,
7 1 3 5 4 1 7 1 4 5 4
à !µ ¶ µ ¶ à !µ ¶ µ ¶
P (X = 8) = · = ≈ 0.013
3 6 6 6 3 6 6

Sea X la variable aleatoria definida como ‘cantidad de ensayos indepen-


dientes de Bernoulli que se realizan hasta que el suceso A se presenta por
r -ésima vez’, y sea P (A) = p. Entonces X tiene una distribución binomial
negativa con parámetros p y r .
à !
k −1 r
P (X = k) = p (1 − p)k−r , k = r, r + 1, r + 2, . . . .
r −1

Además,
r r (1 − p)
E (X ) = , V (X ) = .
p p2

9.1. Ejemplo
La probabilidad de que al comprar un automóvil se lo pida de color negro es 0.40. ¿Cuál es la proba-
bilidad que el octavo cliente en comprar un automóvil sea el tercero en solicitarlo de este color? ¿Cúal
es la cantidad media de ventas hasta que tres clientes demanden un automóvil de color negro?

Sea Y :‘cantidad de ventas que se realizan hasta que tres clientes demanden un automóvil de color
negro’ Entonces Y tiene una distribución binomial negativa con parámetros p = 0.40 y r = 3.
à !
7
P (Y = 8) = 0.403 0.605 ≈ 0.10.
2

3
E (Y ) = = 7.5 ventas.
0.40

10. Distribución hipergeométrica


Se tiene un lote de N artículos de los cuales r son defectuosos (N − r no lo son). Se eligen al azar y sin
reposición n artículos del lote (n ≤ N ). Sea X la cantidad de artículos defectuosos en la muestra de
tamaño n. Entonces R X = {0, 1, 2, . . . , mı́n (n, r )}. En el capítulo correspondiente a la Introducción a la
Probabilidad, hemos calculado en base a un razonamiento combinatorio,
¡r ¢¡N −r ¢
k n−k
P (X = k) = ¡N ¢ , k = 0, 1, 2, . . . , mı́n (n, r ) .
n

Raúl Katz - Pablo Sabatinelli 20


VARIABLES ALEATORIAS DISCRETAS

Sea p = r /N , es decir, la proporción de defectuosos en el lote. Se puede demostrar que E (X ) = np y


V (X ) = np(1 − p) N −n
N −1 .

10.1. Ejemplos
De 800 piezas fabricadas por una máquina, 25 resultaron defectuosas. Se eligen al azar 5 piezas del
lote de 800 piezas. Calcule la probabilidad de que en la muestra de tamaño 5 haya al menos una
defectuosa, suponiendo que

1. el muestreo es sin reposición,

2. el muestreo es con reposición.

3. Si los resultados que obtiene son similares, explique el porqué.

Solución:

1. Sea X : ‘cantidad de elementos defectuosos en la muestra de tamaño 5 extraída sin reposición’.


Entonces X tiene distribución hipergeométrica.
¡775¢¡25¢
5 0
P (X ≥ 1) = 1 − P (X = 0) = 1 − ¡800¢ ≈ 0.147.
5

2. Sea Y : ‘cantidad de elementos defectuosos en la muestra de tamaño 5 extraída con reposición’.


Entonces Y tiene distribución binomial.

800 25 0 775 5
à !µ ¶ µ ¶
P (Y ≥ 1) = 1 − P (Y = 0) = 1 − ≈ 0.146.
0 800 800

3. La variable X tiende a comportarse como la variable Y cuando el tamaño de la población es


grande respecto al tamaño de la muestra. Esto se debe a que las probabilidades calculadas en
el primer caso no difieren sustancialmente de la probabilidad de éxito para la variable Y . La
distribución hipergeométrica se aplica cuando se realiza un muestro sin reposición en una po-
blación finita. En cambio, la distribución binomial se aplica cuando se realiza un muestreo con
reposición en una población finita o sin reposición en una población infinita.

11. Miscelánea de problemas


1. El número de bacterias por mm3 de agua en un estanque es una variable aleatoria X con dis-
tribución de Poisson de parámetro λ = 0.5.

a) ¿Cuál es la probabilidad de que en 2 mm3 haya al menos una bacteria?


b) En 40 tubos de ensayo se toman muestras de agua del estanque (1 mm3 de agua en cada
tubo). ¿Qué distribución tiene la variable aleatoria Y : ‘número de tubos de ensayo, entre
los 40, que no contienen bacterias’? Justifique

2. Un proceso de producción se detiene para hacer ajustes cuando en una muestra al azar de
cinco unidades hay una o más defectuosas.

a) Si el proceso produce 2 % de unidades defectuosas, calcule la probabilidad de que sea


detenido al inspeccionarse.
b) Calcule la probabilidad de que el proceso no sea detenido después de una inspección
cuando está produciendo un 10 % de unidades defectuosas.
c) En el contexto de la situación planteada emita juicio sobre los valores de las probabilida-
des calculados en los apartados 2a y 2b.

Raúl Katz - Pablo Sabatinelli 21


VARIABLES ALEATORIAS DISCRETAS

3. El número de cortes de luz, con una duración superior a una hora, que se produce en un distrito
de una ciudad sigue una ley de Poisson a razón de 10 cortes por año.

a) Calcule la probabilidad de que en medio año se produzcan a lo sumo dos cortes.


b) Una empresa de suministro de energía afirma que ha renovado sus equipos e implemen-
tado un nuevo sistema de mantenimiento que les permite un mejor abastecimiento. Des-
pués de la renovación de sus equipos se han producido en un año tres cortes. Calcule la
probabilidad de que se produzcan a lo sumo tres cortes aún cuando el promedio sigue
siendo de 10 cortes por año.
c) A la luz del cálculo efectuado en 3b ¿considera que ha mejorado el servicio de abasteci-
miento? Justifique.

4. Sean X e Y dos variables aleatorias discretas tales que x < y para todo x ∈ R X , para todo y ∈
R Y . Analice la veracidad de los siguientes enunciados. Justifique.

a) V (X ) < V (Y ).
b) E (X ) < E (Y ).

5. Sea U : ‘número máximo que se obtiene al lanzar dos dados equilibrados’ y T : ‘número mínimo
que se obtiene al lanzar dos dados equilibrados’. Verifique que V (U ) = V (T ).

6. Una empresa compra una gran cantidad de bulones a un mismo proveedor. Cada vez que se
recibe un envío se realiza un control de calidad por muestreo. Se prueban 80 bulones seleccio-
nados al azar del total. Si se encuentra más de un bulón defectuoso se rechaza el envío; en caso
contrario, se lo acepta. Sea p la probabilidad de producir un bulón defectuoso en el proceso de
fabricación. De acuerdo a los estándares de calidad, se desea satisfacer la condición p ≤ 0.005.

a) Halle la probabilidad de rechazar un lote cuando p = 0.004.


b) Halle la probabilidad de aceptar un lote cuando p = 0.05.
c) Si fuera usted el proveedor, ¿cuál de las probabilidades obtenidas en los puntos anteriores
le preocuparía? Justifique su respuesta.

7. Una fabricante realiza un control de sus artículos antes de que se embarquen. De cada caja de
25 unidades, se seleccionan al azar y sin reposición 3 artículos. Si se encuentra al menos uno
defectuoso, se verifica toda la caja. Si no se encuentran defectuosos, la caja se embarca.

a) Calcule la probabilidad de que se embarque una caja que contiene tres defectuosos.
b) Calcule la probabilidad de que una caja que contiene sólo un artículo defectuoso se regre-
se para su revisión total.
c) ¿Qué comentario le merecen las probabilidades calculadas en los apartados anteriores?

8. En un sistema de atención al cliente, el número de solicitudes que se reciben por día sigue una
ley de Poisson a razón de 3 solicitudes diarias.

a) Calcule la probabilidad de que transcurran más de 5 días para recibir la primera solicitud.
b) Calcule la probabilidad de que se reciba una solicitud antes de los 10 días, si ya han pasado
5 días y no se han recibido solicitudes.

9. El departamento de selección de personal de una empresa sabe que ante cada convocatoria
para cubrir un puesto gerencial, sólo el 20 % de los aspirantes cumple con todos los requisitos
exigidos. Se hace una convocatoria para cubir el puesto de un gerente por una reciente jubila-
ción, y se entrevista a los aspirantes uno a uno.

Raúl Katz - Pablo Sabatinelli 22


VARIABLES ALEATORIAS DISCRETAS

a) Calcule la probabilidad de que el cuarto entrevistado sea el primer aspirante que cumpla
con todos los requisitos de la convocatoria.
b) Determine la media del número de aspirantes a entrevistar hasta encontrar el primero
que cumpla con los requisitos pedidos en la convocatoria.

10. El cuerpo de bomberos de una ciudad es capaz de atender hasta un máximo de 30 servicios por
día. La demanda diaria de servicios sigue una ley de Poisson con una media igual a 25 servicios.

a) Calcule la probabilidad de que en un día cualquiera no se puedan atender todos los servi-
cios requeridos.
b) Calcule la probabilidad de que en 31 días haya al menos un día en el que no se puedan
atender todos los servicios requeridos.

11. Una empresa desea comprar un lote de envases de vidrio y quiere asegurarse de que la pro-
porción de envases con la rosca defectuosa no supere 0.01. Para verificar si un lote entregado
cumple con el requerimiento se extrae una muestra de 250 envases y se inspeccionan. Sea X el
número de envases inspeccionados con la rosca defectuosa. Se aceptará el lote si X ≤ c, (para
algún valor cuidadosamente elegido de c) y si X > c, el lote será devuelto.

a) ¿Cómo debe elegirse c, si se quiere tener una probabilidad de a lo sumo 0.1 de aceptar el
lote cuando la verdadera proporción de roscas defectuosas es 0.02?
b) Para ese valor de c, halle la probabilidad de rechazar un lote con una proporción de roscas
defectuosas de 0.005.

12. Dos equipos A y B llevan a cabo un trabajo similar. La siguiente tabla muestra la distribución de
probabilidad de la variable aleatoria tiempo para la finalización del trabajo, en días, para cada
equipo.

Días
6 7 8
Equipo A 0.15 0.65 0.20
Equipo B 0.08 0.70 0.22

Calcule para cada equipo el tiempo medio y la desviación estándar del tiempo para la finaliza-
ción del trabajo.

13. El número de fallas de un instrumento de prueba debido a las partículas contaminantes de un


producto, es una variable aleatoria de Poisson con media 0.02 fallas por hora. Se desea que la
probabilidad de que un instrumento de tal tipo falle en un período de 4 horas sea a lo sumo
0.05.

a) ¿Satisfacen dichos instrumentos las condiciones deseadas?


b) Calcule la probabilidad de que se presente al menos una falla en un período de 24 horas.

14. En una línea de producción de placas para circuitos electrónicos se conoce que: el 5 % de las
placas no satisfacen la especificación de longitud y el 3 % no satisface la especificación de an-
chura. Si los cortes para la longitud y el ancho son variables independientes calcule

a) la proporción de placas que satisfacen ambas especificaciones,


b) la proporción de placas que no satisfacen al menos una de las dos especificaciones,
c) la proporción de placas que satisfacen la especificación de longitud entre aquellas que
satisfacen ambas especificaciones,

Raúl Katz - Pablo Sabatinelli 23


VARIABLES ALEATORIAS DISCRETAS

d) la probabilidad de que en una muestra de 10 placas a lo sumo una de las mismas no cum-
pla con ambas especificaciones.

15. En un taller de fabricación de una pieza seriada, hay dos tornos automáticos que producen una
misma pieza. El torno T1 produce 97 % de unidades buenas mientras que el torno T2 95 %. Un
lote se compone de 80 % de piezas trabajadas con el torno T1 y 20 % de piezas trabajadas por el
torno T2 . Se forman lotes con 1000 piezas. Un cliente acepta un lote cuando en una muestra de
5 piezas elegidas al azar no encuentra piezas defectuosas.

a) Calcule la probabilidad de aceptación de un lote.


b) Calcule el número medio de lotes que se aceptan, cuando se inspeccionan de a 50 lotes.
c) ¿Realizó algún cálculo donde usó el supuesto de independencia? En caso afirmativo, indi-
que dónde y por qué considera válido realizar ese supuesto.

16. Un lote de 30 piezas contiene 3 que son defectuosas. Un comprador utiliza el siguiente plan
de muestreo para la aceptación. Si en una muestra de tamaño 5, sin reposición, encuentra al
menos una pieza defectuosa, rechaza el lote; de lo contrario lo acepta.

a) Calcule la probabilidad de que el lote sea aceptado.


b) ¿Es válido aproximar la probabilidad del punto anterior a través de la distribución bino-
mial? Explique.
c) Si se inspeccionan de a 100 de tales lotes, ¿cuál es el número promedio de lotes rechaza-
dos?

17. Si X es una variable aleatoria discreta entonces E (X ) es el valor que tiene mayor probabilidad
de ocurrir. ¿Esto es verdadero o falso? Justifique.

18. El departamento de calidad ha evaluado que cierto tipo de anclajes metálicos producidos pue-
den ser defectuosos debido a las siguientes causas: defectos en la rosca y defectos en las di-
mensiones. Se ha calculado que el 6 % de los anclajes que producen tienen defectos en la rosca,
mientras que el 9 % tiene defectos en las dimensiones. Sin embargo, el 90 % de los anclajes no
tiene ningún tipo de defectos.

a) ¿Cuál es la probabilidad de que un anclaje tenga ambos tipos de defectos?


b) Los anclajes se empaquetan en cajas de 300 unidades. ¿Cuál es la probabilidad de que una
caja tenga más de un 10 % de anclajes con algún defecto?

19. Sean X y Y dos variables aleatorias con distribución de Poisson con parámetros 5 y 6.5 res-
pectivamente. Los siguientes 30 datos corresponden a una muestra de una de las dos variables
aleatorias.

5 3 2 6 6 7 3 3 6 7
7 9 7 5 3 12 6 10 7 2
6 8 0 7 4 6 5 6 3 5

¿A cuál de las dos variables cree que corresponde esta muestra? ¿Por qué? ¿Cuál de las dos va-
riables tiene más chances de generar estos datos? Justifique.

20. Veinte por ciento de los teléfonos de cierto tipo se envían a reparación cuando todavía está
vigente su garantía. De éstos, el 60 % se puede reparar y el otro 40 % debe sustituirse con apa-
ratos nuevos. Si una compañía compra diez de estos teléfonos, ¿cuál es la probabilidad de que
exactamente se cambien dos dentro del periodo de garantía?

21. Un lote muy grande de componentes ha llegado a un distribuidor. El distribuidor decide selec-
cionar al azar 10 componentes y aceptar el lote si el número de componentes defectuosas en la
muestra es a lo sumo 2.

Raúl Katz - Pablo Sabatinelli 24


VARIABLES ALEATORIAS DISCRETAS

a) ¿Cuál es la probabilidad de que el lote sea aceptado cuando la proporción real de piezas
defectuosas es 0.01? ¿0.05?, ¿0.10?, ¿0.20?, ¿0.25?
b) Sea p la proporción de piezas defectuosas del lote. La gráfica que representa la probabi-
lidad de aceptar el lote en función de p se llama curva característica de operación para el
plan de muestreo de aceptación del lote. Utilice los resultados del apartado anterior para
trazar esta curva para p ∈ [0, 1].
c) Repita los dos primeros apartados cambiando “2” por “1” en el plan de muestreo de acep-
tación del lote.
d) Repita los dos primeros apartados cambiando “10” por “15” en el plan de muestreo de
aceptación del lote.
e) ¿Cuál de los tres planes de muestreo aparece más satisfactorio? Justifique.

22. En la serie de campeonato de la NBA, el equipo que gane 4 juegos de 7 será el ganador de la
serie. Suponga que el equipo A tiene una probabilidad de 0.55 de ganarle al equipo B y que
ambos equipos se enfrentarán entre sí en los juegos de campeonato.

a) ¿Cuál es la probabilidad de que el equipo A gane la serie en 6 juegos?


b) ¿Cuál es la probabilidad de que el equipo A gane la serie?
c) Si ambos equipos se enfrentan entre sí en una serie regional de play-off y el ganador es
quien gana 3 de 5 juegos. ¿Cuál es la probabilidad de que el equipo A ganará un juego de
play-off?

23. Un lote contiene un 2 % de artículos defectuosos. ¿Cuál es la probabilidad de que sea necesario
extraer de manera aleatoria a lo sumo 20 artículos para encontrar el primer defectuoso?

12. Soluciones
Presentamos a continuación algunas respuestas a los problemas de la miscelánea, junto con los co-
mandos de MS-EXCEL o R que permiten reproducirlas.

1. a) 0, 632
En MS-EXCEL =1-POISSON(0;0,5*2;0)
En R ppois(0,0.5*2,lower.tail=FALSE)
b) Y ∼ B n = 40, p = 0, 607
¡ ¢

En MS-EXCEL =POISSON(0;0,5;0)
En R dpois(0,0.5)

2. a) 0.096
En MS-EXCEL =1-DISTR.BINOM(0;5;0,02;0)
En R pbinom(0,5,0.02,lower.tail=FALSE)
b) 0.590
En MS-EXCEL =DISTR.BINOM(0;5;0,1;0)
En R dbinom(0,5,0.1)

3. a) 0.125
En MS-EXCEL =POISSON(2;5;1)
En R ppois(2,5)
b) 0.010

Raúl Katz - Pablo Sabatinelli 25


VARIABLES ALEATORIAS DISCRETAS

En MS-EXCEL =POISSON(3;10;1)
En R ppois(3,10)

4. a) Falso.
b) Verdadero.

5. 1.97 puntos2 .

6. a) 0.041
En MS-EXCEL =1-DISTR.BINOM(1;80;0,004;1)
En R pbinom(1,80,0.004,lower.tail=FALSE)
b) 0.086
En MS-EXCEL =DISTR.BINOM(1;80;0,05;1)
En R pbinom(1,80,0.05)

7. a) 0.670
En MS-EXCEL=DISTR.HIPERGEOM(3;3;22;25)
En R dhyper(3,22,3,3)
b) 0.120
En MS-EXCEL=DISTR.HIPERGEOM(2;3;24;25)
En R dhyper(2,24,1,3)

8. a) 0.736
En R pgeom(5,dpois(0,3),lower.tail=FALSE)
b) 0.264
En R pgeom(5,dpois(0,3))

9. a) 0.102
En MS-EXCEL =NEGBINOMDIST(3;1;0,2)
En R dgeom(3,0.2)
b) 5 aspirantes.

10. a) 0.137
En MS-EXCEL =1-POISSON(30;25;1)
En R ppois(30,25,lower.tail=FALSE)
b) 0.990
En MS-EXCEL =1-DISTR.BINOM(0;31;1-POISSON(30;25;1);0)
En R pbinom(0,31,ppois(30,25,lower.tail=FALSE),lower.tail=FALSE)

13. a) No.
En R ppois(0,0.02*4,lower.tail=FALSE)
b) 0.381
En R ppois(0,0.02*24,lower.tail=FALSE)

15. a) 0.841
En R dbinom(0,5,.03*.8+.05*.2)

16. a) 0.567

Raúl Katz - Pablo Sabatinelli 26


VARIABLES ALEATORIAS DISCRETAS

En R dhyper(5,27,3,5)
b) 0.590
En R dbinom(0,5,0.1)

18. b) 0.452
En R pbinom(30,300,0.1,FALSE)

20. 0.148

En R dbinom(2,10,0.08)

22. a) 0.185
En MS-EXCEL =NEGBINOMDIST(2;4;0,55)
En R dnbinom(2,4,0.55)
b) 0.292
En MS-EXCEL =DISTR.BINOM(4;7;0,55;0)
En R dbinom(4,7,0.55)
c) 0.337
En MS-EXCEL =DISTR.BINOM(3;5;0,55;0)
En R dbinom(3,5,0.55)

Raúl Katz - Pablo Sabatinelli 27

También podría gustarte