Clase - Distribuciones Continuas PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 71

 Estadística y Probabilidades

Modelos de probabilidad para variables


aleatorias continuas

[email protected]

Bibliografía recomendada: Cordova, Manuel. 2003. Estadística:


Descriptiva e Inferencial. Ed. Moshera S.R.L. 5ta edición. Sub
capítulos: 7.2 y 7.3

2019-2 Fotocopiar o escanear Tabla de Distribución de Probabilidad Normal Estándar


Distribución de probabilidad uniforme (rectangular)
La variable aleatoria continua mas sencilla por tener un valor constante
(uniforme) en un intervalo de valores.
Función de densidad de probabilidad:
 1
1
 si a  x  b
f ( x )  p( x )  U ( a, b )   b  a

ba
 0 en otro caso p(x)
Donde a y b se denominan parámetros de
ubicación. Área = 1
Función de distribución de probabilidad
acumulada:
x
a x b
F ( x)   p( t )dt x  

Entonces:
0 xa
x a
F ( x)   a xb
b  a
1 xb
Media, varianza y desviación típica de la distribución de probabilidad
uniforme.
b
b
x  x  b2  a2 a  b
2
μ dx     
a
ba  2(b  a)  a 2(b  a) 2

1 1
(2=1/12) (2=3/4)
p(x) p(x)

0 x 1 1/6 -1 0 1 2 x

Nota: Observa que estas distribuciones tienen la misma media


pero distinta varianza. Mayor varianza implica mayor dispersión
alrededor de la media.
Aplicaciones de U(a,b)
• La distribución uniforme entre 0 y 1 tiene una
aplicación muy importante en los procesos de
simulación.

• Cuando se utiliza un p-value a modo de prueba


estadística para una hipótesis nula simple, y la
distribución de la prueba estadística es continua,
entonces la prueba estadística está uniformemente
distribuida entre 0 y 1 si la hipótesis nula es
verdadera.
Ejemplo de distribución de p. rectangular. Si:
 1
 47  41 para 41  x  47

p(x)  

 0 para el resto de valores

Calcula la probabilidad P(42  x  45)


x 2  x1 45  42 1
P(x1  x  x 2)  P(42  x  45)  
ba 47  41 2
45  42 1
p(x) 
47  41 2

1 1

47  41 6
Area
= 50%

41 42 45 47 x
Ejemplo.
Mamerto es un vendedor que cobra un sueldo
fijo por S/200 más una comisión de 5% del
total de las ventas mensuales. Si el total de las
ventas es una v. a. X con distribución
uniforme comprendida entre S/0 a S/2000,
encuentra:
a) ¿Cuál es sueldo promedio de Mamerto?
S = 200 + 5%*X
donde X es una v.a. que representa el
total de la venta mensual: ͂ U [0;2000]
E(S) = 200 + 0,05*E(X)
= 200 + 0,05*1000
= S/250 mensuales
b) ¿Qué probabilidad hay de que Mame
tenga honorarios superiores a S/275?
¿Cuánto debe vender como mínimo?

P[S > 275] = P[X > 1500]


= 500/2000 = 0,25

La probabilidad es de 25% y debe vender


como mínimo S/1500
c) Si Mamerto vende como mínimo S/500 ¿qué
probabilidad hay de que gane más de S/260?

P(S > 260) P(X > 500) =

P(X > 1200) P(X > 500) =

800 * 1
 2000
1500 * 1
2000
Diferencia entre f(x) y F(x) en una variable aleatoria continua

Para ver más claramente por qué la altura de una función de densidad de
probabilidad no es una probabilidad, considere la variable aleatoria cuya
distribución de probabilidad uniforme es la siguiente:

f (x) = 2 para 0 <= x <= 0,5


0 en cualquier otro caso

La altura de la función de densidad de probabilidad, f(x) es 2 para todos los


valores de x entre 0 y 0,5. Pero se sabe que las probabilidades nunca
pueden ser mayores a 1. Por tanto, f(x) no se interpreta como la probabilidad
de x.
Ejercicios.
1) En las botellas de un detergente líquido «Ña Catita» se indica que el
contenido es de 12 onzas por botella. En la operación de producción se
llenan las botellas uniformemente de acuerdo con la siguiente función de
densidad de probabilidad:

f (x) = 8 para 11,975 <= x <= 12,100


0 en cualquier otro caso

a. ¿Cuál es la probabilidad de que el contenido de una botella esté


entre 12 y 12,05 onzas?

b. ¿Cuál es la probabilidad de que el contenido de una botella sea


12,02 onzas o más?

c. En el control de calidad se acepta que una botella sea llenada con


más o menos 0,02 onzas de lo indicado en la etiqueta. ¿Cuál es la
probabilidad de que una de las botellas de detergente no satisfaga
estos estándares?

R. a. 40%; b. 64% y c. 68%


Ejercicios...

2) Sea X el momento elegido al azar en que Eufemia llega a una cita


entre la 1:00 y las 2:00 de la tarde. Responde:
a) ¿Cuál es en este caso la función de densidad?
b) ¿Cuál es el valor medio esperado?, ¿con qué desviación típica?
c) Calcula la probabilidad de que Eufemia llegue en la primera
media hora, P(X < 1,5).
d) Calcula la probabilidad de que Eufemia aparezca en los últimos
15 minutos, P(1,75 < X < 2).

3) El ingeniero Serapio Jozzo estima inicialmente que el tiempo, en


minutos, de maquinado de una pieza se modela con una distribución
uniforme (10; 20). Calcula la probabilidad de que una pieza sea
maquinada en menos de 14,5 min.
Ejercicios...

4) Supón que se gira el dial mostrado en la figura para que pare en una
posición aleatoria. Modela esto como una apropiada función de densidad de
probabilidad, y úsala para calcular la probabilidad de que la aguja pare en
cualquier posición entre 5° y 300°.

R.= (300 – 5)/360 = 0,8194


Distribución de probabilidad normal

La distribución continua de probabilidad más importante,


por la frecuencia con que se encuentra y por sus
aplicaciones teóricas, es la distribución normal, gaus-
siana o de Laplace-Gauss.

Existen tres funciones de distribución de probabilidad


íntimamente relacionadas con la distribución normal: la
distribución chi-cuadrada, la distribución t de Student y
la distribución F de Fisher. Las definiciones de estas
funciones involucran las fórmulas de la función gamma y
de la función beta.
El doodle de Google para homenajear a Carl Friedrich Gauss, "el príncipe de
las matemáticas"

Fue uno de los más grandes matemáticos de todos los tiempos. Goggle
celebra el aniversario de su nacimiento, el 30 de abril de 1777
Aplicaciones de la distribución normal
Caracteres morfológicos de individuos (personas, animales,
plantas,...) de una especie (tallas, pesos, diámetros, perímetros,...).
Caracteres sociológicos, por ejemplo: consumo de cierto producto
por un mismo grupo de individuos, puntuaciones de examen, ...

Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de


un fármaco.
Errores cometidos al medir ciertas magnitudes.
Valores estadísticos muestrales, por ejemplo: la media.
Y en general cualquier característica que se obtenga como suma de
muchos factores.

Otras distribuciones como la binomial o la de Poisson se aproximan


a la distribución de probabilidad normal.
Distribuciones binomiales con n grande (n > 30) y „p ni pequeño‟
(np > 5) „ni grande‟ (n*(1 - p) > 5).
Características

• Tiene forma de campana, es asintótica al eje de las


abscisas (para x =   )

• Simétrica con respecto a la media () donde coinciden la


mediana (Mn) y la moda (Mo)

• El área por debajo de la curva normal es igual a 1.


 f ( x )dx

Características

• Curtosis igual a 3

• Los puntos de inflexión tienen como abscisas los


valores   

Puntos
de
inflexión

   +
- +
, Mo, Mn
¿Cómo calcular probabilidades asociadas
a una curva normal específica?

Dado que tanto  como  pueden asumir infinitos valores lo


que hace impracticable tabular las probabilidades para todas las
posibles distribuciones normales, se utiliza la distribución
normal estándar, reducida o tipificada.

Se define una variable z= x -


Es una traslación , y un cambio de escala de la


variable original.
La nueva variable z (variable aleatoria estandarizada)
se distribuye como una NORMAL con media  = 0 y
desviación típica  = 1
En cualquier distribución normal las
probabilidades delimitadas entre :
   68 %
 2  95 %
 3  99 %

68%

95%
99% z
-3 -2 -1 0 1 2 3
Tipificación
Dada una variable de media μ y desviación
típica σ, se denomina valor tipificado z,
puntuación z, valor z, puntaje z, de una
observación x, a la distancia (con signo) con
respecto a la media, medido en desviaciones
típicas, es decir:

x
z

Tipificación

• En el caso de variable X normal, la


interpretación es clara: asigna a todo valor
de N(μ, σ), un valor de N(0,1) que deja
exactamente la misma probabilidad por
debajo.
• Permite así comparar entre dos valores de
dos distribuciones normales diferentes, para
saber cuál de los dos es más extremo.
Hay varios tipos de tablas de la distribución de proba-
bilidad normal. La que se explica aquí representa las
áreas para los diferentes valores de z: desde 0 hasta +
.

Los valores
negativos de z NO
están tabulados, ya
que la distribución
es simétrica

+
0
a) Margen izquierdo: Los enteros de z y
su primer decimal.
La tabla de D. N. consta de: b) Margen superior: centésima de unidad
c) Cuerpo de la tabla: áreas acumuladas, desde
Z = 0 hasta Z = 3,99
Z 0 1 2 3 4 5 6 7 8 9

0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359

0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754

0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .... ...... ......

0.3 .1179 ..... ...... ...... ......

0.4 .1554 .... ..... ....

0.5 .1915 ....

Nota: Para valores de z > 3,99 o z < -3,99 usar 0,0001 para el área
Otra: Si no se encuentra el valor de Z en la tabla debes interpolar . Ejemplo Z < 0,246
Otra: Si te dan la probabilidad para hallar Z y no encuentras el área (probabilidad) en
la tabla, debes interpolar. Ejemplo hallar Z para un área de 0,0960.
Ejemplo.
¿Cuál es la probabilidad de que un valor de z esté entre 0 y – 2,03?
Se busca en la tabla el área correspondiente a z = 2,03

Z 0 1 2 3 4
1.8
1.9
2.0 0.47882
2.1

47,88%

z
-3 -2 -1 0 1 2 3
Ejemplo
El colesterol en la población del Centro Poblado
Chancachi - Puno, tiene distribución de
probabilidad normal, con media 200 mg/dl y
desviación estándar 10 mg/dl. Responde:

a) ¿Qué porcentaje de individuos tiene colesterol


inferior a 210 mg/dl?
Todas las distribuciones normales son similares salvo traslación y cambio de
escala: Tipifiquemos.
x 210  200
z   1
 10

P[Z  1,00]  (ver tabla)  0,841


b) ¿Qué valor del colesterol solo es superado por el 10% de los individuos?
• El valor del colesterol que solo supera el 10% de los individuos es el percentil 90.
Calculemos el percentil 90 de la N(0;1) y deshacemos la tipificación.

x
z 

x  200
1,28 
10
x  200  10 1,28  212,8
El colesterol tiene distribución de probabilidad normal, con µ = 200 mg/dl
y = 10 mg/dl. Responde:

c) ¿Cuál es la probabilidad de que se elija aleatoriamente a dos


individuos y cada uno supere los 210 mg/dl? R. 2,518%

d) Se eligen al azar a seis parroquianos ¿cuál es la probabilidad que


por lo menos dos tengan colesterol mayor a 210 mg/dl? R. 24,41%

e) Supón que el Centro Poblado Chancachi tiene 2000 pobladores


adultos ¿Cuántos tendrán colesterol menor que 210 mg/dl? R. 1682

f) ¿Cuál es la probabilidad de elegir un elemento de la población y


tenga colesterol mayor a 810 mg/dl?
Ejercicio:
La vitivinícola Vino para Quedarse, cuenta con una máquina de envasado
automático, la cual vierte en cada botella una cierta cantidad de vino que
sigue una distribución normal con media de 500 ml y una varianza de 25 ml.

a) ¿Qué porcentaje de las botellas se llenan con vino entre 490 y 507
mililitros?

b) Si el 14 de febrero la producción fue un record de 20000 botellas ¿cuántas


botellas tendrán entre 490 y 507 ml?

R. (a) 89,64% (b) 17 928


Teorema aplicable a la distribución de probabilidad normal
(propiedad reproductiva, adición o aditiva)

Sea X1, X2, ... , Xn, n variables aleatorias


independientes (Cov = 0), donde Xi ~ N( ,  ),
2

para i = 1, 2 ... n.
Si Y = c1X1 + c2X2, + ... + cnXn entonces, la v. a. Y
se distribuye normalmente con media y varianza:
n n
 y   ci i  2
y   c i 2 2
i
i 1 i 1
Si X ~ N(μ , σ2 ). Entonces, la variable aleatoria Y = a + b X también se
distribuye normalmente con media E(Y) = a + bμ y varianza V(Y) = b2*σ2.
Es decir: Y ~ N(a + bμ , b2*σ2 ).

Para diferencia de v. a. (X – W) ~ N(μx + μw ; 


2
x +  2w )
Ejemplo.

La suma de v. a. binomiales con el mismo parámetro p es otra


binomial de parámetro p.

En el Hospital Romeo la probabilidad de curar un enfermo sin secuelas es


0,90. Esta probabilidad es análoga en el Hospital Julieta. Si llegan en un
día 20 enfermos al primer hospital y 30 al segundo ¿cuál es la
probabilidad de curar sin ningún tipo de secuela a más de 46 pacientes?

R. 31,92%
Ejercicio.
Un brazo hidráulico utilizado para vaciar el concreto en
edificaciones de altura, consta de tres partes. Supón que X1,
X2 y X3 son fabricados por diferentes empresas cuya distri-
bución de probabilidad de la longitud de cada una de las
partes está dada por:

– X1 N (12 ft; 0,02 ft2)


– X2 N (24; 0,03)
– X3 N (18; 0,04)

Calcula la probabilidad de que la longitud del brazo


hidráulico esté comprendida entre 53,8 y 54,2 feet.
R. 49,5% (Excel); 49,6% (SPSS).
• Ejercicio 1. El valor Z para una observación que se
encuentra a la derecha de la mediana será siempre:
a. Cero b. Negativo c. Mayor a 1 d. Positivo
• Ejercicio 2. En una distribución Normal determina la
proposición falsa:
a. El área total bajo la curva es igual a 1
b. La curva es simétrica con respecto a la moda
c. El valor de la media es siempre mayor al del desvío
estándar
d. La curva se extiende de menos a mas infinito.
• Ejercicio 3. Elige la alternativa correcta. Para la
distribución normal estandarizada se verifica que:
a. μ = 1 y σ = 0
b. μ = 0,5 y σ = 0,5
c. μ = 0 y σ = 0
d. μ = 0 y σ = 1
• Ejercicio 4. Halla Z para un área entre 0 y 4,60%
Ejercicio 4.
¿Cuál de las siguientes proposiciones es falsa acerca de los datos
que sigue la distribución normal?: ( ) El promedio es el mismo que el
modo. ( ) La desviación estándar es la misma que la media. ( ) La
mediana es el mismo que el modo. ( ) La mayoría de los datos está
dentro de 3 desviaciones estándar con respecto a la media.
R/ La desviación estándar es la misma que la media

Ejercicio 5.
La distribución que permite obtener respuesta a preguntas
relacionadas con la probabilidad de que un evento ocurra en
determinado plazo, el tiempo entre dos eventos sucesivos o el
tiempo que transcurre desde un determinado punto temporal hasta
un primer evento, se llama: ( ) Exponencial ( ) Normal ( ) Uniforme
( ) Poisson
R/ Exponencial
Ejercicio 6.
Solo 24 de los 200 alumnos de la EP XXX miden menos de 150 cm.
Si la estatura media de dichos alumnos es de 164 cm ¿cuál es su
varianza?
R. 141,965
Ejercicio 7.
El tiempo empleado para ir de Los Barracones al Aeropuerto Jorge Chávez por
la ruta A se distribuye como N(27; 5) minutos; por la ruta B la distribución es
N(30; 2) ¿Qué ruta conviene utilizar si se dispone de:

a) 30 minutos

b) 34 minutos
Ejercicio 8.
Se ha establecido que los niños en cierto grupo de edad de la
Residencial Los Barracones, tienen presiones diastólicas (mm
de Hg) que presentan una distribución aproximadamente
normal alrededor de una media de 57 con desviación estándar
de 8.
(a) ¿Sería una presión sanguínea de 74, desusadamente
alta en un niño de esta edad?
(b) ¿A partir de qué presión sanguínea se considerará
desusadamente alta? Asume que p = 1% en la población
extrema es de presión sanguínea alta.

Rpta. (a) La P es 1,7%: __________ (b) __________________


Cálculo de probabilidad por aproximación

µ = n*p; σ2 = n*p*q
Aproximación de una binomial por una normal.

Si X es una variable binomial B(n, p) donde n es grande y ni p ni q  1  p están


próximas a cero, entonces puede aproximarse por una variable normal N (  ,  )
haciendo coincidir media y varianza, es decir   np ,   npq . Por lo tanto, en estas
condiciones B(n, p) se puede aproximar por N (np, npq ) . Además, tendremos en
cuenta la corrección por continuidad, es decir,

Binomial Normal

P( X  a ) P(a  0,5  X  a  0,5)


P( X  a ) P( X  a  0,5)
P( X  a ) P( X  a  0,5)
P( X  a ) P( X  a  0,5)
P( X  a ) P( X  a  0,5)
P(a  X  b) P(a  0,5  X  b  0,5)
P(a  X  b) P(a  0,5  X  b  0,5)
P(a  X  b) P(a  0,5  X  b  0,5)
P(a  X  b) P(a  0,5  X  b  0,5)

Aproximación de una Poisson por una normal.

Si X es una variable de Poisson P ( ) , donde   20


10, podemos aproximarla por una
variable normal N ( ,  ) . También aquí es necesario realizar la corrección por
continuidad.
Ejemplo
Si 35% de los productos manufacturados por
Rosquin SA en su línea de producción de
tornillos transformer son defectuosos ¿cuál es
la probabilidad de que entre los siguientes
1000 productos manufacturados en esa línea
a) menos de 354 productos sean defectuosos?
b) entre 342 y 364 inclusive, productos sean
defectuosos?
c) exactamente 354 productos sean defectuo-
sos?
Rosquin SA, propuesta de solución:

a)
n = 1000
p = p (un producto sea defectuoso) = 0,35
q = p (un producto no sea defectuoso)
= 1 - p = 0,65
x = número de productos defectuosos que se
manufacturan en la línea = 0; 1; 2; ... ; 1000
Rosquin SA, propuesta...

X = 354 - 0,5
 = 350

p(x  353,5 ) = p(z <= 0,23) = 59,1%


Rosquin SA, propuesta...
b)

 = 350
X1 = 341,5 X2 = 364,5

p(341,5  x <= 364,5) = p(z1) + p(z2) = 0,2123 + 0,3315 = 54,38%


Rosquin SA, propuesta...

c)

 = 350 X2 = 354,5
X1 = 353,5

p(x = 354) = p(z2) - p(z1) = 0,1179 – 0,091 = 2,69%


Aproximación de la D. de P. Normal a la D. de P. Poisson

Aunque para n finito las distribuciones de Poisson


y Normal no coinciden, es posible aproximar la
primera por la segunda, de acuerdo a la regla
siguiente:

aproximar a la Normal de media λ,


λ ≥ 10
varianza λ
no aproximar, calcular con la variable
λ < 10
original
Ejemplo. En el proceso de fabricación de condensadores térmicos
(intercambiador de calor entre fluidos, de modo que mientras uno de ellos se
enfría, pasando de estado gaseoso a estado líquido, el otro se calienta),
varias pruebas han demostrado que la temperatura más alta (en °C) que
pueden soportar es N(125, 32 °C2). En los sistemas en que se utilizan, la
temperatura máxima (en °C) a que se sujeta un condensador individual es
N(116, 42) ¿Qué proporción de condensadores fallará por sobrecalentamien-
to?
Solución:
Propiedad. Si X ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2) son independientes, entonces X + Y ∼
N (µ1 + µ2, σ21 + σ22)
Sean: F = temperatura más alta de fabricación ~ N(125, 9) y
U = temperatura máxima de uso ~ N(116, 16)
Habrá falla por sobrecalentamiento (S) cuando S = F < U = F – U < 0.
Para hallar la proporción solicitada mediante P(S) = P(F < U) = P(F – U < 0)
determinamos la distribución de F – U usando la propiedad reproductiva de la
distribución normal, así:
F – U ~ N(9, 25) con Z = ( F – U – 9)/ 5 ~ N(0, 1).
Entonces:
𝐹−𝑈−9 0−9
P(S) = P(F < U) = P(F – U < 0) = P ≤ = P(Z ≤ -1,8) = Φ(-1,8) = 0,03593
5 5

Interpretación: alrededor del 3,59% de los condensadores fabricados falla por


sobrecalentamiento en los sistemas en que se utilizan.
Ejercicio 1.
La cementera Peter Punk produce cemento gris de
uso estructural (para la elaboración de morteros y
concretos, etc.) ha encontrado que en promedio, un
2% de las bolsas no cumple con la norma ¿Cuál es la
probabilidad que en 600 bolsas de cemento de uso
estructural seleccionadas al azar, se encuentren 15 o
más bolsas defectuosas?

R. 23,27%
Ejercicio 2. Co320.

En el distrito de Chiguata (Arequipa) se ha establecido que los sueldos,


en dólares neozelandeses, de las parejas de esposos son independien-
tes y que la distribución es N(350; 50) NZ$ para los hombres y N(250;
35) NZ$ para las mujeres, se pide:

a) ¿Cuál es la probabilidad de que el ingreso familiar sea superior a


NZ$720) R. 2,44%

b) Si se escoge al azar a los esposos Huamancurucho ¿cuál es la


probabilidad de que el sueldo del esposo sea mayor que el sueldo
de la esposa? R. 94,95%

c) Si se escoge al azar a los esposos Chuyuncuy ¿cuál es la


probabilidad de que cada sueldo de la pareja sea mayor que
NZ$300? R.6,43%
Distribución de probabilidad exponencial

Mientras que la distribución de Poisson describe las llegadas por


unidad de tiempo, la distribución exponencial estudia el tiempo entre
cada una de estas llegadas.

Si las llegadas son de Poisson el tiempo entre estas llegadas es


exponencial. Mientras que la distribución de Poisson es discreta la
distribución exponencial es continua porque el tiempo entre llegadas
no tiene que ser un número entero.

Esta distribución se utiliza mucho para describir el tiempo entre


eventos.

Ejemplos típicos de esta situación son el tiempo que un medico


dedica a una revisión, el tiempo de entregar una medicina en una
farmacia o el tiempo de atender en una caja de un retail.
Distribución exponencial
El uso de la distribución exponencial supone que los tiempos
de servicio son aleatorios, es decir, que un tiempo de servicio
determinado no depende de otro servicio realizado
anteriormente ni de la posible cola que pueda estar
formándose.
Otra característica de este tipo de distribución es que no
tienen “edad” o en otras palabras, “memoria”.
Por ejemplo, supongamos que el tiempo de atención de un
paciente en una sala quirúrgica sigue una distribución
exponencial. Si el paciente ya lleva 5 horas siendo operado,
la probabilidad de que esté una hora más es la misma que si
hubiera estado 2 horas, o 10 horas o las que sea.
Esto es debido a que la distribución exponencial supone que
los tiempos de servicio tienen una gran variabilidad.
A lo mejor el próximo paciente operado tarda una hora
porque su cirugía era mucho más simple que la anterior.
En el análisis del comportamiento de las Líneas de Espera, se reconoce
que el proceso de llegada de los clientes al sistema ocurre de forma
totalmente aleatoria.

Se entiende por aleatorio que la ocurrencia de un evento no se ve


afectado por el tiempo transcurrido desde la ocurrencia de un evento
anterior.

Por ejemplo, si en estos momentos son las 10:30 h y la última llegada de


un cliente fue a las 10:15, la probabilidad de que la siguiente llegada sea
a las 10:35 es función sólo de las 10:30 a las 10:35 y en consecuencia es
totalmente independiente del tiempo transcurrido desde la ocurrencia del
último evento, es decir, de las 10:15 a las 10:30. Este resultado se conoce
como falta de memoria o amnesia de la Distribución Exponencial.
En la distribución de Poisson la v. a. discreta es el número de eventos
raros que ocurren durante un intervalo determinado de tiempo,
espacio o distancia.
La distribución exponencial describe la v. a. continua, x = la cantidad
de tiempo, espacio o distancia entre las ocurrencia de estos eventos
raros.
Ejemplo. Si el número promedio de llegadas a la caseta de peaje La
Balanza ubicada en el km 3000 de Comas es λ = 5 automóviles por
minuto, la media de la distribución exponencial correspondiente será
1/λ = 0,20 minutos entre automóviles.
Distribución de p. exponencial…
El esquema de un sistema de línea de espera es el siguiente:

Llegadas Cola Servicio Salidas

Podemos asumir una serie de asunciones en la formulación matemá-


tica del modelo de cola:
1) Las llegadas al sistema son aleatorias, describiendo una distribu-
ción Poisson, con un cierto ritmo promedio. Este ritmo se
representa por la letra griega lambda (λ).
2) La duración del servicio es variable, describiendo una distribución
exponencial, con un cierto ritmo promedio. Este ritmo se
representa por la letra griega mu (μ). Tanto λ como μ son
parámetros básicos del modelo de cola.
Ahora imaginemos que las llegadas de solicitud de préstamo a la
biblioteca de la Facu ocurren a un ritmo medio de 2 alumnos por
minuto (λ = 2), en cambio el servicio de biblioteca puede despachar a
4 alumnos por minuto (μ = 4). Por tanto el despacho de préstamo a
veces estará ocioso. Como las llegadas son aleatorias unas veces
llegarán 4 personas, otras 8 y otras nadie. Por ese motivo algunas
veces se formarían colas.
Media y Varianza de la distribución exponencial
Exp ()
 1
 xe  x
dx 
0 
Función de cuantía de la distribución de p. exponencial

 x
f ( x )  e para x  0 y   0

Donde:
λ = denominado parámetro de escala
representa el número de eventos por
unidad de tiempo
e = constante matemática 2,71828183;
base del sistema logarítmico natural
Función de p. exponencial acumulada

En función a λ:

 x
1  e , x0
F ( x)  
 0, x0
O en función a µ:


1e
x

, x 0
F(x)  

 0, x 0
Ejemplo. La vida de cierto tipo de localizadores de
Sistema de Posicionamiento Global (GPS, por sus
siglas en inglés) fabricado por la agroexportadora
«Hijos de Fruta» tiene una distribución exponencial
con vida media de 500 horas. Si X representa la vida
útil de un GPS:
a) Halla la probabilidad que se inutilice a lo más a
las 300 horas.
b) ¿Cuál es la probabilidad que dure por lo menos
300 horas?
c) Si un GPS en particular ha durado 300 horas
¿Cuál es la probabilidad de que dure otras 400
horas adicionales como mínimo?
Propuesta de solución:
• Sabemos que µ = 1/, entonces  = 1/500

• La función de densidad de la v. a. X es:


f(x) = 1/500 e-x/500, para x ≥ 0

• La función de distribución de probabilidad


acumulada de la v. a. X es:
F(x) = 1 - e-x/500, para x ≥ 0
Para los valores entre 0 y 300 horas:

(a) P(X < 300) = F (300)


= 1 - e-300/500 = 1 - e-3/5 = 45,11%

(b) P(X > 300) = 1 – P(X < 300)


= 1 – (1 - e-3/5 ) = e-3/5 = 54,88%
Propiedad de la distribución de p. exponencial que se conoce
como la de “no tener memoria”

p X  ( a  b ) X  a =

p X  (a b) 
= =
p X  a 
= e -b

Otra forma. Las distribución exponencial no tiene memoria, es decir dada


X ∼ Exp(λ) y t1, t2 > 0, se tiene P(X > (t1 + t2) | X > t1) = P(X > t2).
C) Caso de los GPS…


P X  700│X  300  
P X  700 X  300

PX  300

Por propiedad de no memoria:

= e-4/5 = 44,93%
Ejercicio.
El tiempo durante el cual una batería compuesta de iones de aluminio y
litio "recargable y ultra rápida", que podría aplicarse en celulares
Chanchung y tablets Bambamarca trabaja en forma efectiva hasta que
falle (tiempo de falla) se distribuye según el modelo exponencial con un
tiempo promedio de fallas igual a 360 días. Responde:

(a) ¿Qué probabilidad hay de que el tiempo de falla sea mayor que 400
días?

(b) Si una de estas baterías ha trabajado ya 400 días ¿qué probabilidad


hay de que trabaje 200 días más?

(c) Si se están usando 5 de tales baterías calcula la probabilidad de que


más de dos de ellas continúen trabajando después de 360 días.

R. (a) 32,9% (b) 57,4% (c) p(x>360) = 36,8% y p(y>=3) = 26,38%


Teorema Central del Límite (TCL o TLC)
Imagina que tienes una población con media µ y desviación
típica σ y que extraes aleatoriamente todas las posibles muestras,
todas ellas de tamaño n. Si obtuvieras las medias de todas estas
muestras, y las consideras una distribución de datos (la distribución
muestral de medias), comprobarías que:
a) La media de los datos, es la media µ de la población, es decir
la media de las medias de las muestras, es igual que la media de la
población.
b) Estas medias se distribuyen alrededor de la media de la pobla-
ción, con una desviación típica (desviación típica de la media,
error típico, error estándar) igual a la de la población dividida por
la raíz de n:
𝜎 desviación estándar poblacional
𝜎𝑌 = =
𝑛 tamaño de muestra
TCL...
c) La distribución de las medias muestrales, es una
distribución de tipo "normal", siempre que la población de
procedencia lo sea, o incluso si no lo es, siempre que el tamaño
de las muestras sea 30 o mayor.
En consecuencia, "si una población tiene media µ y desviación
típica σ, y tomamos muestras de tamaño n (de tamaño al menos
30, o cualquier tamaño, si la población es "normal"), las medias
de estas muestras siguen aproximadamente la distribución
normal con:
(X1  ....  X n )  nμ Xμ
Z 
2 σ
nσ n
Si población es una d. p. normal, no importa el tamaño de n:

tamaño n
Si la población es diferente a la d. p. normal, para un tamaño de
muestra (n) >= 30, se cumple:

n
Ejemplo 1.

La máquina expendedora de refrescos Bimbo


está programada para que la cantidad de
refrescos que sirve sea una v. a. con una media
de 200 mililitros y una desviación estándar de
15 mililitros:
(a) ¿Cuál es la probabilidad de que la cantidad
media de refresco servido en una muestra
aleatoria de 36 refrescos sea por lo menos 204
mililitros?
(b) Si se elige un vaso aleatoriamente ¿cuál es la
p. que el vaso tenga por lo menos 204 ml?
Bimbo...
Propuesta de solución: (a)

(b)
Ejemplo 2. La renta media de los habitantes de Lilliput se
distribuye uniformemente entre S/4,0 millones y S/10,0
millones. Calcula la probabilidad de que al seleccionar al azar
a 100 lilliputienses la suma de sus rentas supere los S/725
millones.
Solución. Cada renta personal es una variable independiente
que se distribuye según una función uniforme. Por ello, a la
suma de las rentas de 100 personas se le puede aplicar el
Teorema Central del Límite.
La media y varianza de cada variable individual es:
µ = (4 + 10 ) / 2 = 7
σ2 = (10 - 4)^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye según
una normal cuya media y varianza son:
• Media de la suma: n * µ = 100 * 7 = 700
σ
• Varianza de la suma: n * ( )2 = 3
𝑛
Lilliput...
Cálculo de la probabilidad de que la suma de las rentas
sea superior a S/725 millones:
(X1  ....  X n )  nμ
Z

nσ 2

P (X > 725) = P (Z > 1,44) = 1 - P (Z < 1,44)


= 1 - 0,9251 = 0,0749

Es decir, la probabilidad de que la suma de las rentas de


100 lilliputienses seleccionados al azar supere los
S/725 millones es tan solo del 7,49%.
Ejercicio.

La longitud a la que se puede estirar sin ruptura un filamento de nailon (nilón,


nylon) es una variable aleatoria exponencial con media de 5000 feet ¿Cuál es
la probabilidad de que la longitud promedio de 100 filamentos esté
comprendida entre 4750 y 5550 feet?
R.R. 0,5558

También podría gustarte