Cap2-Distribuicoes_Parametricas
Cap2-Distribuicoes_Parametricas
Cap2-Distribuicoes_Parametricas
As variáveis aleatórias que estão associadas a grande parte das experiências podem ser
representadas por modelos paramétricos (distribuições de probabilidade) e cujas propriedades de
localização, escala e forma são funções de poucos parâmetros.
Distribuições discretas:
Uniforme, U {x1 , x2 , · · · , xn }
Bernoulli, Bernoulli(p)
Binomial, Bi(n,p)
Poisson, Poisson(λ)
Distribuições contı́nuas:
Uniforme, U[a, b]
Exponencial, Exp(λ)
Normal, N(µ, σ)
Qui-quadrado (χ2 ), t-student, Fisher-Snedecor.
distribuição uniforme
1
X _ U{x1 , x2 , · · · , xn }; P(X = xi ) = , i = 1, 2, ..., n.
n
Uma v.a. de Bernoulli toma os valores 0 e 1 (0 se ocorre o insucesso; 1 caso contrário) com
P(”sucesso”) = P(X = 1) = p e P(”insucesso”) = P(X = 0) = 1 − p.
distribuição de Bernoulli
X _ Bernoulli(p), p ∈]0, 1[
P(X = k) = pk (1 − p)1−k , k = 0, 1
P(X = 1) = p e P(X = 0) = 1 − p
n k
P(X = k) = k
p (1 − p)n−k , k = 0, 1, 2, . . . , n
Bi(1, p) ≡ Bernoulli(p)
distribuição Binomial
Exemplo 2: Seja X, o número de termómetros calibrados com exatidão num grupo de 5, é uma
v.a. binomial com p = 0.8.
5
X ∼ Bi(5, 0.8) ⇒ P(X = k) = k
0.8k (1 − 0.8)5−k , k = 0, · · · , 5.
5
a) P(X = 5) = 5
0.85 ∗ 0.20 = 0.85 = 0.3277
5
b) P(X ≥ 4) = P(X = 4) + P(X = 5) = 4
∗ 0.84 ∗ 0.2 + 0.85 = 0.7373
No R:
0.25 0.4
0.25
0.20
0.3
0.20
0.15
0.15
P(X=k)
P(X=k)
P(X=k)
0.2
0.10
0.10
0.1
0.05 0.05
0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10
k k k
0.25
1.0
0.20
0.8
0.15
0.6
Fx
fx
0.10
0.4
0.05
0.2
0.00
0.0
0 2 4 6 8 10 0 2 4 6 8 10
x x
funções no R
Cada modelo tem quatro funções obtidas pelo nome da distribuição precedido da letra d, p ,
q ou r:
d - densidade ou massa de probabilidade;
Exercı́cio: Indique o significado dos seguintes comandos: dbinom(3, 4, 0.7); pbinom(3, 4, 0.7);
qbinom(0.9, 4, 0.7) e rbinom(20, 4, 0.7).
distribuição de Poisson
distribuição de Poisson
Seja λ > 0, o número médio de ocorrências, num dado intervalo de tempo (ou região do
espaço);
X a v.a. que representa o número de ocorrências nesse intervalo, assume os valores no
conjunto {0, 1, ...}. Então diz-se que X segue uma distribuição de Poisson, e escreve-se
X _ Poisson(λ)
A f.m.p. é
λk
P(X = k) = e−λ , k = 0, 1, 2, . . .
k!
µ = E[X] = λ e σ 2 = Var[X] = λ.
No R: dpois(x, lambda)
distribuição de Poisson
Exemplo 4: O número de microscópios que avariam por mês, num laboratório é uma v.a. com
distribuição de Poisson com valor médio λ = 3.
a) Qual a probabilidade, num mês, de o número de microscópios avariados ser superior a 6?
b) Determine a capacidade mı́nima da empresa de reparações de modo que se reparem pelo
menos 90% dos microscópios avariados.
e−3 3k
X _ Poisson(3) ⇒ P(X = k) = , k = 0, 1, · · · .
k!
6
X e−3 3k
a) P(X > 6) = 1 − P(X ≤ 6) = 1 − = 0.0335
k=0
k!
x
X e−3 3k
b) P(X ≤ x) ≥ 0.9 e P(X ≤ x) = , tendo-se P(X ≤ 4) = 0.8115 e P(X ≤ 5) = 0.9125,
k=0
k!
donde x = 5.
Distribuição de Poisson
Exemplo 4 (cont.):
No software R:
[1]0.03350854
[1]0.03350854
b) qpois(0.90, 3)
[1]5
distribuição de Poisson
Exemplo 5:
Um material radioativo emite partı́culas α a uma taxa de 2 por cada milisegundo. Determine as
probabilidades de:
a) serem emitidas 2 partı́culas num milisegundo;
distribuição de Poisson
22
a) Para t = 1, X1 _ Poisson(2), P(X1 = 2) = e−2 = 0.2707
2!
44
b) Para t = 2, X2 _ Poisson(4), P(X2 = 4) = e−4 = 0.1954
4!
c) Para t = 2, X2 _ Poisson(4),
40 41 42
= 1 − e−4 { + + }
0! 1! 2!
= 0.7619
distribuição de Poisson
Exemplo 5 (cont.):
No software R:
a) P(X1 = 2) = 0.2707
> dpois(2, 2)
[1]0.2706706
b) P(X2 = 4) = 0.1954
> dpois(4, 4)
[1]0.1953668
> 1 − ppois(2, 4)
[1]0.7618967
var(X) = σ 2 − µ)2 pi
P
variância i (xi
1
− µ)3 pi
P
coef. assimetria β1 σ3 i (xi
1
− µ)4 pi
P
coef. achatamento β2 σ4 i (xi
n+1 n2 −1 6 n2 +1
U{1, ..., n} n>1 2 12
0 3− 5 n2 −1
1−6 p(1−p)
Bi(n, p) 0<p<1 np np(1 − p) √ 1−2p 3+ np(1−p)
np(1−p)
n>0
Poisson(λ) λ>0 λ λ √1 3+ 1
λ λ
distribuição uniforme (contı́nua)
Uma variável aleatória X segue a distribuição uniforme no intervalo [a, b] com a função
densidade de probabilidade (f.d.p.):
1
, x ∈ [a, b]
f (x) = b − a
0 x∈
/ [a, b]
0, x<a
x−a
F(x) = , x ∈ [a, b[
b−a
1 x≥b
a+b (b − a)2
com µ = E[X] = e σ 2 = Var[X] = .
2 12
distribuição uniforme
1.0
0.8
0.8
0.6
0.6
duniforme
duniforme
0.4
0.4
0.2
0.2
0.0
0.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0
x x
X _ U[1, 2]
Exemplo 6: Sabendo que o atraso nas consultas de um gabinete médico segue uma distribuição
uniforme U[0, 30] minutos. Calcule:
30
µ = E[X] = = 15 min
2
(30)2 √
σ 2 = Var[X] = = 75 ⇒ σ = 75 = 8.66 min.
12
distribuição exponencial
Uma variável aleatória X tem distribuição exponencial com parâmetro λ (λ > 0) se a f.d.p.
for dada por:
0, x<0
f (x) =
λe−λx , x≥0
1 1
com µ = E[X] = e σ 2 = Var[X] = 2 .
λ λ
1, x<0
Alternativa: X _ Exp(λ) ⇔ P(X > x) =
e−λx , x≥0
1.0
4
0.8
3
0.6
distexp
dexp
0.4
1
0.2
0.0
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0
x x
distribuição exponencial
Exemplo 7: Seja T a v.a. que representa a duração de vida (em horas) de uma bactéria de certo
tipo, e admita que T _ Exp(0.5).
No R:
[1]0.2386512
distribuição normal
A distribuição Normal ou Gaussiana, é uma distribuição contı́nua cuja função densidade tem
a forma de sino e é muito utilizada em estatı́stica. Uma variável aleatória X segue uma
distribuição Normal cuja f.d.p. é da forma:
2
1 − 12 x−µ
f (x) = √ e σ , x∈R
2πσ 2
1
Z x t−µ
2
− 12
F(x) = P(X ≤ x) = √ e σ dt.
2πσ 2 −∞
distribuição normal
Exemplo 8: Sabendo que a duração de um certo tratamento segue uma distribuição normal com
média 850 dias e desvio-padrão 45 dias. Calcule a probabilidade do tratamento durar:
entre 700 e 1000 dias
> pnorm(1000, 850, 45) − pnorm(700, 850, 45) # cálculo de P(700 < X < 1000)
[1]0.9991419
Qual deve ser o número de dias necessário para haver uma eficácia de 5% ?
> qnorm(0.05, 850, 45)
[1]775.9816
distribuição normal reduzida
X−µ
Z= _ N(0, 1)
σ
1
Z x 1 2
Φ(x) = F(x) = P(Z ≤ x) = √ e− 2 t dt
2π −∞
1.0
0.8
0.3
0.6
distnorm
dnorm
0.2
0.4
0.1
0.2
0.0
0.0
−6 −4 −2 0 2 4 6 −6 −4 −2 0 2 4 6
x x
Exemplo 9:
Sendo X _ N(5, 2), calcular P(X < 7).
X−5 7−5
P(X < 7) = P( < ) = P(Z < 1) = Φ(1) = 0.84134
2 2
> pnorm(7, 5, 2)
[1]0.8413447
1
(x − µ)3 f (x) dx
R
coef. assimetria β1 σ3
1
(x − µ)4 f (x) dx
R
coef. achatamento β2 σ4
1 1 log2
Exp(λ) λ>0 λ λ2 λ
2 9
N(µ, σ) µ∈R µ σ2 µ 0 3
σ>0
propriedades da distribuição normal
Φ(−x) = 1 − Φ(x);
√
Se X _ N(µ, σ) e Y = aX + b com a e b constantes, então Y _ N(aµ + b, a2 σ 2 );
µ1 = nµ e σ12 = nσ 2 ;
√
Se Xi _ N(µ, σ), i = 1, 2, . . . , n, são v.a.’s i.i.d.’s então X _ N(µ, σ/ n).
Exemplo 10: O peso de um homem é uma v.a. com distribuição N(75, 5). Qual a probabilidade do
peso de 4 homens (com pesos independentes) não exceder 320kg?
4
X
Considerando Y = Xi com Xi _ N(µ = 75, σ = 5), i = 1, ..., 4, Y _ N(µY , σY ) com
i=1
No R:
> pnorm((320 − 300)/10, 0, 1)# cálculo de P(Z ≤ 2)
[1]0.9772499
> pnorm(320, 300, 10)# cálculo de P(Y ≤ 320)
[1]0.9772499
distribuição normal no R
rnorm(n, mean = ..., sd = ...) simula uma amostra de dimensão n da distribuição normal
com µ (mean) e σ (sd).
Para uma amostra aleatória X1 , X2 , . . . , Xn , proveniente de uma distribuição normal N(µ, σ),
n
1X
consideremos a v.a. média amostral X = Xi e a v.a. variância amostral
n i=1
n
2 1 X 2
S = Xi − X :
n − 1 i=1
X−µ
Z= √ _ N(0, 1);
σ/ n
X−µ
T= √ _ tn−1 , distribuição t de Student com n − 1 graus de liberdade;
S/ n
S2
U = (n − 1) _ χ2n−1 , distribuição qui-quadrado com n − 1 graus de liberdade.
σ2
distribuições contı́nuas auxiliares
Então,
S2 σ 0 2
V= _ Fn−1;m−1 , distribuição F de Fisher-Snedecor com
S0 2 σ 2
a probabilidade de X estar próximo de µ (tão próximo quanto se queira, > 0) tende para 1.
Se n for grande a frequência relativa será uma boa estimativa para P(A) (teoria frequencista
de probabilidade).
teorema do limite central (TLC)
n
X
Xi − nµ
i=1 X−µ
√ ≈ N(0, 1) ou √ ≈ N(0, 1)
σ n σ/ n
Nota 1: O teorema pode ser aplicado para amostras de dimensão n > 30 desde que a
distribuição de X não seja muito assimétrica.
n
X √ √
Nota 2: Xi ≈ N(nµ, σ n) ; X ≈ N(µ, σ/ n)
i=1
Sendo Xi _ U[0, 10] então µ = E[Xi ] = 5 e σ 2 = Var[Xi ] = 102 /12 = 100/12 = 8.3333.
P40
i=1 Xi − 40E[Xi ]
p ≈ N(0, 1)
40Var[Xi ]
teorema do limite central
√
Var( 40 2 = 40 ∗ 8.3333 ⇒
P
i=1 X i ) = 40 σ 40 ∗ 8.3333 = 18.2574
P40 !
i=1 Xi − 200 230 − 200
P
40
P i=1 X i < 230 =P < = P(Z < 1.6432) = Φ(1.6432) =
18.2574 18.2574
= 0.9498
No R:
40
!
X
> pnorm((230 − 200)/18.2574, 0, 1) #cálculo da P Xi < 230 = P(Z < 1.6432)
i=1
[1]0.949826
Se Xi _ Poisson(λ),
√ i = 1, ..., n, então Sn = X1 + X2 + · · · + Xn _ Poisson(nλ) e pelo TLC
Sn ≈ N(λ, λ), para λ grande
bi(200,0.3) vs N(60, 42) Poisson(100) vs N(100, 100)
0.04
0.06
0.05
0.03
0.04
0.03 0.02
0.02
0.01
0.01
0.00 0.00
x − µ1 x − µ2
com y1 = e y2 = .
σ1 σ2
ρ = 0 ⇔ X e Y são independentes
No R:
mvrnorm (no pacote MASS), dmvnorm (no pacote mvtnorm)
X _ tn−1 t
X _ Fn−1;m−1 f
Exemplo:
1.0
2
0.8
1
quantis empíricos
quantis empíricos
0.6
0
0.4
−1
0.2
−2
0.0
−2 −1 0 1 2 −2 −1 0 1 2
qqline adiciona ao gráfico quantil-quantil uma reta que passa nos 1o e 3o quartis do modelo
normal.
qqnorm para amostra normal qqnorm para amostra uniforme
1.0
2
0.8
1
quantis empíricos
quantis empíricos
0.6
0
0.4
−1
0.2
−2
0.0
−2 −1 0 1 2 −2 −1 0 1 2