Lista 2 Inf Gabarito
Lista 2 Inf Gabarito
Lista 2 Inf Gabarito
(Q.1) Bussab & Morettin (5ª edição) Cap.10, Ex.3. A distribuição do número de filhos, por
família, de uma zona rural está no quadro abaixo.
No de filhos Porcentagem
0 10
1 20
2 30
3 25
4 15
Total 100
(a) [ignorar]
(b) Dê, na forma de uma tabela de dupla entrada, as possíveis amostras de duas famílias que
podem ser formadas e as respectivas probabilidades de ocorrência [trata-se, pois, de
amostras de tamanho 2];
(c) Se fosse escolhida uma amostra de tamanho 4, qual seria a possibilidade de observar a
quádrupla ordenada (2,3,3,1)?
R:
(b)
Família 1 /
0 1 2 3 4
família 2
0 1,00% 2,00% 3,00% 2,50% 1,50%
1 2,00% 4,00% 6,00% 5,00% 3,00%
2 3,00% 6,00% 9,00% 7,50% 4,50%
3 2,50% 5,00% 7,50% 6,25% 3,75%
4 1,50% 3,00% 4,50% 3,75% 2,25%
1
(c)
(Q.2) Bussab & Morettin (5ª edição) Cap.10, Ex.6 (adaptado) Com base nos dados da
questão anterior e para amostras de tamanho 2:
R:
Uma maneira de fazer é gerando, como primeiro passo, uma tabela com todos os valores
possíveis da média e respectivas probabilidades de ocorrência, essas últimas definidas
pela tabela da questão anterior (ou seja, assume-se AAS). No segundo passo tal tabela é
agregada, somando-se as probabilidades de ocorrência para cada valor da média (uma
vez que há valores repetidos na tabela do primeiro estágio).
2
Família Família Probabilidade da
Média
1 2 média
0 0 0 0,01
0 1 0,5 0,02
0 2 1 0,03
0 3 1,5 0,025
0 4 2 0,015
1 0 0,5 0,02
1 1 1 0,04
1 2 1,5 0,06
1 3 2 0,05
1 4 2,5 0,03
2 0 1 0,03
2 1 1,5 0,06
2 2 2 0,09
2 3 2,5 0,075
2 4 3 0,045
3 0 1,5 0,025
3 1 2 0,05
3 2 2,5 0,075
3 3 3 0,0625
3 4 3,5 0,0375
4 0 2 0,015
4 1 2,5 0,03
4 2 3 0,045
4 3 3,5 0,0375
4 4 4 0,0225
3
(b) Apresente o histograma da distribuição amostral de 𝑋̅;
(d) Se as amostras fossem de tamanho 4, a P(|𝑋̅ – μ|> 1) seria maior ou menor do que a
probabilidade encontrada em (c)? Justifique com base nas estatísticas média e variância
calculadas para a variância amostral, com o histograma apresentado em (b) e na noção de
FD.
4
para N = 2. De fato, se espera que, com tal aumento de N, a FD de 𝑋̅ se altere com o
aumento da massa de probabilidade nas proximidades de μ e queda da massa de
probabilidade para níveis mais afastados de μ.
(Q.3) Bussab & Morettin (5ª edição) Cap.10, Ex.24 A distribuição dos comprimentos dos
elos da corrente de uma bicicleta é normal, com média 2 cm e variância 0,01 cm 2. Para que
uma corrente se ajuste à bicicleta, deve ter comprimento total entre 58 e 61 cm.
(a) Qual é a probabilidade de uma corrente com 30 elos não se ajustar à bicicleta?
[Observação: suponha que os elos sejam selecionados aleatoriamente ao acaso para compor
a corrente, de modo que se tenha independência]
R: Seja X1,...,XN uma amostra aleatória simples (AAS), N = 30, com S = X1+X2+...+XN,
E[Xi] = Nµ = 30*2=60, V[Xi] = σ2 = 0,01, i=1,...N.
(item a) P(S < 58 ou S > 61) = P(S < 58) + P(S > 61) = P(S < 58) + 1- P(S < 61) = 1 +
P(S < 58) - P(S < 61).
O próximo passo é padronizar S, de modo a obter uma variável resultante como densidade
de probabilidade normal padrão, i.e., N(0,1) (ver detalhes na próxima resolução).
(Q.4) Bussab & Morettin (5ª edição) Cap.10, Ex.27 Um distribuidor de sementes
determina, por meio de testes, que 5% das sementes não germinam. Ele vende pacotes com
200 sementes com garantia de 90% de germinação. Qual é a probabilidade de que um
pacote não satisfaça à garantia?
5
R: A dificuldade desta questão estava em (i) a omissão, no enunciado, da hipótese de que a
FD subjacente é uma normal, (ii) a necessidade de conhecer a média e variância
populacionais da estatística proporção amostral, (iii) a conveniência de padronizar a
estatística para, com isso, tomar por base a distribuição normal padrão (esta conveniência
não era necessária, caso fosse utilizado um software para obter a probabilidade).
Passo 1: Pergunta a ser respondida. Trata-se de calcular P(𝑝̂ < 0,9), em que 𝑝̂ ≡
proporção amostral. Para isso, é preciso conhecer a FD subjacente à estatística proporção
amostral.
A proporção é uma média de variáveis binárias. Seja considerada uma amostra aleatória
simples X1,...,XN, com Xi, i=1,..,N sendo variáveis binárias. Este último fato implica em que
Xi ~ Bernoulli(p), i=1,...,N, de modo que E[Xi] = p e V[Xi] = p(1-p)
Assim:
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 1
𝜎 2 = 𝑉[𝑝̂ ] = 𝑉 [ ] = 2 𝑉[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 ]
𝑁 𝑁
Porém, X1,...,XN compõem uma amostra aleatória simples, sendo variáveis aleatórias
independentes. Assim sendo:
1 1
𝜎 2 = 𝑉[𝑝̂ ] = 2
𝑉[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 ] = 2 (𝑉[𝑋1 ] + 𝑉[𝑋2 ] + ⋯ + 𝑉[𝑋𝑁 ])
𝑁 𝑁
𝑁𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
= =
𝑁2 𝑁
Importante: o desvio-padrão populacional é, pois:
6
𝑝(1 − 𝑝)
𝜎= √
𝑁
0,95 ∗ 0,05
𝜎= √ ~0,0154
200
Trata-se de calcular P(𝑝̂ < 0,9), considerando que 𝑝̂ ~𝑁(0,95; 0,01542 ). Ocorre que os
valores da média e variância são específicos demais e por isso, por exemplo, não
correspondem às tabelas da FD normal encontradas nos apêndices de livros de estatística.
Por isso é comum padronizar a estatística 𝑝̂ , i.e., subtraí-la de sua média populacional e
dividir o resultado por seu desvio padrão populacional. Com isso, obtém-se uma variável
aleatória com FD normal padrão, i.e., com média zero e variância unitária. Por coerência,
essa operação deve ser realizada em ambos os lados da desigualdade interna à
probabilidade que se deseja calcular, como segue.
Em que Z representa uma variável aleatória com FD normal padrão, i.e., Z ~ N(0,1).
𝑝̂−𝐸[𝑝̂] 𝑋𝛾 −𝐸[𝑝̂]
(Nota: a forma geral da padronização é 𝑃 ( < ))
√𝑉[𝑝̂] √𝑉[𝑝̂]
Aplicando no R a função pnorm(Zγ, µ, σ) = P(X ≤ Zγ) (ou seja, essa função reporta a
probabilidade à esquerda do número Zγ), com Zγ =-3,244 µ = 0, σ =1, obtém-se
0.000588433 ~ 0,06%).
(Q.5) Uma entidade privada apenas apoia candidatos com porcentagem de votos acima de
10%. Para decidir quanto ao apoio a um candidato em específico, a entidade dispõe de
orçamento limitado, e vai coletar uma amostra aleatória de tamanho 100. Suponhamos que
seja cabível assumir que a função densidade da porcentagem amostral de votos seja normal
para o candidato e que a porcentagem de votos “verdadeira” (populacional) seja de 9% para
o candidato (porém a entidade privada não sabe disso). Qual é a probabilidade da entidade
decidir por apoiar após observar as informações contidas na amostra?
R:
Deseja-se calcular P(𝑝̂ > 0.1). Com base no enunciado e na resolução dos itens anteriores,
E[𝑝̂ ] = 0.09 e DP[𝑝̂ ] = √0.09(0.91)/100~0,02862. Deste modo:
7
P(𝑝̂ > 0.1) = P(Z > (0.1 – 0.09)/0.02862) = 1 - P(Z < (0.1 – 0.09)/0.02862) ~ 36,34%
(Q.6) Bussab & Morettin (5ª edição) Cap.10, Ex.8 A máquina de empacotar um
determinado produto o faz segundo uma distribuição normal, com média μ e desvio padrão
10 g. De hora em hora será retirada um amostra de quatro pacotes e esses serão pesados. Se
a média da amostra for inferior a 495 g ou superior a 520 g, encerra-se a produção para
reajustar a máquina, isto é, reajustar o peso médio.
(a) Em quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham
menos do que 500 g?
(b) Com a máquina assim regulada, qual é a probabilidade de ser feita uma parada
desnecessária?
R: Para responder o item (a) basta encontrar μ tal que P(𝑋̅ < 500|μ) = 0,1.
Padronizando:
𝑋̅ −𝜇 500−𝜇 500−𝜇 500−𝜇
𝑃( < ) = 𝑃 (𝑍 < ) = 𝑃 (𝑍 < ) = 0,1, em que Z ~ N(0,1) (1)
𝜎/√𝑁 𝜎/√𝑁 𝜎/√𝑁 10/2
De acordo com a tabela da N(0,1) (ou com o comando qnorm do R), P(z<-1,282) = 0,1 (2)
500 − 𝜇
= − 1,282 → 𝜇 = 506,41
5
Quanto ao item (b), é preciso entender o que significa uma parada desnecessária. Isso de
fato não é claro pelo enunciado. Este dá a entender que a grandeza “peso médio” é
ajustável e deve ser ajustada de maneira a manter a massa dos pacotes dentro de um
intervalo pré-definido, no caso 495 e 520 g. A dificuldade de interpretação está em
perceber que “peso médio” é a média populacional, enquanto que o peso (ou massa)
médio da amostra de quatro pacotes é a média amostral. Em suma, uma parada
desnecessária ocorre sempre que (i) a média amostral está fora do intervalo de 495 a 520
gramas e (ii) a média populacional está dentro de tal intervalo (pois não há, neste caso,
necessidade de um ajuste). A probabilidade a ser calculada é:
8
495−506,41 520−506,41 −11,41
Padronizando, tem-se: 𝑃 (𝑍 < ) + 𝑃 (𝑍 > ) = (𝑍 < )+
5 5 5
13,59
𝑃 (𝑍 > ) = (𝑍 < −2,82) + 𝑃(𝑍 > 2,718) = 0,01452856~1,5%.
5
P(495 < 𝑋̅ < 520 |μ=500) = 1 - P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |μ=500)