Lista 2 Inf Gabarito

Lista 2
(Q.1) Bussab & Morettin (5ª edição) Cap.10, Ex.3. A distribuição do número de filhos, por
família, de uma zona rural está no quadro abaixo.
No de filhos Porcentagem
0 10
1 20
2 30
3 25
4 15
Total 100
(a) [ignorar]
(b) Dê, na forma de uma tabela de dupla entrada, as possíveis amostras de duas famílias que
podem ser formadas e as respectivas probabilidades de ocorrência [trata-se, pois, de
amostras de tamanho 2];
(c) Se fosse escolhida uma amostra de tamanho 4, qual seria a possibilidade de observar a
quádrupla ordenada (2,3,3,1)?
R:
(b)
Foi omitida do enunciado a importante informação de que as duas famílias são

selecionadas aleatoriamente, sendo, pois, duas observações independentes e identicamente
distribuídas. O que permite calcular a probabilidade do evento simultâneo em que a
primeira família tenha x1 filhos e a segunda x2 filhos, P(X=x1 e X = x2), como produto das
probabilidades individuais, i.e., P(X=x1) e P(X = x2). O que foi utilizado para gerar a
tabela abaixo.
Família 1 /
0 1 2 3 4
família 2
0 1,00% 2,00% 3,00% 2,50% 1,50%
1 2,00% 4,00% 6,00% 5,00% 3,00%
2 3,00% 6,00% 9,00% 7,50% 4,50%
3 2,50% 5,00% 7,50% 6,25% 3,75%
4 1,50% 3,00% 4,50% 3,75% 2,25%
1
(c)
Assumindo que se trata de uma AAS, tem-se que P(X1 = 2 e X2 = 3 e X3 = 3 e X4 = 1) =

P(X1=2)P(X2=3)P(X3=3)P(X4=1) = (30/100) (25/100) (25/100) (15/100) = 0,0028125.
(Q.2) Bussab & Morettin (5ª edição) Cap.10, Ex.6 (adaptado) Com base nos dados da
questão anterior e para amostras de tamanho 2:
(a) construa a distribuição amostral de 𝑋̅ (média amostral) seguindo, para isso, o

procedimento do exemplo 10.9 (5ª edição do livro), o que pressupõe o cálculo de duas
tabelas;
R:
Uma maneira de fazer é gerando, como primeiro passo, uma tabela com todos os valores
possíveis da média e respectivas probabilidades de ocorrência, essas últimas definidas
pela tabela da questão anterior (ou seja, assume-se AAS). No segundo passo tal tabela é
agregada, somando-se as probabilidades de ocorrência para cada valor da média (uma
vez que há valores repetidos na tabela do primeiro estágio).
As tabelas do primeiro estágio e do segundo estágio seguem abaixo, nesta ordem.
2
Família Família Probabilidade da
Média
1 2 média
0 0 0 0,01
0 1 0,5 0,02
0 2 1 0,03
0 3 1,5 0,025
0 4 2 0,015
1 0 0,5 0,02
1 1 1 0,04
1 2 1,5 0,06
1 3 2 0,05
1 4 2,5 0,03
2 0 1 0,03
2 1 1,5 0,06
2 2 2 0,09
2 3 2,5 0,075
2 4 3 0,045
3 0 1,5 0,025
3 1 2 0,05
3 2 2,5 0,075
3 3 3 0,0625
3 4 3,5 0,0375
4 0 2 0,015
4 1 2,5 0,03
4 2 3 0,045
4 3 3,5 0,0375
4 4 4 0,0225
Média Probabilidade da média

0 0,01
0,5 0,04
1 0,1
1,5 0,17
2 0,22
2,5 0,21
3 0,1525
3,5 0,075
4 0,0225
3
(b) Apresente o histograma da distribuição amostral de 𝑋̅;
R: na figura à esquerda há o gráfico exato da distribuição de 𝑋̅ (também podendo ser

entendido como um histograma) enquanto que, no gráfico à direita há o histograma com
faixas de tamanho unitário.
(c) Calcule P(|𝑋̅ – μ|> 1)
R: Deve-se considerar que, como a FD da variável aleatória X é exatamente conhecida,

E[X] = μ também é exatamente conhecida e, no caso, igual a 2,15 (basta calcular a média
a partir do enunciado da questão anterior). O item “c” pois pede para calcular P(|𝑋̅ –
2,15| > 1) = P(𝑋̅ – 2,15 < -1 ou 𝑋̅ – 2,15 > 1) = P(𝑋̅ < 1,15 ou 𝑋̅ > 3,15) = P((𝑋̅ = 0 ou 𝑋̅
= 0,5 ou 𝑋̅ = 1) ou (𝑋̅ = 3,5 ou 𝑋̅ = 4)) = P(𝑋̅ = 0) + P(𝑋̅ = 0,5) + P(𝑋̅ = 1) + P(𝑋̅ = 3,5)
+ P(𝑋̅ = 4) = 0,01+0,04+0,1 + 0,075 + 0,0225 = 0,2475.
(d) Se as amostras fossem de tamanho 4, a P(|𝑋̅ – μ|> 1) seria maior ou menor do que a
probabilidade encontrada em (c)? Justifique com base nas estatísticas média e variância
calculadas para a variância amostral, com o histograma apresentado em (b) e na noção de
FD.
R: há um erro no enunciado. O termo “variância amostral” deve ser substituído por

“média amostral” para responder à questão. Conforme visto em sala de aula, E[𝑋̅] = μ e
V[𝑋̅] = σ2/N, ou seja, com o aumento da amostra, a média de 𝑋̅ se mantém constante, mas
a variância é reduzida. O histograma no item “b” se assemelha à função de distribuição
normal, cujo parâmetro variância tem magnitude diretamente proporcional à massa de
probabilidade referente a níveis distantes de μ (probabilidade das caudas). Assim, se a
variância de 𝑋̅ cai com o aumento de N, valores distantes de μ têm de se tornar menos
prováveis e, portanto, P(|𝑋̅ – μ|> 1) tem de ser obrigatoriamente menor para N = 4 do que
4
para N = 2. De fato, se espera que, com tal aumento de N, a FD de 𝑋̅ se altere com o
aumento da massa de probabilidade nas proximidades de μ e queda da massa de
probabilidade para níveis mais afastados de μ.
(Q.3) Bussab & Morettin (5ª edição) Cap.10, Ex.24 A distribuição dos comprimentos dos
elos da corrente de uma bicicleta é normal, com média 2 cm e variância 0,01 cm 2. Para que
uma corrente se ajuste à bicicleta, deve ter comprimento total entre 58 e 61 cm.
(a) Qual é a probabilidade de uma corrente com 30 elos não se ajustar à bicicleta?
(b) E para uma corrente com 29 elos?
[Observação: suponha que os elos sejam selecionados aleatoriamente ao acaso para compor
a corrente, de modo que se tenha independência]
R: Seja X1,...,XN uma amostra aleatória simples (AAS), N = 30, com S = X1+X2+...+XN,
E[Xi] = Nµ = 30*2=60, V[Xi] = σ2 = 0,01, i=1,...N.
Com isso, E[S] = E[X1]+E[X2]+...+E[XN] = Nµ. E, adicionalmente, V[S] =

V[X1+X2+...+XN]. Porém, como X1,...,XN são independentes (AAS), então V[S] = V[X1]
+ V[X2]+...+V[XN] = Nσ2 = 30*0,01 = 0,3.
(item a) P(S < 58 ou S > 61) = P(S < 58) + P(S > 61) = P(S < 58) + 1- P(S < 61) = 1 +
P(S < 58) - P(S < 61).
O próximo passo é padronizar S, de modo a obter uma variável resultante como densidade
de probabilidade normal padrão, i.e., N(0,1) (ver detalhes na próxima resolução).
𝑆-µ 58-µ 𝑆-µ 61-µ −2

P(S < 58 ou S > 61) = 1 + 𝑃 ( 𝜎 < )−𝑃( 𝜎 < ) = 1 + 𝑃 (𝑍 < 0,3) −
𝜎 𝜎
1
𝑃 (𝑍 < 0,3)
Utilizando, no R a função pnorm(Zγ, µ, σ) = P(X ≤ Zγ), chega-se a
P(S < 58 ou S > 61) = 1 + 0.0001303648 - 0.9660554 = 0.03407496.
(item b) análogo ao anterior, porém E[S] = 29*2 = 58.
(Q.4) Bussab & Morettin (5ª edição) Cap.10, Ex.27 Um distribuidor de sementes
determina, por meio de testes, que 5% das sementes não germinam. Ele vende pacotes com
200 sementes com garantia de 90% de germinação. Qual é a probabilidade de que um
pacote não satisfaça à garantia?
5
R: A dificuldade desta questão estava em (i) a omissão, no enunciado, da hipótese de que a
FD subjacente é uma normal, (ii) a necessidade de conhecer a média e variância
populacionais da estatística proporção amostral, (iii) a conveniência de padronizar a
estatística para, com isso, tomar por base a distribuição normal padrão (esta conveniência
não era necessária, caso fosse utilizado um software para obter a probabilidade).
Passo 1: Pergunta a ser respondida. Trata-se de calcular P(𝑝̂ < 0,9), em que 𝑝̂ ≡
proporção amostral. Para isso, é preciso conhecer a FD subjacente à estatística proporção
amostral.
Passo 2: FD subjacente. Sendo a proporção uma média, é comum assumir que a FD

subjacente é uma normal com µ = E[𝑝̂ ] e σ2 = V[𝑝̂ ] . É necessário, pois obter os valores
numéricos destes parâmetros.
Passo 2.a) Expectativa, µ = E[𝑝̂ ]
A proporção é uma média de variáveis binárias. Seja considerada uma amostra aleatória
simples X1,...,XN, com Xi, i=1,..,N sendo variáveis binárias. Este último fato implica em que
Xi ~ Bernoulli(p), i=1,...,N, de modo que E[Xi] = p e V[Xi] = p(1-p)
Atenção: é altamente recomendável saber média e variância de uma variável Bernoulli

(tente demonstrar, como exercício e tenha tais resultados em mente).
Assim:
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 𝐸[𝑋1 ] + 𝐸[𝑋2 ] + ⋯ + 𝐸[𝑋𝑁 ]

µ = 𝐸[𝑝̂ ] = 𝐸 [ ]= =𝑝
𝑁 𝑁
Segundo o enunciado, p = 0,95 (pois 5% não germinam, em geral). Assim, µ = 0,95.
Passo 2.b) Variância, σ2 = V[𝑝̂ ]
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 1
𝜎 2 = 𝑉[𝑝̂ ] = 𝑉 [ ] = 2 𝑉[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 ]
𝑁 𝑁
Porém, X1,...,XN compõem uma amostra aleatória simples, sendo variáveis aleatórias
independentes. Assim sendo:
1 1
𝜎 2 = 𝑉[𝑝̂ ] = 2
𝑉[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 ] = 2 (𝑉[𝑋1 ] + 𝑉[𝑋2 ] + ⋯ + 𝑉[𝑋𝑁 ])
𝑁 𝑁
𝑁𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
= =
𝑁2 𝑁
Importante: o desvio-padrão populacional é, pois:
6
𝑝(1 − 𝑝)
𝜎= √
𝑁
De acordo com o enunciado, p = 0,95 e N = 200, deste modo, pois:
0,95 ∗ 0,05
𝜎= √ ~0,0154
200
Passo 3: cálculo da probabilidade visada
Trata-se de calcular P(𝑝̂ < 0,9), considerando que 𝑝̂ ~𝑁(0,95; 0,01542 ). Ocorre que os
valores da média e variância são específicos demais e por isso, por exemplo, não
correspondem às tabelas da FD normal encontradas nos apêndices de livros de estatística.
Por isso é comum padronizar a estatística 𝑝̂ , i.e., subtraí-la de sua média populacional e
dividir o resultado por seu desvio padrão populacional. Com isso, obtém-se uma variável
aleatória com FD normal padrão, i.e., com média zero e variância unitária. Por coerência,
essa operação deve ser realizada em ambos os lados da desigualdade interna à
probabilidade que se deseja calcular, como segue.
𝑝̂ − 0,95 0,9 − 0,95

𝑃( < ) = 𝑃(𝑍 < −3,244)
0,0154 0,0154
Em que Z representa uma variável aleatória com FD normal padrão, i.e., Z ~ N(0,1).
𝑝̂−𝐸[𝑝̂] 𝑋𝛾 −𝐸[𝑝̂]
(Nota: a forma geral da padronização é 𝑃 ( < ))
√𝑉[𝑝̂] √𝑉[𝑝̂]
Aplicando no R a função pnorm(Zγ, µ, σ) = P(X ≤ Zγ) (ou seja, essa função reporta a
probabilidade à esquerda do número Zγ), com Zγ =-3,244 µ = 0, σ =1, obtém-se
0.000588433 ~ 0,06%).
(Q.5) Uma entidade privada apenas apoia candidatos com porcentagem de votos acima de
10%. Para decidir quanto ao apoio a um candidato em específico, a entidade dispõe de
orçamento limitado, e vai coletar uma amostra aleatória de tamanho 100. Suponhamos que
seja cabível assumir que a função densidade da porcentagem amostral de votos seja normal
para o candidato e que a porcentagem de votos “verdadeira” (populacional) seja de 9% para
o candidato (porém a entidade privada não sabe disso). Qual é a probabilidade da entidade
decidir por apoiar após observar as informações contidas na amostra?
R:
Deseja-se calcular P(𝑝̂ > 0.1). Com base no enunciado e na resolução dos itens anteriores,
E[𝑝̂ ] = 0.09 e DP[𝑝̂ ] = √0.09(0.91)/100~0,02862. Deste modo:
7
P(𝑝̂ > 0.1) = P(Z > (0.1 – 0.09)/0.02862) = 1 - P(Z < (0.1 – 0.09)/0.02862) ~ 36,34%
(Q.6) Bussab & Morettin (5ª edição) Cap.10, Ex.8 A máquina de empacotar um
determinado produto o faz segundo uma distribuição normal, com média μ e desvio padrão
10 g. De hora em hora será retirada um amostra de quatro pacotes e esses serão pesados. Se
a média da amostra for inferior a 495 g ou superior a 520 g, encerra-se a produção para
reajustar a máquina, isto é, reajustar o peso médio.
(a) Em quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham
menos do que 500 g?
(b) Com a máquina assim regulada, qual é a probabilidade de ser feita uma parada
desnecessária?
(c) Se o peso médio da máquina desregulou-se para 500 g, qual é a probabilidade de

continuar a produção fora dos padrões desejados?
R: Para responder o item (a) basta encontrar μ tal que P(𝑋̅ < 500|μ) = 0,1.
Padronizando:
𝑋̅ −𝜇 500−𝜇 500−𝜇 500−𝜇
𝑃( < ) = 𝑃 (𝑍 < ) = 𝑃 (𝑍 < ) = 0,1, em que Z ~ N(0,1) (1)
𝜎/√𝑁 𝜎/√𝑁 𝜎/√𝑁 10/2
De acordo com a tabela da N(0,1) (ou com o comando qnorm do R), P(z<-1,282) = 0,1 (2)
Combinando (1) e (2), tem-se que:
500 − 𝜇
= − 1,282 → 𝜇 = 506,41
5
Quanto ao item (b), é preciso entender o que significa uma parada desnecessária. Isso de
fato não é claro pelo enunciado. Este dá a entender que a grandeza “peso médio” é
ajustável e deve ser ajustada de maneira a manter a massa dos pacotes dentro de um
intervalo pré-definido, no caso 495 e 520 g. A dificuldade de interpretação está em
perceber que “peso médio” é a média populacional, enquanto que o peso (ou massa)
médio da amostra de quatro pacotes é a média amostral. Em suma, uma parada
desnecessária ocorre sempre que (i) a média amostral está fora do intervalo de 495 a 520
gramas e (ii) a média populacional está dentro de tal intervalo (pois não há, neste caso,
necessidade de um ajuste). A probabilidade a ser calculada é:
P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |495<μ<520)
Porém, o enunciado exige μ = 506,41. Então deve-se calcular:
P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |μ=506,41)
8
495−506,41 520−506,41 −11,41
Padronizando, tem-se: 𝑃 (𝑍 < ) + 𝑃 (𝑍 > ) = (𝑍 < )+
5 5 5
13,59
𝑃 (𝑍 > ) = (𝑍 < −2,82) + 𝑃(𝑍 > 2,718) = 0,01452856~1,5%.
5
(c) Tendo em conta os itens anteriores, trata-se de:
P(495 < 𝑋̅ < 520 |μ=500) = 1 - P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |μ=500)
Basta padronizar e utilizar a tabela da normal padrão.

Lista 2 Inf Gabarito

Enviado por

Direitos autorais:

Formatos disponíveis

Lista 2 Inf Gabarito

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Lista 2 Inf Gabarito

Enviado por

Direitos autorais:

Formatos disponíveis

Lista 2

Foi omitida do enunciado a importante informação de que as duas famílias são

Assumindo que se trata de uma AAS, tem-se que P(X1 = 2 e X2 = 3 e X3 = 3 e X4 = 1) =

(a) construa a distribuição amostral de 𝑋̅ (média amostral) seguindo, para isso, o

As tabelas do primeiro estágio e do segundo estágio seguem abaixo, nesta ordem.

Média Probabilidade da média

R: na figura à esquerda há o gráfico exato da distribuição de 𝑋̅ (também podendo ser

(c) Calcule P(|𝑋̅ – μ|> 1)

R: Deve-se considerar que, como a FD da variável aleatória X é exatamente conhecida,

R: há um erro no enunciado. O termo “variância amostral” deve ser substituído por

(b) E para uma corrente com 29 elos?

Com isso, E[S] = E[X1]+E[X2]+...+E[XN] = Nµ. E, adicionalmente, V[S] =

𝑆-µ 58-µ 𝑆-µ 61-µ −2

Utilizando, no R a função pnorm(Zγ, µ, σ) = P(X ≤ Zγ), chega-se a

P(S < 58 ou S > 61) = 1 + 0.0001303648 - 0.9660554 = 0.03407496.

(item b) análogo ao anterior, porém E[S] = 29*2 = 58.

Passo 2: FD subjacente. Sendo a proporção uma média, é comum assumir que a FD

Passo 2.a) Expectativa, µ = E[𝑝̂ ]

Atenção: é altamente recomendável saber média e variância de uma variável Bernoulli

𝑋1 + 𝑋2 + ⋯ + 𝑋𝑁 𝐸[𝑋1 ] + 𝐸[𝑋2 ] + ⋯ + 𝐸[𝑋𝑁 ]

Passo 2.b) Variância, σ2 = V[𝑝̂ ]

De acordo com o enunciado, p = 0,95 e N = 200, deste modo, pois:

Passo 3: cálculo da probabilidade visada

𝑝̂ − 0,95 0,9 − 0,95

(c) Se o peso médio da máquina desregulou-se para 500 g, qual é a probabilidade de

Combinando (1) e (2), tem-se que:

P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |495<μ<520)

Porém, o enunciado exige μ = 506,41. Então deve-se calcular:

P(𝑋̅ < 495 𝑜𝑢 𝑋̅ > 520 |μ=506,41)

(c) Tendo em conta os itens anteriores, trata-se de:

Basta padronizar e utilizar a tabela da normal padrão.

Você também pode gostar