Untitled
Untitled
Untitled
Lista de exercícios # 4
Gabarito
A resolução desta lista deve entregada via escaninho TIDIA até no máximo dia 30 de
Abril.
As questões têm o mesmo valor, 10/4 = 2,5 pontos (o valor dos itens é equivalente à
divisão equitativa do valor da respectiva questão).
(Q.1.a) [Bussab e Morettin, 5ª edição, Q.20, cap.11, adaptado] Antes de uma eleição em
que havia dez candidatos, foi feita uma pesquisa com 1,000 eleitores escolhidos ao acaso, e
verificou-se que 200 deles pretendiam votar no candidato A. Todas as declarações podem
ser consideradas como votos válidos. Com base nesta informação, construa um teste para a
hipótese de que o candidato A vencerá no primeiro turno com significância de 5%.
Considere que, segundo a legislação vigente, a vitória no primeiro turno apenas é possível
com taxa de votação superior a 50% do eleitorado [nota: defina a hipótese nula como uma
condição de igualdade].
(Q.1.b) [Bussab e Morettin, 5ª edição, Q.20, cap.11] Antes de uma eleição em que havia
dois candidatos, A e B, foi feita uma pesquisa com 400 eleitores escolhidos ao acaso, e
verificou-se que 208 deles pretendiam votar no candidato A. Construa um intervalo de
confiança, com coeficiente de confiança de 95%, para a porcentagem populacional de
eleitores favoráveis ao candidato A na época das eleições.
R:
(Q.1.a)
Passo 3: RC = {zα; ∞}, P(Z > zα) = 0,05. A consulta à FD normal padrão revela que zα =
1,65. Assim, RC = {1,65; ∞},
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶(𝑝; 0,95) = {𝑝̂ − 𝑧𝛼 √ ; 𝑝̂ + 𝑧𝛼 √ }
𝑁 𝑁
0,2.0,8 0,2.0,8
= {0,2 − 1,96√ ; 0,2 + 1,96√ } = {0,1608; 0,2392}.
400 400
(Q.1.b)
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶(𝑝; 0,95) = {𝑝̂ − 𝑧𝛼 √ ; 𝑝̂ + 𝑧𝛼 √ }
𝑁 𝑁
0,52.0,48 0,52.0,48
= {0,52 − 1,96√ ; 0,52 + 1,96√ } = {0,471; 0,5689}.
400 400
(b) Qual o tamanho da amostra necessária para que o erro cometido, ao estimarmos a
resistência média, não seja superior a 0,01 unidade com probabilidade 0,9?
(c) Suponha que no item (a) não fosse conhecido o desvio padrão. Como você procederia
para determinar o intervalo de confiança, e que suposições você faria para isso? [Nota:
utilizar a FD t de Student]
R:
2 2
𝐼𝐶[𝜇; 90%] = {6,22 − 1,64 ; 6,22 + 1,64 } ~(5.1267; 7.3133)
√9 √9
(b) De maneira literal, o enunciado estabelece que:
Uma vez que 0,01 = erro, então trata-se de obter N tal que: erro = zασ/√𝑁 = 0,01. Ou
seja:
𝜎 𝜎 𝜎 2
0,01 = 𝑧𝛼 ↔ √𝑁 = 𝑧𝛼 ↔ 𝑁 = (𝑧𝛼 )
√𝑁 0,01 0,01
Em que P(Z < zα) = (1 – 0,9) /2 = 0,05, sendo Z ~ N(0,1). Assim, zα = 1,64 e, pois:
2 2
𝑁 = (1,64 ) = 107.584
0,01
(c) Suponha que no item (a) não fosse conhecido o desvio padrão. Como você procederia
para determinar o intervalo de confiança, e que suposições você faria para isso? [Nota:
utilizar a FD t de Student]
R: Neste caso não há solução exata, mas apenas aproximada, uma vez que a FD t de
Student é definida em função do tamanho amostral (pois o parâmetro de tal distribuição é o
tamanho amostral subtraído da unidade). Ou seja, sendo o tamanho amostral a incógnita, a
função de distribuição de probabilidades a ser tomada por base também se torna uma
incógnita e ocorre que há apenas uma equação. A equação em questão é análoga ao item
anterior, mas assume-se a hipótese de que é correto tomar o desvio padrão amostral, 1,6,
como substituto para o populacional. Essa hipótese é pragmática, mas, contudo,
equivocada, a rigor, pois sendo uma incógnita o tamanho amostral, o desvio padrão
amostral também o é.
1,16 2
𝑁 = (𝑡𝛼 ) = (𝑡𝛼 116)2 = (𝑡𝛼 116)2 = 𝑡𝛼2 13.456
0,01
Tanto N como tα são desconhecidos. Porém, é possível observar que o tamanho amostral
será sem dúvida superior a 13.456 e, pois, a FD t de Student subjacente será
satisfatoriamente próxima de uma FD normal padrão, como o gráfico abaixo indica, com a
primeira FD em linha sólida e a segunda pontilhada.
O erro, pois, de tomar-se o mesmo limiar de confiança do item anterior é desprezível. Com
isso, chega-se ao seguinte tamanho amostral:
(c) Supondo que, na realidade, µ = 33, qual a probabilidade de chegarmos a uma conclusão
errada?
Passo 2:
𝑋̅ − 𝜇0
𝑍= ~𝑁(0,1)
𝜎/√𝑁
𝑋̅ − 𝜇0 30,025 − 30
𝑍= = = 0,0242
𝜎/√𝑁 3,1/3
RC = [γ,∞) tal que P(Z > γ) = 0,05. Consultando a normal padrão, chega-se a γ = 1,65.
Assim, RC = [1,65,∞)
Passo 4, decisão: como o valor observado da estatística não pertence à RC, não rejeita-se
H0.
Passo 2
𝑋̅ − 𝜇0
𝑇= ~𝑡(𝑁 − 1)
𝑆/√𝑁
Em que
𝑁
1
𝐶𝑜𝑚 𝑆 = ∑(𝑋𝑖 − 𝑋̅)2 = 3.36993
𝑁−1
𝑖=1
𝑋̅ − 𝜇0 30,025 − 30
𝑇= = = 0.02225566
𝑆/√𝑁 3.36993/3
Passo 3
RC = [γ,∞) tal que P(T > γ) = 0,05. Consultando t de Student com 8 graus de liberdade,
chega-se a γ = 1,86. Assim, RC = [1,86,∞)
Passo 4: novamente a estatística não pertence à RC, logo H0 não deve ser rejeitada.
(c) Supondo que, na realidade, µ = 33, qual a probabilidade de chegarmos a uma conclusão
errada?
Este item, a rigor, se refere ao erro tipo 2, mas, para perceber isso é preciso de raciocínio
e alguma experiência com testes de hipóteses. Notar que, se µ é de fato 33, então H0: µ =
30 é equivocada e, portanto, haveria erro caso H0 não fosse rejeitada. Ou seja, se, no teste
do item a, H0: µ = 30 vs H1: µ > 30 , rejeitarmos H0, então estaremos tomando uma
decisão correta. Não rejeitar é a decisão errada, e trata-se de um erro tipo II, ou seja, não
rejeitar H0 quando ela é falsa. Vamos então calcular a probabilidade do erro tipo II,
tomando, para isso, como referência a região de aceitação do item a.
A situação está descrita no gráfico abaixo. A curva à esquerda tem média 30 e a curva à
direita tem média 33. A segunda, pois, corresponde à verdade, enquanto a primeira à
hipótese nula.
Há um passo importante agora, não muito fácil de intuir. Como a FD verdadeira não tem
média 30, a padronização feita no item (a) não conduz a uma estatística com média zero e,
portanto, a estatística não possui FD normal padrão. Ou seja:
𝑋̅ − 𝜇0 1 1 1
̅ ̅
𝐸[𝑍] = 𝐸 [ 𝜎 ] = 𝜎 𝐸[𝑋 − 𝜇0 ] = 𝜎 (𝐸[𝑋] − 𝜇0 ) = 𝜎 (µ − 𝜇0 )
√𝑁 √𝑁 √𝑁 √𝑁
1 3
= 𝜎 (33 − 30) = 𝜎
√𝑁 √𝑁
É fácil ver que V[Z] = 1
3 3
𝑍− 𝜎 1,65 − 𝜎
√𝑁 ≤ √𝑁 |µ = 33 9
𝑃 = 𝑃 (𝑍´ ≤ 1,65 − |µ = 33)
1 1 | 3,1
( )
= 𝑃(𝑍´ ≤ −1.253226|µ = 33)
(a) Estes resultados trazem evidências estatísticas da melhora desejada [responda com um
teste de hipótese, utilizando para isso a distribuição t de Student a uma significância de
5%]?
R:
(a) Passo 1: a afirmação a ser testada é a de que o tempo populacional é inferior a 100
minutos. Considerando a necessidade de o teste permitir tanto a reiteração (μ < 100) como a
negação da afirmação (μ = 100 ou μ > 100), bem como de atender as condições básicas,
tem-se:
Passo 2:
𝑋̅ −𝜇 85−100 −15
Estatística do teste = tobs = 𝑆/√𝑁0 = = = −5
12/4 3
Passo 3:
P-valor observado =𝑝̂ = P(t15 < -1,75305); nesse caso o p-valor, i.e., a probabilidade de
observar um valor mais extremo da estatística do que foi observado, é a probabilidade de
observar um valor mais negativo do que o observado. No R, o comando é pt(-5,15), e ele
resulta em 7.92 x 10-5.
Passo 4
Tem-se que tobs = -5 ∈ {-ꚙ;-1,75305} e 𝑝̂ = 7.92 x 10-5 < 5%. Com isso H0 deve ser
rejeitada. Conclui-se pois que o tempo médio para executar a tarefa de fato foi reduzido
pela modificação.
(b) O IC para o novo tempo médio, i.e., o intervalo que contém com 95% de probabilidade
o valor populacional do novo tempo médio, é dado abaixo.
S S
̅ − tγ
(i)IC[μ; 95%] = {X ;̅
X + tγ }
√N √N
(ii) P(t15< -tγ) = 2,5%
Passo 1, coeficiente de confiança: atentar para o fato de que o valor crítico obtido no item
anterior, por ser unilateral, não pode ser tomado como o coeficiente de confiança bilateral.
No R, o comando qt(0.025,15) retorna -2,13145.
12 12
(i)IC[μ; 95%] = {85 − 2,13145 ; 85 + 2,13145 } = {78.60565; 91.39435}
4 4
Importante notar que o limite superior do IC está abaixo do valor presumido pela hipótese
nula do item a, mais uma evidência contra tal hipótese.