Untitled

Introdução à inferência estatística
Lista de exercícios # 4
Gabarito
A resolução desta lista deve entregada via escaninho TIDIA até no máximo dia 30 de
Abril.
As questões têm o mesmo valor, 10/4 = 2,5 pontos (o valor dos itens é equivalente à
divisão equitativa do valor da respectiva questão).
(Q.1) Resolva os dois itens sobre pesquisas de intenção de voto abaixo.
(Q.1.a) [Bussab e Morettin, 5ª edição, Q.20, cap.11, adaptado] Antes de uma eleição em
que havia dez candidatos, foi feita uma pesquisa com 1,000 eleitores escolhidos ao acaso, e
verificou-se que 200 deles pretendiam votar no candidato A. Todas as declarações podem
ser consideradas como votos válidos. Com base nesta informação, construa um teste para a
hipótese de que o candidato A vencerá no primeiro turno com significância de 5%.
Considere que, segundo a legislação vigente, a vitória no primeiro turno apenas é possível
com taxa de votação superior a 50% do eleitorado [nota: defina a hipótese nula como uma
condição de igualdade].
(Q.1.b) [Bussab e Morettin, 5ª edição, Q.20, cap.11] Antes de uma eleição em que havia
dois candidatos, A e B, foi feita uma pesquisa com 400 eleitores escolhidos ao acaso, e
verificou-se que 208 deles pretendiam votar no candidato A. Construa um intervalo de
confiança, com coeficiente de confiança de 95%, para a porcentagem populacional de
eleitores favoráveis ao candidato A na época das eleições.
R:
(Q.1.a)
Passo 1: H0: p = 0,5 vs H1: p > 0,5
Importante: trata-se de um teste unilateral, pois deseja-se testar a hipótese de que o

candidato vencerá no primeiro turno, o que requer taxa de votação superior a 50%. A
especificação anterior testa tal hipótese associando-a a H1, para, com isso, ter H0 como
uma condição de igualdade (e, com isso, pode-se aplicar o procedimento de teste que tem
sido aplicado até aqui).
Passo 2: Estatística do teste:

𝑝̂ − 𝑝0
𝑍= ~𝑁(0,1)
√𝑝0 (1 − 𝑝0 )
𝑁
Valor observado da estatística do teste:
0,2 − 0,5 −0,3 −0,3

𝑍= = = = −18.97367
0,5
√0,5(1 − 0,5) √ 0,25
1000 1000 √1000
Passo 3: RC = {zα; ∞}, P(Z > zα) = 0,05. A consulta à FD normal padrão revela que zα =
1,65. Assim, RC = {1,65; ∞},
Passo 4, decisão: A estatística do teste, apesar de grande em magnitude absoluta, não

pertence à RC e, portanto, a hipótese nula deve ser mantida. Notar que isso faz sentido
pois rejeitar H0 significa aceitar H1, ou seja, aceitar que p > 0,5. Contudo, o valor da
estatística é extremamente negativo, contradizendo fortemente, pois, H1. Daí por que a
decisão mais correta é não rejeitar H0, mesmo sendo o valor da estatística extremamente
negativo. Se o teste fosse bilateral, H0 seria rejeitada, o que seria coerente, pois H1
permitiria tanto um extremamente menor do que 0,5 quanto extremamente maior.
OBS: o IC para a proporção populacional de votos é dado abaixo.
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶(𝑝; 0,95) = {𝑝̂ − 𝑧𝛼 √ ; 𝑝̂ + 𝑧𝛼 √ }
𝑁 𝑁
0,2.0,8 0,2.0,8
= {0,2 − 1,96√ ; 0,2 + 1,96√ } = {0,1608; 0,2392}.
400 400
(Q.1.b)
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶(𝑝; 0,95) = {𝑝̂ − 𝑧𝛼 √ ; 𝑝̂ + 𝑧𝛼 √ }
𝑁 𝑁
0,52.0,48 0,52.0,48
= {0,52 − 1,96√ ; 0,52 + 1,96√ } = {0,471; 0,5689}.
400 400
(Q.2) [Bussab e Morettin, 5ª edição, Q.24, cap.11] Um pesquisador está estudando a

resistência de um determinado material sob determinadas condições. Ele sabe que essa
variável é normalmente distribuída com desvio padrão de duas unidades.
(a) Utilizando os valores 4,9;7;8,1;4,5;5,6;6,8;7,2;5,7;6,2 unidades, obtidos de uma amostra
de tamanho 9, determine o intervalo de confiança para a resistência média com um
coeficiente de confiança γ = 0,9;
(b) Qual o tamanho da amostra necessária para que o erro cometido, ao estimarmos a
resistência média, não seja superior a 0,01 unidade com probabilidade 0,9?
(c) Suponha que no item (a) não fosse conhecido o desvio padrão. Como você procederia
para determinar o intervalo de confiança, e que suposições você faria para isso? [Nota:
utilizar a FD t de Student]
R:
(a) O IC é dado pelas duas equações abaixo:

𝜎 𝜎
(𝑖)𝐼𝐶[𝜇; 𝛾] = {𝑋̅ − 𝑧𝛾 ; 𝑋̅ + 𝑧𝛾 }
√𝑁 √𝑁
(ii) P(Z< -zγ) = (1-γ)/2 = 5%
A equação 2 permite obter o coeficiente de confiança como quinto percentil de uma

variável normal padrão. Deve-se atentar para o fato de que se trata de 5% e não, como de
costume, 2,5%, de modo que o coeficiente de confiança será 1,6449 ~1,64 (e não 1,96).
Tendo esse coeficiente de confiança e os dados, a equação (i) passa a:
2 2
𝐼𝐶[𝜇; 90%] = {6,22 − 1,64 ; 6,22 + 1,64 } ~(5.1267; 7.3133)
√9 √9
(b) De maneira literal, o enunciado estabelece que:
𝑃(|𝑋̅ − 𝜇| ≤ 0,01) = 0,9
Uma vez que 0,01 = erro, então trata-se de obter N tal que: erro = zασ/√𝑁 = 0,01. Ou
seja:
𝜎 𝜎 𝜎 2
0,01 = 𝑧𝛼 ↔ √𝑁 = 𝑧𝛼 ↔ 𝑁 = (𝑧𝛼 )
√𝑁 0,01 0,01
Em que P(Z < zα) = (1 – 0,9) /2 = 0,05, sendo Z ~ N(0,1). Assim, zα = 1,64 e, pois:
2 2
𝑁 = (1,64 ) = 107.584
0,01
(c) Suponha que no item (a) não fosse conhecido o desvio padrão. Como você procederia
para determinar o intervalo de confiança, e que suposições você faria para isso? [Nota:
utilizar a FD t de Student]
R: Neste caso não há solução exata, mas apenas aproximada, uma vez que a FD t de
Student é definida em função do tamanho amostral (pois o parâmetro de tal distribuição é o
tamanho amostral subtraído da unidade). Ou seja, sendo o tamanho amostral a incógnita, a
função de distribuição de probabilidades a ser tomada por base também se torna uma
incógnita e ocorre que há apenas uma equação. A equação em questão é análoga ao item
anterior, mas assume-se a hipótese de que é correto tomar o desvio padrão amostral, 1,6,
como substituto para o populacional. Essa hipótese é pragmática, mas, contudo,
equivocada, a rigor, pois sendo uma incógnita o tamanho amostral, o desvio padrão
amostral também o é.
1,16 2
𝑁 = (𝑡𝛼 ) = (𝑡𝛼 116)2 = (𝑡𝛼 116)2 = 𝑡𝛼2 13.456
0,01
Tanto N como tα são desconhecidos. Porém, é possível observar que o tamanho amostral
será sem dúvida superior a 13.456 e, pois, a FD t de Student subjacente será
satisfatoriamente próxima de uma FD normal padrão, como o gráfico abaixo indica, com a
primeira FD em linha sólida e a segunda pontilhada.
O erro, pois, de tomar-se o mesmo limiar de confiança do item anterior é desprezível. Com
isso, chega-se ao seguinte tamanho amostral:
𝑁 = (1,64)2 13.456 = 36.191,26.

(Q.3) Cap.12, Ex. 25. A precipitação pluviométrica anual numa certa região tem desvio
padrão σ = 3,1 e média desconhecida. Para os últimos 9 anos, foram obtidos os seguintes
resultados: 30,5;34,1;27,9;35;26,9;28,3;31,7;25,8.
(a) Construa um teste de hipóteses para saber se a média da precipitação pluviométrica

anual é maior do que 30 unidades. Utilize um nível de significância de 5%.
(b) Discuta o mesmo problema, considerando σ desconhecido;
(c) Supondo que, na realidade, µ = 33, qual a probabilidade de chegarmos a uma conclusão
errada?
Passo 1: H0: µ = 30 vs H1: µ > 30 (teste unilateral)
Passo 2:
2.a) A estatística do teste é:
𝑋̅ − 𝜇0
𝑍= ~𝑁(0,1)
𝜎/√𝑁
(pois o enunciado informa a variância populacional)
2.b) O valor observado da estatística:
𝑋̅ − 𝜇0 30,025 − 30
𝑍= = = 0,0242
𝜎/√𝑁 3,1/3
Passo 3: a região crítica é
RC = [γ,∞) tal que P(Z > γ) = 0,05. Consultando a normal padrão, chega-se a γ = 1,65.
Assim, RC = [1,65,∞)
Passo 4, decisão: como o valor observado da estatística não pertence à RC, não rejeita-se
H0.
(b) Discuta o mesmo problema, considerando σ desconhecido;
Passo 2
Neste caso, a estatística do teste é
𝑋̅ − 𝜇0
𝑇= ~𝑡(𝑁 − 1)
𝑆/√𝑁
Em que
𝑁
1
𝐶𝑜𝑚 𝑆 = ∑(𝑋𝑖 − 𝑋̅)2 = 3.36993
𝑁−1
𝑖=1
De modo que o valor observado da estatística é:
𝑋̅ − 𝜇0 30,025 − 30
𝑇= = = 0.02225566
𝑆/√𝑁 3.36993/3
Passo 3
RC = [γ,∞) tal que P(T > γ) = 0,05. Consultando t de Student com 8 graus de liberdade,
chega-se a γ = 1,86. Assim, RC = [1,86,∞)
Passo 4: novamente a estatística não pertence à RC, logo H0 não deve ser rejeitada.
(c) Supondo que, na realidade, µ = 33, qual a probabilidade de chegarmos a uma conclusão
errada?
Este item, a rigor, se refere ao erro tipo 2, mas, para perceber isso é preciso de raciocínio
e alguma experiência com testes de hipóteses. Notar que, se µ é de fato 33, então H0: µ =
30 é equivocada e, portanto, haveria erro caso H0 não fosse rejeitada. Ou seja, se, no teste
do item a, H0: µ = 30 vs H1: µ > 30 , rejeitarmos H0, então estaremos tomando uma
decisão correta. Não rejeitar é a decisão errada, e trata-se de um erro tipo II, ou seja, não
rejeitar H0 quando ela é falsa. Vamos então calcular a probabilidade do erro tipo II,
tomando, para isso, como referência a região de aceitação do item a.
P(não-rejeitar µ = 33 | µ = 33) = P(Z ≤ 1,65|µ = 33)
A situação está descrita no gráfico abaixo. A curva à esquerda tem média 30 e a curva à
direita tem média 33. A segunda, pois, corresponde à verdade, enquanto a primeira à
hipótese nula.
Há um passo importante agora, não muito fácil de intuir. Como a FD verdadeira não tem
média 30, a padronização feita no item (a) não conduz a uma estatística com média zero e,
portanto, a estatística não possui FD normal padrão. Ou seja:
𝑋̅ − 𝜇0 1 1 1
̅ ̅
𝐸[𝑍] = 𝐸 [ 𝜎 ] = 𝜎 𝐸[𝑋 − 𝜇0 ] = 𝜎 (𝐸[𝑋] − 𝜇0 ) = 𝜎 (µ − 𝜇0 )
√𝑁 √𝑁 √𝑁 √𝑁
1 3
= 𝜎 (33 − 30) = 𝜎
√𝑁 √𝑁
É fácil ver que V[Z] = 1
Desta maneira, pois:
P(Z ≤ 1,65|µ = 33) =
3 3
𝑍− 𝜎 1,65 − 𝜎
√𝑁 ≤ √𝑁 |µ = 33 9
𝑃 = 𝑃 (𝑍´ ≤ 1,65 − |µ = 33)
1 1 | 3,1
( )
= 𝑃(𝑍´ ≤ −1.253226|µ = 33)
Em que Z’ é uma variável aleatória com FD normal-padrão (trata-se de Z repadronizada).

Assim sendo, a probabilidade acima é conhecida, de fato: 𝑃(𝑍´ ≤ −1.253226|µ = 33)=
0.1050618~ 11%.
(Q.4) Cap.12, Ex. 22. O tempo médio, por operário, para executar uma tarefa, tem sido de
100 minutos, com um desvio padrão de 15 minutos. Introduziu-se uma modificação para
diminuir esse tempo e, após certo período, sorteou-se uma amostra de 16 operários,
medindo-se o tempo de execução de cada um. O tempo médio da amostra foi de 85
minutos, e o desvio padrão foi de 12 minutos.
(a) Estes resultados trazem evidências estatísticas da melhora desejada [responda com um
teste de hipótese, utilizando para isso a distribuição t de Student a uma significância de
5%]?
(b) Calcule o intervalo de confiança para o novo tempo médio.
R:
(a) Passo 1: a afirmação a ser testada é a de que o tempo populacional é inferior a 100
minutos. Considerando a necessidade de o teste permitir tanto a reiteração (μ < 100) como a
negação da afirmação (μ = 100 ou μ > 100), bem como de atender as condições básicas,
tem-se:
H0: μ = 100 vs μ < 100
Um teste unilateral apenas com a cauda inferior.
Passo 2:
𝑋̅ −𝜇 85−100 −15
Estatística do teste = tobs = 𝑆/√𝑁0 = = = −5
12/4 3
FD: tobs ~ t(N-1) = t(15)
Passo 3:
RC = {-ꚙ;-tα}, P(t15< tα) = 5%. No R, o comando qt(0.05,15) resulta em -1,75305, e, pois,

RC = {-ꚙ;-1,75305}.
P-valor observado =𝑝̂ = P(t15 < -1,75305); nesse caso o p-valor, i.e., a probabilidade de
observar um valor mais extremo da estatística do que foi observado, é a probabilidade de
observar um valor mais negativo do que o observado. No R, o comando é pt(-5,15), e ele
resulta em 7.92 x 10-5.
Passo 4
Tem-se que tobs = -5 ∈ {-ꚙ;-1,75305} e 𝑝̂ = 7.92 x 10-5 < 5%. Com isso H0 deve ser
rejeitada. Conclui-se pois que o tempo médio para executar a tarefa de fato foi reduzido
pela modificação.
(b) O IC para o novo tempo médio, i.e., o intervalo que contém com 95% de probabilidade
o valor populacional do novo tempo médio, é dado abaixo.
(b) O IC é dado pelas duas equações abaixo:
S S
̅ − tγ
(i)IC[μ; 95%] = {X ;̅
X + tγ }
√N √N
(ii) P(t15< -tγ) = 2,5%
Passo 1, coeficiente de confiança: atentar para o fato de que o valor crítico obtido no item
anterior, por ser unilateral, não pode ser tomado como o coeficiente de confiança bilateral.
No R, o comando qt(0.025,15) retorna -2,13145.
Passo 2, introduzindo resultado do passo 1 e dados na equação (i):
12 12
(i)IC[μ; 95%] = {85 − 2,13145 ; 85 + 2,13145 } = {78.60565; 91.39435}
4 4
Importante notar que o limite superior do IC está abaixo do valor presumido pela hipótese
nula do item a, mais uma evidência contra tal hipótese.

Untitled

Enviado por

Direitos autorais:

Formatos disponíveis

Untitled

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Untitled

Enviado por

Direitos autorais:

Formatos disponíveis

Introdução à inferência estatística

(Q.1) Resolva os dois itens sobre pesquisas de intenção de voto abaixo.

Passo 1: H0: p = 0,5 vs H1: p > 0,5

Importante: trata-se de um teste unilateral, pois deseja-se testar a hipótese de que o

Passo 2: Estatística do teste:

Valor observado da estatística do teste:

0,2 − 0,5 −0,3 −0,3

Passo 4, decisão: A estatística do teste, apesar de grande em magnitude absoluta, não

OBS: o IC para a proporção populacional de votos é dado abaixo.

(Q.2) [Bussab e Morettin, 5ª edição, Q.24, cap.11] Um pesquisador está estudando a

(a) O IC é dado pelas duas equações abaixo:

A equação 2 permite obter o coeficiente de confiança como quinto percentil de uma

Tendo esse coeficiente de confiança e os dados, a equação (i) passa a:

𝑃(|𝑋̅ − 𝜇| ≤ 0,01) = 0,9

𝑁 = (1,64)2 13.456 = 36.191,26.

(a) Construa um teste de hipóteses para saber se a média da precipitação pluviométrica

(b) Discuta o mesmo problema, considerando σ desconhecido;

Passo 1: H0: µ = 30 vs H1: µ > 30 (teste unilateral)

2.a) A estatística do teste é:

(pois o enunciado informa a variância populacional)

2.b) O valor observado da estatística:

Passo 3: a região crítica é

(b) Discuta o mesmo problema, considerando σ desconhecido;

Neste caso, a estatística do teste é

De modo que o valor observado da estatística é:

P(não-rejeitar µ = 33 | µ = 33) = P(Z ≤ 1,65|µ = 33)

Desta maneira, pois:

P(Z ≤ 1,65|µ = 33) =

Em que Z’ é uma variável aleatória com FD normal-padrão (trata-se de Z repadronizada).

(b) Calcule o intervalo de confiança para o novo tempo médio.

H0: μ = 100 vs μ < 100

Um teste unilateral apenas com a cauda inferior.

FD: tobs ~ t(N-1) = t(15)

RC = {-ꚙ;-tα}, P(t15< tα) = 5%. No R, o comando qt(0.05,15) resulta em -1,75305, e, pois,

(b) O IC é dado pelas duas equações abaixo:

Passo 2, introduzindo resultado do passo 1 e dados na equação (i):

Você também pode gostar