Untitled

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 9

Introdução à inferência estatística

Lista de exercícios # 4

Gabarito

A resolução desta lista deve entregada via escaninho TIDIA até no máximo dia 30 de
Abril.

As questões têm o mesmo valor, 10/4 = 2,5 pontos (o valor dos itens é equivalente à
divisão equitativa do valor da respectiva questão).

(Q.1) Resolva os dois itens sobre pesquisas de intenção de voto abaixo.

(Q.1.a) [Bussab e Morettin, 5ª edição, Q.20, cap.11, adaptado] Antes de uma eleição em
que havia dez candidatos, foi feita uma pesquisa com 1,000 eleitores escolhidos ao acaso, e
verificou-se que 200 deles pretendiam votar no candidato A. Todas as declarações podem
ser consideradas como votos válidos. Com base nesta informação, construa um teste para a
hipótese de que o candidato A vencerá no primeiro turno com significância de 5%.
Considere que, segundo a legislação vigente, a vitória no primeiro turno apenas é possível
com taxa de votação superior a 50% do eleitorado [nota: defina a hipótese nula como uma
condição de igualdade].

(Q.1.b) [Bussab e Morettin, 5ª edição, Q.20, cap.11] Antes de uma eleição em que havia
dois candidatos, A e B, foi feita uma pesquisa com 400 eleitores escolhidos ao acaso, e
verificou-se que 208 deles pretendiam votar no candidato A. Construa um intervalo de
confiança, com coeficiente de confiança de 95%, para a porcentagem populacional de
eleitores favoráveis ao candidato A na época das eleições.

R:

(Q.1.a)

Passo 1: H0: p = 0,5 vs H1: p > 0,5

Importante: trata-se de um teste unilateral, pois deseja-se testar a hipótese de que o


candidato vencerá no primeiro turno, o que requer taxa de votação superior a 50%. A
especificação anterior testa tal hipótese associando-a a H1, para, com isso, ter H0 como
uma condição de igualdade (e, com isso, pode-se aplicar o procedimento de teste que tem
sido aplicado até aqui).

Passo 2: Estatística do teste:


𝑝̂ − 𝑝0
𝑍= ~𝑁(0,1)
√𝑝0 (1 − 𝑝0 )
𝑁

Valor observado da estatística do teste:

0,2 − 0,5 −0,3 −0,3


𝑍= = = = −18.97367
0,5
√0,5(1 − 0,5) √ 0,25
1000 1000 √1000

Passo 3: RC = {zα; ∞}, P(Z > zα) = 0,05. A consulta à FD normal padrão revela que zα =
1,65. Assim, RC = {1,65; ∞},

Passo 4, decisão: A estatística do teste, apesar de grande em magnitude absoluta, não


pertence à RC e, portanto, a hipótese nula deve ser mantida. Notar que isso faz sentido
pois rejeitar H0 significa aceitar H1, ou seja, aceitar que p > 0,5. Contudo, o valor da
estatística é extremamente negativo, contradizendo fortemente, pois, H1. Daí por que a
decisão mais correta é não rejeitar H0, mesmo sendo o valor da estatística extremamente
negativo. Se o teste fosse bilateral, H0 seria rejeitada, o que seria coerente, pois H1
permitiria tanto um extremamente menor do que 0,5 quanto extremamente maior.

OBS: o IC para a proporção populacional de votos é dado abaixo.

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶(𝑝; 0,95) = {𝑝̂ − 𝑧𝛼 √ ; 𝑝̂ + 𝑧𝛼 √ }
𝑁 𝑁

0,2.0,8 0,2.0,8
= {0,2 − 1,96√ ; 0,2 + 1,96√ } = {0,1608; 0,2392}.
400 400

(Q.1.b)

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶(𝑝; 0,95) = {𝑝̂ − 𝑧𝛼 √ ; 𝑝̂ + 𝑧𝛼 √ }
𝑁 𝑁

0,52.0,48 0,52.0,48
= {0,52 − 1,96√ ; 0,52 + 1,96√ } = {0,471; 0,5689}.
400 400

(Q.2) [Bussab e Morettin, 5ª edição, Q.24, cap.11] Um pesquisador está estudando a


resistência de um determinado material sob determinadas condições. Ele sabe que essa
variável é normalmente distribuída com desvio padrão de duas unidades.
(a) Utilizando os valores 4,9;7;8,1;4,5;5,6;6,8;7,2;5,7;6,2 unidades, obtidos de uma amostra
de tamanho 9, determine o intervalo de confiança para a resistência média com um
coeficiente de confiança γ = 0,9;

(b) Qual o tamanho da amostra necessária para que o erro cometido, ao estimarmos a
resistência média, não seja superior a 0,01 unidade com probabilidade 0,9?

(c) Suponha que no item (a) não fosse conhecido o desvio padrão. Como você procederia
para determinar o intervalo de confiança, e que suposições você faria para isso? [Nota:
utilizar a FD t de Student]

R:

(a) O IC é dado pelas duas equações abaixo:


𝜎 𝜎
(𝑖)𝐼𝐶[𝜇; 𝛾] = {𝑋̅ − 𝑧𝛾 ; 𝑋̅ + 𝑧𝛾 }
√𝑁 √𝑁
(ii) P(Z< -zγ) = (1-γ)/2 = 5%

A equação 2 permite obter o coeficiente de confiança como quinto percentil de uma


variável normal padrão. Deve-se atentar para o fato de que se trata de 5% e não, como de
costume, 2,5%, de modo que o coeficiente de confiança será 1,6449 ~1,64 (e não 1,96).

Tendo esse coeficiente de confiança e os dados, a equação (i) passa a:

2 2
𝐼𝐶[𝜇; 90%] = {6,22 − 1,64 ; 6,22 + 1,64 } ~(5.1267; 7.3133)
√9 √9
(b) De maneira literal, o enunciado estabelece que:

𝑃(|𝑋̅ − 𝜇| ≤ 0,01) = 0,9

Uma vez que 0,01 = erro, então trata-se de obter N tal que: erro = zασ/√𝑁 = 0,01. Ou
seja:

𝜎 𝜎 𝜎 2
0,01 = 𝑧𝛼 ↔ √𝑁 = 𝑧𝛼 ↔ 𝑁 = (𝑧𝛼 )
√𝑁 0,01 0,01

Em que P(Z < zα) = (1 – 0,9) /2 = 0,05, sendo Z ~ N(0,1). Assim, zα = 1,64 e, pois:

2 2
𝑁 = (1,64 ) = 107.584
0,01
(c) Suponha que no item (a) não fosse conhecido o desvio padrão. Como você procederia
para determinar o intervalo de confiança, e que suposições você faria para isso? [Nota:
utilizar a FD t de Student]

R: Neste caso não há solução exata, mas apenas aproximada, uma vez que a FD t de
Student é definida em função do tamanho amostral (pois o parâmetro de tal distribuição é o
tamanho amostral subtraído da unidade). Ou seja, sendo o tamanho amostral a incógnita, a
função de distribuição de probabilidades a ser tomada por base também se torna uma
incógnita e ocorre que há apenas uma equação. A equação em questão é análoga ao item
anterior, mas assume-se a hipótese de que é correto tomar o desvio padrão amostral, 1,6,
como substituto para o populacional. Essa hipótese é pragmática, mas, contudo,
equivocada, a rigor, pois sendo uma incógnita o tamanho amostral, o desvio padrão
amostral também o é.

1,16 2
𝑁 = (𝑡𝛼 ) = (𝑡𝛼 116)2 = (𝑡𝛼 116)2 = 𝑡𝛼2 13.456
0,01

Tanto N como tα são desconhecidos. Porém, é possível observar que o tamanho amostral
será sem dúvida superior a 13.456 e, pois, a FD t de Student subjacente será
satisfatoriamente próxima de uma FD normal padrão, como o gráfico abaixo indica, com a
primeira FD em linha sólida e a segunda pontilhada.

O erro, pois, de tomar-se o mesmo limiar de confiança do item anterior é desprezível. Com
isso, chega-se ao seguinte tamanho amostral:

𝑁 = (1,64)2 13.456 = 36.191,26.


(Q.3) Cap.12, Ex. 25. A precipitação pluviométrica anual numa certa região tem desvio
padrão σ = 3,1 e média desconhecida. Para os últimos 9 anos, foram obtidos os seguintes
resultados: 30,5;34,1;27,9;35;26,9;28,3;31,7;25,8.

(a) Construa um teste de hipóteses para saber se a média da precipitação pluviométrica


anual é maior do que 30 unidades. Utilize um nível de significância de 5%.

(b) Discuta o mesmo problema, considerando σ desconhecido;

(c) Supondo que, na realidade, µ = 33, qual a probabilidade de chegarmos a uma conclusão
errada?

Passo 1: H0: µ = 30 vs H1: µ > 30 (teste unilateral)

Passo 2:

2.a) A estatística do teste é:

𝑋̅ − 𝜇0
𝑍= ~𝑁(0,1)
𝜎/√𝑁

(pois o enunciado informa a variância populacional)

2.b) O valor observado da estatística:

𝑋̅ − 𝜇0 30,025 − 30
𝑍= = = 0,0242
𝜎/√𝑁 3,1/3

Passo 3: a região crítica é

RC = [γ,∞) tal que P(Z > γ) = 0,05. Consultando a normal padrão, chega-se a γ = 1,65.
Assim, RC = [1,65,∞)

Passo 4, decisão: como o valor observado da estatística não pertence à RC, não rejeita-se
H0.

(b) Discuta o mesmo problema, considerando σ desconhecido;

Passo 2

Neste caso, a estatística do teste é

𝑋̅ − 𝜇0
𝑇= ~𝑡(𝑁 − 1)
𝑆/√𝑁

Em que
𝑁
1
𝐶𝑜𝑚 𝑆 = ∑(𝑋𝑖 − 𝑋̅)2 = 3.36993
𝑁−1
𝑖=1

De modo que o valor observado da estatística é:

𝑋̅ − 𝜇0 30,025 − 30
𝑇= = = 0.02225566
𝑆/√𝑁 3.36993/3

Passo 3

RC = [γ,∞) tal que P(T > γ) = 0,05. Consultando t de Student com 8 graus de liberdade,
chega-se a γ = 1,86. Assim, RC = [1,86,∞)

Passo 4: novamente a estatística não pertence à RC, logo H0 não deve ser rejeitada.

(c) Supondo que, na realidade, µ = 33, qual a probabilidade de chegarmos a uma conclusão
errada?

Este item, a rigor, se refere ao erro tipo 2, mas, para perceber isso é preciso de raciocínio
e alguma experiência com testes de hipóteses. Notar que, se µ é de fato 33, então H0: µ =
30 é equivocada e, portanto, haveria erro caso H0 não fosse rejeitada. Ou seja, se, no teste
do item a, H0: µ = 30 vs H1: µ > 30 , rejeitarmos H0, então estaremos tomando uma
decisão correta. Não rejeitar é a decisão errada, e trata-se de um erro tipo II, ou seja, não
rejeitar H0 quando ela é falsa. Vamos então calcular a probabilidade do erro tipo II,
tomando, para isso, como referência a região de aceitação do item a.

P(não-rejeitar µ = 33 | µ = 33) = P(Z ≤ 1,65|µ = 33)

A situação está descrita no gráfico abaixo. A curva à esquerda tem média 30 e a curva à
direita tem média 33. A segunda, pois, corresponde à verdade, enquanto a primeira à
hipótese nula.
Há um passo importante agora, não muito fácil de intuir. Como a FD verdadeira não tem
média 30, a padronização feita no item (a) não conduz a uma estatística com média zero e,
portanto, a estatística não possui FD normal padrão. Ou seja:

𝑋̅ − 𝜇0 1 1 1
̅ ̅
𝐸[𝑍] = 𝐸 [ 𝜎 ] = 𝜎 𝐸[𝑋 − 𝜇0 ] = 𝜎 (𝐸[𝑋] − 𝜇0 ) = 𝜎 (µ − 𝜇0 )
√𝑁 √𝑁 √𝑁 √𝑁
1 3
= 𝜎 (33 − 30) = 𝜎
√𝑁 √𝑁
É fácil ver que V[Z] = 1

Desta maneira, pois:

P(Z ≤ 1,65|µ = 33) =

3 3
𝑍− 𝜎 1,65 − 𝜎
√𝑁 ≤ √𝑁 |µ = 33 9
𝑃 = 𝑃 (𝑍´ ≤ 1,65 − |µ = 33)
1 1 | 3,1
( )
= 𝑃(𝑍´ ≤ −1.253226|µ = 33)

Em que Z’ é uma variável aleatória com FD normal-padrão (trata-se de Z repadronizada).


Assim sendo, a probabilidade acima é conhecida, de fato: 𝑃(𝑍´ ≤ −1.253226|µ = 33)=
0.1050618~ 11%.
(Q.4) Cap.12, Ex. 22. O tempo médio, por operário, para executar uma tarefa, tem sido de
100 minutos, com um desvio padrão de 15 minutos. Introduziu-se uma modificação para
diminuir esse tempo e, após certo período, sorteou-se uma amostra de 16 operários,
medindo-se o tempo de execução de cada um. O tempo médio da amostra foi de 85
minutos, e o desvio padrão foi de 12 minutos.

(a) Estes resultados trazem evidências estatísticas da melhora desejada [responda com um
teste de hipótese, utilizando para isso a distribuição t de Student a uma significância de
5%]?

(b) Calcule o intervalo de confiança para o novo tempo médio.

R:

(a) Passo 1: a afirmação a ser testada é a de que o tempo populacional é inferior a 100
minutos. Considerando a necessidade de o teste permitir tanto a reiteração (μ < 100) como a
negação da afirmação (μ = 100 ou μ > 100), bem como de atender as condições básicas,
tem-se:

H0: μ = 100 vs μ < 100

Um teste unilateral apenas com a cauda inferior.

Passo 2:
𝑋̅ −𝜇 85−100 −15
Estatística do teste = tobs = 𝑆/√𝑁0 = = = −5
12/4 3

FD: tobs ~ t(N-1) = t(15)

Passo 3:

RC = {-ꚙ;-tα}, P(t15< tα) = 5%. No R, o comando qt(0.05,15) resulta em -1,75305, e, pois,


RC = {-ꚙ;-1,75305}.

P-valor observado =𝑝̂ = P(t15 < -1,75305); nesse caso o p-valor, i.e., a probabilidade de
observar um valor mais extremo da estatística do que foi observado, é a probabilidade de
observar um valor mais negativo do que o observado. No R, o comando é pt(-5,15), e ele
resulta em 7.92 x 10-5.

Passo 4

Tem-se que tobs = -5 ∈ {-ꚙ;-1,75305} e 𝑝̂ = 7.92 x 10-5 < 5%. Com isso H0 deve ser
rejeitada. Conclui-se pois que o tempo médio para executar a tarefa de fato foi reduzido
pela modificação.
(b) O IC para o novo tempo médio, i.e., o intervalo que contém com 95% de probabilidade
o valor populacional do novo tempo médio, é dado abaixo.

(b) O IC é dado pelas duas equações abaixo:

S S
̅ − tγ
(i)IC[μ; 95%] = {X ;̅
X + tγ }
√N √N
(ii) P(t15< -tγ) = 2,5%

Passo 1, coeficiente de confiança: atentar para o fato de que o valor crítico obtido no item
anterior, por ser unilateral, não pode ser tomado como o coeficiente de confiança bilateral.
No R, o comando qt(0.025,15) retorna -2,13145.

Passo 2, introduzindo resultado do passo 1 e dados na equação (i):

12 12
(i)IC[μ; 95%] = {85 − 2,13145 ; 85 + 2,13145 } = {78.60565; 91.39435}
4 4
Importante notar que o limite superior do IC está abaixo do valor presumido pela hipótese
nula do item a, mais uma evidência contra tal hipótese.

Você também pode gostar