Estatística - Aula 20
Estatística - Aula 20
Estatística - Aula 20
Autor:
Guilherme Neves
Aula 20
21 de Setembro de 2020
Guilherme Neves
Aula 20
Sumário
1. Lista de Questões de Concursos Anteriores........................................................ 2
2. Gabaritos ........................................................................................................... 19
7. Lista de Questões de Concursos Anteriores com Comentários ........................ 22
8. Considerações Finais ....................................................................................... 100
Oi, pessoal.
Hoje faremos uma revisão geral com 100 questões de Estatística Inferencial da banca CESPE.
1. (CESPE 2020/TJ-PA)
Uma amostra aleatória simples de tamanho 5 foi retirada de uma distribuição de Poisson com
média igual a 5. Essa amostra é representada por 𝑋" , 𝑋$ , 𝑋% , 𝑋& , 𝑋' , em que cada variável 𝑋(
denota o total de erros processuais registrados em certo cartório judicial no dia k, com 𝑘 ∈
{1,2,3,4,5}.
2. (CESPE 2020/TJ-PA)
O teste de hipóteses se assemelha ao julgamento de um crime. Em um julgamento, há um réu,
que inicialmente se presume inocente. As provas contra o réu são, então, apresentadas, e, se os
jurados acham que são convincentes, sem dúvida alguma, o réu é considerado culpado. A
presunção de inocência é vencida.
João foi julgado culpado pelo crime de assassinato e condenado a cumprir pena de 20 anos de
reclusão. Após 10 anos de prisão, André, o verdadeiro culpado pelo delito pelo qual João fora
condenado, confessou o ilícito e apresentou provas irrefutáveis de que é o verdadeiro culpado,
exclusivamente.
II No julgamento, ocorreu um erro conhecido nos testes de hipótese como erro do tipo I.
III Se a hipótese nula fosse admitida pelos jurados como verdadeira e fosse efetivamente João o
culpado pelo crime, o erro cometido teria sido o chamado erro do tipo II.
3. (CESPE 2020/TJ-PA)
Uma equipe de engenheiros da qualidade, com vistas a estimar vida útil de determinado
equipamento, utilizou uma amostra contendo 225 unidades e obteve uma média de 1.200 horas
de duração, com desvio padrão de 150 horas.
a) 1.190,00 e 1.210,00.
b) 1.185,20 e 1.214,80.
c) 1.177,50 e 1.222,50.
d) 1.180,40 e 1.219,60.
e) 1.174,20 e 1.225,80.
4. (CESPE 2020/TJ-PA)
Uma fábrica de cerveja artesanal possui uma máquina para envasamento regulada para encher
garrafas de 800 mL. Esse mesmo valor é utilizado como média μ, com desvio padrão fixo no
valor de 40 mL. Com o objetivo de manter um padrão elevado de qualidade, periodicamente, é
retirada da produção uma amostra de 25 garrafas para se verificar se o volume envazado está
controlado, ou seja, com média μ= 800 mL. Para os testes, fixa-se o nível de significância 𝛼 =
1%, o que dá valores críticos de z de – 2,58 e 2,58.
I É correto indicar como hipótese alternativa H1: 𝜇 ≠ 800mL, pois a máquina poderá estar
desregulada para mais ou para menos.
II Caso uma amostra apresente média de 778 mL, os técnicos poderão parar a produção para a
realização de nova regulagem, pois tal valor está dentro da região crítica para o teste.
III A produção não precisaria ser paralisada caso uma amostra apresentasse média de 815 mL,
pois este valor está fora da região crítica para o teste.
5. (CESPE 2020/TJ-PA)
A respeito dos intervalos de confiança, julgue os próximos itens.
I Um intervalo de confiança tem mais valor do que uma estimativa pontual única, pois uma
estimativa pontual não fornece nenhuma informação sobre o grau de precisão da estimativa.
II Um intervalo de confiança poderá ser reduzido se o nível de confiança for menor e o valor da
variância populacional for maior.
6. (CESPE 2020/TJ-PA)
Em uma amostra aleatória de 20 municípios Paraenses, considerando-se os dados da Secretaria
de Estado de Segurança Pública e Defesa Social relativos ao crime de lesão corporal, a média é
igual a 87 e o desvio padrão igual a 101,9419.
7. (CESPE 2020/TJ-PA)
Na construção de um intervalo de confiança para a média, conhecida a variância, considerando o
intervalo na forma [𝑥 + 𝜀; 𝑥 − 𝜀], sendo x o valor do estimador da média e ε a semi-amplitude do
intervalo de confiança ou, como é mais popularmente conhecida, a margem de erro do intervalo
de confiança. Considere que, para uma determinada peça automotiva, um lote de 100 peças
tenha apresentado espessura média de 4,561 polegada, com desvio padrão de 1,125 polegada.
Um intervalo de confiança de 95% para a média apresentou limite superior de 4,7815 e limite
inferior de 4,3405. Nessa situação, a margem de erro do intervalo é de, aproximadamente,
a) 𝜀 = 0,4410.
b) 𝜀 = 0,3436.
c) 𝜀 = 0,2205.
d) 𝜀 = 0,1125.
e) 𝜀 = 0,1103
8. (CESPE 2020/TJ-PA)
Um pesquisador deseja estimar a proporção de funcionários públicos que utilizam transporte
público como meio de locomoção para ir ao trabalho. Ele pretende obter um erro de, no
máximo, 2% com probabilidade de, pelo menos, 95%.
Assinale a opção que indica o número de pessoas que o pesquisador precisará entrevistar para
obter o que deseja.
a) 9.604
b) 4.802
c) 1.681
d) 2.401
e) 457
9. (CESPE 2020/TJ-PA)
Ao analisar uma amostra aleatória simples composta de 324 elementos, um pesquisador obteve,
para os parâmetros média amostral e variância amostral, os valores 175 e 81, respectivamente.
Nesse caso, um intervalo de 95% de confiança de 𝜇 é dado por
a) (166,18; 183,82).
b) (174,02; 175,98).
c) (174,51; 175,49).
d) (163,35; 186,65).
e) (174,1775; 175,8225).
a) 0,2.
b) 0,3.
c) 0,4.
d) 0,5.
e) 0,6.
(CESPE 2013/BACEN)
(CESPE 2013/STF)
Pedro e João são os oficiais de justiça no plantão do fórum de determinado município. Em uma
diligência distribuída a Pedro, X é a variável aleatória que representa o sucesso (X = 1) ou
fracasso (X = 0) no cumprimento desse mandado. Analogamente, Y é a variável aleatória que
representa o sucesso (Y = 1) ou fracasso (Y = 0) de uma diligência do oficial João.
Com base nessa situação hipotética e considerando a soma S = X + Y, e que P(X = 1) = P(Y = 1)
= 0,6 e E(XY) = 0,5, julgue o item que se segue, acerca das variáveis aleatórias X, Y e S.
(CESPE 2014/ANATEL)
16. O valor esperado de uma variável aleatória X cujos valores sejam 0 e 1 é igual à
probabilidade de ocorrência do evento [X = 1].
17. Se X for uma variável aleatória contínua e se Y for uma variável aleatória discreta, é
correto afirmar que P(X = k) > P(Y = k).
(CESPE 2016/TCE-PA)
Se as variáveis aleatórias X e Y seguem distribuições de Bernoulli, tais que 𝑃[𝑋 = 1] = 𝑃[𝑌 = 0] =
0,9, então
(CESPE 2018/ABIN)
As variáveis aleatórias X e Y representam as quantidades de notificações diárias de incidentes de
segurança em duas redes de computadores. A função de distribuição da variável Y é expressa
por 𝑝(𝑦) = 𝑃(𝑌 = 𝑦) = 0,5]^" , para 𝑦 ∈ {0,1,2, … }.
(CESPE 2019/TJ-AM)
Em determinado tribunal, a data em que cada processo é protocolado marca a data inicial deste,
a partir da qual é contada a quantidade de meses que se passam até que o juiz apresente a
decisão final sobre ele. Essa quantidade de meses é uma variável aleatória X cuja função
fg "
densidade de probabilidade é dada por 𝑓(𝑥) = "hi , 𝑝𝑎𝑟𝑎 0 < 𝑥 ≤ 6 e 𝑓(𝑥) = % 𝑒 R(fRn) , para 𝑥 > 6,
em que 𝒆 é o número de Euler, base dos logaritmos neperiano.
26. Na situação apresentada, a área da região entre o gráfico da função 𝒇(𝒙) e o eixo das
abscissas, para 𝒙 > 𝟎, é igual a 𝟏.
27. A probabilidade de que o juiz leve três meses para apresentar sua decisão final a respeito
de determinado processo é inferior a 10%.
29. A probabilidade de que o juiz responsável por certo processo leve mais de seis meses
para apresentar sua decisão final é inferior a 30%.
30. A probabilidade de que o juiz responsável por certo processo leve entre três e sete meses
𝟏𝟏 𝟏
para apresentar sua decisão final é igual a − 𝟑𝒆.
𝟏𝟐
31. Sabendo-se que 𝑮(𝒙) = −(𝒙 + 𝟏)𝒆R𝒙 é primitiva de 𝑭(𝒙) = 𝒙𝒆R𝒙 , conclui-se que, no
tribunal em questão, é superior a seis meses o tempo médio esperado até a decisão final para os
processos protocolados.
(CESPE 2019/TJ-AM)
Em uma fila para atendimento, encontram-se 1.000 pessoas. Em ordem cronológica, cada
pessoa recebe uma senha para atendimento numerada de 1 a 1.000. Para a estimação do tempo
médio de espera na fila, registram-se os tempos de espera das pessoas cujas senhas são
números múltiplos de 10, ou seja, 10, 20, 30, 40, ..., 1.000.
Considerando que o coeficiente de correlação dos tempos de espera entre uma pessoa e outra
nessa fila seja igual a 0,1, e que o desvio padrão populacional dos tempos de espera seja igual a
10 minutos, julgue os itens que se seguem.
(CESPE 2016/TCE-PA)
Uma amostra aleatória simples 𝑋" , 𝑋$ , … , 𝑋u foi retirada de uma população normal com média e
desvio padrão iguais a 10. Julgue os próximos itens, a respeito da média amostral 𝑋 =
[𝑋" + 𝑋$ + ⋯ 𝑋u ]/𝑛.
(CESPE 2016/TCE-PA)
A respeito de uma variável aleatória contínua 𝑼, uniformemente distribuída no intervalo [𝟎, 𝟏],
julgue os seguintes itens.
(CESPE 2019/TJ-AM)
É igual a 3/4 a probabilidade de determinado advogado conseguir decisão favorável a si em
cada petição protocolada por ele na vara cível de certo tribunal. O plano desse advogado é
protocolar, sequencialmente, 12 petições nessa vara cível durante o ano de 2020. Favoráveis ou
não, as decisões do tribunal para petições são emitidas na mesma ordem cronológica em que
são protocoladas e são sempre independentes entre si.
A partir dessa situação hipotética, julgue o próximo item, considerando as variáveis aleatórias X e
Y, em que X = quantidade de decisões emitidas pelo tribunal até que ocorra a primeira decisão
não favorável ao advogado, e Y = quantidade de decisões emitidas pelo tribunal favoráveis ao
advogado.
43. A probabilidade do evento “X é igual a 1”, isto é, de que seja desfavorável ao advogado
a decisão do tribunal a respeito da primeira petição protocolada por ele em 2020, é igual a 25%.
47. Espera-se que, ao longo de 2020, exatamente 9 decisões sejam favoráveis ao advogado.
(CESPE 2018/EBSERH)
Todo paciente que chega a determinado posto hospitalar é imediatamente avaliado no que se
refere à prioridade de atendimento. Suponha que o paciente seja classificado como
“emergente” (Y = 0) ou como “não emergente” (Y = 1), e que as quantidades X, diárias, de
pacientes que chegam a esse posto sigam uma distribuição de Poisson com média igual a 20.
Considerando que W represente o total diário de pacientes emergentes, de tal sorte que
𝑥
𝑃(𝑊 = 𝑤|𝑋 = 𝑥) = • ‚ 0,1ƒ 0,9fRƒ , em que 0 ≤ 𝑤 ≤ 𝑥 e 𝑥 ≥ 0, julgue os itens subsequentes.
𝑤
48. A variável Y segue uma distribuição de Bernoulli, cuja probabilidade de sucesso é igual a
0,9.
49. O total diário W de pacientes emergentes segue uma distribuição de Poisson com média
superior a 3.
50. Se, em determinado dia, 10 pacientes forem atendidos nesse posto hospitalar, então a
probabilidade de se registrar, entre esses pacientes, exatamente um paciente emergente será
igual a 0,1.
51. A variância do número diário de pacientes que chegam a esse posto hospitalar é igual a
20 pacientes².
52. Para 𝟎 ≤ 𝒘 ≤ 𝒙, as variáveis aleatórias 𝑾 e 𝑿 se distribuem, conjuntamente, como
𝟐𝒙 𝟗𝒙ˆ𝒘
𝑷(𝑾 = 𝒘, 𝑿 = 𝒙) = 𝒆R𝟐𝟎 × 𝒘! × (𝒙R𝒘)!.
(CESPE 2018/EBSERH)
Os tempos de duração de exames de cateterismo cardíaco (Y, em minutos) efetuados por
determinada equipe médica seguem uma distribuição normal com média 𝜇 e desvio padrão 𝜎,
ambos desconhecidos. Em uma amostra aleatória simples de 16 tempos de duração desse tipo
de exame, observou-se tempo médio amostral igual a 58 minutos, e desvio padrão amostral
igual a 4 minutos.
53. Ao se aplicar o teste t de Student com nível de significância igual a 2,3%, conclui-se haver
evidências estatisticamente significativas contra a hipótese H0.
54. Nesse teste de hipóteses, comete-se o erro do tipo II caso a hipótese H0 seja rejeitada,
quando, na verdade, H0 não deveria ser rejeitada.
55. Se o teste for efetuado com nível de significância igual a 1%, o poder do teste será igual a
99% para qualquer valor hipotético μ.
56. O P-valor (ou nível descritivo do teste) foi superior a 2,3%.
Sabendo que 𝑃(𝑍 < 2) = 0,975, em que 𝑍 representa a distribuição normal padrão, julgue os
itens que se seguem, em relação a essa situação hipotética.
==7ee66==
A respeito dessa situação hipotética, julgue os próximos itens, sabendo que 𝑏 > 0 e que o
desvio padrão amostral da variável 𝑋 é igual a 2.
61. A correlação linear de Pearson entre a variável resposta 𝒀 e a variável regressora 𝑿 é igual
a 0,75.
62. A estimativa da variância 𝝈𝟐 é superior a 0,5.
63. A estimativa do coeficiente angular 𝒃, pelo método de mínimos quadrados ordinários, é
igual a 0,25.
(CESPE 2018/Polícia Federal – Agente)
O valor diário (em R$ mil) apreendido de contrabando em determinada região do país é uma
variável aleatória 𝑊 que segue distribuição normal com média igual a R$ 10 mil e desvio padrão
igual a R$ 4 mil.
Um estudo mostrou que a quantidade mensal Y (em quilogramas) de drogas ilícitas apreendidas
em certo local segue uma distribuição exponencial e que a média da variável aleatória Y é igual a
10 kg.
Com referência a essas informações, julgue o item que se segue, sabendo que P(Z > 2) = 0,025,
em que Z denota uma variável aleatória normal padrão.
72. Considerando-se o teste da hipótese nula H0: M ≤ 9,5 dias contra a hipótese alternativa
H1: M > 9,5 dias, adotando-se o nível de significância igual a 1%, não haveria evidências
estatísticas contra a hipótese H0
74. Considerando o referido desenho amostral, estima-se que o percentual populacional 𝑷𝒑𝒐𝒑
seja inferior a 79%.
As estimativas dos coeficientes 𝑎 e 𝑏, obtidas pelo método dos mínimos quadrados ordinários
foram, respectivamente, iguais a 2,5 e 10. O tamanho da amostra para a obtenção desses
resultados foi n = 101. A média amostral e o desvio padrão amostral da variável x foram,
respectivamente, iguais a 9 mmol/dm3 e 1,6 mmol/dm3 e o desvio padrão da variável y foi igual a
5 horas.
A partir dessas informações e considerando que 𝑍 representa uma distribuição normal padrão,
em que 𝑃(𝑍 ≤ −2) = 0,025, julgue os itens subsecutivos.
85. O valor mais provável para a realização da variável X é 50 litros, de modo que 𝑷(𝑿 =
𝟓𝟎 𝒍𝒊𝒕𝒓𝒐𝒔) > 𝑷(𝑿 = 𝟑𝟎 𝒍𝒊𝒕𝒓𝒐𝒔).
(CESPE 2016/TCE-PA)
Uma amostra aleatória, com 𝑛 = 16 observações independentes e identicamente distribuídas
(IID), foi obtida a partir de uma população infinita, com média e desvio padrão desconhecidos e
distribuição normal.
(CESPE 2018/EBSERH)
Determinado estudo considerou um modelo de regressão linear simples na forma 𝒚𝒊 = 𝜷𝟎 +
𝜷𝟏 𝒙𝒊 + 𝜺𝒊 , em que 𝒚𝒊 representa o número de leitos por habitante existente no município i; 𝒙𝒊
representa um indicador de qualidade de vida referente a esse mesmo município i, para i = 1, ...,
n. A componente 𝜺𝒊 representa um erro aleatório com média 0 e variância 𝝈𝟐 . A tabela a seguir
mostra a tabela ANOVA resultante do ajuste desse modelo pelo método dos mínimos
quadrados ordinários.
2. GABARITOS
01. C
02. E
03. D
04. E
05. C
06. E
07. C
08. D
09. B
10. B
11. E
12. E
13. E
14. E
15. C
16. C
17. E
18. A
19. E
20. C
21. E
22. E
23. E
24. C
25. E
26. C
27. C
28. E
29. E
30. C
31. E
32. C
33. C
34. C (Deveria ser E)
35. E
36. E
37. C
38. E
39. C
40. C
41. C
42. C
43. C
44. E
45. E
46. E
47. C
48. C
49. E
50. E
51. C
52. C
53. E
54. E
55. E
56. C
57. C
58. C
59. E
60. E
61. C
62. E
63. C
64. E
65. C
66. E
67. E
68. E
69. E
70. E
71. C
72. C
73. E
74. C
75. C
76. C
77. E
78. C
79. C
80. E
81. E
82. C
83. E
84. C
85. E
86. E
87. E
88. C
89. C
90. E
91. E
92. C
93. E
94. C
95. C
96. E
97. E
98. C
99. E
100. C
1. (CESPE 2020/TJ-PA)
Uma amostra aleatória simples de tamanho 5 foi retirada de uma distribuição de Poisson com
média igual a 5. Essa amostra é representada por 𝑋" , 𝑋$ , 𝑋% , 𝑋& , 𝑋' , em que cada variável 𝑋(
denota o total de erros processuais registrados em certo cartório judicial no dia k, com 𝑘 ∈
{1,2,3,4,5}.
Comentário
A distribuição de Poisson é uma variável discreta e sua variância é igual à sua média.
A média da variável 𝑋 de Poisson é 5. Logo, sua variância também é igual a 5.
𝐸(𝑋) = 𝑉𝑎𝑟(𝑋) = 5
Logo, o desvio padrão de X é √5.
A variável Y é a soma de 5 variáveis de Poisson. Vamos calcular a sua média e sua variância.
𝐸(𝑌) = 𝐸(𝑋" + 𝑋$ + 𝑋% + 𝑋& + 𝑋' )
= 5 + 5 + 5 + 5 + 5 = 25
Acredito que a questão poderia ter sido mais precisa e indicar que as variáveis 𝑋" , 𝑋$ , 𝑋% , 𝑋& , 𝑋'
são independentes. Supondo que são independentes, a variância da soma é igual à soma das
variâncias.
𝑉𝑎𝑟(𝑌) = 𝑉𝑎𝑟(𝑋" + 𝑋$ + 𝑋% + 𝑋& + 𝑋' ) =
= 5 + 5 + 5 + 5 + 5 = 25
Aproveito para destacar que a variável Y também segue uma distribuição de Poisson. Isso é
verdade porque soma de 𝑛 variáveis independentes de Poisson também é uma distribuição de
Poisson. Como Y é a soma de 5 variáveis independentes de Poisson, então Y também segue uma
distribuição de Poisson.
𝜎¬ = -𝑉𝑎𝑟(𝑌) = √25 = 5
Vamos analisar as alternativas.
Letra A – Falsa
O coeficiente de variação é o quociente do desvio padrão pela média. Logo,
𝜎¬ 5 1
𝐶𝑉¬ = = =
𝐸(𝑌) 25 5
Letra B – Falsa
Já calculamos 𝐸(𝑌) = 25 > 20.
Letra C – Verdadeira
De fato, 𝜎¬ = 5.
Letra D - Falsa
A probabilidade 𝑃(𝑋 = 𝑥) de uma variável de Poisson é dada por:
𝑒 R¯ ∙ 𝜆f
𝑃(𝑋 = 𝑥) =
𝑥!
No caso da variável X, temos que 𝜆 = 5. Queremos calcular 𝑃(𝑋 = 0).
𝑒 R' ∙ 5h 1
𝑃(𝑋 = 0) = = 𝑒 R' = '
0! 𝑒
No caso da variável Y, temos que 𝜆 = 𝐸(𝑌) = 25. Queremos calcular 𝑃(𝑌 = 0).
𝑒 R$' ∙ 25h 1
𝑃(𝑌 = 0) = = 𝑒 R$' = $'
0! 𝑒
Assim, 𝑃(𝑌 = 0) < 𝑃(𝑋 = 0).
Letra E – Falsa
A média amostral só segue uma distribuição normal se a população seguir uma distribuição
normal.
Gabarito: C
2. (CESPE 2020/TJ-PA)
O teste de hipóteses se assemelha ao julgamento de um crime. Em um julgamento, há um réu,
que inicialmente se presume inocente. As provas contra o réu são, então, apresentadas, e, se os
jurados acham que são convincentes, sem dúvida alguma, o réu é considerado culpado. A
presunção de inocência é vencida.
João foi julgado culpado pelo crime de assassinato e condenado a cumprir pena de 20 anos de
reclusão. Após 10 anos de prisão, André, o verdadeiro culpado pelo delito pelo qual João fora
condenado, confessou o ilícito e apresentou provas irrefutáveis de que é o verdadeiro culpado,
exclusivamente.
II No julgamento, ocorreu um erro conhecido nos testes de hipótese como erro do tipo I.
III Se a hipótese nula fosse admitida pelos jurados como verdadeira e fosse efetivamente João o
culpado pelo crime, o erro cometido teria sido o chamado erro do tipo II.
Item III.
O erro do tipo II ocorre quando a hipótese nula de um teste é falsa (no exemplo, João seria de
fato culpado), mas o teste nos leva a crer que a hipótese nula é verdadeira (no exemplo, João
seria julgado como inocente apesar de ele ser culpado). O item III está correto.
Gabarito: E
3. (CESPE 2020/TJ-PA)
Uma equipe de engenheiros da qualidade, com vistas a estimar vida útil de determinado
equipamento, utilizou uma amostra contendo 225 unidades e obteve uma média de 1.200 horas
de duração, com desvio padrão de 150 horas.
a) 1.190,00 e 1.210,00.
b) 1.185,20 e 1.214,80.
c) 1.177,50 e 1.222,50.
d) 1.180,40 e 1.219,60.
e) 1.174,20 e 1.225,80.
Comentário
A amostra contendo 225 unidades forneceu os seguintes dados:
𝑥 = 1.200 ℎ𝑜𝑟𝑎𝑠
𝑠 = 150 ℎ𝑜𝑟𝑎𝑠
Nós não conhecemos o desvio padrão da população. Teoricamente, deveríamos usar a
distribuição t de Student com n-1 = 224 graus de liberdade para construir o intervalo de
confiança.
Entretanto, a amostra é muito grande. A distribuição t de Student com 224 graus de liberdade
praticamente coincide com a distribuição normal padrão. Por isso, a questão mandou utilizar 𝑧 =
1,96 para construir o intervalo de confiança de 95%.
Vamos construir o intervalo para a média.
𝑠 150 150
𝑥 ± 𝑡h ∙ = 1.200 ± 1,96 × = 1.200 ± 1,96 ×
√𝑛 √225 15
= 1.200 ± 19,6
= [1.180,40; 1.219,60]
Gabarito: D
4. (CESPE 2020/TJ-PA)
Uma fábrica de cerveja artesanal possui uma máquina para envasamento regulada para encher
garrafas de 800 mL. Esse mesmo valor é utilizado como média μ, com desvio padrão fixo no
valor de 40 mL. Com o objetivo de manter um padrão elevado de qualidade, periodicamente, é
retirada da produção uma amostra de 25 garrafas para se verificar se o volume envazado está
controlado, ou seja, com média μ= 800 mL. Para os testes, fixa-se o nível de significância 𝛼 =
1%, o que dá valores críticos de z de – 2,58 e 2,58.
I É correto indicar como hipótese alternativa H1: 𝜇 ≠ 800mL, pois a máquina poderá estar
desregulada para mais ou para menos.
II Caso uma amostra apresente média de 778 mL, os técnicos poderão parar a produção para a
realização de nova regulagem, pois tal valor está dentro da região crítica para o teste.
III A produção não precisaria ser paralisada caso uma amostra apresentasse média de 815 mL,
pois este valor está fora da região crítica para o teste.
Comentário
Item I.
O item I está certo. Também poderíamos construir hipóteses alternativas como 𝜇 > 800 ou 𝜇 <
800, mas nenhuma informação no texto nos leva a construir tais hipóteses.
De fato, levando em consideração que a questão apenas fala que a máquina pode estar
desregulada, ela pode sim estar desregulada para mais ou menos o que nos leva a considerar um
teste bilateral com hipótese alternativa 𝜇 ≠ 800.
Em outras palavras, a fábrica nem quer que a máquina esteja desregulada para baixo (para dar
menos cerveja aos seus clientes em média) nem quer que a máquina esteja desregulada para
cima (para dar mais cerveja do que seus clientes esperam em média).
Item II.
Vamos calcular a estatística teste.
𝑋−𝜇 778 − 800 −22
𝑧ÀœÁÀœ = 𝜎 = = = −2,75
40 8
√𝑛 √25
A região crítica está abaixo de -2,58 e acima de 2,58. A estatística teste caiu na região crítica.
Assim, o teste indica que a máquina está desregulada (para baixo). O item II está certo. Em uma
linguagem grosseira, a média amostral 778 está tão longe de 800 que o teste indicou que a
máquina está desregulada.
Item III.
Vamos calcular a estatística teste.
𝑋−𝜇 815 − 800 15
𝑧ÀœÁÀœ = 𝜎 = = = 1,875
40 8
√𝑛 √25
A região crítica está abaixo de -2,58 e acima de 2,58. A estatística teste caiu na região de
aceitação (região de não rejeição). Assim, devemos aceitar a hipótese nula de que a média é 800
mL.
Em uma linguagem grosseira, a média amostral de 815mL não está tão longe assim de 800mL
para me fazer crer que a máquina está desregulada, ou seja, 815mL ainda é aceitável levando em
consideração o nível de significância do teste de 1%.
Gabarito: E
5. (CESPE 2020/TJ-PA)
A respeito dos intervalos de confiança, julgue os próximos itens.
I Um intervalo de confiança tem mais valor do que uma estimativa pontual única, pois uma
estimativa pontual não fornece nenhuma informação sobre o grau de precisão da estimativa.
II Um intervalo de confiança poderá ser reduzido se o nível de confiança for menor e o valor da
variância populacional for maior.
Item III.
Quando a variância populacional é desconhecida, devemos utilizar a distribuição t de Student
para a construção do intervalo de confiança.
Quando a amostra é grande (geralmente superior a 30), a distribuição t de Student é
praticamente igual à distribuição normal. Assim, para amostras pequenas, a recomendação é
utilizar a distribuição t com 𝑛 − 1 graus de liberdade.
O item III está certo.
Gabarito: C
6. (CESPE 2020/TJ-PA)
Em uma amostra aleatória de 20 municípios Paraenses, considerando-se os dados da Secretaria
de Estado de Segurança Pública e Defesa Social relativos ao crime de lesão corporal, a média é
igual a 87 e o desvio padrão igual a 101,9419.
𝑠 = 101,9419
Como o desvio padrão populacional não é conhecido, devemos utilizar a distribuição t de
Student com 𝑛 − 1 = 20 − 1 = 19 graus de liberdade.
A questão falou que o “coeficiente” a ser utilizar é 𝑎 = 2,093. A questão poderia ter sido um
pouco mais precisa na linguagem e dizer que esse é o valor da distribuição t de Student com 19
graus de liberdade para a construção do intervalo de 95% de confiança.
Vamos construir o intervalo:
𝑠 101,9419
𝑋 ± 𝑡h × = 87 ± 2,093 ×
√𝑛 √20
101,9419
87 ± 2,093 ×
4,4721
87 ± 47,71
[39,29; 134,71]
A amplitude do intervalo é 2 × 47,71 = 95,42.
Gabarito: E
7. (CESPE 2020/TJ-PA)
Na construção de um intervalo de confiança para a média, conhecida a variância, considerando o
intervalo na forma [𝑥 + 𝜀; 𝑥 − 𝜀], sendo x o valor do estimador da média e ε a semi-amplitude do
intervalo de confiança ou, como é mais popularmente conhecida, a margem de erro do intervalo
de confiança. Considere que, para uma determinada peça automotiva, um lote de 100 peças
tenha apresentado espessura média de 4,561 polegada, com desvio padrão de 1,125 polegada.
Um intervalo de confiança de 95% para a média apresentou limite superior de 4,7815 e limite
inferior de 4,3405. Nessa situação, a margem de erro do intervalo é de, aproximadamente,
a) 𝜀 = 0,4410.
b) 𝜀 = 0,3436.
c) 𝜀 = 0,2205.
d) 𝜀 = 0,1125.
e) 𝜀 = 0,1103
Comentário
O problema já deu o intervalo de confiança: [4,3405 ; 4,7815].
Assim, a amplitude do intervalo é:
𝐴 = 4,7815 − 4,3405 = 0,441
A margem de erro é a metade da amplitude.
0,441
𝜀= = 0,2205
2
Poderíamos também calcular a margem de erro através da seguinte fórmula (caso o
problema não desse os limites do intervalo – o que é mais comum):
𝜎 1,125 1,125
𝜀 = 𝑍h × = 1,96 × = 1,96 × = 0,2205
√𝑛 √100 10
Gabarito: C
8. (CESPE 2020/TJ-PA)
Um pesquisador deseja estimar a proporção de funcionários públicos que utilizam transporte
público como meio de locomoção para ir ao trabalho. Ele pretende obter um erro de, no
máximo, 2% com probabilidade de, pelo menos, 95%.
Assinale a opção que indica o número de pessoas que o pesquisador precisará entrevistar para
obter o que deseja.
a) 9.604
b) 4.802
c) 1.681
d) 2.401
e) 457
Comentário
Fiz uma pequena alteração na questão. No enunciado original, na alternativa D, constava o
número 2.041, quando, na verdade, deveria ser 2.401 (gabarito da questão).
O intervalo de confiança para a proporção é dado por:
𝑝̂ 𝑞Ç
𝑝̂ ± 𝑍h Å
𝑛
𝑝̂ 𝑞Ç
𝑍h Å
𝑛
A questão informou que o erro máximo é 2% com uma confiança de 95%. Assim, colocando 𝑍h =
1,96 (valor da distribuição normal padrão associado a 95% de confiança), temos:
𝑝̂ 𝑞Ç
1,96 × Å = 0,02
𝑛
Assim, para determinar o tamanho da amostra, precisamos do valor da proporção. Ora, mas não
temos o valor da proporção! É justamente o que queremos estimar.
A estatística fornece duas soluções para esse dilema. Uma delas é realizar uma amostra prévia
para determinar algum valor para 𝑝̂ e 𝑞Ç. Por exemplo, realizamos uma amostra prévia e obtemos
𝑝̂ = 0,30. Vamos lá e substituímos 𝑝̂ = 0,30 e 𝑞Ç = 0,70. Não é esse o caso da questão.
Caso a questão não informe que uma amostra prévia foi realizada, devemos substituir 𝑝̂ = 𝑞Ç =
0,5. Devemos fazer isso sempre que a questão “ficar calada” ou se a questão pedir “valor
máximo da amostra” ou “variância máxima”.
0,5 × 0,5
1,96 × Å = 0,02
𝑛
0,0016𝑛 = 3,8416
𝑛 = 2.401
Gabarito: D
9. (CESPE 2020/TJ-PA)
Ao analisar uma amostra aleatória simples composta de 324 elementos, um pesquisador obteve,
para os parâmetros média amostral e variância amostral, os valores 175 e 81, respectivamente.
a) (166,18; 183,82).
b) (174,02; 175,98).
c) (174,51; 175,49).
d) (163,35; 186,65).
e) (174,1775; 175,8225).
Comentário
A variância populacional não é conhecida. Nesse caso, devemos utilizar a distribuição t de
Student para construir o intervalo de confiança para a média populacional.
Entretanto, quando a amostra é grande, a distribuição t de Student é muito próxima da
distribuição normal padrão. Assim, para construir um intervalo de 95% de confiança com uma
amostra de 324 elementos, podemos utilizar 𝑍h = 1,96 (valor conhecido da distribuição normal
padrão para 95% de confiança).
Como a variância amostral é 81, o desvio padrão amostral é 𝑠 = √81 = 9.
O intervalo será:
𝑠
𝑋 ± 𝑍h ×
√𝑛
9 9
175 ± 1,96 × = 175 ± 1,96 ×
√324 18
= 175 ± 0,98
[174,02 ; 175,98]
Gabarito: B
a) 0,2.
b) 0,3.
c) 0,4.
d) 0,5.
e) 0,6.
Comentário
Como a distribuição é simétrica em torno de zero, então 𝑃(𝑌 > 0) = 50% e 𝑃(𝑌 < 0) = 50%.
Vamos tomar como exemplo concreto a distribuição normal padrão para facilitar o raciocínio.
A questão diz que 𝑃(𝑌 $ < 4) = 0,4. Isso é o mesmo dizer que 𝑃(−2 < 𝑌 < 2) = 0,4 = 40%. Basta
lembrar que (−2)$ = 2$ = 4.
Como a distribuição é simétrica em torno de zero e como 𝑃(−2 < 𝑌 < 2) = 0,4, então
𝑃(0 < 𝑌 < 2) = 0,2 = 20%
Assim, a área acima de 2, ou seja, 𝑃(𝑌 > 2), é o que falta para 50%.
𝑃(𝑌 > 2) = 50% − 20% = 30% = 0,3
Gabarito: B
(CESPE 2013/BACEN)
Comentário
Para calcular o valor esperado, devemos multiplicar cada valor pela respectiva probabilidade e
somar os resultados.
𝐸(𝑋) = Ì 𝑋Í ∙ 𝑃(𝑋Í )
Gabarito: Errado
(CESPE 2013/STF)
Pedro e João são os oficiais de justiça no plantão do fórum de determinado município. Em uma
diligência distribuída a Pedro, X é a variável aleatória que representa o sucesso (X = 1) ou
Com base nessa situação hipotética e considerando a soma S = X + Y, e que P(X = 1) = P(Y = 1)
= 0,6 e E(XY) = 0,5, julgue o item que se segue, acerca das variáveis aleatórias X, Y e S.
Comentário
Item II.
O coeficiente de correlação entre duas variáveis aleatórias é dado por:
𝑐𝑜𝑣(𝑋, 𝑌)
𝜌(𝑋, 𝑌) =
𝜎Ñ ∙ 𝜎¬
Item III.
A variável S é a soma de duas distribuições de Bernoulli X e Y.
Uma distribuição binomial pode ser vista como a soma de n variáveis independentes de
Bernoulli.
Entretanto, o problema X e Y não são variáveis independentes. Como a covariância não é nula, já
podemos garantir que as variáveis não são independentes.
Item IV.
Queremos calcular a esperança de S.
𝐸(𝑆) = 𝐸(𝑋 + 𝑌)
Lembre-se que a esperança da soma é igual à soma das esperanças.
(CESPE 2014/ANATEL)
16. O valor esperado de uma variável aleatória X cujos valores sejam 0 e 1 é igual à
probabilidade de ocorrência do evento [X = 1].
17. Se X for uma variável aleatória contínua e se Y for uma variável aleatória discreta, é
correto afirmar que P(X = k) > P(Y = k).
Comentário
Item I.
A questão não falou o nome da distribuição, mas conhecemos esse tipo de distribuição de
probabilidades como distribuição de Bernoulli. Ela se caracteriza pela existência de apenas dois
eventos, mutuamente exclusivos, que denominaremos de sucesso e fracasso, em um
experimento que é realizado uma única vez.
Assim, temos a seguinte distribuição de probabilidades (lembre-se que adotamos o valor 0 para
o fracasso e 1 para o sucesso).
𝑿 𝑷(𝑿)
0 𝑞
1 𝑝
𝑿 𝑷(𝑿) 𝑿 ∙ 𝑷(𝑿)
0 𝑞 0
1 𝑝 𝑝
Somando...
𝐸(𝑋) = 0 + 𝑝
𝐸(𝑋) = 𝑝
Item II.
Quando temos uma variável aleatória contínua, a probabilidade de essa variável assumir um valor
específico é igual a 0.
Como 𝑌 é uma variável aleatória discreta, então 𝑃(𝑌 = 𝑘) é um número no intervalo [0,1], ou seja,
0 ≤ 𝑃(𝑌 = 𝑘) ≤ 1.
Comentário
Item I.
Vamos calcular as probabilidades para 𝑘 = 1, 2, … , 6. Para tanto, basta substituir k na função
QR(
𝑃(𝑋 = 𝑘) = $"
.
7−1 6
𝑃(𝑋 = 1) = =
21 21
7−2 5
𝑃(𝑋 = 2) = =
21 21
7−3 4
𝑃(𝑋 = 3) = =
21 21
7−4 3
𝑃(𝑋 = 4) = =
21 21
7−5 2
𝑃(𝑋 = 5) = =
21 21
7−6 1
𝑃(𝑋 = 6) = =
21 21
Para calcular a esperança de X, devemos multiplicar cada valor de X pela sua respectiva
probabilidade e somar os resultados.
6 5 4 3 2 1
𝐸(𝑋) = 1 × +2× +3× +4× +5× +6×
21 21 21 21 21 21
6 10 12 12 10 6
𝐸(𝑋) = + + + + +
21 21 21 21 21 21
56 8
𝐸(𝑋) = =
21 3
Vamos analisar as alternativas.
a) A esperança 𝐸(3𝑋 − 8) é igual a zero.
Vamos aplicar as propriedades da esperança.
8
𝐸(3𝑋 − 8) = 𝐸(3𝑋) − 𝐸(8) = 3 ∙ 𝐸(𝑋) − 8 = 3 × − 8 = 8 − 8 = 0
3
A alternativa A está correta.
c) 𝑃(𝑋 $ = 1) = 4/49.
6 6 2
𝑃(𝑋 $ = 1) = 0 + = =
21 21 7
A letra C está errada.
6 20 36 48 50 36
𝐸(𝑋 $ ) = + + + + +
21 21 21 21 21 21
196
𝐸(𝑋 $ ) =
21
$
196 8 $
𝜎 = −Ó Ô
21 3
196 64
𝜎$ = −
21 9
588 − 448
𝜎$ =
63
140
𝜎$ =
63
20
𝜎$ =
9
Esse número é inferior a 3.
Gabarito: A
(CESPE 2016/TCE-PA)
Se as variáveis aleatórias X e Y seguem distribuições de Bernoulli, tais que 𝑃[𝑋 = 1] = 𝑃[𝑌 = 0] =
0,9, então
Item I.
Sabemos que X pode ser 0 ou 1 com probabilidades 0,1 e 0,9, respectivamente. Assim, 𝑋 $ pode
ser 0$ = 0 ou 1$ = 1 com probabilidades 0,1 e 0,9, respectivamente.
𝑃(𝑋 $ = 0) = 0,1
𝑃(𝑋 $ = 1) = 0,9
Como 𝑋 $ só pode assumir os valores 0 ou 1, então 𝑋 $ segue uma distribuição de Bernoulli.
Lembre-se que a média da distribuição de Bernoulli é a própria probabilidade de sucesso
(probabilidade de ocorrer 1). Logo,
𝐸(𝑋 $ ) = 𝑃(𝑋 $ = 1) = 0,9
O item I está errado porque a média não é 0,81.
Item II.
Já vimos que 𝑉𝑎𝑟(𝑋) = 𝑉𝑎𝑟(𝑌) = 0,09. O item II está certo.
Item III.
Já vimos que 𝐸(𝑌) = 0,1. Logo, o item III está errado.
Item IV.
Queremos calcular 𝑃[𝑋 = 0, 𝑌 = 0]. Essa é apenas outra maneira de escrever que queremos
calcular a probabilidade da interseção dos eventos, ou seja:
𝑃[𝑋 = 0, 𝑌 = 0] = 𝑃 [𝑋 = 0 ∩ 𝑌 = 0]
Não temos informações suficientes para calcular o valor dessa probabilidade. Entretanto,
podemos garantir que essa probabilidade não pode ser superior a 0,2.
Basta observar que 𝑃(𝑋 = 0) = 0,1. Ora, se 𝑃(𝑋 = 0) = 0,1, como seria possível que a
probabilidade da interseção dos eventos 𝑋 = 0 e 𝑌 = 0 fosse maior que 0,2? A probabilidade
dessa interseção seria no máximo igual a 0,1.
O item IV está errado.
Item V.
A distribuição binomial é uma soma de n variáveis independentes de Bernoulli que possuem a
mesma probabilidade de sucesso. Em outras palavras, não basta somar n variáveis
independentes de Bernoulli. É necessário que essas variáveis de Bernoulli sejam idênticas.
O item V está errado.
De qualquer forma, vamos provar que de fato 𝑋 + 𝑌 não segue a distribuição binomial sugerida
pelo enunciado.
A única maneira de 𝑋 + 𝑌 ser igual a 0 é quando X e Y são iguais a 0.
Logo,
𝑃(𝑋 + 𝑌 = 0) = 𝑃(𝑋 = 0 ∩ 𝑌 = 0)
Como esse item garantiu que X e Y são independentes, então a probabilidade da interseção é
igual ao produto das probabilidades.
𝑃(𝑋 + 𝑌 = 0) = 0,1 × 0,9 = 0,09
Vamos agora trabalhar com a distribuição binomial sugerida pelo enunciado (de parâmetros 𝑛 =
2 e 𝑝 = 0,3).
Vamos calcular a probabilidade de essa variável binomial B ser igual a 0.
2
𝑃(𝐵 = 0) = • ‚ 𝑝h 𝑞$ = 𝑞$ = 0,7$ = 0,49
0
Veja que obtivemos probabilidades diferentes para a ocorrência do mesmo número 0. Logo,
essas distribuições não são iguais.
O item V está errado.
(CESPE 2018/ABIN)
As variáveis aleatórias X e Y representam as quantidades de notificações diárias de incidentes de
segurança em duas redes de computadores. A função de distribuição da variável Y é expressa
por 𝑝(𝑦) = 𝑃(𝑌 = 𝑦) = 0,5]^" , para 𝑦 ∈ {0,1,2, … }.
Comentário
Item I.
A função de distribuição da variável Y é expressa por 𝑝(𝑦) = 𝑃(𝑌 = 𝑦) = 0,5]^" , para 𝑦 ∈
{0,1,2, … }.
Assim, para calcular 𝑃(𝑌 = 𝑞), basta substituir 𝑦 por 𝑞 na função acima.
𝑃(𝑌 = 𝑞) = 0,5×^"
Vamos agora calcular 𝑃(𝑌 > 𝑞). Ora, estamos interessados em todos os valores maiores do que 𝑞,
ou seja, 𝑞 + 1, 𝑞 + 2, 𝑞 + 3, ….
𝑃(𝑌 > 𝑞) = 𝑃(𝑌 = 𝑞 + 1) + 𝑃(𝑌 = 𝑞 + 2) + 𝑃(𝑌 = 𝑞 + 3) + ⋯
Estou colocando reticências porque é uma soma infinita.
Vamos substituir 𝑦 por 𝑞 + 1, 𝑞 + 2, 𝑞 + 3, ….
Temos uma série geométrica de primeiro termo igual a 𝑎" = 0,5×^$ e razão igual a 𝑟 = 0,5. A
soma dos infinitos termos de uma Progressão Geométrica é
𝑎"
1−𝑟
Logo,
0,5×^$
𝑃(𝑌 > 𝑞) =
0,5
Para dividir potências de mesma base, devemos conservar a base e subtrair os expoentes.
𝑃(𝑌 > 𝑞) = 0,5×^$R" = 0,5×^"
Ora, obtivemos os seguintes resultados:
𝑃(𝑌 = 𝑞) = 0,5×^"
Item II.
Vamos recordar a fórmula da variância da soma de duas variáveis aleatórias X e Y.
𝑉𝑎𝑟(𝑋 + 𝑌) = 𝑉𝑎𝑟(𝑋) + 𝑉𝑎𝑟(𝑌) + 2 ∙ 𝑐𝑜𝑣(𝑋, 𝑌)
Lembre-se que a variância é sempre um número não negativo. Assim, 𝑉𝑎𝑟(𝑋 + 𝑌) só seria maior
do que ou igual a 𝑉𝑎𝑟(𝑋) + 𝑉𝑎𝑟(𝑌) se a parcela 2 ∙ 𝑐𝑜𝑣(𝑋, 𝑌) não fosse negativa. Não há nada no
enunciado que garanta que 𝑐𝑜𝑣(𝑋, 𝑌) não é negativa. É perfeitamente possível que a covariância
seja um número negativo.
Logo, o item II está errado.
(CESPE 2019/TJ-AM)
Em determinado tribunal, a data em que cada processo é protocolado marca a data inicial deste,
a partir da qual é contada a quantidade de meses que se passam até que o juiz apresente a
decisão final sobre ele. Essa quantidade de meses é uma variável aleatória X cuja função
fg "
densidade de probabilidade é dada por 𝑓(𝑥) = "hi , 𝑝𝑎𝑟𝑎 0 < 𝑥 ≤ 6 e 𝑓(𝑥) = % 𝑒 R(fRn) , para 𝑥 > 6,
em que 𝒆 é o número de Euler, base dos logaritmos neperiano.
26. Na situação apresentada, a área da região entre o gráfico da função 𝒇(𝒙) e o eixo das
abscissas, para 𝒙 > 𝟎, é igual a 𝟏.
27. A probabilidade de que o juiz leve três meses para apresentar sua decisão final a respeito
de determinado processo é inferior a 10%.
29. A probabilidade de que o juiz responsável por certo processo leve mais de seis meses
para apresentar sua decisão final é inferior a 30%.
30. A probabilidade de que o juiz responsável por certo processo leve entre três e sete meses
𝟏𝟏 𝟏
para apresentar sua decisão final é igual a − 𝟑𝒆.
𝟏𝟐
31. Sabendo-se que 𝑮(𝒙) = −(𝒙 + 𝟏)𝒆R𝒙 é primitiva de 𝑭(𝒙) = 𝒙𝒆R𝒙 , conclui-se que, no
tribunal em questão, é superior a seis meses o tempo médio esperado até a decisão final
para os processos protocolados.
Comentário
Item I.
Como temos uma função densidade de probabilidade, então a função dada pelo enunciado é
obrigada a satisfazer as seguintes condições:
i) 𝑓(𝑥) ≥ 0 para todo 𝑥 pertencente ao domínio da função.
Ù
ii) ∫RÙ 𝑓(𝑥) 𝑑𝑥 = 1, ou seja, a área total delimitada pela curva e o eixo 𝑥 é igual a 1.
Como o domínio da função é o conjunto dos números reais positivos, então a área da região
entre o gráfico da função e o eixo x (eixo das abscissas), para 𝑥 > 0, é igual a 1. O item está certo.
Veja que é uma obrigação do elaborador da questão escolher uma função que satisfaça essa
propriedade. Caso contrário, toda a questão deveria ser anulada, pois não teríamos uma função
densidade de probabilidade.
Apenas para treinar, vamos calcular a integral e verificar que de fato a área total abaixo do
gráfico é 1.
Ù n Ù Ù n
𝑥$ 1 R(fRn) 𝑥% 1 Rf^n
Ú 𝑓(𝑥) 𝑑𝑥 = Ú 𝑑𝑥 + Ú ∙𝑒 𝑑𝑥 = Û Ü +Ú ∙𝑒 𝑑𝑥
RÙ h 108 n 3 324 h n 3
Ù Ù
6% 0% 1 n Rf 216 1 n
=Ý − Þ+Ú ∙ 𝑒 ∙ 𝑒 𝑑𝑥 = + ∙ 𝑒 ∙ Ú 𝑒 Rf 𝑑𝑥
324 324 n 3 324 3 n
Logo,
Ù
Ú 𝑒 Rf 𝑑𝑥 = lim (𝑒 Rn − 𝑒 RÀ ) = 𝑒 Rn − 0 = 𝑒 Rn
n À→Ù
Item II.
A variável aleatória que estamos estudando é contínua. Assim, a probabilidade de a variável
assumir um valor específico é igual a 0. Logo, 𝑃(𝑥 = 3) = 0. De fato, 0 é inferior a 10%. O item
está certo.
Item III.
A variável aleatória que estamos estudando é contínua. Assim, a probabilidade de a variável
assumir um valor específico é igual a 0. Logo, 𝑃(𝑥 = 6) = 0 e 𝑃(𝑥 = 5) = 0. O item está errado,
pois 0 não é maior do que 0.
Item IV.
Queremos calcular 𝑃(𝑥 > 6). Essa probabilidade é dada pela seguinte integral.
Ù
𝑃(𝑥 > 6) = Ú 𝑓(𝑥) 𝑑𝑥
n
"
No intervalo considerado, 𝑓(𝑥) = % ∙ 𝑒 R(fRn) . Logo,
Ù
1 R(fRn)
𝑃(𝑥 > 6) = Ú ∙𝑒 𝑑𝑥
n 3
Já calculei essa integral no item I. Reproduzirei aqui o cálculo feito.
Ù Ù
1 R(fRn) 1 Rf^n
Ú ∙𝑒 𝑑𝑥 = Ú ∙𝑒 𝑑𝑥
n 3 n 3
Ù Ù
1 n Rf 1 n
=Ú ∙ 𝑒 ∙ 𝑒 𝑑𝑥 = ∙ 𝑒 ∙ Ú 𝑒 Rf 𝑑𝑥
n 3 3 n
Logo,
Ù
Ú 𝑒 Rf 𝑑𝑥 = lim (𝑒 Rn − 𝑒 RÀ ) = 𝑒 Rn − 0 = 𝑒 Rn
n À→Ù
Item V.
Queremos calcular 𝑃(3 < 𝑥 < 7). A probabilidade pedida é dada pela seguinte integral:
Q
𝑃(3 < 𝑥 < 7) = Ú 𝑓(𝑥) 𝑑𝑥
%
Perceba que a função obedece diferentes leis a depender do intervalo. Assim, precisaremos
separar a integral acima em 2.
n Q
𝑥$ 1
𝑃(3 < 𝑥 < 7) = Ú 𝑑𝑥 + Ú ∙ 𝑒 R(fRn) 𝑑𝑥
% 108 n 3
n Q
𝑥% 1
=Û Ü + Ú ∙ 𝑒 Rf^n 𝑑𝑥
324 % n 3
Q Q
6% 3% 1 216 27 1
=Ý − Þ + Ú ∙ 𝑒 n ∙ 𝑒 Rf 𝑑𝑥 = Ó − Ô + ∙ 𝑒 n ∙ Ú 𝑒 Rf 𝑑𝑥
324 324 n 3 324 324 3 n
189 1 n 7 1 n 7 1 n Rn
= + ∙ 𝑒 ∙ [−𝑒 Rf ]Qn = + ∙ 𝑒 ∙ [−𝑒 RQ − (−𝑒 Rn )] = + ∙ 𝑒 [𝑒 − 𝑒 RQ ]
324 3 12 3 12 3
7 1 h 1 R" 7 1 1 7+4 1 11 1
= + 𝑒 − 𝑒 = + − "= − = −
12 3 3 12 3 3𝑒 12 3𝑒 12 3𝑒
Item VI.
Queremos calcular a média da variável aleatória. A média (ou esperança) de uma variável
aleatória contínua é dada pela seguinte integral.
Ù n Ù
𝑥$ 1
𝐸(𝑥) = Ú 𝑥 ∙ 𝑓(𝑥) 𝑑𝑥 = Ú 𝑥 ∙ 𝑑𝑥 + Ú 𝑥 ∙ ∙ 𝑒 R(fRn) 𝑑𝑥
RÙ h 108 n 3
n Ù Ù n
𝑥% 1 n Rf 𝑥& 1 n
=Ú 𝑑𝑥 + Ú 𝑥 ∙ ∙ 𝑒 ∙ 𝑒 𝑑𝑥 = Û Ü + ∙ 𝑒 ∙ Ú 𝑥 ∙ 𝑒 Rf 𝑑𝑥
h 108 n 3 432 h
3 n
A segunda integral deveria ser resolvida “por partes”, mas a questão já deu de presente a
primitiva da função 𝑥 ∙ 𝑒 Rf .
6& 0& 1
=Û − Ü + ∙ 𝑒 n ∙ [−(𝑥 + 1)𝑒 Rf ]Ù
n
432 432 3
Quando 𝑥 tende a infinito, a função −(𝑥 + 1)𝑒 Rf tende a 0. Isso pode ser mostrado pela regra de
L’Hospital:
−𝑥 − 1 −1
lim −(𝑥 + 1)𝑒 Rf = lim f
= lim f = 0
f→Ù f→Ù 𝑒 f→Ù 𝑒
Continuando o cálculo:
1 1 1
= 3 + ∙ 𝑒 n ∙ [0 − (−(6 + 1)𝑒 Rn )] = 3 + ∙ 𝑒 n ∙ 7 ∙ 𝑒 Rn = 3 + ∙ 7 ∙ 𝑒 h
3 3 3
7 16
=3+ = = 5,333 …
3 3
Assim, a média é menor do que 6 meses e o item VI está errado.
(CESPE 2019/TJ-AM)
Em uma fila para atendimento, encontram-se 1.000 pessoas. Em ordem cronológica, cada
pessoa recebe uma senha para atendimento numerada de 1 a 1.000. Para a estimação do tempo
médio de espera na fila, registram-se os tempos de espera das pessoas cujas senhas são
números múltiplos de 10, ou seja, 10, 20, 30, 40, ..., 1.000.
Considerando que o coeficiente de correlação dos tempos de espera entre uma pessoa e outra
nessa fila seja igual a 0,1, e que o desvio padrão populacional dos tempos de espera seja igual a
10 minutos, julgue os itens que se seguem.
Comentário
Quantos elementos possui essa amostra? Para facilitar o raciocínio, divida todos os números da
amostra por 10.
1, 2, 3, 4, ..., 100
Ficou mais fácil? Há 100 elementos na amostra. Logo,
𝑛 = 100
Item I.
𝜎 10 10
𝜎Ñ = = = =1
√𝑛 √100 10
O primeiro item está certo.
Item II.
Item III.
𝜎$
𝜎Ñ$ =
𝑛
𝑠 $ 200
𝑠Ñ$ = = =2
𝑛 100
O item III está errado. Contudo, o gabarito oficial do CESPE foi dado como “certo”.
(CESPE 2016/TCE-PA)
Uma amostra aleatória simples 𝑋" , 𝑋$ , … , 𝑋u foi retirada de uma população normal com média e
desvio padrão iguais a 10. Julgue os próximos itens, a respeito da média amostral 𝑋 =
[𝑋" + 𝑋$ + ⋯ 𝑋u ]/𝑛.
Comentário
A amostra foi retirada de uma população normal com média 𝜇 = 10 e desvio padrão 𝜎 = 10.
Dessa forma, a média amostral 𝑋 é uma variável aleatória com distribuição normal com média e
desvio padrão iguais a
𝐸x𝑋y = 𝜇 = 10
𝜎 10
𝜎Ñ = =
√𝑛 √𝑛
Como não sabemos o tamanho da amostra, não podemos calcular o desvio padrão dessa variável
aleatória.
Vamos analisar os itens.
Item I.
Não podemos calcular a variância de 𝑋, pois não sabemos o tamanho da amostra. Sabemos
apenas que
𝜎 $ 10$ 100
𝑉𝑎𝑟x𝑋y = = =
𝑛 𝑛 𝑛
O item I está errado.
Item II.
Já comentei que a média amostral 𝑋 segue uma distribuição normal com média 10 e desvio
padrão 10/√𝑛. Logo, o item II está errado.
Item III.
O item afirma que 𝑃x𝑋 − 10 > 0y ≤ 0,5. Isso é o mesmo que afirmar que 𝑃x𝑋 > 10y ≤ 0,5.
Ora, sabemos que 𝑋 é uma variável com distribuição normal e média 10. Observe o gráfico da
distribuição de 𝑋.
Sabemos que a média de uma distribuição normal coincide com a sua mediana. Logo, a
probabilidade de essa variável aleatória 𝑋 ser maior do que 10 é igual a 50%. Logo,
𝑃x𝑋 > 10y = 0,5
A questão disse que essa probabilidade é igual ou inferior a 0,5. Temos aqui uma proposição
composta pelo conectivo “ou”.
𝐴 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 é 𝑖𝑔𝑢𝑎𝑙 𝑎 0,5 𝑜𝑢 𝑎
ÈÉÉÉÉÉÉÉÉÉÊÉÉÉÉÉÉÉÉÉË 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 é 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 0,5.
ÈÉÉÉÉÉÉÉÉÉÉÊÉÉÉÉÉÉÉÉÉÉË
å æ
Sabemos que uma proposição composta pelo “ou” é verdade quando pelo menos um de seus
componentes é verdade. Logo, o item III está certo.
Item IV.
Uma variável normal padrão (ou reduzida) é aquela que possui média zero e variância igual a 1
(consequentemente o desvio padrão também é 1).
𝑍~𝑁(0,1)
Vamos considerar 𝑘 variáveis normais reduzidas e independentes. Pois bem, a soma dos
quadrados das 𝑘 variáveis normais reduzidas e independentes é, por definição, a distribuição de
qui-quadrado 𝜒($ com 𝑘 graus de liberdade.
Assim, se 𝑍" , 𝑍$ , … 𝑍( são variáveis aleatórias normais reduzidas (as médias são 0 e os desvios-
padrão são iguais a 1), então:
𝜒($ = Ì 𝑍Í$
Íê"
𝜒"$ = 𝑍"$
Sabemos que 𝑋 tem distribuição normal, mas não é uma distribuição normal reduzida porque sua
média não é igual a 0. Logo, o item IV está errado.
Item V.
"h
Já sabemos que 𝑋 segue uma distribuição normal com média 10 e desvio padrão igual a .
√u
Para transformar essa variável aleatória 𝑋 em uma distribuição normal padrão (ou reduzida),
devemos subtrair a sua média e dividir pelo seu desvio padrão. Em outras palavras, a seguinte
variável tem distribuição normal padrão:
𝑋 − 10
10
√𝑛
√𝑛
x𝑋 − 10y ∙ = 0,1 ∙ x𝑋 − 10y ∙ √𝑛
10
Item VI.
Já vimos que o valor esperado da média amostral 𝑋 é igual à média populacional. Logo,
𝐸x𝑋y = 𝜇 = 10
(CESPE 2016/TCE-PA)
A respeito de uma variável aleatória contínua 𝑼, uniformemente distribuída no intervalo [𝟎, 𝟏],
julgue os seguintes itens.
Comentário
Item I.
A variância de uma variável aleatória contínua com distribuição uniforme no intervalo [𝑎, 𝑏] é
dada por
(𝑏 − 𝑎)$ $
𝜎 =
12
No caso da questão, temos 𝑎 = 0 e 𝑏 = 1. Logo,
$
(1 − 0)$ 1
𝜎 = =
12 12
De fato, 1/12 é inferior a 1/10. O item I está certo.
Item II.
O gráfico de uma distribuição uniforme contínua é um segmento de reta horizontal. A área total
abaixo do gráfico tem que ser igual a 1.
Assim, como a base do retângulo é 1, a altura do retângulo também deverá ser igual a 1 (para
que a área do retângulo seja igual a 1). Observe:
A base do retângulo mede 1 − 0,1 = 0,9 e a altura mede 1. Logo, a área, que é igual à
probabilidade pedida, é igual a
1
𝑃 Ó𝑈 > Ô = 𝑏𝑎𝑠𝑒 × 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,9 × 1 = 0,9
10
O item II está certo.
(CESPE 2019/TJ-AM)
É igual a 3/4 a probabilidade de determinado advogado conseguir decisão favorável a si em
cada petição protocolada por ele na vara cível de certo tribunal. O plano desse advogado é
protocolar, sequencialmente, 12 petições nessa vara cível durante o ano de 2020. Favoráveis ou
não, as decisões do tribunal para petições são emitidas na mesma ordem cronológica em que
são protocoladas e são sempre independentes entre si.
A partir dessa situação hipotética, julgue o próximo item, considerando as variáveis aleatórias X e
Y, em que X = quantidade de decisões emitidas pelo tribunal até que ocorra a primeira decisão
não favorável ao advogado, e Y = quantidade de decisões emitidas pelo tribunal favoráveis ao
advogado.
43. A probabilidade do evento “X é igual a 1”, isto é, de que seja desfavorável ao advogado
a decisão do tribunal a respeito da primeira petição protocolada por ele em 2020, é igual
a 25%.
47. Espera-se que, ao longo de 2020, exatamente 9 decisões sejam favoráveis ao advogado.
Comentário
Item I.
Sabemos que a probabilidade de o advogado obter uma decisão favorável é igual a 3/4. Logo, a
probabilidade de ele obter uma decisão desfavorável é igual a 1/4.
Queremos que a primeira decisão seja desfavorável. A probabilidade de isso ocorrer é 1/4 =
25%.
O item I está certo.
Item II.
Item III.
No item anterior, vimos que Y tem distribuição binomial com parâmetros 𝑛 = 12 e 𝑝 = 3/4.
Queremos calcular 𝑃(𝑌 = 0).
12 h "$ "$
1 "$
𝑃(𝑌 = 0) = • ‚ 𝑝 𝑞 = 1 ∙ 1 ∙ 𝑞 = Ó Ô
0 4
Essa probabilidade não é zero. Logo, Y = 0 não é o evento impossível. O item III está errado.
Item IV.
Já sabemos que Y tem distribuição binomial com parâmetros 𝑛 = 12 e 𝑝 = 3/4. Queremos
calcular 𝑃(𝑌 < 2).
𝑃(𝑌 < 2) = 𝑃(𝑌 = 0) + 𝑃(𝑌 = 1)
Essas duas probabilidades já foram calculadas nos itens anteriores.
1 "$ 1 ""
𝑃(𝑌 < 2) = Ó Ô + 9 ∙ Ó Ô
4 4
1 1 "" 1 ""
=Ó Ô∙Ó Ô +9∙Ó Ô
4 4 4
1 "" 1
= Ó Ô ∙ Ó + 9Ô
4 4
1 ""
= Ó Ô × 9,25
4
Observe que 4' = 1.024. Assim, o número acima é muito menor do que 1%. O item IV está
errado.
Item V.
Vimos que a variável Y é o número de decisões emitidas pelo tribunal favoráveis ao advogado e
que Y tem distribuição binomial com parâmetros 𝑛 = 12 e 𝑝 = 3/4.
O item pede o valor esperado desse número de decisões favoráveis, ou seja, queremos calcular o
valor esperado da variável Y.
O valor esperado da variável binomial de parâmetros 𝑛 e 𝑝 é 𝑛𝑝.
3
𝐸(𝑌) = 𝑛𝑝 = 12 × =9
4
(CESPE 2018/EBSERH)
Todo paciente que chega a determinado posto hospitalar é imediatamente avaliado no que se
refere à prioridade de atendimento. Suponha que o paciente seja classificado como
“emergente” (Y = 0) ou como “não emergente” (Y = 1), e que as quantidades X, diárias, de
pacientes que chegam a esse posto sigam uma distribuição de Poisson com média igual a 20.
Considerando que W represente o total diário de pacientes emergentes, de tal sorte que
𝑥
𝑃(𝑊 = 𝑤|𝑋 = 𝑥) = • ‚ 0,1ƒ 0,9fRƒ , em que 0 ≤ 𝑤 ≤ 𝑥 e 𝑥 ≥ 0, julgue os itens subsequentes.
𝑤
48. A variável Y segue uma distribuição de Bernoulli, cuja probabilidade de sucesso é igual a
0,9.
49. O total diário W de pacientes emergentes segue uma distribuição de Poisson com média
superior a 3.
50. Se, em determinado dia, 10 pacientes forem atendidos nesse posto hospitalar, então a
probabilidade de se registrar, entre esses pacientes, exatamente um paciente emergente
será igual a 0,1.
51. A variância do número diário de pacientes que chegam a esse posto hospitalar é igual a
20 pacientes².
52. Para 𝟎 ≤ 𝒘 ≤ 𝒙, as variáveis aleatórias 𝑾 e 𝑿 se distribuem, conjuntamente, como
𝟐𝒙 𝟗𝒙ˆ𝒘
𝑷(𝑾 = 𝒘, 𝑿 = 𝒙) = 𝒆R𝟐𝟎 × 𝒘! × (𝒙R𝒘)!.
Comentário
Há 3 variáveis envolvidas no problema: Y, X e W.
A variável X segue uma distribuição de Poisson e indica quantos pacientes chegam a esse posto
hospitalar. A média dessa variável é igual a 20 pacientes, ou seja, chegam 20 pacientes por dia
em média. A distribuição de Poisson possui média e variância iguais. Logo, 𝐸(𝑋) = 20 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠
A variável W representa a quantidade de pacientes emergentes por dia. Assim, a variável W tem
distribuição binomial em que os pacientes emergentes são considerados “sucessos”.
Perceba a diferença entre as variáveis Y e W.
i) A variável Y trabalha com apenas um paciente. Ela classifica cada paciente. O paciente pode
ser sucesso (não emergente) ou fracasso (emergente). A variável Y tem distribuição de Bernoulli.
ii) A variável W conta o total de pacientes emergentes em um dia. O número de pacientes
emergentes é o valor da nossa variável. Cada paciente emergente é um sucesso e estamos
contanto o número de sucessos. A variável W tem distribuição binomial. O detalhe é que os
pacientes emergentes são considerados sucessos (diferente da variável Y).
Assim, temos:
𝑃(𝑒𝑚𝑒𝑟𝑔𝑒𝑛𝑡𝑒) = 0,1
𝑃(𝑛ã𝑜 𝑒𝑚𝑒𝑟𝑔𝑒𝑛𝑡𝑒) = 0,9
Item I.
A variável Y segue uma distribuição de Bernoulli. Nessa variável, sucesso é um paciente não
emergente. Logo, a probabilidade de sucesso é
𝑝¬ = 𝑝(𝑛ã𝑜 𝑒𝑚𝑒𝑟𝑔𝑒𝑛𝑡𝑒) = 0,9
O item I está certo.
Item II.
O item II está errado. A variável W tem distribuição binomial.
Item III.
O terceiro item pede diz que 10 pacientes foram atendidos em um dia, ou seja, 𝑋 = 10.
Queremos calcular a probabilidade de exatamente 1 paciente ser emergente.
A variável W representa o total de pacientes emergentes em um dia. Assim, queremos calcular a
probabilidade de W ser igual 1.
10
𝑃(𝑊 = 1|𝑋 = 10) = • ‚ ∙ 0,1" ∙ 0,9ì = 10 ∙ 0,1 ∙ 0,9ì
1
Esse número não é igual a 0,1. Logo, o item III está errado.
Item IV.
O número de pacientes que chegam ao posto hospitalar é descrito pela variável X. O item pede
a variância de X. Já vimos que
𝑉𝑎𝑟(𝑋) = 20 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 $
O item IV está certo.
Item V.
Queremos a função de probabilidade conjunto 𝑃(𝑊 = 𝑤, 𝑋 = 𝑋). Essa é apenas outra maneira de
escrever a probabilidade da interseção 𝑃(𝑊 = 𝑤 ∩ 𝑋 = 𝑥), ou seja, a “vírgula” e a interseção
simbolizam a mesma coisa.
Lembremos a fórmula da probabilidade condicional.
𝑃(𝑊 = 𝑤 ∩ 𝑋 = 𝑥)
𝑃(𝑊 = 𝑤|𝑋 = 𝑥) =
𝑃(𝑋 = 𝑥)
Logo,
𝑃(𝑊 = 𝑤 ∩ 𝑋 = 𝑥) = 𝑃(𝑊 = 𝑤|𝑋 = 𝑥) ∙ 𝑃(𝑋 = 𝑥)
A probabilidade 𝑃(𝑊 = 𝑤|𝑋 = 𝑥) já foi dada no enunciado. Lembre-se que X tem distribuição de
Poisson com média de 20 pacientes por dia. Logo,
𝑒 R¯ ∙ 𝜆f 𝑒 R$h ∙ 20f
𝑃(𝑋 = 𝑥) = =
𝑥! 𝑥!
Logo,
𝑥 ƒ fRƒ
𝑒 R$h ∙ 20f
𝑃(𝑊 = 𝑤, 𝑋 = 𝑥) = • ‚ 0,1 0,9 ∙
𝑤 𝑥!
Observe que 10ƒ ∙ 10Rƒ = 10h = 1. Observe ainda que vamos cortar 10f no numerador e
denominador. Podemos também cortar 𝑥! no numerador e no denominador.
1 9fRƒ 𝑒 R$h ∙ 2f
𝑃(𝑊 = 𝑤, 𝑋 = 𝑥) = ∙ ∙
𝑤! (𝑥 − 𝑤)! 1 1
2f 9fRƒ
𝑃(𝑊 = 𝑤, 𝑋 = 𝑥) = 𝑒 R$h × ×
𝑤! (𝑥 − 𝑤)!
O item V está certo.
(CESPE 2018/EBSERH)
Os tempos de duração de exames de cateterismo cardíaco (Y, em minutos) efetuados por
determinada equipe médica seguem uma distribuição normal com média 𝜇 e desvio padrão 𝜎,
ambos desconhecidos. Em uma amostra aleatória simples de 16 tempos de duração desse tipo
de exame, observou-se tempo médio amostral igual a 58 minutos, e desvio padrão amostral
igual a 4 minutos.
53. Ao se aplicar o teste t de Student com nível de significância igual a 2,3%, conclui-se haver
evidências estatisticamente significativas contra a hipótese H0.
54. Nesse teste de hipóteses, comete-se o erro do tipo II caso a hipótese H0 seja rejeitada,
quando, na verdade, H0 não deveria ser rejeitada.
55. Se o teste for efetuado com nível de significância igual a 1%, o poder do teste será igual a
99% para qualquer valor hipotético μ.
56. O P-valor (ou nível descritivo do teste) foi superior a 2,3%.
Comentário
A média 𝜇 e o desvio padrão 𝜎 da população, que segue uma distribuição normal, são
desconhecidos e queremos realizar um teste de hipóteses sobre a média a partir de uma amostra
aleatória de tamanho 16. A média amostral foi 𝑥 = 58 minutos e o desvio padrão amostral foi
igual a 𝑠 = 4 minutos.
Como não conhecemos o desvio padrão populacional e a amostra é pequena, precisamos utilizar
a distribuição t-Student.
A estatística teste (t-Student) é igual a:
𝑥−𝜇
𝑡ÀœÁÀœ = 𝑠
√𝑛
A média populacional é desconhecida. Na fórmula acima, devemos utilizar o valor dado pela
hipótese nula.
58 − 60
𝑡ÀœÁÀœ = = −2
4
√16
Estamos diante de um teste unilateral à esquerda. Precisamos saber o valor crítico para saber se
a estatística teste caiu na região de aceitação ou na região de rejeição.
O problema é que a questão nos deu um valor referente à distribuição normal padrão e o nosso
teste precisa ser feito com a distribuição t-Student.
Vamos começar a análise com a distribuição normal padrão. Sabemos que 𝜙(2) = 0,977, ou seja,
𝑃(𝑍 < 2) = 0,977. Logo, 𝑃(𝑍 > 2) = 0,023. Em outras palavras, a área abaixo de 2 é 97,7% e,
consequentemente, a área acima de 2 é 2,3%.
Pela simetria da distribuição normal, concluímos que a área abaixo de -2 é 2,3%, ou seja,
𝑃(𝑍 < −2) = 2,3%.
Assim como a distribuição normal, a distribuição t-Student também é simétrica e tem um gráfico
com a forma de sino. Entretanto, as caudas são mais largas, ou seja, a distribuição t-Student é
mais dispersa.
Observe o gráfico a seguir comparando a curva normal padrão e a distribuição t de Student com
1 grau de liberdade.
À medida que o número de graus de liberdade vai aumentando, a curva t-Student vai se
aproximando cada vez mais da normal. Observe os gráficos a seguir (curva t-Student com 2, 3 e 9
graus de liberdade, respectivamente).
Veja que a distribuição t-Student tem uma área maior que a distribuição normal nas suas caudas.
A distribuição normal padrão delimita na cauda uma área de 2,3% para um valor 𝑧 = −2. Assim, a
para que a distribuição t-Student com 16 – 1 = 15 graus de liberdade delimite a mesma área de
2,3%, precisaríamos de um valor menor que -2.
Assim, a estatística teste 𝑡ÀœÁÀœ = −2 caiu na região de não-rejeição. Logo, o teste sugere que há
evidências estatísticas para não rejeitar a hipótese nula.
Item II.
Vamos relembrar os tipos de erro em um teste de hipóteses.
O teste
Decisão Correta
aceita
Verdadeira
O teste
Erro Tipo I
Hipótese rejeita
Nula O teste
Erro Tipo II
aceita
Falsa
O teste
Decisão Correta
rejeita
O erro tipo II ocorre quando o teste aceita (não rejeita) a hipótese nula quando ela deveria ser
rejeitada. Logo, o item II está errado. O item descreveu, na verdade, o erro do tipo I.
Item III.
O nível de significância de um teste é a probabilidade de cometermos um erro do tipo I.
Indicamos essa probabilidade por 𝛼.
𝛼 = 𝑃(𝑒𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼) = 𝑃(𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟 𝐻h |𝐻h é 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑎) = 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎 = 1%
O complementar de 𝛼 é denominado nível de confiança do teste.
1 − 𝛼 = 𝑃(𝐴𝑐𝑒𝑖𝑡𝑎𝑟 𝐻h |𝐻h é 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑎 = 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎 = 99%
Assim, é o nível de confiança que é 99% e não o poder do teste. Vamos relembrar o que é o
poder do teste.
Denotamos por 𝛽 a probabilidade de cometermos um erro do tipo II.
Item IV.
O p-valor (ou nível descritivo) é a área delimitada pela estatística teste. A estatística teste é igual
a 𝑡ÀœÁÀœ = −2.
Observe novamente o gráfico da distribuição t-Student.
Obviamente, a área abaixo de −2 será superior a 2,3%. Logo, 𝑝 − 𝑣𝑎𝑙𝑜𝑟 > 2,3%.
Sabendo que 𝑃(𝑍 < 2) = 0,975, em que 𝑍 representa a distribuição normal padrão, julgue os
itens que se seguem, em relação a essa situação hipotética.
É importante notar que, na distribuição binomial, a amostra deve ser obtida com reposição.
Por quê? Para que a probabilidade de um ex-condenado sorteado ao acaso seja sempre igual a
0,25.
Para exemplificar, imagine que a população seja formada por 100 pessoas. Assim, há 25 ex-
condenados que voltam a ser condenados por algum crime no prazo de 5 anos (isso porque o
problema diz que a probabilidade é de 0,25).
Como o problema diz que será formado um grupo com 4 ex-condenados libertos no mesmo dia,
devemos interpretar que são 4 pessoas diferentes. Logo, a amostra de 4 pessoas não foi feita
com reposição.
Como o processo foi feito sem reposição, temos uma distribuição hipergeométrica. Entretanto,
não temos como resolver o problema, pois não sabemos o tamanho da população.
Ora, observe que, no exemplo anterior, a probabilidade de sucesso quando o processo é feito
com reposição é sempre igual a 25%, mas quando o processo é feito sem reposição, a
probabilidade é calculada a partir do tamanho da população.
Sendo assim, não temos como resolver o problema pela distribuição hipergeométrica.
Aí é que vem o pulo do gato: a população é muito grande (observe que a primeira amostra
realizada era composta de 1.875 processos) e, portanto, a probabilidade de sucesso é
praticamente constante.
Para exemplificar, imagine que a população seja de 10.000 pessoas. Assim, há 2.500 pessoas
com tal característica.
Como o processo é feito sem reposição, a probabilidade de o segundo possuir tal característica é
2.499/9.999 = 0,2499...
Em suma: quando a população for muito grande, a distribuição hipergeométrica pode ser
aproximada por uma distribuição binomial.
Portanto, temos uma variável binomial com 𝑛 = 4 (porque são 4 pessoas sorteadas) e 𝑝 = 0,25
(probabilidade de sucesso). Queremos calcular a probabilidade de exatamente 1 desses
sorteados voltar a ser condenado, ou seja, queremos calcular a probabilidade de obtermos
exatamente 1 sucesso.
4
𝑃(𝑋 = 1) = • ‚ ∙ 𝑝" 𝑞% = 4𝑝𝑞% = 4 ∙ 0,25" ∙ 0,75%
1
1 3 %
=4× ×Ó Ô
4 4
3 % 27
=Ó Ô = ≅ 0,42
4 64
Item II.
A proporção amostral 𝑝̂ é uma variável aleatória com média e variância dadas por:
𝐸(𝑝̂ ) = 𝑝
𝑝𝑞
𝑉𝑎𝑟(𝑝̂ ) =
𝑛
𝑝𝑞
𝜎õÇ = ö
𝑛
Não precisamos utilizar o fator de correção para população finita justamente porque estamos
considerando que a população é infinita.
Na verdade, deveríamos utilizar os valores populacionais de 𝑝 e 𝑞. Como não sabemos esses
valores, devemos utilizar suas estimativas 𝑝̂ e 𝑞Ç obtidas na amostra.
1 3
𝑝̂ 𝑞Ç 0,25 × 0,75 Å 4 × 4 1 1 3
𝜎õÇ = Å = Å = = × Å
𝑛 1.875 1.875 2 2 1.875
1 1 1 1 1
= ×Å = × = = 0,01
4 625 4 25 100
Item III.
O problema informou que 𝑃(𝑍 < 2) = 0,975.
Como a área total abaixo da curva de distribuição normal é 1, temos que 𝑃(𝑍 > 2) = 1 − 0,975 =
0,025.
Sabemos que 𝑃(𝑍 > 0) = 0,50. Logo, 𝑃(0 < 𝑍 < 2) = 0,50 − 0,025 = 0,475.
Pela simetria da distribuição normal, temos que 𝑃(−2 < 𝑍 < 2) = 2 × 0,475 = 0,95.
Portanto, para construir um intervalo de 95% de confiança, devemos utilizar 𝑍h = 2.
Os extremos do intervalo são dados por:
𝑝̂ 𝑞Ç
𝑝̂ ± 𝑍h ∙ Å
𝑛
õÇ×Ç
Já calculamos ö u = 0,01 no item anterior. Logo,
0,25 ± 2 × 0,01 =
= 0,25 ± 0,02
O item III está errado.
Item IV.
A média da distribuição binomial é dada por 𝑛𝑝. Assim, a estimativa da média é igual a
𝑛𝑝̂ = 1.000 × 0,25 = 250
O item IV está errado.
A respeito dessa situação hipotética, julgue os próximos itens, sabendo que 𝑏 > 0 e que o
desvio padrão amostral da variável 𝑋 é igual a 2.
61. A correlação linear de Pearson entre a variável resposta 𝒀 e a variável regressora 𝑿 é igual
a 0,75.
62. A estimativa da variância 𝝈𝟐 é superior a 0,5.
63. A estimativa do coeficiente angular 𝒃, pelo método de mínimos quadrados ordinários, é
igual a 0,25.
Resolução
Item I.
Logo, o valor de R é
225 15
𝑅=Å = = 0,75
400 20
Item II.
A estimativa de 𝜎 $ corresponde ao quadrado médio dos erros (dentro).
Item III.
Nesse ponto, vale a pena relembrar a tabela padrão da ANOVA.
Sabemos que o desvio padrão amostral é igual a 2. Logo, a variância amostral é igual a 4. Vamos
aplicar a fórmula da variância amostral.
$
∑(𝑋Í − 𝑋! )$
𝑠 =
𝑛−1
∑(𝑋Í − 𝑋! )$ = 3.600
A tabela informa que a soma de quadrados total é 400, ou seja,
∑(𝑌Í − 𝑌! )$ = 400
∑[(𝑋Í − 𝑋! ) ∙ (𝑌Í − 𝑌! )]
0,75 =
√3.600 × 400
∑[(𝑋Í − 𝑋! ) ∙ (𝑌Í − 𝑌! )]
0,75 =
60 × 20
∑[(𝑋Í − 𝑋! ) ∙ (𝑌Í − 𝑌! )]
0,75 =
1.200
∑(𝑋Í − 𝑋)((𝑌Í − 𝑌)
𝑏= $
∑x𝑋Í − 𝑋y
900
𝑏= = 0,25
3.600
O item III está certo.
Resolução
Item I.
Vamos relembrar propriedades das variáveis aleatórias.
𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)
Essa propriedade diz que a média da soma de duas variáveis aleatórias é igual à soma das
médias.
Sabemos que 𝑊" e 𝑊$ são variáveis normais independentes. Cada uma delas tem média
𝑅$ 10 𝑚𝑖𝑙 e desvio padrão 𝑅$ 4 𝑚𝑖𝑙.
Logo, a soma 𝑊" + 𝑊$ também tem distribuição normal. Sua média e variância são dadas por:
Item II.
Sabemos que 𝑊 tem distribuição normal com média igual a R$ 10 mil e desvio padrão igual a R$
4 mil.
Sendo 𝜇 a média, sabemos que 𝑃(𝑊 > 𝜇) = 0,5, pois a distribuição normal é simétrica em relação
à média.
Logo, 𝑃(𝑊 > 10 𝑚𝑖𝑙) = 0,5. O item II está certo.
É importante notar ainda que como W é uma variável aleatória contínua, a probabilidade de ela
assumir um valor específico é igual a 0. Assim, se a questão perguntasse, por exemplo, o valor de
𝑃(𝑊 = 10 𝑚𝑖𝑙), a resposta seria zero.
Item III.
Vamos relembrar. Seja 𝑋 uma variável aleatória normal com média 𝜇 e desvio padrão 𝜎. A variável
aleatória
𝑋−𝜇
𝑍=
𝜎
tem distribuição normal de média 0 e desvio padrão unitário. Tal distribuição Z é denominada
distribuição normal padrão.
Assim, para transformar W em uma distribuição normal padrão, deveríamos subtrair a média (10
mil) e dividir pelo desvio padrão (4 mil).
Logo, a variável
𝑋 − 10 𝑚𝑖𝑙
𝑍=
4 𝑚𝑖𝑙
tem distribuição normal padrão.
O item III está errado.
Comentário
Uma variável aleatória contínua Y, que tome todos os valores não-negativos, terá uma
distribuição exponencial com parâmetro 𝜆 > 0, se a sua função densidade de probabilidade for
dada por:
𝑓(𝑦) = 𝜆 ∙ 𝑒 R¯] , 𝑠𝑒 𝑦 ≥ 0
𝑓(𝑦) = 0, 𝑠𝑒 𝑦 < 0
1
𝐸(𝑌) =
𝜆
1
𝑉𝑎𝑟(𝑌) =
𝜆$
Consequentemente,
1
𝜎¬ =
𝜆
1
= 10
𝜆
1
𝜆= = 0,1
10
Item I.
A média é igual a 10 kg. Vimos que, na distribuição exponencial, a média é igual ao desvio
padrão. Logo,
𝜎¬ = 10 𝑘𝑔
Item II.
A distribuição exponencial é igual a zero para valores negativos de y. Para valores não-negativos,
a função densidade de probabilidade é dada por
"h
𝑃(𝑌 ≤ 10) = Ú 𝑓(𝑦)𝑑𝑦
RÙ
Veja que 𝑓(𝑦) é igual a 0 para valores negativos e igual a 0,1 ∙ 𝑒 Rh,"] para valores não-negativos
de y.
Logo,
h "h "h
𝑃(𝑌 ≤ 10) = Ú 0 𝑑𝑦 + Ú 0,1 ∙ 𝑒 Rh,"] 𝑑𝑦 = 0 + 0,1 ∙ Ú 𝑒 Rh,"] 𝑑𝑦
RÙ h h
Neste ponto, precisamos calcular ∫ 𝑒 Rh,"] 𝑑𝑦. Se você não consegue fazer de cabeça, sugiro fazer
uma mudança de variável.
−0,1𝑦 = 𝑢
−0,1𝑑𝑦 = 𝑑𝑢
𝑑𝑦 = −10𝑑𝑢
Logo,
"h
0,1 ∙ Ú 𝑒 Rh,"] 𝑑𝑦 = 0,1 ∙ [−10 ∙ 𝑒 Rh,"] ]"h
h = 0,1 ∙ (−10) ∙ [𝑒
Rh,"] ]"h
h =
h
Item III.
A variável Y é contínua. A probabilidade de uma variável contínua assumir um valor específico é
igual a 0. Logo, 𝑃(𝑌 = 10) = 0. O item III está errado.
Com referência a essas informações, julgue o item que se segue, sabendo que P(Z > 2) = 0,025,
em que Z denota uma variável aleatória normal padrão.
72. Considerando-se o teste da hipótese nula H0: M ≤ 9,5 dias contra a hipótese alternativa
H1: M > 9,5 dias, adotando-se o nível de significância igual a 1%, não haveria evidências
estatísticas contra a hipótese H0
Comentário
Item I.
A variável aleatória X segue distribuição normal com média M e desvio padrão conhecido e igual
a 3 dias.
Como X tem distribuição normal e conhecemos seu desvio padrão, utilizaremos a distribuição
normal para construir o intervalo de confiança para a média populacional.
O problema informou que 𝑃(𝑍 > 2) = 0,025. Logo, 𝑃(0 < 𝑍 < 2) = 0,50 − 0,025 = 0,475 e,
consequentemente, 𝑃(−2 < 𝑍 < 2) = 2 × 0,475 = 0,95. Em outras palavras, para construir o
intervalo de 95% de confiança, devemos utilizar 𝑍h = 2.
Eis o intervalo pedido:
𝜎 3
𝑋 ± 𝑍h ∙ = 10 ± 2 ∙ = 10 ± 0,6
√𝑛 √100
O item I está errado.
Item II.
A média amostral 𝑋 é uma variável aleatória. Como a população é normal, então 𝑋 também tem
distribuição normal. Sua média é a própria média populacional, ou seja, 𝐸x𝑋y = 𝑀. O seu desvio
padrão (erro padrão) é dado por:
𝜎 3 3
𝜎Ñ = = = = 0,3
√𝑛 √100 10
Item II está certo.
Item III.
A média amostral foi igual a 10. Assim, a estatística teste é igual a
𝑋 − 𝜇 10 − 9,5 0,5
𝑍ÀœÁÀœ = = = ≅ 1,67
𝜎Ñ 0,3 0,3
O problema informou que 𝑃(𝑍 > 2) = 0,025 = 2,5%.
Assim, SE (eu disse SE) o teste fosse realizado a um nível de significância de 2,5%, teríamos a
seguinte situação:
O nível de significância é a área da região crítica. Se o nível de significância fosse igual a 2,5%, o
valor crítico de Z seria igual a 2. Assim, a estatística teste cairia na região de aceitação.
Se diminuirmos o nível de significância para 1%, ou seja, se diminuirmos a área da região crítica
para 1%, a estatística teste continuará caindo na região de aceitação.
Assim, para um nível de significância de 1%, deveríamos aceitar a hipótese nula, ou seja, não
haveria evidências estatísticas contra a hipótese nula 𝐻h .
Poderíamos raciocinar de outra maneira. O p-valor é a área delimitada pela estatística teste.
Como 𝑃(𝑍 > 2) = 0,025 = 2,5%, então 𝑃(𝑍 > 𝑍ÀœÁÀœ ) = 𝑃(𝑍 > 1,67) é maior do que 2,5%. Logo,
𝑝 − 𝑣𝑎𝑙𝑜𝑟 > 2,5%
Como o nível de significância 𝛼 é igual a 1%, então:
𝑝 − 𝑣𝑎𝑙𝑜𝑟 > 𝛼
Quando o p-valor é maior do que 𝛼, devemos aceitar a hipótese nula.
74. Considerando o referido desenho amostral, estima-se que o percentual populacional 𝑷𝒑𝒐𝒑
seja inferior a 79%.
Comentário
Item I.
Observe que dividimos a população em grupos homogêneos (pois vieram da mesma região). Em
seguida, realizamos uma amostragem aleatória simples em cada um desses grupos. Assim, a
amostragem foi feira por estratos. Além disso, a alocação foi proporcional.
Item II.
𝑿 = 𝟕𝟖𝟎
Assim,
𝑋 780
$=
𝒑 = = 78%
𝑛 1.000
80
$=
𝒑 = 0,80
100
Até agora o item está perfeito. Vamos agora calcular o erro padrão (desvio padrão).
Como 𝒑
$ = 0,80, então 𝒒
$ = 0,20. Logo, o desvio padrão é dado por:
O CESPE considerou esse item como certo, ou seja, considerou que o desvio padrão é menor do
que 4%. Só me resta concluir que o CESPE interpretou que a amostra foi feita sem reposição.
Assim, utilizando o fator de correção para população finita, temos:
𝑝̂ 𝑞Ç 𝑁−𝑛
Å ×Å
𝑛 𝑁−1
1.000.000 − 1.000
4% × Å
1.000.000 − 1
999.000
4% × Å
999.999
ììì.hhh
O número öììì.ììì é um pouco menor do que 1; dessa forma, o produto acima é um pouco
menor do que 4%.
Item II.
A probabilidade de X = 7 pode ser calculada pela função de Poisson.
𝑒 R¯ ∙ 𝜆Q
𝑃(𝑋 = 7) =
7!
Esse número não é igual a 0.
Ademais, não é porque o número 7 não foi realizado em uma amostra que é impossível que ele
ocorra.
O item II está errado.
Item III.
O parâmetro M é a média da distribuição de Poisson. O estimador de mínimos quadrados da
média é a média aritmética simples dos termos.
6 + 8 + 0 + 4 + 2 20
𝜆% = = =4
5 5
O item III está certo.
As estimativas dos coeficientes 𝑎 e 𝑏, obtidas pelo método dos mínimos quadrados ordinários
foram, respectivamente, iguais a 2,5 e 10. O tamanho da amostra para a obtenção desses
resultados foi n = 101. A média amostral e o desvio padrão amostral da variável x foram,
respectivamente, iguais a 9 mmol/dm3 e 1,6 mmol/dm3 e o desvio padrão da variável y foi igual a
5 horas.
82. De acordo com o modelo ajustado, caso a concentração molar de potássio encontrada
em uma vítima seja igual a 2 mmol/dm3, o valor predito correspondente do intervalo post
mortem será igual a 15 horas
Comentário
Item I.
A reta calculada de regressão linear é 𝑦 = 2,5𝑥 + 10. É importante notar que a reta de regressão
linear passa pelo ponto (𝑥, 𝑦). Assim, para calcular a média de 𝑦, basta substituir 𝑥 pela média de
𝑥.
𝑦 = 2,5𝑥 + 10
𝑦 = 2,5 ∙ 9 + 10
𝑦 = 32,5
O item I está certo.
Item II.
𝑆𝑄𝑀
𝑅$ =
𝑆𝑄𝑇
$
𝑆𝑄𝑇 = Ìx𝑌Í − 𝑌y
Sabemos que o desvio padrão da variável Y foi igual a 5 horas. Logo, sua variância é igual a 5$ =
25 ℎ𝑜𝑟𝑎𝑠 $ .
$
∑x𝑌Í − 𝑌y
= 25
𝑛−1
𝑆𝑄𝑇
= 25
101 − 1
𝑆𝑄𝑇 = 2.500
𝑆𝑄𝑀 = 𝑎$ ∙ Ì(𝑋Í − 𝑋! )$
Sabemos que o desvio padrão de X é 1,6. Logo, a sua variância é 1,6$ = 2,56. Assim, podemos
calcular o valor de ∑(𝑋Í − 𝑋!)$ através da fórmula da variância amostral.
$
∑x𝑋Í − 𝑋y
= 2,56
𝑛−1
$
∑x𝑋Í − 𝑋y
= 2,56
101 − 1
$
Ìx𝑋Í − 𝑋y = 256
𝑆𝑄𝑀 1.600
𝑅$ = = = 0,64
𝑆𝑄𝑇 2.500
Item III.
𝜎$
𝑉𝑎𝑟(𝑎Ç) = $
∑x𝑋Í − 𝑋y
$
Já calculamos ∑x𝑋Í − 𝑋y = 256. O numerador é a variância do erro aleatório. Como o desvio-
padrão do erro aleatório é 4, então 𝜎 $ = 16. Logo,
𝜎$ 16 1
𝑉𝑎𝑟(𝑎Ç) = $ = =
∑x𝑋Í − 𝑋y 256 16
1 1
𝜎'Ç = Å = = 0,25
16 4
Item IV.
A equação da reta é 𝑦 = 2,5𝑥 + 10, em que 𝑥 é a concentração molar de potássio e 𝑦 é o
intervalo post mortem em horas. Queremos saber a predição do tempo para 𝑥 = 2.
𝑦 = 2,5 ∙ 2 + 10 = 15 ℎ𝑜𝑟𝑎𝑠
O item IV está certo.
A partir dessas informações e considerando que 𝑍 representa uma distribuição normal padrão,
em que 𝑃(𝑍 ≤ −2) = 0,025, julgue os itens subsecutivos.
Comentário
Item I.
Queremos calcular a probabilidade de X ser maior do que 70. Para calcular tal probabilidade,
precisamos padronizar esse valor.
𝑋 − 𝜇 70 − 50
𝑍= = =2
𝜎 10
Assim, o número 2 é o corresponde de 70 na distribuição normal padrão, ou seja, calcular 𝑃(𝑋 >
70) é o mesmo que calcular 𝑃(𝑍 > 2).
Ora, o enunciado afirma que 𝑃(𝑍 ≤ −2) = 0,025. Como a distribuição normal padrão é simétrica
em torno de 0, então 𝑃(𝑍 > 2) = 0,025. Logo,
Item II.
Observe que a média da distribuição normal é 50 e lembre-se que a distribuição normal é
simétrica em relação à média.
Assim, os números 40 e 60 são equidistantes da média. Logo, a área abaixo de 60 é igual à área
acima de 40.
É importante ainda destacar que como a distribuição normal é contínua, não importa se a
probabilidade é pedida com intervalos abertos ou fechados, ou seja, 𝑃(𝑋 ≥ 40) =𝑃(𝑋 > 40).
Item III.
Conforme mencionei, a variável aleatória X tem distribuição normal e, portanto, X é uma variável
aleatória contínua.
A probabilidade de uma variável aleatória contínua assumir um valor específico é igual a 0. Logo,
𝑃(𝑋 = 50) = 0
𝑃(𝑋 = 30) = 0
Portanto, 𝑃(𝑋 = 50) = 𝑃(𝑋 = 30).
O item III está errado.
(CESPE 2016/TCE-PA)
Uma amostra aleatória, com 𝑛 = 16 observações independentes e identicamente distribuídas
(IID), foi obtida a partir de uma população infinita, com média e desvio padrão desconhecidos e
distribuição normal.
89. Se a média populacional verdadeira for igual a 1,8 e o tamanho da amostra utilizada for
𝒎R𝟏,𝟖
𝒏 = 𝟏𝟔, a estatística 𝒔 , em que 𝒎 é a média amostral e s é o desvio padrão amostral,
𝟒
terá distribuição t-Student com 15 graus de liberdade.
90. Caso, em uma amostra aleatória de tamanho 𝒏 = 𝟒, os valores amostrados sejam A = {2,
3, 0, 1}, a estimativa de máxima verossimilhança para a variância populacional será́ igual a
5/3.
91. Se a média amostral for igual a 3,2 e a variância amostral, igual a 4,0, o estimador de
máxima verossimilhança para a média populacional será́ igual a 1,6.
92. Se a variância amostral for igual a 4,0, o erro padrão da média amostral será́ igual a 0,5.
Comentário
Item I.
A “largura” é a amplitude do intervalo.
A amplitude de um intervalo de confiança para a média com desvio padrão populacional
desconhecido é dada por:
𝑠
𝐴 = 2 × 𝑡h ×
√𝑛
Queremos comparar as amplitudes de dois intervalos de confiança construídos com amostras de
tamanhos 16 e 1.600.
Para comparar as amplitudes, podemos dividir uma pela outra.
𝑠
2 × 𝑡h ×
𝐴" √16 = 1/4 = 1 × 40 = 10
= 𝑠
𝐴$ 2 × 𝑡h × 1/40 4 1
√1.600
𝐴" = 10 × 𝐴$
𝐴"
𝐴$ =
10
Assim, a primeira amplitude (do intervalo construído com amostra de tamanho 16) será dividida
por 10. O item I está errado.
Item II.
A potência de um teste de hipóteses é definida através da probabilidade de ocorrência do erro
tipo II.
O erro tipo II ocorre quando a hipótese nula é falsa, mas a hipótese nula é aceita. A
probabilidade de ocorrência do erro tipo II é denotada por 𝛽.
Item III.
A média amostral 𝑋 é uma variável aleatória. Quando a amostra é retirada de uma população
infinita com distribuição normal, 𝑋 também tem distribuição normal.
A média da variável aleatória 𝑋 é a própria média populacional e a sua variância é igual à
variância populacional dividida pelo tamanho da amostra.
𝐸x𝑋y = 𝜇
𝜎$
𝑉𝑎𝑟x𝑋y = 𝜎Ñ$ =
𝑛
O desvio padrão de 𝑋 é a raiz quadrada da sua variância.
𝜎
𝜎Ñ =
√𝑛
De fato, o valor esperado de 𝑋 é igual à média populacional.
O item III está certo.
Item IV.
(
Vimos que a variável 𝑋 tem distribuição normal com média 𝜇 e desvio padrão igual a 𝜎Ñ = .
√u
Para transformar a variável 𝑋 em uma distribuição normal padrão, devemos subtrair a sua média e
dividir pelo seu desvio padrão. Assim, a seguinte variável tem distribuição normal padrão:
𝑋−𝜇
𝜎
√𝑛
Quando não conhecemos o desvio padrão populacional, usamos o desvio padrão amostral.
Nesse caso, a variável deixa de ser normal e passa a seguir uma distribuição t de Student com n-1
graus de liberdade. Assim, a seguinte variável tem distribuição t de Student com n-1 graus de
liberdade.
𝑋−𝜇
𝑠
√𝑛
O item informou que a média populacional é 1,8 e que a média amostral é 𝑚. Sabemos ainda
que 𝑛 = 16. Logo, a variável
𝑚 − 1,8 𝑚 − 1,8
𝑠 = 𝑠
√16 4
tem distribuição t de Student com n – 1 = 16 – 1 = 15 graus de liberdade.
O item IV está certo.
Item V.
∑x𝑋Í − 𝑋y
𝑠$ =
𝑛
A média é amostral é:
2+3+0+1
𝑋= = 1,5
4
Assim, temos:
Poderíamos também ter usado a fórmula “média dos quadrados menos quadrado da média”.
2$ + 3$ + 0$ + 1$ 14
𝑋$ = = = 3,5
4 4
Assim, temos:
$
𝑠 $ = 𝑋 $ − x𝑋y
u
Observe que mesmo sendo uma amostra não precisamos multiplicar por uR"
(como fazíamos nas
aulas de Estatística Descritiva) porque a questão pediu o estimado de máxima verossimilhança e
não o estimador não-tendencioso.
𝑠 $ = 3,5 − 1,5$
𝑠 $ = 1,25
Item VI.
Como a população tem distribuição normal, então a média amostral é um estimador de máxima
verossimilhança.
O item afirmou que a média amostral é 3,2. Logo, o estimador de máxima verossimilhança para a
média é igual a 3,2.
Item VII.
Se a variância amostral é igual a 4, então o desvio padrão amostral é √4 = 2.
O erro padrão da média amostral é dado por:
𝜎
𝜎Ñ =
√𝑛
Como não conhecemos o desvio padrão populacional 𝜎, utilizamos a sua estimativa, que é 2.
Dessa forma, não temos como calcular o desvio padrão da média amostral. Podemos apenas
calcular a sua estimativa.
𝑠 2 2
𝑠Ñ = = = = 0,5
√𝑛 √16 4
O gabarito do item VII deveria ser errado, mas essa falha na linguagem é bastante comum e o
item foi dado como certo.
(CESPE 2016/TCE-SC)
Considerando que um auditor fiscal encarregado de analisar indícios de irregularidades em obras
de um determinado estado tenha analisado 50 obras e constatado irregularidades em 40 delas,
julgue os itens a seguir.
Considerando que a variável em estudo seja a proporção amostral e que definimos como sucesso
ocorrer uma irregularidade, temos:
40
𝑝̂ = = 0,80
50
𝑞Ç = 1 − 𝑝̂ = 1 − 0,80 = 0,20
𝑝̂ 𝑞Ç 0,8 ∙ 0,2
Å =Å = -0,0032
𝑛 50
Queremos comparar este valor com 0,05. Como 0,052 = 0,0025, concluímos que √0,0032 > 0,05.
Assim, o item I está errado.
Item II.
)Ru
O fator de correção para população finita é igual a )R"
, em que N é o tamanho da população e n
é o tamanho da amostra.
300 − 50
≅ 0,836
300 − 1
-0,836
Esse número também é maior do que 0,8. Perceba que para números entre 0 e 1, a raiz quadrada
é maior do que o próprio número. Assim, √0,836 é maior do que 0,836 e, consequentemente,
maior do que 0,8.
Item III.
(CESPE 2018/EBSERH)
Determinado estudo considerou um modelo de regressão linear simples na forma 𝒚𝒊 = 𝜷𝟎 +
𝜷𝟏 𝒙𝒊 + 𝜺𝒊 , em que 𝒚𝒊 representa o número de leitos por habitante existente no município i; 𝒙𝒊
representa um indicador de qualidade de vida referente a esse mesmo município i, para i = 1, ...,
n. A componente 𝜺𝒊 representa um erro aleatório com média 0 e variância 𝝈𝟐 . A tabela a seguir
mostra a tabela ANOVA resultante do ajuste desse modelo pelo método dos mínimos
quadrados ordinários.
Item II.
A correlação linear é dada por:
𝑺𝑸𝑴
𝑹=Å
𝑺𝑸𝑻
𝟗𝟎𝟎
𝑹=Å = -𝟎, 𝟗
𝟏. 𝟎𝟎𝟎
O item II está errado. Observe que o coeficiente de determinação 𝑹𝟐 é que é igual a 0,9. A
banca tentou confundir o coeficiente de correlação linear com o coeficiente de determinação.
Item III.
𝟏𝟐 − 𝟏
𝑹𝟐 = 𝟏 − (𝟏 − 𝟎, 𝟗) ∙
𝟏𝟐 − 𝟐
𝟏𝟏
𝑹𝟐 = 𝟏 − 𝟎, 𝟏 ∙
= 𝟎, 𝟖𝟗
𝟏𝟎
Logo, o coeficiente de determinação ajustado é inferior a 0,9 e o item III está certo.
Item IV.
Observemos a equação de regressão linear.
𝒚𝒊 = 𝜷𝟎 + 𝜷𝟏 𝒙𝒊 + 𝜺𝒊
A ANOVA testa a hipótese de que o coeficiente angular 𝜷𝟏 é nulo. Portanto, o item IV está
errado.
Item V.
Lembre-se que a estimativa de 𝝈𝟐 corresponde ao quadrado médio residual.
&𝟐 = 𝑸𝑴𝑹 = 𝟏𝟎
𝝈
O item V está certo.
8. CONSIDERAÇÕES FINAIS
Ficamos por aqui, queridos alunos. Espero que tenham gostado da aula.
Vamos juntos nesta sua caminhada. Lembre-se que vocês podem fazer perguntas e sugestões no
nosso fórum de dúvidas.
Guilherme Neves
Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 100
www.estrategiaconcursos.com.br