Estatística Afrf Apostila p2
Estatística Afrf Apostila p2
Estatística Afrf Apostila p2
Introdução - Os jogos de azar, que se caracterizam por ações como girar uma roleta, lançar dados ou
retirar carta de baralho tem duas características básicas: a incerteza e a regularidade. Assim, por exemplo,
toda vez que se joga um dado, pode ocorrer qualquer uma das faces. No entanto, o jogo, embora incerto
tem regularidade. Se forem feitos muitos lançamentos espera-se que todas as faces ocorram igual número
de vezes. Essas características de jogos de azar, percebidas há muito tempo, criaram a idéia de que seria
possível achar uma “fórmula” ou um “método”, que permitisse ao jogador ganhar sempre, ou pelo menos,
ganhar na maioria das vezes. Isso não é possível, mas foi essa idéia que incentivou o estudo de tais jogos,
o que levou a formulação da teoria da probabilidade, base da estatística moderna.
Experimento Aleatório - é aquele que repetido sob as mesmas condições indefinidamente apresenta
variações nos resultados.
Exemplos:
E1 ⇒ retirar uma carta de um baralho com 52 cartas e observar o resultado.
E2 ⇒ retirar com reposição bolas de uma urna que contém 5 bolas brancas e 6 pretas.
E3 ⇒ jogar uma moeda 10 vezes e observar o número de caras.
Espaço Amostral (S) - é o conjunto de todos os resultados possíveis de um experimento aleatório.
Exemplos:
Lançamento de uma moeda ⇒ S = {Ca , Co}
Lançamento de um dado ⇒ S = {1,2,3,4,5,6}
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 1 MANUEL
Exemplo: Qual é a probabilidade de aparecer uma face ímpar (número ímpar) no lançamento de um dado?
OBS: Sendo p a probabilidade que um evento ocorra (sucesso) e q a probabilidade que ele não ocorra
(insucesso), para um mesmo evento existe sempre a relação: p + q = 1 ⇒ q = 1 - p
Eventos Independentes ⇒ dois eventos são independentes quando a realização ou não realização de
um deles não afeta a probabilidade de realização ou não do outro e vice-versa. Por exemplo: no
lançamento de dois dados, o resultado obtido em um deles independe do resultado obtido no outro. A
probabilidade de ocorrência simultânea de dois eventos independentes é dada por:
p = p1 × p2.
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 2 MANUEL
Observe o Espaço Amostral (S) do lançamento de 2 dados.
O número de elementos de S é 36, mas só estamos interessados em um deles que é ocorrer 1 no primeiro
lançamento e 5 no segundo lançamento do dado, ou seja, o elemento (1,5).
Assim a probabilidade de ocorrer (1,5) = 1/36, ou seja, 1/6 (que é a probabilidade de dar 1 no primeiro
dado) vezes 1/6 (que é a probabilidade de dar 1 no segundo dado).
Propriedades de Probabilidade
Exemplos:
1 - Determinar a probabilidade de retirar a dama de paus quando retiramos uma carta de um baralho
comum de 52 cartas.
Evento (E) ⇒ retirar uma dama de paus.
Como só existe uma dama de paus no baralho o nº de casos favoráveis ao evento é 1, logo:
P(E) = 1/52.
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 3 MANUEL
2 - Determinar a probabilidade de não retirar a dama de paus quando retiramos uma carta de um baralho
comum de 52 cartas.
Este evento é complementar ao do exemplo anterior, logo:
P(E’) = 1 - P(E) = 1 - 1/52 = 51/52.
3 - Determinar a probabilidade de retirar uma carta de copas ou de ouros quando retiramos uma carta de
um baralho comum de 52 cartas.
4 - Determinar a probabilidade de retirar uma carta de paus ou um rei quando retiramos uma carta de um
baralho comum de 52 cartas.
Os eventos A e B não são mutuamente excludentes, visto que existe um rei de paus. A probabilidade
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 4 MANUEL
Probabilidade Condicional
Se A e B são eventos de um espaço amostral S com P(B) ≠ 0, então a probabilidade condicional do evento
A, tendo ocorrido o evento B é indicada por P(A/B) e dada por:
P( A ∩ B) NCF ao evento A ∩ B
P(A | B) = ou P( A / B) =
P( B) NCF ao evento B
Onde:
P(A | B) ⇒ é a probabilidade de A ocorrer depois de B ter ocorrido.
Exemplo: Um número é sorteado ao acaso entre os inteiros: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15.
Temos:
S = {1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; 13; 14; 15} ⇒ Espaço Amostral
A = {o número 6}.
B = {um número par}.
Temos então:
1
P (A ∩ B ) 15 1 15 1
P( A / B) = = = × =
P( B) 7 15 7 7
15
Sem a informação da ocorrência de B (o número sorteado ser par) P(A) seria 1/15, ou seja, menor que o
valor quando B é conhecido (1/7). Assim, a informação (a priori) sobre a ocorrência de B diminui o
espaço amostral e aumenta o valor da probabilidade do número sorteado ser 6.
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 5 MANUEL
Regra do Produto
Exemplo: Retiram-se sem reposição duas peças de um lote de 10 peças onde 4 são boas. Qual a
probabilidade de que ambas sejam defeituosas ?
Temos:
A = { a 1ª peça ser defeituosa }.
B = { a 2ª peça ser defeituosa }.
Como é sem reposição perceba que o fato de se retirar uma peça defeituosa afeta o espaço amostral
quando se vai retirar a segunda peça.
Eventos Independentes
Exemplo: Retiram-se com reposição duas cartas de um baralho com 52 cartas. Qual a probabilidade de
que ambas sejam de “paus” ?
Temos:
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 6 MANUEL
Fórmula de Bayes
P( Ei ) × P( B / Ei )
P ( Ei / B ) =
∑ P( Ei ) × P( B / Ei )
Exemplo: Considere duas caixas. A primeira caixa contém 2 bolas vermelhas e 1 branca, e a segunda caixa
que contém 2 bolas vermelhas e 2 bolas brancas. Escolhe-se uma das caixas ao acaso e retira-se dela uma
bola. Se a bola retirada for vermelha, qual a probabilidade de que ela tenha vindo da primeira caixa?
Sejam os eventos:
E1 = a 1ª caixa foi escolhida.
Temos então:
P ( E1 ) × P ( B / E1 ) 1 2
P ( E1 / B ) = = ×
P ( E1 ) × P( B / E1 ) + P( E 2 ) × P( B / E 2 ) 2 3 = 4/7
1 2 1 2
× + ×
2 3 2 4
Análise Combinatória
Para obtenção da probabilidade de eventos complexos, a enumeração de casos é muitas vezes difícil. Para
facilitar essa etapa utiliza-se os conceitos básicos de análises combinatória.
Arranjos
n!
Anr = ⇒ Arranjos de n objetos r a r.
(n − r )!
Permutações
No caso particular em que r = n temos: A n,n = n!
7! 7!
Temos: n = 7 r = 3 A73 = = = 5 × 6 × 7 = 210
(7 − 3)! 4!
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 7 MANUEL
Combinações
Nos arranjos a ordem em que os objetos aparecem é importante. No exemplo anterior ABC é um arranjo
diferente de BCA. Em muitos problemas, entretanto, não estamos interessados na ordem em que os objetos
aparecem. Tais escolhas são chamadas combinações.
n!
C nr = ⇒ Combinações de n elementos r a r.
r! (n − r )!
Exemplos:
01 - Calcular a probabilidade de se obter cinco espadas em uma mão de cinco cartas de um baralho de 52
cartas.
O número de mãos de 5 cartas que podem ser formadas de um baralho de 52 cartas distintas (nº de casos
possíveis) é dado por:
52! 52! 52 × 51 × 50 × 49 × 48 × 47! 52 × 51 × 50 × 49 × 48
C 52,5 = = = = = 2.598.960
5!(52 − 5)! 5!×47! 5!×47! 5!
O número de maneiras de selecionar 5 espadas dentre as 13 cartas de espada (nº da casos favoráveis) é
dado por:
13! 13! 13 × 12 × 11 × 10 × 9
C 13,5 = = = = 1.287
5! (13 − 5)! 5!×8! 1× 2 × 3 × 4 × 5
Obs. Usando a Regra do Produto (Eventos Dependentes) temos uma solução mais simples:
13 12 11 10 9
P( E ) = × × × × = 0,05%
52 51 50 49 48
02 - Num lote de 12 peças 4 são defeituosas. Retirando-se 2 peças aleatoriamente, calcule a probabilidade
de ambas serem defeituosas.
O número de combinações de 2 peças que podem ser selecionadas dentre as 12 peças ( nº da casos
12! 12! 12 × 11 132
possíveis) é dado por: C 12,2 = = = = = 66 .
2! (12 − 2)! 2 !×10! 1 × 2 2
O número de maneiras de selecionar 2 peças defeituosas dentre as 4 peças defeituosas (nº de casos
4! 4!
favoráveis) é dado por: C 4,2 = = =6
2! (4 − 2)! 2!×2!
A probabilidade desejada é dada por: P(E) = 6 / 66 = 0,091 ou 9,1 %
Obs. Aqui também podemos usar a Regra do Produto, ou seja, P(E) = 4/12 × 3/11 = 9,1%.
Ou seja, quando vamos retirar a primeira peça a probabilidade de sair uma defeituosa é 4/12. Quando
vamos retirar a segunda peça, a probabilidade de que ela seja defeituosa é 3/11, já que como a primeira
bola retirada foi defeituosa sobram apenas 3 defeituosas em um total de 11. Logo, a probabilidade de se
retirar duas defeituosas será 4/12 × 3/11 = 0,091 = 9,1%.
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 8 MANUEL
EXERCÍCIOS - PROBABILIDADE / TEOREMA DE BAYES
01-(CVM-Analista Planejamento e Execução Financeira-ESAF) Acredita-se que o preço de um bem (X), em
reais, tenha distribuição populacional uniforme no intervalo aberto (1; 7). Assinale a opção que corresponde
à probabilidade de se observar na população um valor de X de pelo menos 3 reais e de no máximo 5 reais.
a) 2/7 b) 1/3 c) 5/6 d) ½ e) 3/4
03-(FINEP-ANALISTA-2006/NCE) Um jogador está interessado em fazer apostas com base nos resultados
obtidos com o lançamento de dois dados simultaneamente. Ele deseja determinar as probabilidades de dois
tipos de resultados: a) a soma dos números que aparecem nos dois dados é menor do que 4; e b) o número
que aparece em um dado é diferente do número que aparece no outro dado. As respostas corretas são,
respectivamente:
(A) a. 1/9; b. 5/6;
(B) a. 1/12; b. 5/6;
(C) a. 1/9; b. 5/12;
(D) a. 1/12; b. 2/3;
(E) a. 1/6; b. 5/12.
06-(AFPS-ESAF) Suponha que a probabilidade de um evento C seja 0,4 e que a probabilidade condicional do
evento D dado que C ocorreu seja 0,2. Assinale a opção que dá o valor da probabilidade de ocorrência de D e
C.
a) 0,50 b) 0,08 c) 0,00 d) 1,00 e) 0,60
ESTATÍSTICA 9 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
08-(MP-RO-ANALISTA-2008/CESGRANRIO) A e B são eventos independentes com probabilidades
P(A) = 0,6 e P(B) = 0,5. Quanto vale a probabilidade de A ocorrer e B não ocorrer?
(A) 0,1 (B) 0,3 (C) 0,4 (D) 0,5 (E) 0,8
N1 | N2 0 1 2 3
0 0,25 0,13 0,04 0,02
1 0,15 0,11 0,02 0,01
2 0,08 0,06 0,05 0,02
3 0,01 0,01 0,01 0,03
a) 0,54 b) 0,50 c) 0,49 d) 0,44 e)0,19
ESTATÍSTICA 10 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
14- (ELETROBRÁS-ESTATÍSTICO-2002/NCE) A, B e C são eventos tais que:
P[A] = 0,2 P[B] = 0,3 P[C] = 0,4 P[A | B] = 0,2 P[A | C] = 0,8 P[C| B] = 0,4
Observe as afirmativas a seguir:
I- A e B são independentes;
II- A e C são independentes;
III- B e C são independentes.
Assinale o item que relaciona todas as afirmativas corretas:
a. I b. I , II c. I , III d. II , III e. I , II , III
16-(PBGÁS/2007) Um estudante é submetido a um teste no qual constam 4 questões do tipo verdadeiro (V)
ou falso (F). Ele não sabe responder a nenhuma das questões. A probabilidade de ele acertar todas as
quatro questões assinalando aleatoriamente a resposta de cada uma delas é
(A) 1,25%
(B) 2,5%
(C) 5,0%
(D) 6,25%
(E) 25%
17-(TCE-MG/2007) Em uma caixa há 8 processos a serem arquivados, em cada um dos quais foi colocada
uma etiqueta marcada com um único dos números de 1 a 8. Se no interior da caixa os processos não estão
ordenados e, para dar início à execução de tal tarefa, um funcionário do Tribunal de Contas pegar
aleatoriamente dois desses processos, a probabilidade de que nessa retirada os números marcados em
suas respectivas etiquetas sejam consecutivos é de
(A) 25% (B) 20% (C) 12,5% (D) 10% (E) 7,5%
ESTATÍSTICA 11 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
18-(CEF-2004) A tabela abaixo apresenta dados parciais sobre a folha de pagamento de um Banco.
Um desses empregados foi sorteado para receber um prêmio. A probabilidade desse empregado ter seu
salário na faixa de R$ 300,00 a R$ 500,00 é
(A) 1/3
(B) 2/5
(C) 1/2
(D) 3/5
(E) 7/10
19-(ANS-2007) A tabela fornece informações sobre o tipo de câncer e a idade de 500 pacientes que sofrem
desta doença, internados num determinado hospital especializado na doença.
20-(ANS-2007) Sabe-se que 3/5 dos pacientes submetidos a uma determinada cirurgia sobrevivem. Se 4
pacientes realizarem a cirurgia, a probabilidade de que pelo menos um não sobreviva é de
(A) 609/625 (B) 544/625 (C) 96 /625 (D) 24/625 (E) 16/625
21-(CAMDEP/2007) Uma rede local de computadores é composta por um servidor e 2 (dois) clientes (Z e
Y). Registros anteriores indicam que dos pedidos de certo tipo de processamento, cerca de 30% vêm de Z e
70% de Y. Se o pedido não for feito de forma adequada, o processamento apresentará erro. Sabendo-se
que 2% dos pedidos feitos por Z e 1% dos feitos por Y apresentam erro, a probabilidade do sistema
apresentar erro é:
(A) 5%
(B) 4,1%
(C) 3,5%
(D) 3%
(E) 1,3%
ESTATÍSTICA 12 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
22-(DNOCS/2009) Em uma loja, as unidades vendidas por dia de um determinado eletrodoméstico
apresentam a seguinte distribuição de probabilidades de ocorrência de venda:
Unidades
0 1 2 3 4 A probabilidade de que em um determinado dia tenham sido
Vendidas
vendidas mais que uma unidade do eletrodoméstico é igual a
Probabilidade P P 3P 2P P
(A) 87,5% (B) 80,0% (C) 75,0% (D) 60,0% (E) 50,0%
25-(METRO/2008) Dois irmãos investem no mercado financeiro. Em um determinado período, sabe-se que
o primeiro tem 80% de probabilidade de apresentar um ganho positivo e o segundo em 90%. A
probabilidade de nenhum deles apresentar em ganho positivo, neste período, é igual a
(A) 2% (B) 3% (C) 10% (D) 20% (E) 25%
26-(METRO/2008) Considere que um investidor possui metade de seus títulos do tipo A, 20% do tipo B e o
restante do tipo C. Sabe-se que a probabilidade dele obter lucro com o tipo A é igual a 80%, com o tipo B
90% e com o tipo C 60%. Escolhendo aleatoriamente um destes títulos e verificando que ele não
apresentou lucro, a probabilidade dele ser do tipo A é igual a
(A)2/3 (B)7/12 (C)1/2 (D)5/12 (E)2/7
ESTATÍSTICA 13 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
27-(METRO/2008) Em uma assembléia com 25 participantes, sabe-se que 5 deles são contra a realização
de determinado projeto e o restante a favor. Extraindo ao acaso uma amostra de 3 participantes desta
assembléia, sem reposição, a probabilidade (P) de todos os 3 participantes serem a favor do projeto é tal
que
(A) P < 50% (B) 50% ≤ P < 60% (C) 60% ≤ P < 70% (D) 70% ≤ P < 80% (E) 80% ≤ P < 90%
28-(METRO/2010) Em uma empresa, 20% dos homens e 10% das mulheres têm salários superiores a R$
5.000,00. Sabe-se que 40% dos empregados desta empresa são mulheres. Escolhendo aleatoriamente um
empregado desta empresa e verificando-se que seu salário não é superior a R$ 5.000,00, a probabilidade
dele ser homem é:
(A) 4/7 (B) 3/8 (C) 5/8 (D) 2/3 (E) 12/25
29-(MPE-PE/2006) Uma rede local de computadores é composta por um servidor e 2 clientes (A e B).
Registros anteriores indicam que, dos pedidos de certo tipo de processamento, cerca de 30% vêm de A e
70% de B. Se o pedido não for feito de forma adequada, o processamento apresentará erro. Sabe-se que
2% dos pedidos feitos por A e 5% dos feitos por B apresentam erro. Selecionando um pedido ao acaso, a
probabilidade dele ser proveniente de A, sabendo que apresentou erro, é
(A) 5/41 (B) 6/41 (C) 3/5 (D) 2/35 (E) 1/35
30-(MPE-PE/2006) Um lote contém 20 peças das quais 5 são defeituosas. Colhendo-se uma amostra de 2
peças, ao acaso e sem reposição deste lote, a probabilidade de se obter pelo menos uma peça defeituosa é
(A) 21/38 (B) 19/38 (C) 17/38 (D) 15/38 (E) 13/38
31-(MPU-2007) O tempo necessário para um medicamento contra dor fazer efeito segue um modelo com
densidade Uniforme no intervalo de 5 a 15 (em minutos). Um paciente é selecionado ao acaso entre os que
tomaram o remédio. A probabilidade do medicamento fazer efeito em até 10 minutos, neste paciente, é
(A) 0,8 (B) 0,7 (C) 0,5 (D) 0,4 (E) 0,3
32-(SEGAS-2010) A tabela abaixo apresenta o consumo médio mensal de 100 residências em um bairro
servido pela SERGAS.
Consumo (m3) Número de residências Escolhendo-se uma dessas residências ao acaso, a
10 28 probabilidade de que o seu consumo médio mensal de gás
15 53 natural seja de 25 m3 é
20 11
25 x
Total 100
(A) 2/25 (B) 7/100 (C) 3/50 (D) 1/20 (E) 1/25
ESTATÍSTICA 14 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
33-(TJ-2009) Dois processadores tipos A e B são colocados em teste por mil horas. A probabilidade de que
um erro de cálculo aconteça em um processador do tipo A é de 3%, do tipo B é 2% e em ambos é de 0,3%.
A probabilidade de que nenhum processador tenha apresentado erro é igual a
(A) 0,953 (B) 0,950 (C) 0,835 (D) 0,773 (E) 0,558
34-(TJ-PA-2009) Uma fábrica produz parafusos utilizando duas máquinas A e B. 60% dos parafusos são
produzidos por A e o restante por B. Sabe-se que 1% dos parafusos produzidos por A e 2% dos produzidos
por B são defeituosos. Então, a probabilidade de um processo de produção desta fábrica produzir parafusos
sem defeito é
(A) 96,4% (B) 97,0% (C) 98,0% (D) 98,2% (E) 98,6%
35-(TJ-PA-2009) Considere que 2 peças defeituosas estão misturadas com 3 peças perfeitas. As peças são
extraídas aleatoriamente uma a uma até que a última peça defeituosa seja encontrada. A probabilidade de
que a última peça defeituosa seja encontrada na terceira extração é igual a
(A) 1/5 (B) 1/10 (C) 1/15 (D) 2/5 (E) 1/2
36-(TJ-PA-2009) Seja uma cidade em que existem somente os jornais A, B e C. 40% da população desta
cidade lê um e somente um dos jornais, 10% lê os jornais A e B, 20% lê os jornais A e C, 30% lê os jornais
B e C e 5% lê todos os 3 jornais. Escolhendo aleatoriamente uma pessoa desta cidade, a probabilidade
dela não ler nenhum dos jornais é
(A) 5% (B) 10% (C) 15% (D) 20% (E) 25%
37-(TJ-PA-2009) Considere que em um país 10% da população pertence à classe A, 40% à classe B e o
restante à classe C. A probabilidade do indivíduo da classe A comprar um veículo da marca X é 80%, da B
é 50% e da C somente 8%. Um indivíduo comprou um veículo da marca X. A probabilidade dele não
pertencer à classe A é
(A) 50% (B) 60% (C) 65% (D) 75% (E) 80%
ESTATÍSTICA 15 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
38-(TJ-PI-2009) Seja P(X) a probabilidade de ocorrência do evento X. Se P(A) = 1/2, P(B) = 7/10
P(A∩B) = p e P (A ∪ B) = 2p.
Então, o valor de p é igual a
(A) 60% (B) 50% (C) 40% (D) 30% (E) 20%
39-(TJ-PI-2009) Em uma repartição pública, três setores A, B e C são responsáveis pela análise de todos
os processos autuados, recebendo cada um o mesmo número de processos para analisar
independentemente. Pela complexidade de tais processos, sabe-se que em A, B e C, respectivamente, 6%,
4,5% e 1,5% não são analisados dentro do tempo estipulado pela Administração. Escolhendo
aleatoriamente um processo entre todos autuados, a probabilidade dele ser analisado dentro do tempo
estipulado é de
(A) 94,0% (B) 94,5% (C) 95,0% (D) 96,0% (E) 98,5%
41-(BACEN-2001/ESAF) Uma variável aleatória X tem função de distribuição de probabilidades dada por
Assinale a opção que corresponde à probabilidade de que, num dia típico, tenham sido vendidas 2
secadoras dado que 3 lavadoras foram vendidas.
a. 1/6 b. 1/4 c. 5/12 d. 1 e. 1/ 3
ESTATÍSTICA 16 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
43-(MIN-PLANEJAMENTO-ENAP-2006/ESAF) Com a seguinte função de probabilidade conjunta, onde x
assume os valores 0 e 1, e y assume os valores, 1, 2 e 3,
a) P(Y = 3) = 0,08
b) P(X =0) = P(Y =2)
c) P(Y = 2 / X = 0) = 0,6.
d) E(X) = 0,4.
e) X e Y são variáveis aleatórias dependentes.
45-(ATRFB-2006/ESAF) Paulo e Helena jogam, cada um, uma moeda. Se do lançamento dessas duas
moedas resultar duas caras, Paulo paga a Helena R$ 5,00. Dando qualquer outro resultado, Helena paga a
Paulo R$ 2,00. Supondo que ambas as moedas sejam estatisticamente honestas, o valor esperado dos
ganhos de Helena (considerando-se como ganhos negativos os valores que ela paga a Paulo) é igual a
GABARITOS
ESTATÍSTICA 17 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
MÓDULO- 5B - VARIÁVEIS ALEATÓRIAS e DISTRIBUIÇÕES DE PROBABILIDADE
VARIÁVEIS ALEATÓRIAS
No capítulo anterior estudamos as probabilidades de ocorrência de eventos do espaço amostral
correspondente ao experimento aleatório considerado. O que vamos ver agora é uma maneira mais
conveniente de tratar tais eventos, o que será feito a partir da associação de “valores” aos pontos do
espaço amostral.
Exemplo: Considere o experimento aleatório que consiste no lançamento simultâneo de duas moedas.
O espaço amostral (S) correspondente a esse experimento aleatório é:
S = { (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co) }.
Podemos definir a variável aleatória X como a que corresponde ao número de caras obtidas e Y como
a variável aleatória que corresponde ao número de coroas. Dessa maneira cada ponto do espaço
amostral corresponderá a valores das variáveis X e Y, como mostrado na tabela abaixo.
X Y
Ponto Amostral
(nº caras) (nº coroas)
(Ca,Ca) 2 0
(Ca,Co) 1 1
(Co,Ca) 1 1
(Co,Co) 0 2
Qual seria a probabilidade de no lançamento simultâneo de duas moedas se obter duas caras (X = 2) ?
ESTATÍSTICA 18 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Distribuição de Probabilidade
Para Variável Aleatória Discreta ⇒ é uma tabela especificando a probabilidade de que a variável
aleatória assuma cada um dos valores possíveis. Ou seja, é a função que determina a probabilidade de
X assumir o valor x ⇒ P (X = x).
X 0 1 2 Número de caras
P(X) 1/4 1/2 1/4 onde ∑ P(X) = 1
X 1 2 3 4 5 6
P( X ) 1/6 1/6 1/6 1/6 1/6 1/6 ∑ P(X) = 1
ESTATÍSTICA 19 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Distribuição de Probabilidade Contínua
FIGURA 5.1
A área total limitada por essa curva e pelo eixo dos x é igual a 1 (ou seja, é igual a soma de todas as
probabilidades) e a área compreendida entre X = a e X = b dá a probabilidade de X estar entre a e b, ou
seja, P(a ≤ X ≤ b).
Valor Esperado
Suponhamos que a variável aleatória X assuma um dos valores x1, x2, ..., xk, com as respectivas
probabilidades p(x1), p(x2), ... , p(xk), onde p(x1) + p(x2) +...+ p(xk) = 1. Então o valor esperado desta
variável aleatória é definido por:
E (X) = ∑ xi . p(xi)
Exemplo: Suponha um jogo disputado com um dado honesto, em que um jogador ganha R$ 20,00 se o
resultado é 2, R$ 40,00 se o resultado é 4, perde R$ 30,00 se o resultado é 6, e não ganha nem perde
se aparecer qualquer das outras faces. Determine seu ganho esperado.
Seja X a variável aleatória que representa a quantia ganha em uma jogada qualquer.
Resultado 1, 3 ou 5 2 4 6
Xi R$ 0,00 + R$ 20,00 + R$ 40,00 - R$ 30,00
P(Xi) 3/6 1/6 1/6 1/6
3 1 1 1
E( X ) = 0 × + 20 × + 40 × − 30 × = 5
6 6 6 6
Então em uma jogada o jogador pode esperar ganhar R$ 5,00.
ESTATÍSTICA 20 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Distribuições Discretas
Distribuição Binomial
Utiliza-se esse tipo de distribuição para designar (modelar) situações em que os dados podem ser
grupados em duas classes ou categorias como, por exemplo: respostas a um teste do tipo V ou F,
respostas do tipo “sim” ou “não” a um questionário, produtos com ou sem defeito, pessoas vacinadas
ou não vacinadas, datagramas transmitidos com erro ou sem erro, etc.
P( X = x) = C nx × p x × q n− x
Observação: Os experimentos que seguem esta distribuição devem satisfazer as seguintes condições:
• O experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n).
• As tentativas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os
resultados das seguintes.
• Em cada tentativa deve aparecer um dos dois possíveis resultados: sucesso ou insucesso.
• No decorrer do experimento, a probabilidade p de sucesso e a probabilidade q de insucesso
deverão permanecer constantes.
Exemplo-1- Qual a probabilidade de se obter exatamente 2 caras em 6 lances de uma moeda não
viciada.
Temos:
n=6 ⇒ número de jogadas
x=2 ⇒ número de ocorrências do evento desejado
p = ½ ⇒ probabilidade de ocorrência do evento desejado (sucesso) - dar cara
q = ½ ⇒ probabilidade de não ocorrência do evento desejado (insucesso) - não dar cara
2 4 6
⎛1⎞ ⎛1⎞ 6! ⎛1⎞ 15
P( X = 2) = C62 ×⎜ ⎟ ×⎜ ⎟ = ×⎜ ⎟ =
⎝2⎠ ⎝2⎠ 2!× 4! ⎝ 2 ⎠ 64
ESTATÍSTICA 21 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Exemplo-2 - Qual a probabilidade de se obter pelo menos 4 caras em 6 lances de uma moeda não
viciada.
Solução: Aqui como é pedida a probabilidade de se obter pelo menos 4 caras, temos que somar as
probabilidades de se obter 4, 5 ou 6 caras.
Assim P(X ≥ 4) = P(X = 4) + P(X = 5) + P(X = 6)
Temos então:
n=6 ⇒ número de jogadas
x = 4, 5 ou 6 ⇒ número de ocorrências do evento desejado (4, 5 ou 6 caras)
p=½ ⇒ probabilidade de ocorrência do evento desejado (sucesso) - dar cara
q=½ ⇒ probabilidade de não ocorrência do evento desejado (insucesso) - não dar cara
4 2 5 1 6 0
⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞
P ( X = 4) + P ( X = 5) + P ( X = 6) = C 64 × ⎜ ⎟ × ⎜ ⎟ + C 65 × ⎜ ⎟ × ⎜ ⎟ + C 66 × ⎜ ⎟ × ⎜ ⎟
⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠
4 2 5 1 6 0
6! ⎛ 1 ⎞ ⎛ 1 ⎞ 6! ⎛ 1 ⎞ ⎛ 1 ⎞ 6! ⎛ 1 ⎞ ⎛ 1 ⎞
P ( X = 4 ) + P ( X = 5) + P ( X = 6 ) = ×⎜ ⎟ ×⎜ ⎟ + ×⎜ ⎟ ×⎜ ⎟ + ×⎜ ⎟ ×⎜ ⎟
4 !×2 ! ⎝ 2 ⎠ ⎝ 2 ⎠ 5!× 1! ⎝ 2 ⎠ ⎝ 2 ⎠ 6!× 0! ⎝ 2 ⎠ ⎝ 2 ⎠
15 6 1 22
P ( X ≥ 4) = + + =
64 64 64 64
Média μ = n× p
Variância σ 2 = n× p×q
Desvio Padrão σ = n× p×q
Exemplo: Calcular a média (o número esperado) de caras em 100 lançamentos de uma moeda não
viciada.
Temos:
n = 100 p = ½ (probabilidade de ocorrer cara) - sucesso
Variância σ2 = 100 × ½ × ½ = 25
Desvio padrão σ = 25 = 5
ESTATÍSTICA 22 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Distribuição de Poisson
λx e − λ
P( X = x) = e = 2,71828... (número de Euler)
x!
onde, x = 0,1,2,3,4.... é o número de ocorrências (x ≥ 0) que se deseja calcular a probabilidade e
λ > 0 é o número médio dessas ocorrências (sucessos) no intervalo ou região considerada.
Média μ =λ
Variância σ2 =λ
Desvio Padrão σ= λ
Exemplo-01- Suponhamos que 300 erros de impressão sejam distribuídos aleatoriamente em um livro
com 500 páginas. Qual a probabilidade de cada página conter exatamente 2 erros.
Temos:
n = 300 (há 300 erros de impressão)
A probabilidade de um erro ocorrer em cada página é p = 1/500 (o livro tem 500 páginas).
A média de erros por página (λ) é dada por: λ = n ×p = 300 ×1/500 = 0,6.
Agora podemos utilizar Poisson para calcular a probabilidade desejada onde x = 2 e λ = 0,6.
OBS. Se quiser pode utilizar a função POISSON no MS EXCEL para fazer os cálculos com os
seguintes parâmetros: = POISSON( x ; λ; CUMULATIVO) onde:
x = 2 (número de sucessos) λ = 0,6 (média)
CUMULATIVO=FALSO (significa que queremos o valor para x=2. Se CUMULATIVO for VERDADEIRO
ela fará o cálculo para x=0, x=1 e x=2 e dará como resultado a soma desses valores).
ESTATÍSTICA 23 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Distribuições Contínuas
FIGURA 5.2
Assim, dizemos que uma variável aleatória X que pode ser representada por um gráfico como o da
figura acima tem distribuição Normal com média μ e desvio padrão σ, e representamos da seguinte
maneira X ∼ N ( μ , σ ). Ou seja, X é uma Normal com média μ e desvio padrão σ.
A equação da curva Normal é dada pela expressão abaixo, onde x é o valor da variável aleatória
considerada e μ e σ são parâmetros conhecidos da variável, ou seja, média e desvio padrão.
− (x − μ )
2
1
f ( x) = . e 2σ
2
, onde π = 3.14159 e e = 2.71828
σ 2π
Assim, a curva normal é uma distribuição que possibilita determinar probabilidades associadas a todos
os pontos da linha de base (valores de x), ou seja, é uma distribuição de freqüências, sendo a
freqüência total sob a curva (soma das probabilidades) igual a 100%.
Propriedades da Normal
Uma curva Normal tem forma de sino, é simétrica (Média = Moda = Mediana) e Unimodal.
Adicionalmente são válidos os valores de probabilidades exibidos na figura e tabela abaixo.
μ±1σ 68,26%
μ±2σ 95,45%
μ±3σ 99,73%
FIGURA 5.3
ESTATÍSTICA 24 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Normal Padrão
Dizemos que a variável aleatória Z tem distribuição normal padrão quando μ = 0 e σ = 1, e utilizamos
a seguinte notação Z ∼ N (0,1).
Toda variável X ∼ N(μ ,σ) pode ser reduzida a uma variável com distribuição normal padrão (Z) através
da seguinte transformação:
X −μ
Z= , onde X ∼ N(μ ,σ) e Z ∼ N( 0, 1).
σ
Ou seja , a variável Z (transformada) é obtida subtraindo-se de cada valor observado de X sua média μ
Observações
• A variável aleatória X pode assumir todo e qualquer valor real.
• A representação gráfica da distribuição normal é uma curva em formato de sino, simétrica em
relação à média (μ). Tal representação recebe o nome de Curva Normal ou Curva de Gauss
(FIGURA 5.4).
• A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade da variável aleatória X assumir qualquer valor real entre (-∞ e + ∞).
FIGURA 5.4
ESTATÍSTICA 25 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Exemplo-01: Seja X a variável aleatória que representa os diâmetros de parafusos produzidos por
determinada máquina. Suponha que essa variável tenha distribuição normal com média μ = 2 cm e
desvio padrão σ = 0,04 cm. Calcular a probabilidade de um parafuso produzido pela máquina ter um
diâmetro com valor entre 2,0 cm e 2,05 cm.
Temos: X ~ N( 2; 0.04)
Queremos calcular P( 2,0 < x < 2,05 ).
Para poder utilizar os valores tabelados da distribuição normal padrão precisamos transformar os
Média μ
Variância σ2
Desvio Padrão σ
Se N (número de observações) for grande, e se nem p nem q estiverem muito próximos de zero, a
distribuição Binomial pode ser aproximada por uma distribuição Normal, cuja variável reduzida será
dada por:
X − Np
Z=
Npq
Na prática, a aproximação é muito boa, quando tanto N×p quanto N×q são superiores a 5.
Ao utilizar uma distribuição contínua como aproximação de uma distribuição discreta, é
conveniente o uso da correção de continuidade, que consiste em adicionar ou subtrair 0,5 de
acordo com a forma da probabilidade solicitada:
• Subtrair 0,5 de x quando é solicitado P( X ≥ x )
• Subtrair 0,5 de x quando é solicitado P( X > x )
• Adicionar 0,5 a x quando é solicitado P( X ≤ x)
• Adicionar 0,5 a x quando é solicitado P( X < x)
ESTATÍSTICA 26 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Exemplo: Determinar a probabilidade de se obter entre 3 e 6 caras, inclusive, em 10 lances de uma
moeda honesta, utilizando (a) distribuição binomial; (b) aproximação normal.
Solução
P( 3 ≤ X ≤ 6) = P( X = 3 ) + P( X = 4 ) + P( X = 5 ) + P( X = 6 )
Temos então:
n = 10 (número de lances - lançamentos da moeda)
x = 3, 4, 5 ou 6 (resultados desejados 3, 4, 5 ou 6 caras)
p=½ (probabilidade de sair cara - sucesso !)
q=½ (probabilidade de não sair cara - insucesso !)
Fórmula da Binomial P( X = x) = C nx × p x × q n− x
3 7 4 6 5 5 6 4
⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞
P (3 ≤ X ≤ 6) = C10
3
× ⎜ ⎟ × ⎜ ⎟ + C10
4
× ⎜ ⎟ × ⎜ ⎟ + C10
5
× ⎜ ⎟ × ⎜ ⎟ + C10
6
×⎜ ⎟ ×⎜ ⎟
⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠
P(3 ≤ X ≤ 6) = 0,7734 (77,34%).
Então X é uma Normal com média μ = 5 e desvio padrão σ =1,58, ou seja X ~ N(5 ; 1,58).
Normalizando os valores de X (2,5 e 6,5) para obter uma Normal padronizada Z ~ (0,1) temos:
2,5 − 5 6,5 − 5
z1 = = −1,58 z2 = = 0,95
1,58 1,58
P(0,95) = 0,3289
Logo a probabilidade desejada equivale a P(-1,58 ≤ Z ≤ 0,95 ) = 0,4429 + 0,3289 = 0,7718 (77,18%).
Perceba a diferença entre a solução utilizando a Binomial e a solução utilizando a aproximação pela
Normal (0,7734 - 0,7718) = 0,0016.
ESTATÍSTICA 27 MANUEL
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
EXERCÍCIOS - BINOMIAL - POISSON - NORMAL
BINOMIAL
02- Jogando-se um dado três vezes, determine a probabilidade de se obter um múltiplo de 3 duas vezes.
a) 1/9 b) 2/9 c) 1/3 d) 4/9 e) 5/9
03- (AFRF) Em uma cidade, 10% das pessoas possuem carro importado. Dez pessoas dessa cidade
são selecionadas ao acaso e com reposição. A probabilidade de que exatamente 7 das pessoas
selecionadas possuam carro importado é:
a) (0,1)7 (0,9)3
b) (0,1)3 (0,9)7
c) 120 (0,1)7 (0,9)3
d) 120 (0,1)7 (0,9)7
e) 120 (0,1)7 (0,9)
05- (BACEN-ESAF) Um fabricante de discos rígidos sabe que 2% dos discos produzidos falham durante
o período de garantia. Assinale a opção que dá a probabilidade de que pelo menos um disco falhe numa
amostra aleatória de 10 discos tomados da linha de produção.
a) (0,98)10 - (0,02)10
b) (0,02)10
c) 1 - (0,98)10
d) 1 - (0,02)10
e) 0,02
ESTATÍSTICA 28 MANUEL
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
06- (ICMS-SP) Os produtos de uma empresa são vendidos em lotes de 4 peças e, se houver uma ou
mais peças defeituosas no lote, o comprador não paga. Se a proporção de defeituosos da fábrica é de
10%, então, a probabilidade de isso ocorrer é de, aproximadamente:
a) 0,19
b) 0,27
c) 0,34
d) 0,40
e) 0,46
08- (INPI-2009) Marcelo fez uma prova de múltipla escolha. Cada questão tinha cinco alternativas,
sendo apenas uma correta. Sabendo-se que ele marcou aleatoriamente três questões, a probabilidade
de ter acertado pelo menos uma delas é de:
a) 0,24
b) 0,488
c) 0,512
d) 0,6
e) 0,2
09- (ICMS-MG) Suponha que a probabilidade de que se encontre erro contábil grave em uma auditoria
seja de 0,2. Se dez auditorias independentes são realizadas, assinale a opção que dá a probabilidade de
que não mais do que uma detecte erro contábil grave.
a) 2,8 (4/5)
b) 0,400
c) (0,2)10
d) 2,8 (4/5)10
e) 2,8 (4/5)9
10- (BACEN-2006) A probabilidade de um associado de um clube pagar a sua mensalidade com atraso
é de 5%. Entre 5 associados escolhidos aleatoriamente, a probabilidade de pelo menos um pagar a sua
mensalidade sem atraso é de:
a) 1 - (0,95)5
b) (0,95)5
c) 4,75(0,95)5
d) 5 (0,95)5
e) 1 - (0,05)5
ESTATÍSTICA 29 MANUEL
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
11- (ICMS-RJ-2010 FGV) 40% dos eleitores de uma certa população votaram, na última eleição, num
certo candidato A. Se cinco eleitores forem escolhidos ao acaso, com reposição, a probabilidade de que
três tenham votado no candidato A é igual a:
(A) 12,48%.
(B) 17,58%.
(C) 23,04%.
(D) 25,78%.
(E) 28,64%.
POISSON
13-(CGM/2003) A procura semanal de certa peça sobressalente pode ser modelada segundo uma
distribuição de Poisson com média igual a 0,15. Em uma semana, a probabilidade de ser pedida ao
-15
menos uma peça é, aproximadamente: (e ) = 0,8607.
a) 14%
b) 15%
c) 86%
d) 85%
e) 16%
14- (AFRF-2009) O número de petroleiros que chegam a uma refinaria ocorre segundo uma distribuição
de Poisson, com média de dois petroleiros por dia. Desse modo, a probabilidade de a refinaria receber
no máximo três petroleiros em dois dias é igual a:
32 −4 3 4 71 −4 71 −2 32 −2
a) e b) e c) e d) e e) e
73 71 3 3 3
15-(ICMS/SP-2009) O número de pessoas que chega ao guichê de uma repartição pública para
autuação de processos apresenta uma distribuição de Poisson a uma taxa de duas pessoas por minuto.
A probabilidade de que nos próximos 2 minutos chegue pelo menos uma pessoa neste guichê é:
(Observação: e = 2,71828...)
a) (e4 - 1). e-4
b) 4.e-4
c) (e4 - 4).e-4
d) 2. [ (e2 − 1)].e-2
e) (e2 - 2).e-2
ESTATÍSTICA 30 MANUEL
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
16- (MPE/PE-2006) O número de falhas de certo tipo de placa térmica tem distribuição de Poisson, com
taxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário, é necessário cobrir uma
superfície de 2m por 2m com essa placa. A probabilidade de que haja pelo menos uma falha nessa
superfície é de:
a) e-0,1
b) 1 - e-0,1
c) 1 - e-0,4
d) e-0,4
e) 1 - 1,4 e-0,4
17- (MPU-2007) O número de pacientes atendidos por um clínico geral segue uma distribuição de
Poisson com taxa de 4 pacientes por hora. A probabilidade de que pelo menos um paciente consulte o
clínico geral em um período de 15 minutos é:
a) 1 - e-1
b) 1 - e4
c) e-4
d) e4
e) e-1
18- (TRT-7aR-2009) Seja X a variável aleatória que representa o número de chamadas por minuto
recebidas por um PBX. Sabe-se que X tem média λ e que P(X = 3) = P(X = 4). Supondo que a
distribuição de Poisson seja adequada para X, a probabilidade de que ocorra uma chamada em 30
segundos é:
a) e-4
b) 4.e-4
c) e-2
d) 2.e-2
e) 1 - 2.e-2
19- (MEC-2009) O número de clientes que chega a cada hora a uma empresa tem Distribuição de
2 k −2
Poisson, com parâmetro 2, ou seja, a probabilidade de que cheguem k clientes é dada por e para
k!
k = 0, 1, 2, .... Qual é a probabilidade de que, em uma determinada hora, cheguem dois ou mais
clientes? (Dado e-2 = 0,14).
a) 0,28
b) 0,35
c) 0,42
d) 0,58
e) 0,72
20-(TRF) A probabilidade de que um item produzido por uma máquina seja defeituoso é de 10%. Uma
amostra de 30 itens produzidos por esta máquina é selecionada ao acaso. Use a aproximação pela
distribuição de Poisson para determinar a probabilidade de que não mais do que um item defeituoso seja
encontrado nesta amostra.
a) 4e-3
b) 4e-2
c) 3e-3
d) 1 - 4e-3
e) 1 - 3e-3
ESTATÍSTICA 31 MANUEL
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
NORMAL
x φ (x)
1,85 0,968
1,96 0,975
2,00 0,977
2,12 0,983
a) 5,0%
b) 3,1%
c) 2,3%
d) 2,5%
e) 4,0%
24-(SERPRO-Analista Sistemas-ESAF) Suponha que o tempo que a Receita Federal leva no processo
de devolução do imposto pago a mais tenha distribuição normal com média de 12 semanas e
desvio-padrão de 3 semanas. Assinale a opção que estima a proporção de contribuintes que recebem a
devolução em no máximo 6 semanas. A tabela abaixo dá os valores de P{0<X<Z} quando X tem
distribuição normal padrão para valores selecionados de Z. Por exemplo, P{0<X<1,56}=0,4406.
Z 00 06 08
1,0 0,3413 0,3554 0,3599
1,5 0,4332 0,4406 0,4429
1,9 0,4332 0,4750 0,4761
2,0 0,4772 0,4803 0,4812
a) 50,00%
b) 5,56%
c) 43,32%
d) 2,28%
e) 47,72%
ESTATÍSTICA 32 MANUEL
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
25-(SESPA-ESTATÍSTICO-2006/NCE) Uma variável aleatória X tem distribuição normal com média 20 e
variância 144. A probabilidade de que X seja maior do que 14 é aproximadamente igual a:
(A) 45%;
(B) 53%;
(C) 62%;
(D) 69%;
(E) 76%.
N1 | N2 0 1 2 3
0 0,25 0,13 0,04 0,02
1 0,15 0,11 0,02 0,01
2 0,08 0,06 0,05 0,02
3 0,01 0,01 0,01 0,03
a) 0,54 b) 0,50 c) 0,49 d) 0,44 e)0,19
27- (TCDF/CESP-UNB) O número de horas que um analista do TCDF gasta examinando cada um dos
processos submetidos ao órgão tem distribuição normal, simétrica, com média de 10 horas e desvio
padrão de 2 horas. É correto afirmar
a. que nenhum processo levará mais de 30 horas para ser examinado
b. que o número de processos que consomem mais de 15 horas de trabalho é igual ao número de
processos que despendem menos de 5 horas.
c. que, em 50% dos casos, o tempo despendido ao exame do processo será de exatamente 10 horas.
d. que a moda da distribuição de horas é igual à mediana, que é diferente da média.
e. que 10% dos processos devem gastar entre 8 e 12 horas para serem examinados.
28-(AFC/ESAF) Um parâmetro de malha de determinado tributo tem distribuição Normal com média 12 e
desvio padrão 4. Considerando que ficarão retidas em malha declarações que apresentarem o valor do
parâmetro maior do que 22, e que a população é de 20.000.000 declarantes, o número de declarações
retidas no atual exercício fiscal é:
a) 12.400
b) 250.000
c) 220.000
d) 124.000
e) 62.000
29- (AFC/ESAF) Em relação a questão anterior quanto deve ser o ponto de corte para que fiquem
retidas em malha 80.000 declarações:
a) 22,6
b) 19,7
c) 20,8
d) 23,7
e) 21,3
ESTATÍSTICA 33 MANUEL
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
30-(SUSEP-ANALISTA TÉCNICO-2006/ESAF) Se a variável X pode assumir um conjunto infinito
(contínuo) de valores, o polígono de freqüência relativa de uma amostra torna-se uma curva contínua,
cuja equação é Y = p(X). A área total limitada por essa curva e pelo eixo dos X é igual a 1 e a área
compreendida entre as verticais X = a e X = b, sendo a < b e, ambos, contidos na área total da curva, a
probabilidade de X cair neste intervalo a e b é dada por:
a) P (a<X<b), composta pela soma de P(X=a) + P(X=b).
b) P (a<X<b), composta pela integral de P(X=a) até P(X=b).
c) P (a>X>b), composta pela soma de P(X=a) – P(X=b).
d) P (a>X>b), composta pela integral de P(X=a) até P(X=b).
e) P (a< X<b), composta pela P(X=b), de forma cumulativa até o ponto b.
GABARITOS
EXERCÍCIOS
01-B
02-B
03-C
04-D
05-C
06-C
07-E
08-B
09-E
10-E
11-C
12-D
13-A
14-C
15-A
16-C
17-A
18-D
19-D
20-A
21-C
22-D
23-A
24-D
25-D
26-D
27-B
28-D
29-A
30-B
ESTATÍSTICA 34 MANUEL
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
TABELA NORMAL PADRÃO
Quantis da distribuição Normal Padrão: P(0 ≤ Z ≤ z)
Segunda decimal de z
0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
Parte inteira e primeira decimal de z
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
ESTATÍSTICA 35 MANUEL
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
MÓDULO- 08-CORRELAÇÃO E REGRESSÃO
Correlação Linear Simples - Para avaliar o grau de correlação linear entre duas variáveis aleatórias X e
Y usa-se o coeficiente de correlação de Pearson assim definido:
n ∑ xy − ∑ x ∑ y
r= , onde n é o número de observações.
[ n∑ x 2
− ( ∑ x)
2
] × [ n∑ y 2
− ( ∑ y)
2
]
Demonstra-se que r varia entre -1 e 1 ⇒ -1 ≤ r ≤ 1
Tipos de Correlação
ESTATÍSTICA 36 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Correlação Nula - quando não há relação entre as variáveis X e Y, ou seja, quando as variações de X e
Y são independentes (r = 0) (FIG-E).
Observações:
1. Observando os diagramas de dispersão conclui-se que, quanto mais os pontos estiverem próximos da reta,
mais forte será a correlação, ou seja, r estará mais próximo de ± 1. Quanto mais fraca for a correlação,
mais próximo de zero(0) será o coeficiente de correlação(r).
2. Se duas variáveis aleatórias X e Y são independentes o coeficiente de correlação entre elas será zero (0).
3. Para o cálculo da correlação é conveniente montar uma tabela como a seguinte:
Y X X2 Y2 XxY
ΣY ΣX Σ X2 Σ Y2 ΣXxY
5 × 288 − 30 × 46 60
r= = = 0,416
[5 × 220 − 30 ]× [5 × 444 − 46 ]
2 2 144,22
S X ,Y =
∑ XY − nXY ou S XY =
∑ XY − XY ⇒ a média do produto menos o produto das médias.
n n
Onde:
SXY ⇒ covariância entre as variáveis X e Y.
X ⇒ média aritmética de X.
Y ⇒ média aritmética de Y.
n ⇒ número de observações.
ESTATÍSTICA 37 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Uma outra fórmula também muito utilizada para a covariância é:
S XY =
∑ (X − X )(Y − Y )
n
Ou seja, Covariância também é “a média do produto dos desvios”.
A partir do conceito de covariância, obtêm-se uma fórmula mais simples para o Coeficiente de
Correlação entre duas variáveis aleatórias X e Y:
S X ,Y
Coeficiente de Correlação ⇒ r = onde:
S X × SY
Sxy ⇒ covariância entre X e Y.
Sx ⇒ desvio-padrão de X.
Sy ⇒ desvio-padrão de Y.
S2x =
∑(x i − x)2
=
∑x 2
i
− x2 =
220
− 62 = 44-36 = 8 ⇒ Sx = 2,83
n n 5
S2Y =
∑( y i− y)2
=
∑y 2
i
− y2 =
444
− 9,2 2 = 88,8 - 84,64 = 4,16 ⇒ SY = 2,04
n n 5
S X ,Y 2,4
Assim, o coeficiente de correlação será: r = ⇒ r= ⇒ r = 0,416.
S X × SY 5,77
Exemplos:
Cov(4+X,Y) = Cov(X,Y) ⇒ somar uma constante (4) a X.
Cov(X,Y+4) = Cov(X,Y) ⇒ somar uma constante (4) a Y.
Cov(4X,Y) = 4×Cov(X,Y) ⇒ multiplicar X por uma constante (4).
Cov(X, 4Y) = 4×Cov(X,Y)⇒ multiplicar Y por uma constante (4).
Cov(X/4,Y) = Cov(X,Y)/4 ⇒ dividir X por uma constante (4).
Cov(X,Y/4) = Cov(X,Y)/4 ⇒ dividir Y por uma constante (4).
Cov(2X,5Y) = 2×5×Cov(X,Y) = 10×Cov(X,Y) ⇒ multiplicar X (por 2) e Y (por 5).
Cov(2X+3, 5Y+4) = 10×Cov(X,Y) ⇒ as constantes 3 e 4 como estão somadas não afetam a covariância.
ESTATÍSTICA 38 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Regressão
Regressão Linear Simples - a análise de regressão tem por objetivo descrever através de um
modelo matemático, a relação existente entre duas variáveis (X e Y) a partir de n observações dessas
variáveis. Supondo X a variável explicativa (independente) e Y a variável explicada (dependente)
pode-se escrever que: Y = f (X), ou seja, a variável Y é função da variável X. Considera-se que Y é uma
variável aleatória e que a relação entre X e Y não é regida apenas por uma lei matemática. Assim, a
relação entre X e Y deve ser escrita de forma mais correta como Y= f (X) + e, onde e é uma variável que
irá captar as influências sobre Y não decorrentes de X. Assim, a regressão linear simples busca
determinar a equação de uma reta que descreva a relação entre duas variáveis. A reta que é descrita
por esta equação chama-se reta de regressão. O processo de determinação dos parâmetros da reta de
regressão é chamado de ajustamento.
O processo para obtenção da reta ajustada é denominado método dos mínimos quadrados. Este
processo consiste em minimizar a soma dos quadrados dos desvios entre Y e Y$ , ou seja:
∑ê 2
= ∑ (Y − Yˆ ) 2 = ∑ (Y − a − bX ) 2 é mínima, onde:
∑ (Y − Y$) 2
, ou seja, deriva-se em relação aos parâmetros (a e b) e iguala-se as derivadas a zero.
S XY
b= onde: SXY é a covariância entre X e Y e S2x é a variância de X.
S X2
Propriedades da Regressão
Covariância (SXY)
SXY > 0 ⇒ correlação positiva entre X e Y.
SXY = 0 ⇒ não há correlação.
SXY < 0 ⇒ correlação negativa entre X e Y.
X Y
1 1
3 2
4 4
6 4
8 5
9 7
11 8
14 9
Σ 56 Σ 40
Temos então:
X = 56/8 = 7 → média de X Y = 40/8 = 5 → média de Y
S X2 =
∑ xi2 − x 2 = 524 − 7 2 = 16,54 Sxy = ∑ XY − XY = 364/8 - 7×8= 10,5
n 8 n
S XY
Os parâmetros do modelo linear são dados por: b = e a = Y - bX
S X2
Temos então:
b = 10,5/16,5 ⇒ b = 0,636
a = Y - b X = 5 - 0,636 x 7 = 5 - 4,452 ⇒ a = 0,548
ESTATÍSTICA 40 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Ajustamento de Curvas
Em muitos casos a forma funcional entre as variáveis X e Y não é linear, ou seja, a variável Y não é uma
função linear de X. Veremos a seguir os principais modelos não lineares que podem ser linearizados,
utilizando-se uma transformação de variáveis.
Utilizando logaritmo e transformando o modelo teórico acima, vem: log Y = log a + b log X.
Fazendo: y = log Y x = log X A = log a
Temos: y = A + bx → modelo linearizado.
O ajustamento é feito e os valores dos parâmetros são determinados a partir do modelo linear.
Temos Y = a Xb
Fazendo: y = ln Y x = ln X A = ln a
Temos então:
ESTATÍSTICA 41 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Curva Exponencial Forma Teórica ⇒ Y = abX , onde: a>0 e b>1
Exemplo-5: A tabela a seguir reflete a evolução do Índice Geral de Preços(IGP) no Brasil, no período de
1958 a 1967.
Determinação do valor de B
n ∑ XY − ∑ X ∑ Y
Temos: b= n = 10 substituindo, vem:
n∑ X 2 − (∑ X ) 2
10 × 186,2165 − 55 × 31,0942 1862 ,165 − 1710,181 151,984
B= = B= ⇒ B = 0,18422
10 × 385 − (55) 2 3850 − 3025 825
31,0942 55
A= Y-Bx X A= − 0,18422 × A = 2,09622
10 10
ESTATÍSTICA 42 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Regressão Polinomial - Ajuste por Parábola
Das funções não lineares que não podem ser linearizadas (transformadas em retas) as mais importantes
são as parábolas.
∑ (Y − Y$) 2
∂ ∑ (Y − Y$ ) 2 ∂ ∑ (Y − Y$ ) ∂ ∑ (Y − Y$ )
2 2
=0 , =0 , =0
∂ a ∂ b ∂ c
∑Y = n.a + b ∑ x + c ∑ x2
∑XY = a ∑X + b ∑X2 + b ∑X3
∑ X2Y = a ∑X2 + b ∑X3 + c ∑X4
Resolvendo-se esse sistema com três equações e três incógnitas, obtém-se o valor dos parâmetros da
parábola: a, b e c.
Para facilitar a resolução do sistema de equações é conveniente centrar a variável X na média, uma vez
que os momentos centrados de ordem ímpar são nulos.
Efetuando-se a transformação x = X - X obtém-se:
∑x = ∑ (X - X ) = 0
∑x = ∑ (X - X )3 = 0
∑x = ∑ (X - X )5 = 0
Exemplo-6: A tabela seguinte apresenta o preço do litro de gasolina observado por um período de sete
semestres consecutivos:
Datas Preço($)
Ago/77 6,00
Fev/78 6,30
Ago/78 7,30
Fev/79 9,60
Ago/79 10,20
Fev/80 22,60
Ago/80 38,00
ESTATÍSTICA 43 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Temos então:
X Y x =(X - X) xY x2 x2Y x4 Y2
1 6,00 -3 -18,0 9 54,0 81 36,00
2 6,30 -2 -12,6 4 25,2 16 39,69
3 7,30 -1 -7,3 1 7,3 1 53,29
4 9,60 0 0 0 0 0 92,16
5 10,20 1 10,2 1 10,2 1 104,04
6 22,60 2 45,2 4 90,4 16 510,76
7 38,00 3 114,0 9 342,0 81 1444,00
∑ 100,00 0 131,5 28 529,1 196 2279,94
O poder explicativo do modelo tem por objetivo avaliar a “qualidade” do ajuste. O seu valor fornece a
proporção da variação total da variável dependente Y, explicada pela variável independente X, através
da função ajustada. A medida do poder explicativo é denominada coeficiente de determinação (R2), e
é assim definida:
b 2 × S XX
R =
2
, onde
SYY
n∑ X 2 − (∑ X ) 2 n∑Y 2 − (∑Y ) 2
S XX = e SYY =
n n
Quando R2 = 0, a variação de Y explicada por X é zero, ou seja, a reta ajustada é paralela ao eixo da
variável X. Se R2 = 1, a variável independente X explicará toda a variação de Y. Então, quanto mais
próximo de 1 estiver o valor de R2, melhor será a “qualidade“ do ajuste da função aos pontos do
diagrama de dispersão. Quanto mais próximo de zero for R2, pior será a “qualidade” do ajuste. Se
R2 = 0,96, por exemplo, significa que 96% da variação de Y é explicada pela variável X através da função
escolhida para relacionar as duas variáveis, e os 4% restantes são atribuídas a causas aleatórias.
ESTATÍSTICA 44 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Exemplo-7: Seja Y uma variável que representa o valor do frete rodoviário de determinada mercadoria, e
X a variável distância (em Km) ao destino da mercadoria. Uma amostra de 10 observações das variáveis
apresentou os seguintes resultados:
n = 10 ∑XY = 842060
∑X = 1200 ∑Y2 = 4713304,03
∑Y = 6480,50 ∑X2 = 186400
Cálculo do R2
b 2 × S XX
R2 =
SYY
n∑ X 2 − (∑ X ) 2 n∑Y 2 − (∑Y ) 2
S XX = e SYY =
n n
10 × 186400 − (1200) 2
S xx = ⇒ Sxx = 42400
10
10 × 4713304,03 − (6480,50) 2
SYY = ⇒ Syy = 513616
10
(1,52) 2 × 42400
R2 = ⇒ R2 = 19,07% → significa que apenas 19,07%
513616
da variação da variável dependente Y é explicada pela variável independente X.
ESTATÍSTICA 45 MANUEL
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
EXERCÍCIOS-08 - CORRELAÇÃO E REGRESSÃO
CORRELAÇÃO
X Y
2 6
4 8
6 10
8 12
10 14
03- Se as variáveis aleatórias X e Y são tais que Y = 2X, o coeficiente de correlação linear entre X e Y vale:
(A) - 0,55;
(B) - 0,2;
(C) - 0,05;
(D) 0,3;
(E) 0,5.
a) 26
b) 20
c) 23
d) 14
e) Não é possível calcular a variância de X-Y com a informação dada
ESTATÍSTICA 46 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
07-(MP-RO-ESTATÍSTICO-2005/CESGRANRIO) Analise as afirmativas a seguir, a respeito do
coeficiente de correlação linear de Pearson entre duas variáveis positivas X e Y:
I. é positivo;
II. não se altera quando adicionamos uma constante positiva aos valores de X;
III. não se altera quando multiplicamos por uma constante positiva os valores de X.
Está(ão) correta(s) a(s) afirmativa(s):
(A) II somente
(B) I e II somente
(C) I e III somente
(D) II e III somente
(E) I, II e III.
Y
X -1 1
0 0,1 0,2
1 0,3 0,1
2 0,2 0,1
X/Y Y1 Y2
X1 0,25 0,25
X2 0,25 0,25
a) -6,40
b) -0,87
c) -0,05
d) 0,00
e) 0,25
Aluno 1 2 3 4 5 6 7 8
X 10 9 6 8 7 5 4 3
Y 1 2 6 4 5 7 8 10
(A) 2
(B) 6
(C) 8
(D) 10
(E) 12
(A) -0,2
(B) -0,1
(C) 0
(D) 0,1
(E) 0,2
ESTATÍSTICA 48 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
16-(SEFAZ-AFTE-MS-2006/FGV) Analise as afirmativas a seguir, a respeito de duas variáveis aleatórias
X e Y.
I. Se X e Y são independentes, então Cov(X;Y) = 0.
II. Se Cov(X;Y) = 0, então X e Y são independentes.
III. Se X e Y são independentes, então E(XY) = E(X).E(Y).
IV. Se E(XY) = E(X).E(Y), então X e Y são independentes.
Dos valores a seguir, o que melhor representa o coeficiente de correlação linear amostral associado a
esse diagrama é:
(A) 0,80;
(B) 0,35;
(C) - 0,42;
(D) - 0,78;
(E) - 1,0.
ESTATÍSTICA 49 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
21-(SMA-RIO/RJ-TÉCNICO CONTROLE INTERNO/99) Duas variáveis aleatórias X e Y têm coeficiente
de correlação 0,80. O coeficiente de correlação entre as variáveis (3+X) e 4Y é:
a. 0,80
b. 0,70
c. 0,50
d. 0,30
e. 0,20
a) + 1,000
b) + 0,709
c) + 0,390
d) - 0,975
e) - 0,600
ESTATÍSTICA 50 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
25-(BACEN-ANALISTA-2005/FCC) Sejam X e Y duas variáveis aleatórias e
I. E(X) e E(Y) as expectâncias de X e Y, respectivamente;
II. Var(X) e Var(Y) as variâncias de X e Y, respectivamente;
III. Cov(X,Y) a covariância de X e Y.
Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os salários das
mulheres.
a) 0,72
b) 0,75
c) 0,68
d) 0,81
e) 0,78
27- (ICMS-RJ-2010) Duas variáveis aleatórias x e y têm coeficiente de correlação linear igual a 0,8. Se w
e z são tais que w = 2x - 3 e z = 4 - 2y então o coeficiente de correlação entre w e z será igual a:
(A) -0,8.
(B) -0,64.
(C) 0,36.
(D) 0,64.
(E) 0,8.
28- (ICMS-RJ-2008) Sejam X, Y e Z três variáveis com correlações de Pearson expressas pela matriz
abaixo:
ESTATÍSTICA 51 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
REGRESSÃO
29- Sabendo-se que: ∑X = 10; ∑Y = 36; ∑XY = 100; ∑X2 =30 e n = 4, a reta de regressão para
esses valores será:
a. Y = -4X + 2
b. Y = -4X – 2
c. Y = 2X + 4
d. Y = 4X + 2
e. Y = -2X - 4
X Y
1 1
2 2
3 4
4 5
5 8
a. Y= -1,1 + 1,7X
b. Y= -1,7 + 1,1X
c. Y= -1,1 - 1,7X
d. Y= -1,7 - 1,7X
32- Em relação ao coeficiente de correlação da reta do exercício anterior pode-se afirmar que:
a. 3 b. -2 c. 0 d. 2
ESTATÍSTICA 52 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
38- (ACE-ESAF) A tabela abaixo exibe o consumo de determinado item no período de 1999 a 2007.
Ano Consumo
1999 1
2000 2
2001 4
2002 4
2003 5
2004 7
2005 8
2006 9
2007 12
Sabendo-se que os valores dos parâmetros para a reta ajustada são a = - 0,57 e b = 1,27, e que as
condições de mercado permanecem inalteradas, a previsão de consumo para 2008 será:
a. 37,53
b. 13,27
c. 12,13
d. 46,61
e. 14,79
39- (ACE-ESAF) O coeficiente de correlação do exercício anterior é 0,98. Este resultado significa que a
previsão:
a. pode ser efetuada com relativa margem de segurança, pois o valor de r está muito próximo de 1
b. não pode ser efetuada, dado que o valor de r está distante de 100
c. não pode ser efetuada, pois este resultado expressa uma relação linear
d. pode ser efetuada, dada a importante significância deste resultado
a. Se a covariância entre duas variáveis é negativa, então a correlação linear entre essas variáveis
será também negativa.
b. O valor do coeficiente angular no modelo linear de regressão é equivalente a tangente do ângulo
que a reta de regressão forma com o eixo dos X.
c. Um valor nulo para o coeficiente linear, significa que a covariância linear entre a variável
dependente e a variável independente é zero.
d. A correlação linear perfeita ocorre quando os pontos observados estão perfeitamente alinhados
sobre uma reta.
ESTATÍSTICA 53 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
42- (ACE-ESAF) A tabela abaixo exibe o consumo de determinado item no período de 1999 a 2007.
Ano-X Consumo-Y
1999 1
2000 2
2001 4
2002 4
2003 5
2004 7
2005 8
2006 9
2007 12
Para obter-se um modelo de regressão linear do consumo contra o tempo são fornecidas as seguintes
informações:
∑i X i = 45 ∑i Yi = 52 ∑ (X ∑ (Y ∑ (X − X )(Yi − Y ) = 76
∑ t X t = 459 , 4 ; ∑ t Y t = 59 ; ∑ t (X t − M x ) 2
= 0 , 444 ; ∑ t (Y t − M y ) 2
= 1600 , 9
i i − X ) 2 = 60 i i − Y ) 2 = 99,56 i i
Assinale a opção que representa a equação da reta de mínimos quadrados ajustada: yˆ i = aˆ + bˆ.x i + ε i
onde aˆ e bˆ são parâmetros desconhecidos e εi são não correlacionados e provenientes de
2
distribuições com média zero e variância constante σ .
a. yˆ i = 0,57 + 1,27.xi
b. yˆ i = −0,57 + 1,27.x i
c. yˆ i = −0,78 + 1,27.xi
d. yˆ i = −0,57 + 1,37.x i
e. yˆ i = 0,57 + 2,78.x i
43- (ACE-ESAF) Assinale a opção que representa o valor do coeficiente de correlação linear entre as
variáveis X e Y da questão anterior.
a. 0,964
b. 0,903
c. 0,892
d. 0,983
e. 0,912
ESTATÍSTICA 54 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
(AFRF-ESAF) Para efeito das duas questões 44 e 45, considere a seguinte tabela que apresenta valores
referentes às variáveis x e y porventura relacionadas.
X Y X2 Y2 XY
1 5 1 25 5
2 7 4 49 14
3 12 9 144 36
4 13 16 169 52
5 18 25 324 90
6 20 36 400 120
∑ 21 75 91 1111 317
44- Marque a opção que representa o coeficiente de correlação linear entre as variáveis X e Y.
a. 0,90
b. 0,926
c. 0,947
d. 0,967
e. 0,989
a. y$ i = 1,601 + 3,114. xi
b. y$ i = 1,643 + 3,482. xi
c. y$ i = 1,685 + 3,271. xi
d. y$ i = 1,713 + 2 ,992. xi
e. y$ i = 1,726 + 2 ,864. xi
ESTATÍSTICA 55 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
47-(ACE-98/ESAF) Uma empresa tem interesse em estudar o efeito dos gastos com propaganda X (em
R$ 10.000,00) no volume de vendas Y (em R$ 10.000,00). Não há sazonalidade aparente na evolução
de Y e o modelo linear Yt = α + βXt + εt representa uma aproximação plausível para o ajuste dos
dados da tabela abaixo. Tais dados representam pares de observações (Xt , Yt) ao longo de 10 meses
escolhidos ao acaso. Na equação do modelo linear α e β são parâmetros desconhecidos e εt são não
correlacionados e provenientes de distribuições com média zero e variância constante σ2.
Mês X Y
1 1,2 101
2 0,8 92
3 1,0 110
4 1,3 120
5 0,7 90
6 0,8 82
7 1,0 93
8 0,6 75
9 0,9 91
10 1,1 105
Pretende-se utilizar a técnica de mínimos quadrados para estimar os parâmetros do modelo linear. Com
este fim calcularam-se as quantidades seguintes:
∑ t X t = 9,4; ∑ t Yt = 959; ∑ t ( X t − M x )
2
= 0,444; ∑ t (Yt − M y )
2
= 1600 ,9 ∑ t ( X t − M x )(Yt − M y ) = 23 ,34
Nestas expressões Mx representa a média aritmética dos valores Xt e My a média aritmética dos valores
Yt. Assinale a opção que corresponde à estimativa do aumento esperado no nível de vendas (em R$
10.000,00) decorrente do aumento de R$ 10.000,00 de gastos com publicidade.
a. 60,31
b. 53,43
c. 51,26
d. 52,57
e. 57,00
ESTATÍSTICA 56 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
49-(ICMS-SP-2006/FCC) Em um determinado país, deseja-se determinar a relação entre a renda
disponível (Y), em bilhões de dólares, e o consumo (C), também em bilhões de dólares. Foi utilizado o
modelo linear simples Ci = α + βYi + εi, em que Ci é o consumo no ano i, Yi é o valor da renda disponível
no ano i e εi o erro aleatório com as respectivas hipóteses para a regressão linear simples. α e β são
parâmetros desconhecidos, cujas estimativas foram obtidas através do método dos mínimos quadrados.
Para obtenção desta relação considerou-se ainda as seguintes informações colhidas através da
observação nos últimos 10 anos:
Então,
A estimativa do aumento esperado de tempo por máquina adicional servida por chamada é de
a) 2 minutos.
b) 10 minutos.
c) 12 minutos.
d) 5 minutos.
e) 6 minutos.
a) É o valor predito de y, dado que x = 0, desde que esse valor de x seja compatível com o conjunto de
observações da variável exógena.
b) Mede a variação esperada em y por unidade de variação na variável exógena.
c) É o valor esperado de y, quando se padroniza a variável exógena.
d) Mede a variação da reta de regressão.
e) Mede o coeficiente angular da reta de regressão.
ESTATÍSTICA 57 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
52-(MP-ENAP-2006/ESAF) Com o objetivo de estimar-se o modelo Y = α + X, foi retirada uma amostra
com cinco pares de observações (X,Y), obtendo-se os seguintes resultados:
Desse modo,
a) Y = - 2 - 2X
b) Y = 2 - 2X
c) Y = 2X
d) Y = 2 + 2X
e) Y = - 2 + 2X
a) 0,5 dias
b) 1,0 dias
c) 3,0 dias
d) 5,0 dias
e) 4,5 dias
)
55- (AFRF-2009) Na análise de regressão linear simples, as estimativas α e β dos parâmetros α e
βˆ da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores
dessas estimativas são obtidos através de uma amostra de n pares de valores Xi Yi com (i =1, 2,....,n),
) ) ) )
obtendo-se: Yi = α + β . X i onde Yi é a estimativa de Yi = α + β . X i . Para cada par de valores Xi Yi
com (i =1, 2,...,n) pode-se estabelecer o desvio ou resíduo aqui denotado por ei − entre a reta de
)
regressão Yi e sua estimativaYi . Sabe-se que o Método de Mínimos Quadrados consiste em adotar
como estimativas dos parâmetros α e β os valores que minimizam a soma dos quadrados dos desvios
(ei). Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:
[ ] ∑ [Y ]
n 2 n 2
a) ∑ Yi − (αˆ − βˆ . X i ) i − Yˆi
2 2
d)
i =1 i =1
∑[ ] ∑ [Yi 2 − (α − β . X i ) 2 ]
n 2 n
b) (Yi − αˆ − βˆ . X i ) e)
i =1 i =1
n 2
c) ∑ [Yi − (α − β . X i )]
i =1
ESTATÍSTICA 58 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
Exercício-08 Exercício-08
01- B 31- B
02- E 32- C
03- A 33- D
04- A 34- C
05- D 35- A
06- E 36- B
07- D 37- C
08- B 38- C
09- B 39- D
10- D 40- E
11- B 41- C
12- D 42- B
13- D 43- D
14- B 44- E
15- D 45- A
16- B 46- C
17- D 47- D
18- A 48- D
19- E 49- B
20- A 50- A
21- A 51- A
22- C 52- D
23- A 53- C
24- E 54- A
25- D 55- B
26- B
27- A
28- C
29- C
30- A
ESTATÍSTICA 59 MANUEL
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
MÓDULO-09 - TEORIA ELEMENTAR DA AMOSTRAGEM - INTERVALO DE CONFIANÇA
Introdução
A teoria da amostragem é um estudo das relações existentes entre uma população e as amostras
dela extraídas. É útil para a avaliação de grandezas desconhecidas da população, freqüentemente
chamadas de parâmetros populacionais, através do conhecimento das grandezas correspondentes
das amostras, denominadas estatísticas amostrais.
Nem sempre é possível incluir no estudo todos os elementos de uma população, seja em decorrência
dos altos custos implicados, por premência de tempo, por questões operacionais, etc. Nestes casos, a
solução é estudar um grupo (amostra) desta população. Por mais adequado que seja o planejamento e
a execução do processo de amostragem, os resultados obtidos a partir de amostras raramente são
iguais aos da população. A média, o desvio padrão e outros parâmetros da amostra serão
provavelmente próximos aos da população de origem, mas dificilmente iguais. Esta diferença se deve
ao acaso, fenômeno também chamado de erro amostral. Considerando que o processo de seleção da
amostra foi realizado de forma técnica correta, o tamanho da amostra (n) passa a ser o principal
responsável para diminuir a importância do erro amostral. Amostras com pequeno número de casos
geram dados mais imprecisos; quanto maior o tamanho da amostra (n) mais seus parâmetros se
aproximarão dos valores dos parâmetros reais da população. Assim, quanto maior o tamanho da
amostra (n), menor será o erro das estimativas geradas a partir da mesma. Daí a importância de um
bom dimensionamento da amostra durante a elaboração do projeto e também do chamado Intervalo
de Confiança para os resultados obtidos a partir da mesma.
A relação existente entre os parâmetros (média e variância) da população e das amostras podem ser
deduzidas a partir de um exemplo bastante simples.
Na Tabela 1 são apresentadas as idades de uma população de crianças com uma doença muito rara.
Caso Idade(X) X2
paciente 1 2 4
paciente 2 4 16
paciente 3 6 36
paciente 4 8 64
Soma 20 120
Como estes quatro pacientes formam uma população, seus parâmetros são:
Média ⇒ μ =
∑ x = 20 = 5
n 4
Variância ⇒ σ2 =
∑ x2 − μ2 =
120
− 5 2 = 30 − 25 = 5
n 4
ESTATÍSTICA 60 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Se não pudéssemos estudar todas as crianças, poderíamos sortear amostras com um, dois ou três
elementos. Sabemos que amostras com n=1 serão imprecisas, com n=3 muito melhor, mas vamos
estudar o comportamento de amostras com n=2. Considerando um processo de amostragem com
reposição, teremos 16 possibilidades de composição, cada uma com sua média e desvio padrão.
Como tomamos todas as amostras possíveis, neste caso temos uma "população de amostras" e uma
"população de médias das amostras". As amostras e suas médias são apresentadas na Tabela 2.
Amostras
(em anos)
Média da amostra ( x ) (x )2
2e2 2 4
2e4 3 9
2e6 4 16
2e8 5 25
4e2 3 9
4e4 4 16
4e6 5 25
4e8 6 36
6e2 4 16
6e4 5 25
6e6 6 36
6e8 7 49
8e2 5 25
8e4 6 36
8e6 7 49
8e8 8 64
∑ 80 440
Anr = n r A42 = 42 = 16
μx =
∑ x = 80 = 5
Média ⇒
n 16
Variância ⇒ σ 2
x =
∑ x2
− μ2 =
440
− 5 2 = 27,5 − 25 = 2,5
n 16
ESTATÍSTICA 61 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Assim, obtemos os seguintes resultados:
2- A variância das médias amostrais ( σ ) (2,5) é menor que a da população inicial ( σ ) (5,0).
2 2
x
Assim, temos uma população de origem com sua média e desvio padrão; várias amostras cada qual
com sua média e desvio padrão, e agora uma população de médias amostrais com sua média e
desvio-padrão. Para não confundir, o desvio-padrão da população de médias amostrais por
convenção recebe o nome de Erro Padrão da Média (EP).
Neste pequeno e prático estudo partimos do conhecimento da população e conseguimos determinar a
média de todas as possíveis amostras e estudar a sua distribuição. Na pesquisa o caminho é
diferente: só conhecemos alguns dados de uma das possíveis amostras e desejamos inferir os
parâmetros da população. Como isto é possível?
Resultados Fundamentais
ESTATÍSTICA 62 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Desvio Padrão da Amostra - Erro Padrão da Média
σ2 σ2
Transformando-se algebricamente a fórmula =n obtemos ⇒ σ x =
2
.
σ 2x n
σ2
Assim, a variâncias das médias amostrais é dada por: σ 2x =
n
σ2 σ
Logo o desvio-padrão das médias amostrais é dado por: σx = =
n n
Por convenção o desvio-padrão das médias amostrais é chamado de Erro Padrão (EP).
σ
Temos então ⇒ EPx =
n
S
Aplicando-se essa fórmula para uma amostra qualquer com desvio-padrão (S) temos: EPx = .
n
A partir da média da amostra e do Erro Padrão (EP) pode-se determinar o INTERVALO DE
CONFIANÇA da média da população.
Exemplo-1 Uma amostra de 40 crianças do sexo masculino aos quatro anos tem média de altura igual
a 100,0 cm e desvio padrão 5,0 cm. A probabilidade de se obter uma amostra de 40 elementos com
média menor que 98 cm é calculada da seguinte forma:
1- Inicialmente determinamos o Erro Padrão da Média (EP) das amostras compostas por 40 casos.
5
EPx = = 0,790
40
2- Como n (40) é maior que 30 as médias das amostras tem distribuição normal ou aproximadamente
normal. A seguir calculamos o valor de z equivalente a 98 cm considerando a média 100,0 cm e o
erro padrão igual a 0,790 cm. Temos então:
x − μ 98 − 100
z= = = −2,531
EPx 0,790
Da tabela Normal obtemos para z = 2,531 o valor da probabilidade p = 0,005676, ou 0,56%. Assim a
probabilidade de se obter uma amostra com 40 elementos e que tenha uma média menor que 98 é
aproximadamente 0,56%.
ESTATÍSTICA 63 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Intervalo de Confiança da Média Populacional
S
ser: EPx = .
n
Amplitude do Intervalo de Confiança
A amplitude do intervalo de confiança [IC] está relacionada com a precisão desejada. Para uma
distribuição Normal usamos os seguintes valores de z quando desejamos os seguintes intervalos de
confiança:
Intervalo de Confiança [IC] Valor de z
90% 1,645
95% 1,960
99% 2,575
Como na Tabela Normal não existe o valor correspondente a 0,45 [0,50 - 0,05] usamos a média entre
os valores 0,4495 e 0,4505 para o valor de z, ou seja [ 1,64 + 1,65 ] / 2 = 1,645.
ESTATÍSTICA 64 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Determinação de z para IC = 95%
Como na Tabela Normal não existe o valor correspondente a 0,495 [0,500-0,005] usamos a média
entre os valores 0,4949 e 0,4951 para o valor de z, ou seja [ 2,57 + 2,58 ] / 2 = 2,575.
ESTATÍSTICA 65 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Exemplo-02- Uma amostra de 120 crianças tem média 120 cm e desvio padrão 5,6 cm. Qual o
intervalo de confiança de 95% para a média populacional ?
s 5,6 5,6
O Erro padrão é dado por ⇒ EP = = = = 0,511
n 120 10,95
S
x − ε ⇔ x + ε onde ε é o erro da estimativa dado por ε = z × EP ou ainda ε = z ×
n
Assim, os limites do intervalo de confiança são:
S
Limite Inferior ⇒ x − z×
n
S
Limite Superior ⇒ x + z×
n
Temos então:
Limite Inferior ⇒ 120 – 1,96 × 0,511 = 118,99
Limite Superior ⇒ 120 + 1,96 × 0,511 = 121,00
Tamanho da Variância
Amostra Populacional Distribuição a ser usada
ESTATÍSTICA 66 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Fórmula para cálculo do erro da estimativa (ε)
σ
1) Distribuição Normal, σ conhecido ⇒ ε = zα ×
2 n
S
2) Distribuição Normal, σ desconhecido. Usamos S (desvio padrão amostral)⇒ ε = zα ×
2 n
S
3) Distribuição t-Student ⇒ ε = tα ×
2 n
Exemplo-03- Estatístico ELETROBRÁS/2002-NCE Uma amostra aleatória simples X ,X ,..., X , de
1 2 25
25 25 2
∑x
i =1
i = 123 ∑ (x
i =1
i − x ) = 96
Um intervalo de 95% de confiança para a média populacional será dado aproximadamente por:
(A) ] 3,59 ; 6,25 [
(B) ] 4,40 ; 5,44 [
(C) ] 2,18 ; 7,66 [
(D) ] 4,09 ; 5,75 [
(E) ] 4,88 ; 4,96 [
Como a amostra é pequena, n = 25 (n < 30) e a variância populacional é desconhecida, devemos
utilizar para o cálculo do intervalo a distribuição t-Student.
∑x i
123
Média Amostral ⇒ x= i =1
= = 4,92
n 25
25 2
∑ ( xi − x ) 96
Variância Amostral ⇒ S2 = i =1
= =4
n −1 24
Como a Tabela t-Student é uma tabela de dupla entrada temos:
ESTATÍSTICA 67 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Tamanho da Amostra - Intervalo de Confiança da Média Populacional
Em muitas questões de prova é pedido o tamanho da amostra para que o erro de estimação não
ultrapasse determinado valor.
S S S2
Temos que ε = z× ⇒ n = z× ⇒ n = z2.
n ε ε2
2
S2 ⎛ S⎞
Logo,o tamanho da amostra é dado por: n=z . 2
ou n = ⎜ z. ⎟ onde ε é o erro máximo
ε2 ⎝ ε⎠
desejado.
(A) 2.420
(B) 3.080
(C) 3.755
(D) 4.340
(E) 4.755
Temos:
96% de confiança ⇒ temos 48% antes da média e 48% depois da média.
A partir da Tabela Normal obtemos para 48% (0,4798) o valor de z=2,05.
S = 1,2 ⇒ desvio padrão
ε = 0,05 ⇒ erro
2 2
⎛ S⎞ ⎛ 1,2 ⎞
Como n = ⎜ z. ⎟ temos n = ⎜ 2,05. ⎟ ⇒ n = (49,2)2 ⇒ n ≅ 2.420
⎝ ε⎠ ⎝ 0,05 ⎠
ESTATÍSTICA 68 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Intervalo de Confiança para Proporção Populacional
Seja θ a proporção de elementos de uma população com N elementos que possuem uma
determinada característica (x). Ao extrairmos uma amostra com n elementos dessa população,
obteremos uma proporção de elementos com essa característica.
Essa proporção amostral ( p’ ) é dada por:
x
p' = , onde x é o número de elementos na amostra que possuem a característica e n é o tamanho da
n
amostra. Na estimação por intervalo para a proporção populacional não há necessidade (como na
estimação da média) de nos preocuparmos com o tamanho da amostra. Nesse caso usaremos sempre a
tabela da Distribuição Normal Padrão para arbitrar o valor da abscissa na fórmula do erro da estimativa.
Para um elemento da amostra escolhido ao acaso, poderá acontecer: sucesso (esse elemento tem a
característica x) ou fracasso (o elemento não tem a característica x). Assim, se p’ é a proporção dos
elementos que têm determinada característica x, a proporção dos que não apresentam essa característica
será: q’ = 1 - p’, pois p’ + q’ = 1.
σ
Na estimação por intervalo da média populacional, a fórmula do erro é dada por: ε = zα × .
2 n
Na proporção substituiremos o desvio padrão σ por p '.q ' , onde p' será a proporção favorável na
amostra e q' a proporção desfavorável.
p'.q' p'.q'
Assim a fórmula do erro será: ε = zα × ⇒ ε = zα ×
2 n 2 n
Sob condições de completa incerteza, pode-se admitir inicialmente p' = 0,50, o que revelará a maior
quantidade de erro possível. Assim, em questões pedindo o tamanho mínimo de amostra para que o
erro não ultrapasse um determinado valor, não sendo fornecida a proporção amostral, utilizamos
p' = 0,50.
ESTATÍSTICA 69 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
RESUMO - AMOSTRAGEM / INTERVALO DE CONFIANÇA
Critérios adotados para determinação do Intervalo de Confiança
Tamanho da Variância
Amostra Populacional Distribuição a ser usada
α ⇒ nível de significância
ϕ ⇒ número de graus de liberdade = n - 1 (número de elementos da amostra menos 1).
Obs: Em ambos o casos o erro ε é igual a metade da amplitude do Intervalo de Confiança.
p'.q'
Nesse caso o erro é dado por: ε=z ×
n
Onde:
p’ ⇒ é a proporção dos elementos que têm determinada característica.
q’ ⇒ é a proporção dos elementos que não têm determinada característica.
p’ + q’ = 1 ⇒ q’ = 1 - p’
ESTATÍSTICA 70 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
EXERCÍCIOS - AMOSTRAGEM / INTERVALO DE CONFIANÇA / T-STUDENT
z P(Z ≤ z)
0,25 0,60
0,52 0,70
0,67 0,75
0,84 0,80
1,30 0,90
(A) R$ 1.825,00 (B) R$ 1.805,00 (C) R$ 1.710,00 (D) R$ 1.695,00 (E) R$ 1.650,00
03- (Estatístico ELETROBRÁS/2002-NCE) Suponha que as notas obtidas por candidatos em uma
prova sigam uma distribuição normal com média 50 e variância 256. Se uma amostra aleatória simples
de cem candidatos for observada, a probabilidade de que a nota média dessa amostra seja superior a
55 é aproximadamente de:
(A) 0,09%
(B) 1,26%
(C) 3,47%
(D) 5,76%
(E) 9,02%
04- (ICMS-2005) Uma amostra de tamanho 25 foi extraída de uma população com média μ e desvio
padrão desconhecido. Suponha que a média amostral seja 4,004 e o desvio padrão amostral seja
0,366. O intervalo para μ com 95% de confiança é:
a) [3,853 ; 4,155]
b) [3,164 ; 4,002]
c) [2,891 ; 4,287]
d) [3,583 ; 4,551]
e) [3,289 ; 4,329]
ESTATÍSTICA 71 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
05- (ICMS-2005) Uma amostra de tamanho 25 foi extraída de uma população com média μ e desvio
padrão desconhecido. Suponha que a média amostral seja 4,004 e o desvio padrão amostral seja
0,366. O intervalo para μ com 99% de confiança é:
a) [3,199; 4,509]
b) [3,923; 4,878]
c) [3,021; 4,789]
d) [3,799; 4,209]
e) [3,782; 4,912]
06- (IBGE-CESGRANRIO/2007) Uma amostra de 120 crianças tem média 120 cm e desvio padrão
5,6 cm. O intervalo de confiança de 95% para a média populacional é:
a) [111,12 a 130,02]
b) [112,91 a 131,45]
c) [109,02 a 131,15]
d) [107,99 a 131,02]
e) [118,99 a 121,00]
07- (IBGE-CESGRANRIO/2006) Uma amostra de 40 ovelhas tem média igual a 100, kg e desvio
padrão 5,0 kg. A probabilidade de se obter uma amostra de 40 ovelhas com média menor que 98 kg
vale:
a) 0,56%.
b) 5,6%
c) 7,93%
d) 8,21%
e) 0,82%
08- (ICMS/MS-2006) Uma amostra aleatória simples de tamanho 25 foi selecionada para estimar a
média desconhecida de uma população normal. A média amostral encontrada foi 4,2, e a variância
amostral foi 1,44. O intervalo de 95% de confiança para a média populacional é:
(A) 4,2 ± 0,49
(B) 4,2 ± 0,64
(C) 4,2 ± 0,71
(D) 4,2 ± 0,75
(E) 4,2 ± 0,81
09- (ICMS/RJ-2010) Suponha que os salários dos trabalhadores numa certa região sejam descritos
por uma variável populacional com média desconhecida e desvio padrão igual a R$200,00. Para se
garantir, com 95% de probabilidade, que o valor da média amostral dos salários não diferirá do valor da
média populacional por mais de R$10,00, a amostra aleatória simples deverá ter no mínimo,
aproximadamente, o seguinte tamanho:
(A) 3.568.
(B) 3.402.
(C) 2.489.
(D) 2.356.
(E) 1.537.
ESTATÍSTICA 72 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
10- (Tecnologista Junior-IBGE/2002-NCE) O tamanho de uma amostra aleatória simples para que
possamos garantir, com 92% de confiança, que o valor da média da amostra não se afastará do da
média populacional por mais de 10% do desvio padrão populacional é, no mínimo, aproximadamente,
igual a:
(A) 254
(B) 282
(C) 306
(D) 458
(E) 560
a) 0,09
b) 0,20
c) 0,82
d) 0,07
e) 0,66
ESTATÍSTICA 73 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
15- (PETROBRÁS-ESTATÍSTICO/2005-CESGRANRIO) Uma amostra aleatória simples, de tamanho
16, foi selecionada para estimar a média desconhecida de uma população normal. A média amostral
encontrada foi 4,8 e a variância amostral, 1,44. O intervalo de 90% de confiança para a média
populacional é
(A) 4,8 ± 0,53
(B) 4,8 ± 0,64
(C) 4,8 ± 0,71
(D) 4,8 ± 0,75
(E) 4,8 ± 0,81
256 256
∑ X i = 3.072
i =1
∑X
i =1
2
i = 37.119
Um intervalo de 95% de confiança para a média populacional será dado aproximadamente por:
(A) (11,88; 12,12);
(B) (11,62; 12,38);
(C) (11,05; 12,95);
(D) (10,46; 13,54);
(E) (10,20; 13,80).
19- (ICMS/MS-2006) Uma amostra aleatória de tamanho 400 revelou que 64% dos torcedores
brasileiros acham que conquistaremos o hexacampeonato mundial de futebol. O intervalo de 95% de
confiança para a proporção de torcedores na população que acreditam no hexacampeonato é:
(A) 64% ± 3,9%
(B) 64% ± 4,2%
(C) 64% ± 4,7%
(D) 64% ± 5,1%
(E) 64% ± 5,6%
ESTATÍSTICA 74 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
20- (SEAD-AM/2006-CESGRANRIO) Amostra aleatória de 900 consumidores de detergentes revelou
36% de preferência pela marca X. O intervalo de 95% de confiança para a preferência, na população,
pela marca X é:
(A) 36% ± 1%
(B) 36% ± 2%
(C) 36% ± 3%
(D) 36% ± 4%
(E) 36% ± 5%
a) 4,7936 ≤ μ ≤ 5,2064
b) 4,0132 ≤ μ ≤ 5,7091
c) 4,3426 ≤ μ ≤ 5,2982
d) 4,7019 ≤ μ ≤ 5,0064
e) 4,7219 ≤ μ ≤ 5,3124
a) 17,1 ≤ μ ≤ 20,8
b) 19,1 ≤ μ ≤ 20,3
c) 18,5 ≤ μ ≤ 21,1
d) 18,9 ≤ μ ≤ 21,2
e) 18,0 ≤ μ ≤ 21,8
ESTATÍSTICA 75 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
26-(AFC/CGU-ESTATÍSTICO-ESAF/2008) Construa um intervalo de 95% de confiança para a média
de uma população normal a partir dos dados de uma amostra aleatória simples de tamanho 64 desta
população, que forneceu uma média de 48 e um desvio-padrão amostral de 16, considerando que
φ(1,96) = 0,975, onde φ(z) é a função de distribuição de uma variável aleatória normal padrão Z.
a) 44,08 a 51,92.
b) 41,78 a 54,22.
c) 38,2 a 57,8.
d) 35,67 a 60,43.
e) 32,15 a 63,85.
ESTATÍSTICA 76 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
31-(MP-PE-ESTATÍSTICO-FCC/2006) Supondo-se que a porcentagem da receita investida em
educação, dos 600 municípios de uma região, tem distribuição normal com média μ, deseja-se estimar
essa média. Para tanto se sorteou dentre esses 600, aleatoriamente e com reposição, 16 municípios e
se observou os percentuais investidos por eles em educação. Os resultados indicaram uma média
amostral de 8% e desvio padrão amostral igual a 2%. Um intervalo de confiança para μ, com
coeficiente de confiança de 96%, é dado por:
(A) (8 ± 1,124)%
(B) (8 ±1,117)%
(C) (8 ± 0,877)%
(D) (8 ± 0,870)%
(E) (8 ± 0,755)%
(A) 1000
(B) 1024
(C) 2500
(D) 1900
(E) 2000
ESTATÍSTICA 77 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
35- (TRF-1R-ESTAT-FCC/2001) Um engenheiro encarregado do controle de qualidade deseja estimar
a proporção p de lâmpadas defeituosas de um lote, com base numa amostra de tamanho
suficientemente grande. Sabe-se, com base em experiências anteriores, que p deve estar próxima de
0,5. Que tamanho deve ter a amostra se ele deseja que o erro de estimação seja no máximo 0,02, com
confiança de 90%?
(A) 800
(B) 1082
(C) 1241
(D) 1530
(E))1681
38-(MIN CIDADES ESTATÍSTICO-NCE/2005) Para estimar a média de uma densidade normal, uma
amostra aleatória simples de tamanho 225 foi observada. Os valores da média e da soma dos
quadrados dos desvios foram:
225
x = 66 ∑ (xi − x )2 = 322,56
i =1
Uma estimativa de intervalo de 95% de confiança para a média populacional será dada por:
(A) (63,555 ; 68,445);
(B) (65,843 ; 66,157);
(C) (64,888 ; 67,112);
(D) (61,500 ; 70,500);
(E) (64,125 ; 67,875).
ESTATÍSTICA 78 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
39- (ICMS-RJ-FGV/2009) Para examinar a opinião de uma população sobre uma proposta, foi montada
uma pesquisa de opinião em que foram ouvidas 1680 pessoas, das quais 51,3% se declararam
favoráveis à proposta. Os analistas responsáveis determinaram que a margem de erro desse
resultado, em um determinado nível de confiança, era de 2 pontos percentuais, para mais ou para
menos. Considerando que fosse desejada uma margem de erro de 1 ponto percentual, para mais ou
para menos, no mesmo nível de confiança, assinale a alternativa que indique o número de pessoas
que deveriam ser ouvidas.
(A) 840
(B) 2520
(C) 3360
(D) 5040
(E) 6720
GABARITO
01 - A 11 - B 21 - A 31 - A
02 - B 12 - D 22 - A 32 - C
03 - A 13 - A 23 - D 33 - D
04 - A 14 - D 24 - E 34 - C
05 - D 15- A 25 - B 35 - E
06 - E 16- B 26 - A 36 - B
07 - A 17- D 27 - C 37 - E
08 - A 18- A 28 - E 38 - B
09 - E 19 -C 29 - D 39 - E
10 - C 20 -C 30 - E 40 - A
ESTATÍSTICA 79 MANUEL
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
MÓDULO-10 - TESTE DE HIPÓTESES
Definição: É uma regra de decisão utilizada para aceitar ou rejeitar uma hipótese estatística com
base em elementos amostrais.
Hipóteses: Temos sempre duas hipóteses, H0, que é a HIPÓTESE NULA e H1 que é a
HIPÓTESE ALTERNATIVA. Geralmente a hipótese alternativa (H1) representa a suposição
que o pesquisador quer provar, sendo a hipótese nula (H0) formulada com o expresso
propósito de ser rejeitada. Conseguindo rejeitar H0, a hipótese alternativa H1 terá de ser
aceita, conseguindo então o pesquisador provar o que queria. A hipótese nula H0 é sempre a
hipótese a ser examinada. Se a aceitarmos, implicitamente estaremos rejeitando H1 e se
rejeitarmos H0, então não podemos rejeitar H1, devendo esta ser aceita.
H0 : Hipótese Nula ⇒ a que deve ser examinada (e rejeitada se for o caso).
H1 : Hipótese Alternativa ⇒ o que queremos provar.
Tipos de erro
Dois tipos de erro podem ser cometidos num Teste de Hipóteses:
• Erro Tipo I (α) ⇒ A hipótese nula (H0) é verdadeira e o pesquisador a rejeita.
• Erro Tipo II (β) ⇒ A hipótese nula (H0) é falsa e o pesquisador a aceita.
O Erro Tipo I (α) é mais grave que o Tipo II e a probabilidade que ele aconteça deverá ser
minimizada. Essa probabilidade chama-se Nível de Significância do Teste, dado por α. Já a
probabilidade de β do Erro Tipo II não pode ser calculada, a menos que se especifique um valor
alternativo para μ. O poder (ou potência) do teste é dado por (1-β).
QUADRO RESUMO
Comete o Erro
Aceita H0 Decisão Correta
Tipo II (β)
Comete o Erro
Rejeita H0 Decisão Correta
Tipo I (α)
ESTATÍSTICA 80 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
TIPOS DE TESTE DE HIPÓTESES PARA A MÉDIA
Bicaudal ou Bilateral
H0: μ = μ0
H1: μ ≠ μ0
ESTATÍSTICA 81 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
Teste Unicaudal ou Unilateral à esquerda
H0: μ = μ0
H1: μ < μ0
OBS: Na hipótese NULA sempre temos uma igualdade (=) e na hipótese ALTERNATIVA uma desigualdade
(<, > ou ≠).
Tamanho da Variância
2 Distribuição a ser usada
Amostra Populacional (σ )
Grande Conhecida Normal
(n > 30) Desconhecida Normal
Pequeno Conhecida Normal
(n ≤30) Desconhecida t-Student
ESTATÍSTICA 82 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
ROTEIRO PARA O TESTE DE HIPÓTESES
1º Passo ⇒ Pelo enunciado do problema, estabelecer a Hipótese Nula (H0) e a Hipótese
Alternativa (H1);
2º Passo ⇒ Também pelos dados do enunciado, definir a distribuição que será utilizada: Normal
ou t-Student;
3º Passo ⇒ Utilizando a Tabela Normal Padrão ou a Tabela t-Student, encontrar o valor de ZTAB
ou tTAB;
ZTAB ⇒ Valor de Z encontrado usando a Tabela Normal
tTAB ⇒ Valor de t encontrado usando a Tabela t-Student
4º Passo ⇒ Fazer o desenho da curva, plotando no eixo das abscissas o valor tabelado, que será
a fronteira entre a área de aceitação (RA) e a(s) área(s) de rejeição (RC-Região Crítica);
5º Passo ⇒ Calcular a estatística teste (ZCALC ou tCALC) utilizando as seguintes fórmulas:
ESTATÍSTICA 83 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
EXEMPLOS
Supondo que usaremos a Distribuição Normal Padrão (Z):
1- TESTE BILATERAL
ESTATÍSTICA 84 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
3- TESTE UNILATERAL À ESQUERDA
O mesmo procedimento vale para os casos em que usarmos a Distribuição t-Student, a única
diferença é que a comparação será feita entre tCALC e tTAB.
ESTATÍSTICA 85 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
UTILIZAÇÃO DAS TABELAS - PRINCIPAIS NÍVEIS DE SIGNIFICÂNCIA (α) UTILIZADOS
Tabela da Distribuição NORMAL PADRÃO
Teste Bilateral
a) Se α = 1%, teremos α/2 = 0,5% = 0,005 (para cada lado) e a área de aceitação será de 99%
(0,99), sendo 0,495 à esquerda e 0,495 à direita do ponto máximo da curva (a Distribuição Normal
é simétrica). Verificando a Tabela Normal, temos 0,4949 para uma abscissa de 2,57 e 0,4951 para
uma abscissa de 2,58. Logo, por interpolação, a abscissa correspondente à área de 0,495 será a
média das duas abscissas, ou seja, 2,575. Mas para facilitar, vamos adotar, no teste bilateral,
quando α = 1%, ZTAB = 2,58. Observe o gráfico da curva normal.
b) Se α = 5%, teremos α/2 = 2,5% = 0,025 (para cada lado) e a área de aceitação será de 95%
(0,95), sendo 0,475 à esquerda e 0,475 à direita. Verificamos, na Tabela Normal, que uma área de
0,475 corresponde à abscissa 1,96. Logo, no teste bilateral, quando α = 5% então ZTAB=1,96.
Observe o gráfico da curva normal.
ESTATÍSTICA 86 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
c) Se α = 10%, α/2 = 5% = 0,05 (para cada lado). Área de aceitação igual a 0,90, sendo 0,45 à
esquerda e 0,45 à direita. Na Tabela Normal uma área de 0,4495 corresponde à abscissa 1,64 e
uma área de 0,4505 corresponde à abscissa de 1,65. Logo, com precisão, a abscissa seria 1,645.
Mas para facilitar vamos adotar no teste bilateral, quando α = 10%, ZTAB = 1,64. Observe o gráfico
da curva normal.
Teste Unilateral
Vamos considerar apenas o teste à direita, pois o teste à esquerda é semelhante, bastando
inverter os lados.
a) Se α = 1% (0,01), a área de aceitação será de 99% (0,99) à esquerda. Mas até a metade da
curva (a Distribuição Normal é simétrica) temos 50% (0,5) de área. Logo, queremos a abscissa
correspondente a uma área de 0,49. Verificando, na Tabela Normal, o valor mais próximo é de
0,4901, correspondente à uma abscissa de 2,33. Assim, no teste unilateral à direita, quando
α = 1%, teremos ZTAB = 2,33. e no teste unilateral à esquerda para o mesmo α, -ZTAB = -2,33.
Observe o gráfico da curva normal.
ESTATÍSTICA 87 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
b) Se α = 5% (0,05), teremos área de aceitação = 0,95 à esquerda. Procuraremos, na tabela
normal a área de 0,45 (0,95 - 0,50), que corresponde à abscissa de 1,64. Portanto, no teste
unilateral à direita, quando α = 5%, então ZTAB = 1,64 e no teste unilateral à esquerda para o
mesmo α, -ZTAB = -1,64. Observe o gráfico da curva normal.
c) Se α = 10% (0,10), área de aceitação = 0,90 à esquerda. Na Tabela Normal o valor mais
próximo de 0,40 (0,90 – 0,50) é de 0,3997, que corresponde à abscissa de 1,28. Portanto, no teste
unilateral à direita, para α = 10%, ZTAB = 1,28 e no teste unilateral à esquerda, -ZTAB = -1,28.
Observe o gráfico da curva normal.
ESTATÍSTICA 88 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
Tabela da Distribuição t-STUDENT
Nesta tabela, temos que levar em consideração dois parâmetros: α (alfa), que é o nível de
significância e ϕ (fi) que é o número de graus de liberdade dado por: n (número de elementos
Teste Bilateral
Para um α = 5%, vemos na tabela que a célula interseção de α = ,05 e ϕ = 24 nos fornece 2,0639.
Portanto: t = 2,0639 para α = 5% e n = 25. Observe o gráfico da t-Student.
TAB
ESTATÍSTICA 89 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
Teste Unilateral
Nesse caso não poderemos pegar diretamente a interseção de α=0,05 com ϕ = 24, pois o valor
fornecido é para um teste bilateral. Teremos que pegar a interseção de ϕ = 24 com α = 0,10, pois
nesta tabela (bilateral), o α = 0,05 corresponde a 0,025 de cada lado. Teremos que pegar α=0,10,
que corresponderá a 0,05 de cada lado. Assim a célula interseção de α = 0,10 com ϕ = 24
fornecerá t = 1,7109. Observe o gráfico da t-Student.
TAB
ESTATÍSTICA 90 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
EXEMPLO-1 Uma amostra de 36 elementos de uma variável X normalmente distribuída forneceu:
X (média) = 42,3 e S = 5,2. Testar, no nível de significância 0,05, a hipótese de que μ > 40.
Temos:
H : μ = 40
0
α = 0,05 n = 36
Média = 42,3 Desvio Padrão (S) = 5,2
Como n > 30 ⇒ TABELA NORMAL
Como ZCALC > ZTAB (2,65 > 1,64) REJEITAMOS a HIPÓTESE H0 (μ = 40) com nível de
significância de 0,05 ⇒ logo, μ > 40.
ESTATÍSTICA 91 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
EXEMPLO-2 Uma amostra de 20 elementos de uma variável X normalmente distribuída forneceu:
X = 53,4 e S = 7,5. Testar, no nível de significância 0,05, a hipótese de que μ = 50.
Temos:
H : μ = 50;
0
H : μ ≠ 50 (teste bilateral);
1
α = 0,05
Média = 53,4 Desvio Padrão (S) = 7,5
n = 20 ⇒ Como n < 30 ⇒ TABELA T-STUDENT
ESTATÍSTICA 92 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
EXEMPLO-3 Uma indústria produz lâmpadas cuja duração segue uma distribuição Normal com
Média = 788 e Variância = 1.600. Testar a hipótese de que μ = 800 contra a alternativa de μ ≠ 800
se uma amostra aleatória de 30 lâmpadas tem um tempo médio de vida de 788 horas. Adotar
α = 0,05.
Temos:
H : μ = 800;
0
ESTATÍSTICA 93 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
EXEMPLO-4 Uma amostra de tamanho n = 18 de população normal tem média X = 31,5 e desvio
padrão S = 4,2. Ao nível de significância de 5%, estes dados sugerem que a média populacional
seja superior a 30 ?
Temos:
H : μ = 30
0
Como - TTAB < TCALC < TTAB (- 1,7396 < 1,515 < 1,7396) ACEITAMOS a HIPÓTESE H0 (μ = 30),
com nível de significância de 0,05 ⇒ logo, μ = 30.
ESTATÍSTICA 94 MANUEL
MÓDULO-10 - TESTE DE HIPÓTESE
EXERCÍCIOS - TESTE DE HIPÓTESES
a) 1,28 e 3,00
b) 1,28 e 2,09
c) 1,96 e 1,28
d) 3,00 e 3,00
e) 1,64 e 3,00
ESTATÍSTICA 95 MANUEL
EXERCÍCIO-10-TESTE DE HIPÓTESES
05-(AFC-ESAF)) Os graus dos alunos de Estatística têm sido baixos, com média de 5,2 e desvio
de 1,2. Optou-se por um curso de revisão e com ele pretende-se aumentar o rendimento dos
alunos. Entre 36 alunos que freqüentaram tal curso, a média foi de 6,4. Pode-se dizer, ao nível de
significância de 8%, que o curso é:
a) Eficiente e aceitar a hipótese alternativa H1
b) Não eficiente e aceitar a hipótese nula H0
c) Eficiente, pois o valor calculado é menor que 5,2
d) Não eficiente, pois o valor calculado é menor que 5,2
e) Eficiente e aceitar a hipótese nula H0
06) (BACEN-FCC) Uma amostra aleatória de 9 valores de salários extraída de uma população,
considerada normal e de tamanho infinito, apresentou média igual a R$800,00 com um desvio
padrão igual a R$120,00. Os registros históricos indicam que a média dos salários da população é
igual a R$740,00. Deseja-se testar a hipótese, ao nível de significância α, se o valor da média
verificada na amostra difere do valor de R$740,00. Seja H0 a hipótese nula do teste (μ = 740), H1
a hipótese alternativa (μ ≠ 740) e t > 0 o quantil da distribuição "t" de Student, no nível de
α/2
significância α, para testes bicudais com 8 graus de liberdade. Sabendo-se que H0 foi rejeitada,
tem-se que:
(a) t < 1,5.
α/2
(b) t > 1,5.
α/2
(c) para qualquer nível de significância H0 seria rejeitada, pois (800 − 740) ≠ 0.
(d) o valor da variável do teste (t calculado) obtido através da amostra e necessário para
comparação com −t e t é igual a 0,5.
α/2 α/2
(e) a um nível de significância β, β > α, H0 não teria sido rejeitada.
07) (IBGE-NCE) Considere uma amostra aleatória de tamanho 36 de uma distribuição normal com
média μ e desvio padrão 1,8. Deseja-se testar H0: μ ≤ 10 versus H1: μ > 10. O teste
uniformemente mais poderoso de tamanho 1% rejeitará H0 se a média amostral for, no mínimo,
igual a:
(a) 10,7
(b) 11,1
(c) 11,5
(d) 11,9
(e) 12,3
ESTATÍSTICA 96 MANUEL
EXERCÍCIO-10-TESTE DE HIPÓTESES
09) (SEFAZ-MS-FGV) Um teste de hipóteses apresentou p-valor igual a 0,03. Portanto, nos níveis
de significância de 1% e 5%, respectivamente, a hipótese nula:
a) deve ser aceita e aceita
b) deve ser aceita e rejeitada
c) deve ser rejeitada e aceita
d) deve ser rejeitada e rejeitada
e) pode ou não ser rejeitada, dependendo de a hipótese ser simples ou não
10) (SEFAZ/RJ-FGV) Uma empresa afirma que os pacotes de bala que ela produz pesam em
média 25g. Para testar essa hipótese, foram selecionados ao acaso 16 pacotes produzidos pela
16
empresa, registrados seus pesos X1, X2, ..., X16 e calculadas as estatísticas: ∑ X i = 320 e
i =1
16
∑ X i2 = 7360 . O valor da estatística t (a ser comparado com o ponto desejado da distribuição t
i =1
de Student) para o teste é:
(A) -0,8
(B) -1,2
(C) -2,0
(D) -2,5
(E) -3,2
11) (IRB-ESAF) Num estudo do consumo de combustível para uma determinada marca de
automóvel, supõe-se que a distribuição do consumo é aproximadamente normal com média
desconhecida μ Km/l e desvio padrão de 3 km/l. Uma amostra de 36 veículos produziu a média de
consumo de 16 km/l. Deseja-se testar a hipótese H: μ = 15 contra a alternativa A: μ > 15.
Considerando os valores da função de distribuição normal padrão dados abaixo, assinale a opção
que dá o valor probabilístico (p-valor) do teste.
a) 0,500 z F(z)
b) 0,977 1,0 0,841
c) 0,050 1,2 0,885
d) 0,023 1,4 0,919
e) 0,010
1,6 0,945
1,8 0,964
2,0 0,977
2,2 0,986
2,4 0,992
ESTATÍSTICA 97 MANUEL
EXERCÍCIO-10-TESTE DE HIPÓTESES
12) (SEFAZ-RS-FGV) A comissão de planejamento de um aeroporto está pensando em remodelar
as instalações do estacionamento de carros. A idéia inicial é realocar a área de estacionamento
rápido se, dentre os carros que permanecem menos de 3 horas estacionados, o tempo médio de
estacionamento for inferior a 30 minutos. Para avaliar a situação, uma amostra composta de 25
canhotos de estacionamento (com o horário de entrada e de saída do veículo) foi selecionada
aleatoriamente dentre todos os carros que, em um determinado dia, ficaram estacionados menos
de 3 horas. Observou-se, então, que o tempo médio de estacionamento de 25 veículos
selecionados foi de 28 minutos com variância igual a 4. Para analisar este problema, foi realizado
o Teste t de Student (unilateral e a = 0,05). Qual o valor da estatística deste teste ?
a) -2,5
b) -3,3
c) -5,0
d) -12,5
e) -25,0
14) (ECONOMISTA-FGV) Um teste de hipóteses apresentou p-valor igual a 0,07. Portanto, nos
níveis de significância de 10% e 5%, respectivamente, a hipótese nula:
a) deve ser aceita e aceita
b) deve ser aceita e rejeitada
c) deve ser rejeitada e aceita
d) deve ser rejeitada e rejeitada
e) pode ou não ser rejeitada, dependendo de a hipótese ser simples ou não
15) (AFRE-MG-ESAF) Um fabricante afirma que pelo menos 95% dos equipamentos que fornece
à indústria encontram-se dentro de suas especificações. Uma amostra de 200 itens escolhidos ao
acaso revelou 10 itens fora de especificação. Assinale a opção que corresponde ao valor
probabilístico (p-valor) do teste de H:θ ≥ 0,95 contra A: θ < 0,95, sendo θ a proporção populacional
de itens dentro de especificação.
a) 0,500
b) 0,050
c) 0,025
d) 0,010
e) 0,100
ESTATÍSTICA 98 MANUEL
EXERCÍCIO-10-TESTE DE HIPÓTESES
16) (GESTOR-MG-ESAF) Lança-se uma moeda 20 vezes e observa-se a ocorrência de 7 caras.
Seja θ a probabilidade de cara. Assinale a opção que dá o valor da estatística teste
correspondente ao teste da hipótese H: θ ≥ 0,5 contra a alternativa A: θ < 0,5.
a) - 0, 3 20
b) - 0, 2 20
c) 0, 3 20
d) 0, 2 20
e) 0, 5 20
19) (ICMSRJ-2010-FGV) Para testar H0: p ≤ 0,5 contra H1: p > 0,5, sendo p a proporção de pessoas que
são protegidas por planos de previdência privada numa certa população, uma amostra aleatória simples de
tamanho 400 será obtida e será usado como critério de decisão rejeitar a hipótese H0 se a proporção de
pessoas com essa proteção na amostra for maior ou igual a um certo número k.
Ao nível de significância de 5%, o valor de k é aproximadamente igual a:
(A) 0,508
(B) 0,541
(C) 0,562
(D) 0,588
(E) 0,602
20) (ICMSRJ-2010-FGV) Para testar H0: μ ≤ 10 contra H1: μ > 10, sendo μ a média de uma variável
populacional suposta normalmente distribuída com variância igual a 100, uma amostra aleatória simples de
tamanho 25 foi obtida e resultou num valor da média amostral igual a 15,76. Ao nível de significância de 5%,
o valor-p (nível crítico) correspondente e a decisão a ser tomada são respectivamente:
(A) 0,102 e não rejeitar H0.
(B) 0,01 e rejeitar H0.
(C) 0,058 e não rejeitar H0.
(D) 0,002 e rejeitar H0.
(E) 0,154 e não rejeitar H0.
ESTATÍSTICA 99 MANUEL
EXERCÍCIO-10-TESTE DE HIPÓTESES
GABARITO
01-A
02-A
03-A
04-A
05-A
06-A
07-A
08-E
09-B
10-D
11-D
12-C
13-E
14-C
15-A
16-A
17-B
18-B
19-B
20-D
Segunda decimal de z
0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
Parte inteira e primeira decimal de z
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
TABELA T-Student - BICAUDAL
12% 5,24 2,62 2,16 1,97 1,87 1,81 1,77 1,74 1,72 1,70 1,67 1,65 1,62 1,61 1,60 1,59 1,58 1,57 1,56 1,55
13% 4,83 2,50 2,07 1,90 1,81 1,75 1,72 1,69 1,67 1,65 1,63 1,60 1,58 1,57 1,56 1,55 1,54 1,53 1,52 1,51
14% 4,47 2,38 2,00 1,84 1,75 1,70 1,66 1,64 1,62 1,60 1,58 1,56 1,54 1,52 1,52 1,51 1,50 1,49 1,48 1,48
15% 4,17 2,28 1,92 1,78 1,70 1,65 1,62 1,59 1,57 1,56 1,54 1,52 1,50 1,49 1,48 1,47 1,46 1,45 1,44 1,44
16% 3,89 2,19 1,86 1,72 1,65 1,60 1,57 1,55 1,53 1,52 1,50 1,48 1,46 1,45 1,44 1,43 1,43 1,42 1,41 1,41
17% 3,66 2,10 1,80 1,67 1,60 1,56 1,53 1,51 1,49 1,48 1,46 1,44 1,42 1,41 1,41 1,40 1,39 1,38 1,37 1,37
18% 3,44 2,03 1,74 1,62 1,56 1,52 1,49 1,47 1,45 1,44 1,42 1,41 1,39 1,38 1,37 1,36 1,36 1,35 1,34 1,34
19% 3,25 1,95 1,69 1,58 1,52 1,48 1,45 1,43 1,42 1,41 1,39 1,37 1,36 1,35 1,34 1,33 1,33 1,32 1,31 1,31
20% 3,08 1,89 1,64 1,53 1,48 1,44 1,41 1,40 1,38 1,37 1,36 1,34 1,33 1,32 1,31 1,30 1,30 1,29 1,28 1,28
21% 2,92 1,82 1,59 1,49 1,44 1,40 1,38 1,36 1,35 1,34 1,32 1,31 1,30 1,29 1,28 1,27 1,27 1,26 1,25 1,25
22% 2,78 1,76 1,55 1,45 1,40 1,37 1,35 1,33 1,32 1,31 1,29 1,28 1,27 1,26 1,25 1,25 1,24 1,23 1,23 1,23
23% 2,65 1,71 1,50 1,41 1,37 1,34 1,31 1,30 1,29 1,28 1,26 1,25 1,24 1,23 1,23 1,22 1,22 1,21 1,20 1,20
24% 2,53 1,65 1,46 1,38 1,33 1,30 1,28 1,27 1,26 1,25 1,24 1,22 1,21 1,20 1,20 1,19 1,19 1,18 1,18 1,18
25% 2,41 1,60 1,42 1,34 1,30 1,27 1,25 1,24 1,23 1,22 1,21 1,20 1,18 1,18 1,17 1,17 1,16 1,16 1,15 1,15
25% 2,41 1,60 1,42 1,34 1,30 1,27 1,25 1,24 1,23 1,22 1,21 1,20 1,18 1,18 1,17 1,17 1,16 1,16 1,15 1,15
27% 2,21 1,51 1,35 1,28 1,24 1,22 1,20 1,19 1,18 1,17 1,16 1,15 1,13 1,13 1,12 1,12 1,12 1,11 1,10 1,10
28% 2,13 1,47 1,31 1,25 1,21 1,19 1,17 1,16 1,15 1,14 1,13 1,12 1,11 1,10 1,10 1,10 1,09 1,09 1,08 1,08
29% 2,04 1,43 1,28 1,22 1,18 1,16 1,14 1,13 1,12 1,12 1,11 1,10 1,09 1,08 1,08 1,07 1,07 1,06 1,06 1,06
30% 1,96 1,39 1,25 1,19 1,16 1,13 1,12 1,11 1,10 1,09 1,08 1,07 1,06 1,06 1,05 1,05 1,05 1,04 1,04 1,04
35% 1,63 1,21 1,10 1,06 1,03 1,01 1,00 0,99 0,99 0,98 0,97 0,96 0,96 0,95 0,95 0,95 0,94 0,94 0,94 0,93
40% 1,38 1,06 0,98 0,94 0,92 0,91 0,90 0,89 0,88 0,88 0,87 0,87 0,86 0,86 0,85 0,85 0,85 0,85 0,84 0,84
45% 1,17 0,93 0,87 0,84 0,82 0,81 0,80 0,79 0,79 0,79 0,78 0,78 0,77 0,77 0,77 0,76 0,76 0,76 0,76 0,76
50% 1,00 0,82 0,76 0,74 0,73 0,72 0,71 0,71 0,70 0,70 0,70 0,69 0,69 0,68 0,68 0,68 0,68 0,68 0,67 0,67
55% 0,85 0,71 0,67 0,65 0,64 0,63 0,63 0,62 0,62 0,62 0,62 0,61 0,61 0,61 0,60 0,60 0,60 0,60 0,60 0,60
60% 0,73 0,62 0,58 0,57 0,56 0,55 0,55 0,55 0,54 0,54 0,54 0,54 0,53 0,53 0,53 0,53 0,53 0,53 0,52 0,52
65% 0,61 0,53 0,50 0,49 0,48 0,48 0,47 0,47 0,47 0,47 0,47 0,46 0,46 0,46 0,46 0,46 0,46 0,46 0,45 0,45
70% 0,51 0,44 0,42 0,41 0,41 0,40 0,40 0,40 0,40 0,40 0,39 0,39 0,39 0,39 0,39 0,39 0,39 0,39 0,39 0,39
75% 0,41 0,37 0,35 0,34 0,34 0,33 0,33 0,33 0,33 0,33 0,33 0,32 0,32 0,32 0,32 0,32 0,32 0,32 0,32 0,32
80% 0,32 0,29 0,28 0,27 0,27 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,25 0,25 0,25 0,25
85% 0,24 0,21 0,21 0,20 0,20 0,20 0,20 0,20 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19
90% 0,16 0,14 0,14 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13
95% 0,08 0,07 0,07 0,07 0,07 0,07 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06
100% 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00