Estatística Afrf Apostila p2

MÓDULO - 5A - PROBABILIDADE
Introdução - Os jogos de azar, que se caracterizam por ações como girar uma roleta, lançar dados ou
retirar carta de baralho tem duas características básicas: a incerteza e a regularidade. Assim, por exemplo,
toda vez que se joga um dado, pode ocorrer qualquer uma das faces. No entanto, o jogo, embora incerto
tem regularidade. Se forem feitos muitos lançamentos espera-se que todas as faces ocorram igual número
de vezes. Essas características de jogos de azar, percebidas há muito tempo, criaram a idéia de que seria
possível achar uma “fórmula” ou um “método”, que permitisse ao jogador ganhar sempre, ou pelo menos,
ganhar na maioria das vezes. Isso não é possível, mas foi essa idéia que incentivou o estudo de tais jogos,
o que levou a formulação da teoria da probabilidade, base da estatística moderna.
Experimento Aleatório - é aquele que repetido sob as mesmas condições indefinidamente apresenta
variações nos resultados.
Exemplos:
E1 ⇒ retirar uma carta de um baralho com 52 cartas e observar o resultado.
E2 ⇒ retirar com reposição bolas de uma urna que contém 5 bolas brancas e 6 pretas.
E3 ⇒ jogar uma moeda 10 vezes e observar o número de caras.
Espaço Amostral (S) - é o conjunto de todos os resultados possíveis de um experimento aleatório.
Exemplos:
Lançamento de uma moeda ⇒ S = {Ca , Co}
Lançamento de um dado ⇒ S = {1,2,3,4,5,6}
Evento - é qualquer subconjunto do espaço amostral S de um experimento aleatório.

Exemplo: No lançamento de um dado, o espaço amostral é S = {1,2,3,4,5,6} , assim:
A = {2,4,6} ⊂ S é um evento de S.
B = {1,2,3,4,5,6} é um evento de S.
C = {4} é um evento de S.
D = ∅ ⊂ S é um evento impossível. Ou seja, o conjunto vazio representa o evento impossível.
Um evento pode ser definido por uma sentença, logo, os eventos acima podem ser assim definidos:
A ⇒ obter um número par na face superior.
B ⇒ obter um número menor ou igual a 6 na face superior.
C ⇒ obter o número 4 na face superior.
D ⇒ obter um número maior que 6 na face superior.
Probabilidade - chama-se probabilidade de um evento A, A ⊂ S ao número real P(A) tal que:

n( A)
P(A) = , onde: n(A) = nº de elementos de A n(S) = nº de elementos de S
n( S )
Exemplo: Qual é a probabilidade de se obter cara no lançamento de uma moeda?
Temos: Espaço Amostral S = {Ca, Co} n(S) = 2
Seja A o evento “aparecer cara”, então, A é dado por: A = {Ca} e n(A) = 1.
Logo, P(A) = n(A)/n(S) P(A) = ½ = 0,5 ou 50%.
ESTATÍSTICA-MÓDULO-5A-PROBABILIDADE 1 MANUEL
Exemplo: Qual é a probabilidade de aparecer uma face ímpar (número ímpar) no lançamento de um dado?
Temos: Espaço Amostral ⇒ S = {1,2,3,4,5,6} ⇒ n(S) = 6

Face ímpar, evento ⇒ A = {1, 3, 5} ⇒ n(A) = 3
P(A) = n(A) / n(S) = 3/6 = ½ = 0,5 ou 50%.
Exemplo: Qual é a probabilidade de se tirar um rei em um baralho de 52 cartas ?
Evento A ⇒ aparecer um rei

n(A) = 4 ⇒ nº de reis do baralho
n(S) = 52 ⇒ nº de cartas do baralho
P(A) = n(A)/n(S) = 4/52 = 1/13
OBS: A probabilidade de um evento A pode também ser definida da seguinte maneira:
Número de casos favoráveis a ocorrência de A

P ( A) =
Número Total de casos
Eventos Complementares ⇒ dois eventos de um espaço amostral S são complementares quando o

resultado da união dos dois corresponde exatamente ao espaço amostral S.
Exemplo: No lançamento de uma moeda, se definirmos os eventos:

E1 ⇒ o resultado é cara
E2 ⇒ o resultado é coroa
E1 e E2 são eventos complementares, pois E1 ∪ E2 = S (Espaço Amostral)
OBS: Sendo p a probabilidade que um evento ocorra (sucesso) e q a probabilidade que ele não ocorra
(insucesso), para um mesmo evento existe sempre a relação: p + q = 1 ⇒ q = 1 - p
Exemplo: Se a probabilidade de ocorrer 4 no lançamento de um dado é p =1/6, a probabilidade de não

ocorrer 4 é q = 1 - p = 1 - 1/6 = 5/6.
Eventos Independentes ⇒ dois eventos são independentes quando a realização ou não realização de
um deles não afeta a probabilidade de realização ou não do outro e vice-versa. Por exemplo: no
lançamento de dois dados, o resultado obtido em um deles independe do resultado obtido no outro. A
probabilidade de ocorrência simultânea de dois eventos independentes é dada por:
p = p1 × p2.
Exemplo: Lançamento de dois dados. A probabilidade de obtermos 1 no primeiro dado é p1 = 1/6. A

probabilidade de obtermos 5 no segundo dado é p2 = 1/6.
A probabilidade de obtermos simultaneamente 1 no primeiro dado e 5 no segundo é dada por:
p = p1 × p2 = 1/6 × 1/6 = 1/36
Observe o Espaço Amostral (S) do lançamento de 2 dados.
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
O número de elementos de S é 36, mas só estamos interessados em um deles que é ocorrer 1 no primeiro
lançamento e 5 no segundo lançamento do dado, ou seja, o elemento (1,5).
Assim a probabilidade de ocorrer (1,5) = 1/36, ou seja, 1/6 (que é a probabilidade de dar 1 no primeiro
dado) vezes 1/6 (que é a probabilidade de dar 1 no segundo dado).
Eventos Mutuamente Exclusivos - dois ou mais eventos são mutuamente exclusivos se a

realização de um excluir a realização do outro ou dos outros. Assim, no lançamento de uma moeda, o
evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos já que ao se realizar um deles o
outro não pode se realizar. Se dois eventos são mutuamente exclusivos a probabilidade de que um ou
outro se realize é igual a soma das probabilidades para que cada um deles se realize e é dada por:
p = p1 + p2.
Exemplo: Lançamento de um dado. A probabilidade de se tirar o 3 ou o 5 é:
p = 1/6 + 1/6 = 2/6 = 1/3.
Propriedades de Probabilidade
1 - A probabilidade de um evento A é um número maior ou igual a zero e menor ou igual a 1.

0 ≤ P(A) ≤ 1.
2 - A probabilidade de um evento certo é igual a 1 ⇒ P(S) = 1.
3 - A probabilidade de um evento impossível é igual a zero ⇒ P(∅) = 0.
4 - Regra da Soma - Se A e B são eventos mutuamente exclusivos, (A ∩ B) = ∅ então:
P(A∪B) = P(A + B) = P(A) + P(B).
5 - Se A e B não são mutuamente exclusivos, então: P(A∪B) = P(A) + P(B) - P(A∩B).
6 - Se B é o evento complementar de A então: P(B) = 1 - P(A).
Exemplos:
1 - Determinar a probabilidade de retirar a dama de paus quando retiramos uma carta de um baralho
comum de 52 cartas.
Evento (E) ⇒ retirar uma dama de paus.
Como só existe uma dama de paus no baralho o nº de casos favoráveis ao evento é 1, logo:
P(E) = 1/52.
2 - Determinar a probabilidade de não retirar a dama de paus quando retiramos uma carta de um baralho
comum de 52 cartas.
Este evento é complementar ao do exemplo anterior, logo:
P(E’) = 1 - P(E) = 1 - 1/52 = 51/52.
3 - Determinar a probabilidade de retirar uma carta de copas ou de ouros quando retiramos uma carta de
um baralho comum de 52 cartas.
Podemos definir os seguintes eventos:

A ⇒ a carta retirada é de copas.
B ⇒ a carta retirada é de ouros.
Como os eventos A e B são mutuamente excludentes, podemos então calcular a probabilidade a partir de
P(A) + P(B).
P(A) = 13 / 52 ⇒ 13 cartas de copas.

P(B) = 13 / 52 ⇒ 13 cartas de ouros.
P(A ∪ B) = P(A) + P(B) = 26 / 52 = 50%.
4 - Determinar a probabilidade de retirar uma carta de paus ou um rei quando retiramos uma carta de um
baralho comum de 52 cartas.
Podemos definir os seguintes eventos:

A ⇒ a carta retirada é de paus.
B ⇒ a carta é um rei.
Os eventos A e B não são mutuamente excludentes, visto que existe um rei de paus. A probabilidade
será dada então por: P(A ∪ B) = P(A) + P(B) - P(A ∩ B).
P(A) = 13/52 ⇒ 13 cartas de paus.

P(B) = 4/52 ⇒ 4 reis.
P(A ∩ B) = 1/52 ⇒ 1 rei de paus.
P(A ∪ B) = P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 13/52 + 4/52 - 1/52 = 16/52.
Probabilidade Condicional
Se A e B são eventos de um espaço amostral S com P(B) ≠ 0, então a probabilidade condicional do evento
A, tendo ocorrido o evento B é indicada por P(A/B) e dada por:
P( A ∩ B) NCF ao evento A ∩ B
P(A | B) = ou P( A / B) =
P( B) NCF ao evento B
Onde:
P(A | B) ⇒ é a probabilidade de A ocorrer depois de B ter ocorrido.
P(A ∩ B) ⇒ é a probabilidade de A e B ocorrerem simultaneamente.
P(B) ⇒ é a probabilidade de B ocorrer.
Exemplo: Um número é sorteado ao acaso entre os inteiros: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15.
Se o número sorteado for par, qual a probabilidade de que seja o número 6 ?
Temos:
S = {1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; 13; 14; 15} ⇒ Espaço Amostral
A = {o número 6}.
B = {um número par}.
Temos então:
P(B) = 7/15 ⇒ sete números pares em 15.
P(A∩Β) = 1/15 ⇒ o número 6 em 15, ou seja, uma chance em 15.
1
P (A ∩ B ) 15 1 15 1
P( A / B) = = = × =
P( B) 7 15 7 7
15
Sem a informação da ocorrência de B (o número sorteado ser par) P(A) seria 1/15, ou seja, menor que o
valor quando B é conhecido (1/7). Assim, a informação (a priori) sobre a ocorrência de B diminui o
espaço amostral e aumenta o valor da probabilidade do número sorteado ser 6.
Regra do Produto
Eventos Dependentes ⇒ Se dois eventos A e B são dependentes então:
P(A∩B) = P(B) × P(A/B) ou P(A∩B) = P(A) × P(B/A)
Exemplo: Retiram-se sem reposição duas peças de um lote de 10 peças onde 4 são boas. Qual a
probabilidade de que ambas sejam defeituosas ?
Temos:
A = { a 1ª peça ser defeituosa }.
B = { a 2ª peça ser defeituosa }.
Como é sem reposição perceba que o fato de se retirar uma peça defeituosa afeta o espaço amostral
quando se vai retirar a segunda peça.
Precisamos calcular P(A∩B), ou seja, a ocorrência simultânea de A e B.
Temos: P(A∩B) = P(A) × P(B/A).
P(A) = 6/10 ⇒ seis defeituosas em 10.
P(B/A) = 5/9 ⇒ a 1ª era defeituosa - sobram 5 defeituosas em um total de 9.
Então, P(A∩B) = 6/10 × 5/9 = 30/90 = 1/3.
Eventos Independentes
Se dois eventos são independentes então: P(A∩B) = P(A) × P(B)
Exemplo: Retiram-se com reposição duas cartas de um baralho com 52 cartas. Qual a probabilidade de
que ambas sejam de “paus” ?
Temos:
A = {a 1ª carta é de paus} ⇒ P(A) = 13/52.

B = {a 2ª carta é de paus} ⇒ P(B) = 13/52.
P(A∩B) = 13/52 × 13/52 = ¼ × ¼ = 1/16.
Fórmula de Bayes
Sejam E1 , E2 , ... , En eventos mutuamente exclusivos tais que E1 ∪ E2 ∪ ... ∪ En = S. Sejam P ( Ei ) as

probabilidades conhecidas dos diversos eventos, e B um evento qualquer de S para o qual conhecemos
todas as probabilidades condicionais P ( B | Ei ). Então para cada i temos:
P( Ei ) × P( B / Ei )
P ( Ei / B ) =
∑ P( Ei ) × P( B / Ei )
Exemplo: Considere duas caixas. A primeira caixa contém 2 bolas vermelhas e 1 branca, e a segunda caixa
que contém 2 bolas vermelhas e 2 bolas brancas. Escolhe-se uma das caixas ao acaso e retira-se dela uma
bola. Se a bola retirada for vermelha, qual a probabilidade de que ela tenha vindo da primeira caixa?
Sejam os eventos:
E1 = a 1ª caixa foi escolhida.
E2 = a 2ª caixa foi escolhida.

B = a bola retirada é vermelha.
Queremos determinar P (E1 | B), ou seja, qual a probabilidade da bola ter vindo da caixa-1 dado que a bola
retirada é da cor vermelha.
Temos então:
P(E1) = P (E 2) = ½ ⇒ a probabilidade de sortear cada caixa é ½ = 50%.

P ( B | E 1 ) = 2/3 ⇒ 2 bolas vermelhas em 3.
P ( B | E 2 ) = 2/4 ⇒ 2 bolas vermelhas em 4.
Então:
P ( E1 ) × P ( B / E1 ) 1 2
P ( E1 / B ) = = ×
P ( E1 ) × P( B / E1 ) + P( E 2 ) × P( B / E 2 ) 2 3 = 4/7
1 2 1 2
× + ×
2 3 2 4
Análise Combinatória
Para obtenção da probabilidade de eventos complexos, a enumeração de casos é muitas vezes difícil. Para
facilitar essa etapa utiliza-se os conceitos básicos de análises combinatória.
Arranjos
n!
Anr = ⇒ Arranjos de n objetos r a r.
(n − r )!
Permutações
No caso particular em que r = n temos: A n,n = n!
Assim, arranjos de n elementos n a n são chamados de Permutações.
Exemplo: Com as letras A, B, C, D, E, F, G, quantos arranjos de 3 letras podemos formar?
7! 7!
Temos: n = 7 r = 3 A73 = = = 5 × 6 × 7 = 210
(7 − 3)! 4!
Combinações
Nos arranjos a ordem em que os objetos aparecem é importante. No exemplo anterior ABC é um arranjo
diferente de BCA. Em muitos problemas, entretanto, não estamos interessados na ordem em que os objetos
aparecem. Tais escolhas são chamadas combinações.
n!
C nr = ⇒ Combinações de n elementos r a r.
r! (n − r )!
Exemplos:
01 - Calcular a probabilidade de se obter cinco espadas em uma mão de cinco cartas de um baralho de 52
cartas.
O número de mãos de 5 cartas que podem ser formadas de um baralho de 52 cartas distintas (nº de casos
possíveis) é dado por:
52! 52! 52 × 51 × 50 × 49 × 48 × 47! 52 × 51 × 50 × 49 × 48
C 52,5 = = = = = 2.598.960
5!(52 − 5)! 5!×47! 5!×47! 5!
O número de maneiras de selecionar 5 espadas dentre as 13 cartas de espada (nº da casos favoráveis) é
dado por:
13! 13! 13 × 12 × 11 × 10 × 9
C 13,5 = = = = 1.287
5! (13 − 5)! 5!×8! 1× 2 × 3 × 4 × 5
A probabilidade desejada P(E) será: nº casos favoráveis/ nº de casos possíveis.
P (E) = 1.287 / 2.598.960 = 0,0005 ou 0,05 %
Obs. Usando a Regra do Produto (Eventos Dependentes) temos uma solução mais simples:
13 12 11 10 9
P( E ) = × × × × = 0,05%
52 51 50 49 48
02 - Num lote de 12 peças 4 são defeituosas. Retirando-se 2 peças aleatoriamente, calcule a probabilidade
de ambas serem defeituosas.
O número de combinações de 2 peças que podem ser selecionadas dentre as 12 peças ( nº da casos
12! 12! 12 × 11 132
possíveis) é dado por: C 12,2 = = = = = 66 .
2! (12 − 2)! 2 !×10! 1 × 2 2
O número de maneiras de selecionar 2 peças defeituosas dentre as 4 peças defeituosas (nº de casos
4! 4!
favoráveis) é dado por: C 4,2 = = =6
2! (4 − 2)! 2!×2!
A probabilidade desejada é dada por: P(E) = 6 / 66 = 0,091 ou 9,1 %
Obs. Aqui também podemos usar a Regra do Produto, ou seja, P(E) = 4/12 × 3/11 = 9,1%.
Ou seja, quando vamos retirar a primeira peça a probabilidade de sair uma defeituosa é 4/12. Quando
vamos retirar a segunda peça, a probabilidade de que ela seja defeituosa é 3/11, já que como a primeira
bola retirada foi defeituosa sobram apenas 3 defeituosas em um total de 11. Logo, a probabilidade de se
retirar duas defeituosas será 4/12 × 3/11 = 0,091 = 9,1%.
EXERCÍCIOS - PROBABILIDADE / TEOREMA DE BAYES
01-(CVM-Analista Planejamento e Execução Financeira-ESAF) Acredita-se que o preço de um bem (X), em
reais, tenha distribuição populacional uniforme no intervalo aberto (1; 7). Assinale a opção que corresponde
à probabilidade de se observar na população um valor de X de pelo menos 3 reais e de no máximo 5 reais.
a) 2/7 b) 1/3 c) 5/6 d) ½ e) 3/4
02-(ELETROBRÁS-ESTATÍSTICO-2002/NCE) A e B são eventos independentes com P[A] = 0,5 e P[B]=0,3.

A probabilidade de que nem A nem B ocorra é igual a:
a. 15% b. 20% c. 25% d. 30% e. 35%
03-(FINEP-ANALISTA-2006/NCE) Um jogador está interessado em fazer apostas com base nos resultados
obtidos com o lançamento de dois dados simultaneamente. Ele deseja determinar as probabilidades de dois
tipos de resultados: a) a soma dos números que aparecem nos dois dados é menor do que 4; e b) o número
que aparece em um dado é diferente do número que aparece no outro dado. As respostas corretas são,
respectivamente:
(A) a. 1/9; b. 5/6;
(B) a. 1/12; b. 5/6;
(C) a. 1/9; b. 5/12;
(D) a. 1/12; b. 2/3;
(E) a. 1/6; b. 5/12.
04-(IBGE-ANALISTA-2002/NCE) Dois eventos A e B são independentes, P[A] = 0,16 e P[B] = 0,5. A

probabilidade de que ocorra A ou B é igual a:
(A) 36% (B) 42% (C) 50% (D) 58% (E) 66%
05-(IBGE-ANALISTA CENSITÁRIO-2000/NCE) Se A e B são eventos independentes com probabilidades de

50% e 60%, respectivamente, então a probabilidade de que pelo menos um dos dois ocorra é de:
a. 30% b. 50% c. 60% d. 80% e. 100%
06-(AFPS-ESAF) Suponha que a probabilidade de um evento C seja 0,4 e que a probabilidade condicional do
evento D dado que C ocorreu seja 0,2. Assinale a opção que dá o valor da probabilidade de ocorrência de D e
C.
a) 0,50 b) 0,08 c) 0,00 d) 1,00 e) 0,60
07-(MIN-CIDADES-ESTATÍSTICO-2006/NCE) Se A e B são eventos com probabilidades 50% e 60%

respectivamente, então os valores mínimo e máximo da probabilidade de A∩B são:
(A) 0% e 50%
(B) 10% e 50%
(C) 0% e 60%
(D) 30% e 45%
(E) 12% e 50%.
ESTATÍSTICA 9 MANUEL
EXERCÍCIOS-PROBABILIDADE-TEOREMA DE BAYES
08-(MP-RO-ANALISTA-2008/CESGRANRIO) A e B são eventos independentes com probabilidades
P(A) = 0,6 e P(B) = 0,5. Quanto vale a probabilidade de A ocorrer e B não ocorrer?
(A) 0,1 (B) 0,3 (C) 0,4 (D) 0,5 (E) 0,8
09-(PETROBRÁS-ECONOMISTA-JR-2005/CESGRANRIO) Jogando-se um dado duas vezes, a

probabilidade de a soma dos pontos obtidos ser igual a 4 é igual a:
(A) 1/2 (B) 1/6 (C) 1/12 (D) 1/18 (E) 1/72
10-(PETROBRÁS-ESTATÍSTICO-2005/CESGRANRIO) Os eventos A e B são independentes e suas

probabilidades são P(A) = 0,5 e P (B) = 0,4. Quanto vale P(A∪B)?
(A) 0,5 (B) 0,6 (C) 0,7 (D) 0,8 (E) 0,9
11-(SEAD-AM-ESTATÍSTICO-2005/CESGRANRIO) Os eventos A e B são independentes e suas

probabilidades valem, respectivamente, P(A) = 0,8 e P(B) = 0,4. Qual é a probabilidade de que A ocorra e B
não ocorra?
(A) 0,40 (B) 0,42 (C) 0,44 (D) 0,46 (E) 0,48
12-(MIN-PLANEJAMENTO-ENAP-2006/ESAF) Se E1 e E2 são dois eventos independentes, então:

a) a probabilidade de E1 é igual à probabilidade de E2.
b) E1 e E2 são mutuamente exclusivos.
c) a probabilidade de E1 é maior do que a probabilidade de E2.
d) a probabilidade de E2 é maior do que a probabilidade de E1.
e) a ocorrência, ou não, de E1 não afeta a probabilidade de ocorrência de E2.
13-(SUSEP-Analista Técnico Atuária-2001/ESAF) Uma loja vende lavadoras e secadoras de roupa. A

distribuição conjunta do número N1 de secadoras e do número N2 de lavadoras vendidas num mesmo dia é
dada na tabela abaixo. Assinale a opção que dá a probabilidade de que a venda, num mesmo dia, de
lavadoras seja igual à de secadoras.
N1 | N2 0 1 2 3
0 0,25 0,13 0,04 0,02
1 0,15 0,11 0,02 0,01
2 0,08 0,06 0,05 0,02
3 0,01 0,01 0,01 0,03
a) 0,54 b) 0,50 c) 0,49 d) 0,44 e)0,19
14- (ELETROBRÁS-ESTATÍSTICO-2002/NCE) A, B e C são eventos tais que:
P[A] = 0,2 P[B] = 0,3 P[C] = 0,4 P[A | B] = 0,2 P[A | C] = 0,8 P[C| B] = 0,4
Observe as afirmativas a seguir:
I- A e B são independentes;
II- A e C são independentes;
III- B e C são independentes.
Assinale o item que relaciona todas as afirmativas corretas:
a. I b. I , II c. I , III d. II , III e. I , II , III
15- (ELETRONORTE-ESTATÍSTICO-2006/NCE) A e B são dois eventos, P[A∪B] = 0,42, P[A] = 0,34,

P[B] = 0,28. A probabilidade condicional de A ocorre dado que B ocorreu é, aproximadamente:
(A) 46%;
(B) 53%;
(C) 64%;
(D 71%;
(E) 83%.
16-(PBGÁS/2007) Um estudante é submetido a um teste no qual constam 4 questões do tipo verdadeiro (V)
ou falso (F). Ele não sabe responder a nenhuma das questões. A probabilidade de ele acertar todas as
quatro questões assinalando aleatoriamente a resposta de cada uma delas é
(A) 1,25%
(B) 2,5%
(C) 5,0%
(D) 6,25%
(E) 25%
17-(TCE-MG/2007) Em uma caixa há 8 processos a serem arquivados, em cada um dos quais foi colocada
uma etiqueta marcada com um único dos números de 1 a 8. Se no interior da caixa os processos não estão
ordenados e, para dar início à execução de tal tarefa, um funcionário do Tribunal de Contas pegar
aleatoriamente dois desses processos, a probabilidade de que nessa retirada os números marcados em
suas respectivas etiquetas sejam consecutivos é de
(A) 25% (B) 20% (C) 12,5% (D) 10% (E) 7,5%
18-(CEF-2004) A tabela abaixo apresenta dados parciais sobre a folha de pagamento de um Banco.
Um desses empregados foi sorteado para receber um prêmio. A probabilidade desse empregado ter seu
salário na faixa de R$ 300,00 a R$ 500,00 é
(A) 1/3
(B) 2/5
(C) 1/2
(D) 3/5
(E) 7/10
19-(ANS-2007) A tabela fornece informações sobre o tipo de câncer e a idade de 500 pacientes que sofrem
desta doença, internados num determinado hospital especializado na doença.
Idade Câncer estomacal Câncer pulmonar Outros Total

00 --- 10 0 6 60 66
10 --- 30 30 9 25 64
30 --- 50 100 75 55 230
50 --- 70 70 60 10 140
Total 200 150 150 500
Ao selecionar aleatoriamente um paciente, dentre esses 500, a probabilidade dele ter câncer pulmonar ou
estomacal, dado que ele tem idade inferior a 30 anos, é
(A) 16/125 (B) 9/26 (C) 39/64 (D) 13/50 (E) 32/65
20-(ANS-2007) Sabe-se que 3/5 dos pacientes submetidos a uma determinada cirurgia sobrevivem. Se 4
pacientes realizarem a cirurgia, a probabilidade de que pelo menos um não sobreviva é de
(A) 609/625 (B) 544/625 (C) 96 /625 (D) 24/625 (E) 16/625
21-(CAMDEP/2007) Uma rede local de computadores é composta por um servidor e 2 (dois) clientes (Z e
Y). Registros anteriores indicam que dos pedidos de certo tipo de processamento, cerca de 30% vêm de Z e
70% de Y. Se o pedido não for feito de forma adequada, o processamento apresentará erro. Sabendo-se
que 2% dos pedidos feitos por Z e 1% dos feitos por Y apresentam erro, a probabilidade do sistema
apresentar erro é:
(A) 5%
(B) 4,1%
(C) 3,5%
(D) 3%
(E) 1,3%
22-(DNOCS/2009) Em uma loja, as unidades vendidas por dia de um determinado eletrodoméstico
apresentam a seguinte distribuição de probabilidades de ocorrência de venda:
Unidades
0 1 2 3 4 A probabilidade de que em um determinado dia tenham sido
Vendidas
vendidas mais que uma unidade do eletrodoméstico é igual a
Probabilidade P P 3P 2P P
(A) 87,5% (B) 80,0% (C) 75,0% (D) 60,0% (E) 50,0%
23-(INFRAERO-2011) A empresa de aviação T tem 4 balcões de atendimento ao público: A, B, C e D.

Sabe-se que, num determinado dia, os balcões A e B atenderam, cada um, a 20%; C e D atenderam, cada
um, a 30% do público que procurou atendimento em T. Sabe-se ainda que A, B, C e D atenderam,
respectivamente, 5%, 15%, 10% e 20% de pessoas com atendimento prioritário (idosos, deficientes,
gestantes ou mães com crianças no colo, etc). Selecionando-se ao acaso uma pessoa atendida por T,
nesse mesmo dia, a probabilidade dela ter sido atendida no balcão C, sabendo-se que era do grupo de
atendimento prioritário, é igual a
(A)5/13 (B)1/6 (C)2/15 (D)5/12 (E)3/13
24-(METRO/2008) Em uma cidade em que existem somente os jornais A e B, 20% da população lê

somente o jornal A, 15% lê o jornal A e o jornal B e 10% não lê nenhum dos jornais. Escolhendo
aleatoriamente uma pessoa desta cidade, a probabilidade dela ler um e somente um dos jornais é de
(A) 55% (B) 60% (C) 65% (D) 70% (E) 75%
25-(METRO/2008) Dois irmãos investem no mercado financeiro. Em um determinado período, sabe-se que
o primeiro tem 80% de probabilidade de apresentar um ganho positivo e o segundo em 90%. A
probabilidade de nenhum deles apresentar em ganho positivo, neste período, é igual a
(A) 2% (B) 3% (C) 10% (D) 20% (E) 25%
26-(METRO/2008) Considere que um investidor possui metade de seus títulos do tipo A, 20% do tipo B e o
restante do tipo C. Sabe-se que a probabilidade dele obter lucro com o tipo A é igual a 80%, com o tipo B
90% e com o tipo C 60%. Escolhendo aleatoriamente um destes títulos e verificando que ele não
apresentou lucro, a probabilidade dele ser do tipo A é igual a
(A)2/3 (B)7/12 (C)1/2 (D)5/12 (E)2/7
27-(METRO/2008) Em uma assembléia com 25 participantes, sabe-se que 5 deles são contra a realização
de determinado projeto e o restante a favor. Extraindo ao acaso uma amostra de 3 participantes desta
assembléia, sem reposição, a probabilidade (P) de todos os 3 participantes serem a favor do projeto é tal
que
(A) P < 50% (B) 50% ≤ P < 60% (C) 60% ≤ P < 70% (D) 70% ≤ P < 80% (E) 80% ≤ P < 90%
28-(METRO/2010) Em uma empresa, 20% dos homens e 10% das mulheres têm salários superiores a R$
5.000,00. Sabe-se que 40% dos empregados desta empresa são mulheres. Escolhendo aleatoriamente um
empregado desta empresa e verificando-se que seu salário não é superior a R$ 5.000,00, a probabilidade
dele ser homem é:
(A) 4/7 (B) 3/8 (C) 5/8 (D) 2/3 (E) 12/25
29-(MPE-PE/2006) Uma rede local de computadores é composta por um servidor e 2 clientes (A e B).
Registros anteriores indicam que, dos pedidos de certo tipo de processamento, cerca de 30% vêm de A e
70% de B. Se o pedido não for feito de forma adequada, o processamento apresentará erro. Sabe-se que
2% dos pedidos feitos por A e 5% dos feitos por B apresentam erro. Selecionando um pedido ao acaso, a
probabilidade dele ser proveniente de A, sabendo que apresentou erro, é
(A) 5/41 (B) 6/41 (C) 3/5 (D) 2/35 (E) 1/35
30-(MPE-PE/2006) Um lote contém 20 peças das quais 5 são defeituosas. Colhendo-se uma amostra de 2
peças, ao acaso e sem reposição deste lote, a probabilidade de se obter pelo menos uma peça defeituosa é
(A) 21/38 (B) 19/38 (C) 17/38 (D) 15/38 (E) 13/38
31-(MPU-2007) O tempo necessário para um medicamento contra dor fazer efeito segue um modelo com
densidade Uniforme no intervalo de 5 a 15 (em minutos). Um paciente é selecionado ao acaso entre os que
tomaram o remédio. A probabilidade do medicamento fazer efeito em até 10 minutos, neste paciente, é
(A) 0,8 (B) 0,7 (C) 0,5 (D) 0,4 (E) 0,3
32-(SEGAS-2010) A tabela abaixo apresenta o consumo médio mensal de 100 residências em um bairro
servido pela SERGAS.
Consumo (m3) Número de residências Escolhendo-se uma dessas residências ao acaso, a
10 28 probabilidade de que o seu consumo médio mensal de gás
15 53 natural seja de 25 m3 é
20 11
25 x
Total 100
(A) 2/25 (B) 7/100 (C) 3/50 (D) 1/20 (E) 1/25
33-(TJ-2009) Dois processadores tipos A e B são colocados em teste por mil horas. A probabilidade de que
um erro de cálculo aconteça em um processador do tipo A é de 3%, do tipo B é 2% e em ambos é de 0,3%.
A probabilidade de que nenhum processador tenha apresentado erro é igual a
(A) 0,953 (B) 0,950 (C) 0,835 (D) 0,773 (E) 0,558
34-(TJ-PA-2009) Uma fábrica produz parafusos utilizando duas máquinas A e B. 60% dos parafusos são
produzidos por A e o restante por B. Sabe-se que 1% dos parafusos produzidos por A e 2% dos produzidos
por B são defeituosos. Então, a probabilidade de um processo de produção desta fábrica produzir parafusos
sem defeito é
(A) 96,4% (B) 97,0% (C) 98,0% (D) 98,2% (E) 98,6%
35-(TJ-PA-2009) Considere que 2 peças defeituosas estão misturadas com 3 peças perfeitas. As peças são
extraídas aleatoriamente uma a uma até que a última peça defeituosa seja encontrada. A probabilidade de
que a última peça defeituosa seja encontrada na terceira extração é igual a
(A) 1/5 (B) 1/10 (C) 1/15 (D) 2/5 (E) 1/2
36-(TJ-PA-2009) Seja uma cidade em que existem somente os jornais A, B e C. 40% da população desta
cidade lê um e somente um dos jornais, 10% lê os jornais A e B, 20% lê os jornais A e C, 30% lê os jornais
B e C e 5% lê todos os 3 jornais. Escolhendo aleatoriamente uma pessoa desta cidade, a probabilidade
dela não ler nenhum dos jornais é
(A) 5% (B) 10% (C) 15% (D) 20% (E) 25%
37-(TJ-PA-2009) Considere que em um país 10% da população pertence à classe A, 40% à classe B e o
restante à classe C. A probabilidade do indivíduo da classe A comprar um veículo da marca X é 80%, da B
é 50% e da C somente 8%. Um indivíduo comprou um veículo da marca X. A probabilidade dele não
pertencer à classe A é
(A) 50% (B) 60% (C) 65% (D) 75% (E) 80%
38-(TJ-PI-2009) Seja P(X) a probabilidade de ocorrência do evento X. Se P(A) = 1/2, P(B) = 7/10
P(A∩B) = p e P (A ∪ B) = 2p.
Então, o valor de p é igual a
(A) 60% (B) 50% (C) 40% (D) 30% (E) 20%
39-(TJ-PI-2009) Em uma repartição pública, três setores A, B e C são responsáveis pela análise de todos
os processos autuados, recebendo cada um o mesmo número de processos para analisar
independentemente. Pela complexidade de tais processos, sabe-se que em A, B e C, respectivamente, 6%,
4,5% e 1,5% não são analisados dentro do tempo estipulado pela Administração. Escolhendo
aleatoriamente um processo entre todos autuados, a probabilidade dele ser analisado dentro do tempo
estipulado é de
(A) 94,0% (B) 94,5% (C) 95,0% (D) 96,0% (E) 98,5%
40-(TJ-PI-2009) Duas pessoas A e B são encarregadas de realizar um trabalho independentemente. A

executará 60% da tarefa e B o restante. Sabe-se que A comete 2% de falhas em seus trabalhos e B comete
5%. A probabilidade de todo o trabalho inicial ser realizado sem falhas é igual a
(A) 90,8% (B) 94,6% (C) 96,2% (D) 96,5% (E) 96,8%
41-(BACEN-2001/ESAF) Uma variável aleatória X tem função de distribuição de probabilidades dada por
Assinale a opção que dá o valor da probabilidade de X=2.
a) 7/12 b) 11/12 c) 1/3 d) ¾ e) 10/12
42-(CVM-Analista Planejamento e Execução Financeira-2000/ESAF) Uma loja de departamentos vende

máquinas de lavar roupa e secadoras entre outros eletrodomésticos. A tabela abaixo dá a distribuição de
probabilidades conjunta do número Y de maquinas de lavar roupa (linhas) e do número X de secadoras
(colunas) vendidas num dia típico.
Assinale a opção que corresponde à probabilidade de que, num dia típico, tenham sido vendidas 2
secadoras dado que 3 lavadoras foram vendidas.
a. 1/6 b. 1/4 c. 5/12 d. 1 e. 1/ 3
43-(MIN-PLANEJAMENTO-ENAP-2006/ESAF) Com a seguinte função de probabilidade conjunta, onde x
assume os valores 0 e 1, e y assume os valores, 1, 2 e 3,
a) P(Y = 3) = 0,08
b) P(X =0) = P(Y =2)
c) P(Y = 2 / X = 0) = 0,6.
d) E(X) = 0,4.
e) X e Y são variáveis aleatórias dependentes.
44-(Analista Técnico-Administração e Finanças-SUSEP-2002/ESAF) A variável aleatória X tem função de

distribuição de probabilidades dada por
Assinale a opção que dá o valor da probabilidade de que X assuma o valor 3.
a) 0 b) 1/16 c) 1/8 d) 13/16 e) 3/4
45-(ATRFB-2006/ESAF) Paulo e Helena jogam, cada um, uma moeda. Se do lançamento dessas duas
moedas resultar duas caras, Paulo paga a Helena R$ 5,00. Dando qualquer outro resultado, Helena paga a
Paulo R$ 2,00. Supondo que ambas as moedas sejam estatisticamente honestas, o valor esperado dos
ganhos de Helena (considerando-se como ganhos negativos os valores que ela paga a Paulo) é igual a
a) - R$ 0,25 b) + R$ 0,25 c) + R$ 3,00 d) - R$ 1,50 e) + R$ 1,25
GABARITOS
01-B 11-E 21-E 31-C 41-C

02-E 12-E 22-C 32-A 42-E
03-B 13-D 23-E 33-A 43-C
04-D 14-C 24-E 34-E 44-C
05-D 15-D 25-A 35-A 45-A
06-B 16-D 26-D 36-B
07-B 17-A 27-A 37-D
08-B 18-A 28-A 38-C
09-C 19-B 29-B 39-D
10-C 20-B 30-C 40-E
MÓDULO- 5B - VARIÁVEIS ALEATÓRIAS e DISTRIBUIÇÕES DE PROBABILIDADE
VARIÁVEIS ALEATÓRIAS
No capítulo anterior estudamos as probabilidades de ocorrência de eventos do espaço amostral
correspondente ao experimento aleatório considerado. O que vamos ver agora é uma maneira mais
conveniente de tratar tais eventos, o que será feito a partir da associação de “valores” aos pontos do
espaço amostral.
Variável Aleatória ⇒ é a função que associa a cada elemento do espaço amostral S de um

experimento aleatório, um número. As variáveis aleatórias podem ser discretas ou contínuas.
Exemplo: Considere o experimento aleatório que consiste no lançamento simultâneo de duas moedas.
O espaço amostral (S) correspondente a esse experimento aleatório é:
S = { (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co) }.
Podemos definir a variável aleatória X como a que corresponde ao número de caras obtidas e Y como
a variável aleatória que corresponde ao número de coroas. Dessa maneira cada ponto do espaço
amostral corresponderá a valores das variáveis X e Y, como mostrado na tabela abaixo.
X Y
Ponto Amostral
(nº caras) (nº coroas)
(Ca,Ca) 2 0
(Ca,Co) 1 1
(Co,Ca) 1 1
(Co,Co) 0 2
Qual seria a probabilidade de no lançamento simultâneo de duas moedas se obter duas caras (X = 2) ?
Temos: P(X=2) = 1/4.
Qual a probabilidade de se obter pelo menos uma cara (X=1 ou X=2) ?
Temos: P(X =1 ou X=2) = 3/4 , ou seja 3 em 4.
Qual a probabilidade de se obter exatamente uma coroa (Y=1) ?
Temos: P(Y=1) = 2/4 = ½, ou seja, 1 em 2.
MÓDULO-5B-DISTRIBUIÇÃO DE PROBABILIDADE
Distribuição de Probabilidade
Para Variável Aleatória Discreta ⇒ é uma tabela especificando a probabilidade de que a variável
aleatória assuma cada um dos valores possíveis. Ou seja, é a função que determina a probabilidade de
X assumir o valor x ⇒ P (X = x).
Para Variável Aleatória Contínua ⇒ é a função que determina a probabilidade de X assumir

valores em um determinado intervalo, por exemplo, P( a ≤ X ≤ b ).
Distribuição de Probabilidade Discreta

Se uma variável X pode assumir um conjunto discreto de valores X1, X2, ..., Xk, com as probabilidades
P1 , P2 , ... , Pk, respectivamente, sendo P1 + P2 + ... + Pk = 1, diz-se que está definida uma distribuição
de probabilidade discreta.
Exemplo-1 - Considere o experimento aleatório do exemplo anterior que consiste no lançamento

simultâneo de duas moedas. Considere também que X é a variável aleatória que mede o número de
caras obtidas no lançamento. A distribuição de probabilidade correspondente a variável aleatória X é
dada pela tabela:
X 0 1 2 Número de caras
P(X) 1/4 1/2 1/4 onde ∑ P(X) = 1
Assim, a probabilidade de não sair nenhuma cara é P(X=0) = ¼.

Observe que o evento “não sair nenhuma cara” corresponde ao ponto amostral (Co,Co), cuja
probabilidade de ocorrência é ¼, ou seja 1 em 4.
A probabilidade de sair uma cara é P(X=1) = ½, pois neste caso temos duas chances em 4 de sair
cara que são (Ca,Co) e (Co,Ca).
Qual a probabilidade de X ser menor do que 2 [P(X<2)] ?
Exemplo-2 - Suponha o experimento aleatório correspondente ao lançamento de um dado honesto e

que X represente o ponto obtido.
Então a distribuição de probabilidade de X é dada pela tabela:
X 1 2 3 4 5 6
P( X ) 1/6 1/6 1/6 1/6 1/6 1/6 ∑ P(X) = 1
Assim, a probabilidade de sair 4 no lançamento de um dado (X=4) é P(X = 4) = 1/6.
A probabilidade de sair um número menor ou igual a 4 ( X≤ 4) é:
P( X ≤ 4 ) = P(X=1) + P(X=2) + P(X=3) + P(X=4) = 1/6+1/6+1/6+1/6 = 4/6 = 2/3.
Distribuição de Probabilidade Contínua
Se X é uma variável aleatória contínua a função P(X) é denominada função de densidade de

probabilidade.
FIGURA 5.1
A área total limitada por essa curva e pelo eixo dos x é igual a 1 (ou seja, é igual a soma de todas as
probabilidades) e a área compreendida entre X = a e X = b dá a probabilidade de X estar entre a e b, ou
seja, P(a ≤ X ≤ b).
Valor Esperado
Suponhamos que a variável aleatória X assuma um dos valores x1, x2, ..., xk, com as respectivas
probabilidades p(x1), p(x2), ... , p(xk), onde p(x1) + p(x2) +...+ p(xk) = 1. Então o valor esperado desta
variável aleatória é definido por:
E (X) = ∑ xi . p(xi)
Exemplo: Suponha um jogo disputado com um dado honesto, em que um jogador ganha R$ 20,00 se o
resultado é 2, R$ 40,00 se o resultado é 4, perde R$ 30,00 se o resultado é 6, e não ganha nem perde
se aparecer qualquer das outras faces. Determine seu ganho esperado.
Seja X a variável aleatória que representa a quantia ganha em uma jogada qualquer.
Resultado 1, 3 ou 5 2 4 6
Xi R$ 0,00 + R$ 20,00 + R$ 40,00 - R$ 30,00
P(Xi) 3/6 1/6 1/6 1/6
O valor esperado E(X) da variável X é dado por: E (X) = ∑ xi . p(xi)
3 1 1 1
E( X ) = 0 × + 20 × + 40 × − 30 × = 5
6 6 6 6
Então em uma jogada o jogador pode esperar ganhar R$ 5,00.
Distribuições Discretas
Distribuição Binomial
Utiliza-se esse tipo de distribuição para designar (modelar) situações em que os dados podem ser
grupados em duas classes ou categorias como, por exemplo: respostas a um teste do tipo V ou F,
respostas do tipo “sim” ou “não” a um questionário, produtos com ou sem defeito, pessoas vacinadas
ou não vacinadas, datagramas transmitidos com erro ou sem erro, etc.
Seja p a probabilidade de um evento ocorrer em uma única tentativa (probabilidade de sucesso) e

q = 1 - p a probabilidade dele não ocorrer. Então a probabilidade do evento ocorrer exatamente x
vezes em n tentativas é dada por:
P( X = x) = C nx × p x × q n− x
Observação: Os experimentos que seguem esta distribuição devem satisfazer as seguintes condições:
• O experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n).
• As tentativas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os
resultados das seguintes.
• Em cada tentativa deve aparecer um dos dois possíveis resultados: sucesso ou insucesso.
• No decorrer do experimento, a probabilidade p de sucesso e a probabilidade q de insucesso
deverão permanecer constantes.
Exemplo-1- Qual a probabilidade de se obter exatamente 2 caras em 6 lances de uma moeda não
viciada.
Temos:
n=6 ⇒ número de jogadas
x=2 ⇒ número de ocorrências do evento desejado
p = ½ ⇒ probabilidade de ocorrência do evento desejado (sucesso) - dar cara
q = ½ ⇒ probabilidade de não ocorrência do evento desejado (insucesso) - não dar cara
Usando a fórmula acima obtemos:
2 4 6
⎛1⎞ ⎛1⎞ 6! ⎛1⎞ 15
P( X = 2) = C62 ×⎜ ⎟ ×⎜ ⎟ = ×⎜ ⎟ =
⎝2⎠ ⎝2⎠ 2!× 4! ⎝ 2 ⎠ 64
Exemplo-2 - Qual a probabilidade de se obter pelo menos 4 caras em 6 lances de uma moeda não
viciada.
Solução: Aqui como é pedida a probabilidade de se obter pelo menos 4 caras, temos que somar as
probabilidades de se obter 4, 5 ou 6 caras.
Assim P(X ≥ 4) = P(X = 4) + P(X = 5) + P(X = 6)
Temos então:
n=6 ⇒ número de jogadas
x = 4, 5 ou 6 ⇒ número de ocorrências do evento desejado (4, 5 ou 6 caras)
p=½ ⇒ probabilidade de ocorrência do evento desejado (sucesso) - dar cara
q=½ ⇒ probabilidade de não ocorrência do evento desejado (insucesso) - não dar cara
Escrevendo as fórmulas obtemos:
4 2 5 1 6 0
⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞
P ( X = 4) + P ( X = 5) + P ( X = 6) = C 64 × ⎜ ⎟ × ⎜ ⎟ + C 65 × ⎜ ⎟ × ⎜ ⎟ + C 66 × ⎜ ⎟ × ⎜ ⎟
⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠
4 2 5 1 6 0
6! ⎛ 1 ⎞ ⎛ 1 ⎞ 6! ⎛ 1 ⎞ ⎛ 1 ⎞ 6! ⎛ 1 ⎞ ⎛ 1 ⎞
P ( X = 4 ) + P ( X = 5) + P ( X = 6 ) = ×⎜ ⎟ ×⎜ ⎟ + ×⎜ ⎟ ×⎜ ⎟ + ×⎜ ⎟ ×⎜ ⎟
4 !×2 ! ⎝ 2 ⎠ ⎝ 2 ⎠ 5!× 1! ⎝ 2 ⎠ ⎝ 2 ⎠ 6!× 0! ⎝ 2 ⎠ ⎝ 2 ⎠
15 6 1 22
P ( X ≥ 4) = + + =
64 64 64 64
Propriedades da distribuição Binomial
Média μ = n× p
Variância σ 2 = n× p×q
Desvio Padrão σ = n× p×q
Exemplo: Calcular a média (o número esperado) de caras em 100 lançamentos de uma moeda não
viciada.
Temos:
n = 100 p = ½ (probabilidade de ocorrer cara) - sucesso
μ = 100 × 1/2 = 50 ⇒ Esse é o valor que responderíamos intuitivamente !!!!
A variância e o desvio padrão são dados por:
Variância σ2 = 100 × ½ × ½ = 25
Desvio padrão σ = 25 = 5
Distribuição de Poisson
No caso da distribuição Binomial a variável de interesse era o número de sucessos em um intervalo de

tempo discreto (n provas). Muitas vezes, entretanto estamos interessados no número de ocorrências
em um intervalo contínuo como, por exemplo, número de chamadas telefônicas por minuto,
quantidade de erros de impressão por página impressa, número de partículas emitidas por uma
substância radioativa, número de acessos a um site em um intervalo de tempo, etc.
A distribuição de Poisson é definida como se segue:
λx e − λ
P( X = x) = e = 2,71828... (número de Euler)
x!
onde, x = 0,1,2,3,4.... é o número de ocorrências (x ≥ 0) que se deseja calcular a probabilidade e
λ > 0 é o número médio dessas ocorrências (sucessos) no intervalo ou região considerada.
Propriedades da distribuição de Poisson
• os eventos em um determinado intervalo são independentes.

• a probabilidade de ocorrência em um intervalo é proporcional ao tamanho do intervalo.
• a probabilidade de ocorrência de mais de um sucesso em um intervalo muito pequeno é
desprezível.
A média a variância e o desvio-padrão são dados por:
Média μ =λ
Variância σ2 =λ
Desvio Padrão σ= λ
Exemplo-01- Suponhamos que 300 erros de impressão sejam distribuídos aleatoriamente em um livro
com 500 páginas. Qual a probabilidade de cada página conter exatamente 2 erros.
Temos:
n = 300 (há 300 erros de impressão)
A probabilidade de um erro ocorrer em cada página é p = 1/500 (o livro tem 500 páginas).
A média de erros por página (λ) é dada por: λ = n ×p = 300 ×1/500 = 0,6.
Agora podemos utilizar Poisson para calcular a probabilidade desejada onde x = 2 e λ = 0,6.
0,6 2 e −0,6 0,36 × 2,71828−0,6

P ( X = 2) = = = 0,0988 ≅ 0,1
2! 1× 2
OBS. Se quiser pode utilizar a função POISSON no MS EXCEL para fazer os cálculos com os
seguintes parâmetros: = POISSON( x ; λ; CUMULATIVO) onde:
x = 2 (número de sucessos) λ = 0,6 (média)
CUMULATIVO=FALSO (significa que queremos o valor para x=2. Se CUMULATIVO for VERDADEIRO
ela fará o cálculo para x=0, x=1 e x=2 e dará como resultado a soma desses valores).
Distribuições Contínuas
Distribuição Normal - Um dos mais importantes exemplos de distribuição de probabilidade contínua

é a chamada distribuição normal. Muitas das variáveis analisadas especialmente em pesquisas
econômicas seguem essa distribuição ou dela se aproximam, sendo aplicada em inúmeros fenômenos
e utilizada para o desenvolvimento teórico da Estatística. Uma distribuição normal é representada
graficamente como abaixo.
FIGURA 5.2
Assim, dizemos que uma variável aleatória X que pode ser representada por um gráfico como o da
figura acima tem distribuição Normal com média μ e desvio padrão σ, e representamos da seguinte
maneira X ∼ N ( μ , σ ). Ou seja, X é uma Normal com média μ e desvio padrão σ.
A equação da curva Normal é dada pela expressão abaixo, onde x é o valor da variável aleatória
considerada e μ e σ são parâmetros conhecidos da variável, ou seja, média e desvio padrão.
− (x − μ )
2
1
f ( x) = . e 2σ
2
, onde π = 3.14159 e e = 2.71828
σ 2π
Assim, a curva normal é uma distribuição que possibilita determinar probabilidades associadas a todos
os pontos da linha de base (valores de x), ou seja, é uma distribuição de freqüências, sendo a
freqüência total sob a curva (soma das probabilidades) igual a 100%.
Propriedades da Normal
Uma curva Normal tem forma de sino, é simétrica (Média = Moda = Mediana) e Unimodal.
Adicionalmente são válidos os valores de probabilidades exibidos na figura e tabela abaixo.
Intervalo Probabilidade (%)
μ±1σ 68,26%
μ±2σ 95,45%
μ±3σ 99,73%
FIGURA 5.3
Normal Padrão
Dizemos que a variável aleatória Z tem distribuição normal padrão quando μ = 0 e σ = 1, e utilizamos
a seguinte notação Z ∼ N (0,1).
Toda variável X ∼ N(μ ,σ) pode ser reduzida a uma variável com distribuição normal padrão (Z) através
da seguinte transformação:
X −μ
Z= , onde X ∼ N(μ ,σ) e Z ∼ N( 0, 1).
σ
Ou seja , a variável Z (transformada) é obtida subtraindo-se de cada valor observado de X sua média μ
e em seguida dividindo-se pelo seu desvio padrão σ. As probabilidades associadas à distribuição

normal padrão (Z) são encontradas em tabelas (ver última página), não sendo necessário realizar
cálculos para determiná-las.
Observações
• A variável aleatória X pode assumir todo e qualquer valor real.
• A representação gráfica da distribuição normal é uma curva em formato de sino, simétrica em
relação à média (μ). Tal representação recebe o nome de Curva Normal ou Curva de Gauss
(FIGURA 5.4).
• A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade da variável aleatória X assumir qualquer valor real entre (-∞ e + ∞).
• Como a curva é simétrica em torno de μ , a probabilidade de ocorrer um valor maior do que a

média é igual à probabilidade de ocorrer um valor menor do que a média, isto é,
P( X > μ ) = P( X < μ ) = 0,5 = 50%.
FIGURA 5.4
Exemplo-01: Seja X a variável aleatória que representa os diâmetros de parafusos produzidos por
determinada máquina. Suponha que essa variável tenha distribuição normal com média μ = 2 cm e
desvio padrão σ = 0,04 cm. Calcular a probabilidade de um parafuso produzido pela máquina ter um
diâmetro com valor entre 2,0 cm e 2,05 cm.
Temos: X ~ N( 2; 0.04)
Queremos calcular P( 2,0 < x < 2,05 ).
Para poder utilizar os valores tabelados da distribuição normal padrão precisamos transformar os
valores da variável X em valores da variável Z utilizando a transformação: Z =

X −μ
σ
Temos então:
x1 = 2,0 x2 = 2,05 μ=2 e σ = 0,04
2−2 2,05 − 2
z1 = =0 z2 = = 1,25
0,04 0,04
Então P( 2,0 < X < 2,05 ) = P( 0 < Z < 1,25)
Da tabela NORMAL obtemos que P( 0 < z < 1,25) = 0,3944 = 39,44%.
Propriedades da distribuição Normal
Média μ
Variância σ2
Desvio Padrão σ
Relação entre as distribuições Binomial e Normal
Se N (número de observações) for grande, e se nem p nem q estiverem muito próximos de zero, a
distribuição Binomial pode ser aproximada por uma distribuição Normal, cuja variável reduzida será
dada por:
X − Np
Z=
Npq
Na prática, a aproximação é muito boa, quando tanto N×p quanto N×q são superiores a 5.
Ao utilizar uma distribuição contínua como aproximação de uma distribuição discreta, é
conveniente o uso da correção de continuidade, que consiste em adicionar ou subtrair 0,5 de
acordo com a forma da probabilidade solicitada:
• Subtrair 0,5 de x quando é solicitado P( X ≥ x )
• Subtrair 0,5 de x quando é solicitado P( X > x )
• Adicionar 0,5 a x quando é solicitado P( X ≤ x)
• Adicionar 0,5 a x quando é solicitado P( X < x)
Exemplo: Determinar a probabilidade de se obter entre 3 e 6 caras, inclusive, em 10 lances de uma
moeda honesta, utilizando (a) distribuição binomial; (b) aproximação normal.
Solução
(a) Utilizando distribuição Binomial
Nesse caso será necessário calcular:
P( 3 ≤ X ≤ 6) = P( X = 3 ) + P( X = 4 ) + P( X = 5 ) + P( X = 6 )
Temos então:
n = 10 (número de lances - lançamentos da moeda)
x = 3, 4, 5 ou 6 (resultados desejados 3, 4, 5 ou 6 caras)
p=½ (probabilidade de sair cara - sucesso !)
q=½ (probabilidade de não sair cara - insucesso !)
Fórmula da Binomial P( X = x) = C nx × p x × q n− x
3 7 4 6 5 5 6 4
⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞ ⎛1⎞
P (3 ≤ X ≤ 6) = C10
3
× ⎜ ⎟ × ⎜ ⎟ + C10
4
× ⎜ ⎟ × ⎜ ⎟ + C10
5
× ⎜ ⎟ × ⎜ ⎟ + C10
6
×⎜ ⎟ ×⎜ ⎟
⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠ ⎝2⎠
P(3 ≤ X ≤ 6) = 0,7734 (77,34%).
(b) Utilizando aproximação Normal

Para usar a aproximação pela Normal deveremos utilizar a correção de continuidade e calcular P(2,5
≤ X ≤ 6,5). Ou seja, como é P(X ≥ 3) subtraímos 0,5 de 3 o que resulta 2,5 e como é P(X≤ 6)
adicionamos 0,5 o que resulta em 6,5.
A variável X será aproximada por uma distribuição Normal com:
Média: μ = n×p = 10 × ½ = 5
1 1
Desvio Padrão: σ = npq = 10 × × = 2,5 = 1,58
2 2
Então X é uma Normal com média μ = 5 e desvio padrão σ =1,58, ou seja X ~ N(5 ; 1,58).
Normalizando os valores de X (2,5 e 6,5) para obter uma Normal padronizada Z ~ (0,1) temos:
2,5 − 5 6,5 − 5
z1 = = −1,58 z2 = = 0,95
1,58 1,58
Logo P(2,5 ≤ X ≤ 6,5) = P(-1,58 ≤ Z ≤ 0,95)
Da tabela NORMAL obtemos os seguintes valores:
P(-1,58) = P(1,58) = 0,4429
P(0,95) = 0,3289
Logo a probabilidade desejada equivale a P(-1,58 ≤ Z ≤ 0,95 ) = 0,4429 + 0,3289 = 0,7718 (77,18%).
Perceba a diferença entre a solução utilizando a Binomial e a solução utilizando a aproximação pela
Normal (0,7734 - 0,7718) = 0,0016.
EXERCÍCIOS - BINOMIAL - POISSON - NORMAL
BINOMIAL
01- Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda.
a) 3/16 b) 5/16 c) 6/16 d) 7/16 e) 9/16
02- Jogando-se um dado três vezes, determine a probabilidade de se obter um múltiplo de 3 duas vezes.
a) 1/9 b) 2/9 c) 1/3 d) 4/9 e) 5/9
03- (AFRF) Em uma cidade, 10% das pessoas possuem carro importado. Dez pessoas dessa cidade
são selecionadas ao acaso e com reposição. A probabilidade de que exatamente 7 das pessoas
selecionadas possuam carro importado é:
a) (0,1)7 (0,9)3
b) (0,1)3 (0,9)7
c) 120 (0,1)7 (0,9)3
d) 120 (0,1)7 (0,9)7
e) 120 (0,1)7 (0,9)
04- (AFC) Sabendo-se que no processo de um determinado tipo de máquina a probabilidade de

ocorrência de algum erro é 0,02, qual a probabilidade p de que ao montar 4 dessas máquinas ocorram
erros em exatamente 2 das montagens ?
a) p= 0,04
b) p= 0,0004
c) p = 0,022 . 0,982
d) p = 6 . 0,022 . 0,982
e) p =24. 0,022 . 0,982
05- (BACEN-ESAF) Um fabricante de discos rígidos sabe que 2% dos discos produzidos falham durante
o período de garantia. Assinale a opção que dá a probabilidade de que pelo menos um disco falhe numa
amostra aleatória de 10 discos tomados da linha de produção.
a) (0,98)10 - (0,02)10
b) (0,02)10
c) 1 - (0,98)10
d) 1 - (0,02)10
e) 0,02
EXERCÍCIO - DISTRIBUIÇÕES DE PROBABILIDADE
06- (ICMS-SP) Os produtos de uma empresa são vendidos em lotes de 4 peças e, se houver uma ou
mais peças defeituosas no lote, o comprador não paga. Se a proporção de defeituosos da fábrica é de
10%, então, a probabilidade de isso ocorrer é de, aproximadamente:
a) 0,19
b) 0,27
c) 0,34
d) 0,40
e) 0,46
07- (CÂMARA DEPUTADOS-2007) Sabe-se que existem inúmeros fornecedores de um material X.

Porém, somente 60% deles estão aptos a participar de uma licitação para fornecimento do material X
para o setor público. Então, a probabilidade de que, numa amostra aleatória simples de 3 destes
fornecedores, pelo menos um esteja apto a participar de uma licitação para fornecimento do material X
para o setor público é:
a) 60,0%
b) 78,4%
c) 80,4%
d) 90,4%
e) 93,6%
08- (INPI-2009) Marcelo fez uma prova de múltipla escolha. Cada questão tinha cinco alternativas,
sendo apenas uma correta. Sabendo-se que ele marcou aleatoriamente três questões, a probabilidade
de ter acertado pelo menos uma delas é de:
a) 0,24
b) 0,488
c) 0,512
d) 0,6
e) 0,2
09- (ICMS-MG) Suponha que a probabilidade de que se encontre erro contábil grave em uma auditoria
seja de 0,2. Se dez auditorias independentes são realizadas, assinale a opção que dá a probabilidade de
que não mais do que uma detecte erro contábil grave.
a) 2,8 (4/5)
b) 0,400
c) (0,2)10
d) 2,8 (4/5)10
e) 2,8 (4/5)9
10- (BACEN-2006) A probabilidade de um associado de um clube pagar a sua mensalidade com atraso
é de 5%. Entre 5 associados escolhidos aleatoriamente, a probabilidade de pelo menos um pagar a sua
mensalidade sem atraso é de:
a) 1 - (0,95)5
b) (0,95)5
c) 4,75(0,95)5
d) 5 (0,95)5
e) 1 - (0,05)5
11- (ICMS-RJ-2010 FGV) 40% dos eleitores de uma certa população votaram, na última eleição, num
certo candidato A. Se cinco eleitores forem escolhidos ao acaso, com reposição, a probabilidade de que
três tenham votado no candidato A é igual a:
(A) 12,48%.
(B) 17,58%.
(C) 23,04%.
(D) 25,78%.
(E) 28,64%.
12- (AFRF-2009-ESAF) Em um experimento binomial com três provas, a probabilidade de ocorrerem

dois sucessos é doze vezes a probabilidade de ocorrerem três sucessos. Desse modo, as
probabilidades de sucesso e fracasso são, em percentuais, respectivamente, iguais a:
a) 80% e 20%
b) 30% e 70%
c) 60% e 40%
d) 20% e 80%
e) 25% e 75%
POISSON
13-(CGM/2003) A procura semanal de certa peça sobressalente pode ser modelada segundo uma
distribuição de Poisson com média igual a 0,15. Em uma semana, a probabilidade de ser pedida ao
-15
menos uma peça é, aproximadamente: (e ) = 0,8607.
a) 14%
b) 15%
c) 86%
d) 85%
e) 16%
14- (AFRF-2009) O número de petroleiros que chegam a uma refinaria ocorre segundo uma distribuição
de Poisson, com média de dois petroleiros por dia. Desse modo, a probabilidade de a refinaria receber
no máximo três petroleiros em dois dias é igual a:
32 −4 3 4 71 −4 71 −2 32 −2
a) e b) e c) e d) e e) e
73 71 3 3 3
15-(ICMS/SP-2009) O número de pessoas que chega ao guichê de uma repartição pública para
autuação de processos apresenta uma distribuição de Poisson a uma taxa de duas pessoas por minuto.
A probabilidade de que nos próximos 2 minutos chegue pelo menos uma pessoa neste guichê é:
(Observação: e = 2,71828...)
a) (e4 - 1). e-4
b) 4.e-4
c) (e4 - 4).e-4
d) 2. [ (e2 − 1)].e-2
e) (e2 - 2).e-2
16- (MPE/PE-2006) O número de falhas de certo tipo de placa térmica tem distribuição de Poisson, com
taxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário, é necessário cobrir uma
superfície de 2m por 2m com essa placa. A probabilidade de que haja pelo menos uma falha nessa
superfície é de:
a) e-0,1
b) 1 - e-0,1
c) 1 - e-0,4
d) e-0,4
e) 1 - 1,4 e-0,4
17- (MPU-2007) O número de pacientes atendidos por um clínico geral segue uma distribuição de
Poisson com taxa de 4 pacientes por hora. A probabilidade de que pelo menos um paciente consulte o
clínico geral em um período de 15 minutos é:
a) 1 - e-1
b) 1 - e4
c) e-4
d) e4
e) e-1
18- (TRT-7aR-2009) Seja X a variável aleatória que representa o número de chamadas por minuto
recebidas por um PBX. Sabe-se que X tem média λ e que P(X = 3) = P(X = 4). Supondo que a
distribuição de Poisson seja adequada para X, a probabilidade de que ocorra uma chamada em 30
segundos é:
a) e-4
b) 4.e-4
c) e-2
d) 2.e-2
e) 1 - 2.e-2
19- (MEC-2009) O número de clientes que chega a cada hora a uma empresa tem Distribuição de
2 k −2
Poisson, com parâmetro 2, ou seja, a probabilidade de que cheguem k clientes é dada por e para
k!
k = 0, 1, 2, .... Qual é a probabilidade de que, em uma determinada hora, cheguem dois ou mais
clientes? (Dado e-2 = 0,14).
a) 0,28
b) 0,35
c) 0,42
d) 0,58
e) 0,72
20-(TRF) A probabilidade de que um item produzido por uma máquina seja defeituoso é de 10%. Uma
amostra de 30 itens produzidos por esta máquina é selecionada ao acaso. Use a aproximação pela
distribuição de Poisson para determinar a probabilidade de que não mais do que um item defeituoso seja
encontrado nesta amostra.
a) 4e-3
b) 4e-2
c) 3e-3
d) 1 - 4e-3
e) 1 - 3e-3
NORMAL
21-(AFRE-MG-2005/ESAF) As vendas em um mês de determinado produto, de custo unitário, em reais,

tem distribuição aproximadamente normal com média de R$ 500,00 e desvio padrão de R$ 50,00. Se a
empresa decide fabricar, em dado mês, 600 unidades do produto, assinale a opção que dá a
probabilidade de que a demanda não seja atendida. (Em sua resposta faça uso da tabela da função de
distribuição φ (x) da normal padrão dada abaixo).
x φ (x)
1,85 0,968
1,96 0,975
2,00 0,977
2,12 0,983
a) 5,0%
b) 3,1%
c) 2,3%
d) 2,5%
e) 4,0%
22-(MP-RO-ANALISTA-2006/CESGRANRIO) Se X tem distribuição normal com média 10 e variância 4,

a probabilidade de que X > 11, aproximadamente, vale:
(A) 0,25
(B) 0,28
(C) 0,33
(D) 0,31
(E) 0,46
23-(AFTE-MS-2006/FGV) Se X tem distribuição normal com média 4 e variância 9, a probabilidade de

X > 6 vale, aproximadamente:
(A) 0,25
(B) 0,28
(C) 0,33
(D) 0,37
(E) 0,46
24-(SERPRO-Analista Sistemas-ESAF) Suponha que o tempo que a Receita Federal leva no processo
de devolução do imposto pago a mais tenha distribuição normal com média de 12 semanas e
desvio-padrão de 3 semanas. Assinale a opção que estima a proporção de contribuintes que recebem a
devolução em no máximo 6 semanas. A tabela abaixo dá os valores de P{0<X<Z} quando X tem
distribuição normal padrão para valores selecionados de Z. Por exemplo, P{0<X<1,56}=0,4406.
Z 00 06 08
1,0 0,3413 0,3554 0,3599
1,5 0,4332 0,4406 0,4429
1,9 0,4332 0,4750 0,4761
2,0 0,4772 0,4803 0,4812
a) 50,00%
b) 5,56%
c) 43,32%
d) 2,28%
e) 47,72%
25-(SESPA-ESTATÍSTICO-2006/NCE) Uma variável aleatória X tem distribuição normal com média 20 e
variância 144. A probabilidade de que X seja maior do que 14 é aproximadamente igual a:
(A) 45%;
(B) 53%;
(C) 62%;
(D) 69%;
(E) 76%.
26-(SUSEP-Analista Técnico Atuária-ESAF) Uma loja vende lavadoras e secadoras de roupa. A

distribuição conjunta do número N1 de secadoras e do número N2 de lavadoras vendidas num mesmo
dia é dada na tabela abaixo. Assinale a opção que dá a probabilidade de que a venda, num mesmo dia,
de lavadoras seja igual à de secadoras.
N1 | N2 0 1 2 3
0 0,25 0,13 0,04 0,02
1 0,15 0,11 0,02 0,01
2 0,08 0,06 0,05 0,02
3 0,01 0,01 0,01 0,03
a) 0,54 b) 0,50 c) 0,49 d) 0,44 e)0,19
27- (TCDF/CESP-UNB) O número de horas que um analista do TCDF gasta examinando cada um dos
processos submetidos ao órgão tem distribuição normal, simétrica, com média de 10 horas e desvio
padrão de 2 horas. É correto afirmar
a. que nenhum processo levará mais de 30 horas para ser examinado
b. que o número de processos que consomem mais de 15 horas de trabalho é igual ao número de
processos que despendem menos de 5 horas.
c. que, em 50% dos casos, o tempo despendido ao exame do processo será de exatamente 10 horas.
d. que a moda da distribuição de horas é igual à mediana, que é diferente da média.
e. que 10% dos processos devem gastar entre 8 e 12 horas para serem examinados.
28-(AFC/ESAF) Um parâmetro de malha de determinado tributo tem distribuição Normal com média 12 e
desvio padrão 4. Considerando que ficarão retidas em malha declarações que apresentarem o valor do
parâmetro maior do que 22, e que a população é de 20.000.000 declarantes, o número de declarações
retidas no atual exercício fiscal é:
a) 12.400
b) 250.000
c) 220.000
d) 124.000
e) 62.000
29- (AFC/ESAF) Em relação a questão anterior quanto deve ser o ponto de corte para que fiquem
retidas em malha 80.000 declarações:
a) 22,6
b) 19,7
c) 20,8
d) 23,7
e) 21,3
30-(SUSEP-ANALISTA TÉCNICO-2006/ESAF) Se a variável X pode assumir um conjunto infinito
(contínuo) de valores, o polígono de freqüência relativa de uma amostra torna-se uma curva contínua,
cuja equação é Y = p(X). A área total limitada por essa curva e pelo eixo dos X é igual a 1 e a área
compreendida entre as verticais X = a e X = b, sendo a < b e, ambos, contidos na área total da curva, a
probabilidade de X cair neste intervalo a e b é dada por:
a) P (a<X<b), composta pela soma de P(X=a) + P(X=b).
b) P (a<X<b), composta pela integral de P(X=a) até P(X=b).
c) P (a>X>b), composta pela soma de P(X=a) – P(X=b).
d) P (a>X>b), composta pela integral de P(X=a) até P(X=b).
e) P (a< X<b), composta pela P(X=b), de forma cumulativa até o ponto b.
GABARITOS
EXERCÍCIOS
01-B
02-B
03-C
04-D
05-C
06-C
07-E
08-B
09-E
10-E
11-C
12-D
13-A
14-C
15-A
16-C
17-A
18-D
19-D
20-A
21-C
22-D
23-A
24-D
25-D
26-D
27-B
28-D
29-A
30-B
TABELA NORMAL PADRÃO
Quantis da distribuição Normal Padrão: P(0 ≤ Z ≤ z)
Segunda decimal de z
0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
Parte inteira e primeira decimal de z
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
MÓDULO- 08-CORRELAÇÃO E REGRESSÃO
Correlação - Um dos maiores problemas do investigador de fenômenos humanos e físicos é

estabelecer um modelo matemático que descreva e explique o fenômeno real com uma boa
aproximação. Para isso, é necessário que se consiga medir e avaliar o grau de relação existente entre
as variáveis do modelo. Assim, correlação é o estudo da interdependência entre duas ou mais variáveis
quantitativas. Podemos medir, por exemplo, se a demanda de um produto decresce linearmente com o
acréscimo do seu preço, ou, se o número de filhos de uma família tem uma relação forte com o grau de
instrução dos pais.
A correlação pode ser simples ou múltipla.
Correlação Linear Simples: quando se estuda a relação entre duas variáveis.
Correlação Linear Múltipla: quando se estuda a relação entre mais de duas variáveis.
Correlação Linear Simples - Para avaliar o grau de correlação linear entre duas variáveis aleatórias X e
Y usa-se o coeficiente de correlação de Pearson assim definido:
n ∑ xy − ∑ x ∑ y
r= , onde n é o número de observações.
[ n∑ x 2
− ( ∑ x)
2
] × [ n∑ y 2
− ( ∑ y)
2
]
Demonstra-se que r varia entre -1 e 1 ⇒ -1 ≤ r ≤ 1
Tipos de Correlação
Correlação Linear Positiva Perfeita - a

Correlação Linear Positiva - a correlação linear correlação será perfeita se os pontos estiverem
será positiva se valores crescentes de Y estão perfeitamente alinhados como mostra a figura
associados a valores crescentes de X, ou valores acima (r = 1) (FIG-B).
decrescentes de Y estiverem associados a valores
decrescentes de X (0 < r < 1) (FIG-A).
Correlação Linear Negativa - quando valores

crescentes de Y estão associados a valores Correlação Negativa Perfeita - quando os
decrescentes de X, ou valores decrescentes de Y pontos estão perfeitamente alinhados em sentidos
estiverem associados a valores crescentes de X. opostos, ou seja, valores crescentes de Y
(- < r < 0) (FIG-C). correspondem a valores decrescentes de X e
vice-versa (r = -1) (FIG-D).
MÓDULO-08-CORRELAÇÃO E REGRESSÃO
Correlação Nula - quando não há relação entre as variáveis X e Y, ou seja, quando as variações de X e
Y são independentes (r = 0) (FIG-E).
Neste caso as variáveis X e Y são ditas independentes.
Observações:
1. Observando os diagramas de dispersão conclui-se que, quanto mais os pontos estiverem próximos da reta,
mais forte será a correlação, ou seja, r estará mais próximo de ± 1. Quanto mais fraca for a correlação,
mais próximo de zero(0) será o coeficiente de correlação(r).
2. Se duas variáveis aleatórias X e Y são independentes o coeficiente de correlação entre elas será zero (0).
3. Para o cálculo da correlação é conveniente montar uma tabela como a seguinte:
Y X X2 Y2 XxY
ΣY ΣX Σ X2 Σ Y2 ΣXxY
Exemplo-1: Calcular o coeficiente de correlação linear para as variáveis X e Y

2 2
X Y X Y XxY
2 10 4 100 20
4 8 16 64 32
6 6 36 36 36
8 10 64 100 80
10 12 100 144 120
Σ = 30 46 220 444 288
5 × 288 − 30 × 46 60
r= = = 0,416
[5 × 220 − 30 ]× [5 × 444 − 46 ]
2 2 144,22
Covariância ⇒ a covariância representa a variação de X e Y, e é assim definida:
S X ,Y =
∑ XY − nXY ou S XY =
∑ XY − XY ⇒ a média do produto menos o produto das médias.
n n
Onde:
SXY ⇒ covariância entre as variáveis X e Y.
X ⇒ média aritmética de X.
Y ⇒ média aritmética de Y.
n ⇒ número de observações.
Assim, Covariânica é “a média do produto menos o produto das médias”.
Uma outra fórmula também muito utilizada para a covariância é:
S XY =
∑ (X − X )(Y − Y )
n
Ou seja, Covariância também é “a média do produto dos desvios”.
A partir do conceito de covariância, obtêm-se uma fórmula mais simples para o Coeficiente de
Correlação entre duas variáveis aleatórias X e Y:
S X ,Y
Coeficiente de Correlação ⇒ r = onde:
S X × SY
Sxy ⇒ covariância entre X e Y.
Sx ⇒ desvio-padrão de X.
Sy ⇒ desvio-padrão de Y.
Exemplo-2: Usando os dados da tabela do Exemplo-1, calcular o coeficiente de correlação entre as

variáveis X e Y.
Temos: X = 30/5 = 6 Y = 46/5 = 9,2
S2x =
∑(x i − x)2
=
∑x 2
i
− x2 =
220
− 62 = 44-36 = 8 ⇒ Sx = 2,83
n n 5
S2Y =
∑( y i− y)2
=
∑y 2
i
− y2 =
444
− 9,2 2 = 88,8 - 84,64 = 4,16 ⇒ SY = 2,04
n n 5
A covariância é dada por: ⇒ S XY =

∑ XY − XY ⇒ S XY =
288
− 6 × 9,2 ⇒ SXY = 2,4.
n 5
S X ,Y 2,4
Assim, o coeficiente de correlação será: r = ⇒ r= ⇒ r = 0,416.
S X × SY 5,77
Propriedades da Covariância (Cov)

• Somando-se ou subtraindo-se uma constante a uma das variáveis a Covariância não se altera.
• Multiplicando-se ou dividindo-se uma das variáveis por uma constante a Covariância ficará
multiplicada ou dividida por essa constante.
Operação Covariância Exemplo

Somar uma constante a uma das variáveis Não se altera Cov(X + k , Y) = Cov(X,Y)
Subtrair uma constante de uma das variáveis Não se altera Cov(X - k , Y) = Cov(X,Y)
Multiplicar por uma constante uma das variáveis Fica multiplicada pela constante Cov(kX , Y) = k Cov(X,Y)
Dividir por uma constante uma das variáveis Fica dividida pela constante Cov(X/k ,Y) = Cov(X,Y)/ k
Exemplos:
Cov(4+X,Y) = Cov(X,Y) ⇒ somar uma constante (4) a X.
Cov(X,Y+4) = Cov(X,Y) ⇒ somar uma constante (4) a Y.
Cov(4X,Y) = 4×Cov(X,Y) ⇒ multiplicar X por uma constante (4).
Cov(X, 4Y) = 4×Cov(X,Y)⇒ multiplicar Y por uma constante (4).
Cov(X/4,Y) = Cov(X,Y)/4 ⇒ dividir X por uma constante (4).
Cov(X,Y/4) = Cov(X,Y)/4 ⇒ dividir Y por uma constante (4).
Cov(2X,5Y) = 2×5×Cov(X,Y) = 10×Cov(X,Y) ⇒ multiplicar X (por 2) e Y (por 5).
Cov(2X+3, 5Y+4) = 10×Cov(X,Y) ⇒ as constantes 3 e 4 como estão somadas não afetam a covariância.
Regressão
Regressão Linear Simples - a análise de regressão tem por objetivo descrever através de um
modelo matemático, a relação existente entre duas variáveis (X e Y) a partir de n observações dessas
variáveis. Supondo X a variável explicativa (independente) e Y a variável explicada (dependente)
pode-se escrever que: Y = f (X), ou seja, a variável Y é função da variável X. Considera-se que Y é uma
variável aleatória e que a relação entre X e Y não é regida apenas por uma lei matemática. Assim, a
relação entre X e Y deve ser escrita de forma mais correta como Y= f (X) + e, onde e é uma variável que
irá captar as influências sobre Y não decorrentes de X. Assim, a regressão linear simples busca
determinar a equação de uma reta que descreva a relação entre duas variáveis. A reta que é descrita
por esta equação chama-se reta de regressão. O processo de determinação dos parâmetros da reta de
regressão é chamado de ajustamento.
A reta ajustada é representada por: Y$ = a + bX , onde a e b são os parâmetros do modelo:
a - ponto onde a reta ajustada corta o eixo da variável Y (coeficiente linear-intercept).

b - tangente do ângulo que a reta forma com uma paralela ao eixo da variável X (coeficiente angular).
O processo para obtenção da reta ajustada é denominado método dos mínimos quadrados. Este
processo consiste em minimizar a soma dos quadrados dos desvios entre Y e Y$ , ou seja:
∑ê 2
= ∑ (Y − Yˆ ) 2 = ∑ (Y − a − bX ) 2 é mínima, onde:
Y ⇒ valor observado (real).

Y$ ⇒ valor estimado (pelo modelo de regressão).
Para obtenção dos estimadores de a e b aplica-se a condição necessária de mínimo à função
∑ (Y − Y$) 2
, ou seja, deriva-se em relação aos parâmetros (a e b) e iguala-se as derivadas a zero.
Os parâmetros a e b são dados por:

n ∑ XY − ∑ X ∑ Y
a=Y-bX b= ou
n∑ X 2 − (∑ X ) 2
x
S XY
b= onde: SXY é a covariância entre X e Y e S2x é a variância de X.
S X2
Propriedades da Regressão
Covariância (SXY)
SXY > 0 ⇒ correlação positiva entre X e Y.
SXY = 0 ⇒ não há correlação.
SXY < 0 ⇒ correlação negativa entre X e Y.
Coeficiente Angular (b)

b > 0 ⇒ correlação positiva (a reta forma um ângulo agudo com o eixo dos X [0< θ < 90º] ).
b = 0 ⇒ não há correlação (reta paralela ao eixo dos X).
b < 0 ⇒ correlação negativa(a reta forma um ângulo obtuso com o eixo dos X (θ > 90º).
Coeficiente Linear (a)

a > 0 ⇒ a reta corta o eixo dos y acima da origem.
a = 0 ⇒ a reta passa pela origem.
a < 0 ⇒ a reta corta o eixo dos y abaixo da origem.
Hipóteses da Análise de Regressão - Pressupostos Básicos
1- Equação linear do modelo de regressão ⇒ Yi = a + bX i + ei .

2- Normalidade ⇒ ei (desvio ou resíduo) é uma variável aleatória com distribuição Normal.
3- Média zero ⇒ todos os desvios têm média zero.
4- Homocedasticidade ⇒ todos os desvios têm a mesma variância (σ 2).
5- Os desvios são não auto-regressivos ⇒ significa que os desvios são independentes.
Assim: Covariância(ei , ej )=0 se i ≠ j, ou seja a covariância entre dois desvios quaisquer é zero.
6- Xi não estocástico ⇒ Xi é uma variável não estocástica, os valores de Xi são conhecidos e
perfeitamente determinados.
Exemplo-3: Dada a tabela abaixo determinar a reta de regressão entre X e Y.
X Y
1 1
3 2
4 4
6 4
8 5
9 7
11 8
14 9
Σ 56 Σ 40
Precisamos abrir colunas na tabela para X2, Y2 e XY

2 2
X Y X Y XY
1 1 1 1 1
3 2 9 4 6
4 4 16 16 16
6 4 36 16 24
8 5 64 25 40
9 7 81 49 63
11 8 121 64 88
14 9 196 81 126
Σ 56 Σ 40 524 256 364
Temos então:
X = 56/8 = 7 → média de X Y = 40/8 = 5 → média de Y
S X2 =
∑ xi2 − x 2 = 524 − 7 2 = 16,54 Sxy = ∑ XY − XY = 364/8 - 7×8= 10,5
n 8 n
S XY
Os parâmetros do modelo linear são dados por: b = e a = Y - bX
S X2
Temos então:
b = 10,5/16,5 ⇒ b = 0,636
a = Y - b X = 5 - 0,636 x 7 = 5 - 4,452 ⇒ a = 0,548
Utilizando o modelo linear: Y$ = a + bX vem:

Y$ = 0,548 + 0,636.X que é o modelo linear ajustado aos dados da tabela.
↑ ↑
a b
Ajustamento de Curvas
Em muitos casos a forma funcional entre as variáveis X e Y não é linear, ou seja, a variável Y não é uma
função linear de X. Veremos a seguir os principais modelos não lineares que podem ser linearizados,
utilizando-se uma transformação de variáveis.
Curva Geométrica - Função Potência Forma Teórica ⇒ Y = a Xb
Utilizando logaritmo e transformando o modelo teórico acima, vem: log Y = log a + b log X.
Fazendo: y = log Y x = log X A = log a
Temos: y = A + bx → modelo linearizado.
O ajustamento é feito e os valores dos parâmetros são determinados a partir do modelo linear.
Exemplo-4: Os dados da tabela abaixo exibem as vendas de um determinado produto e os seus

respectivos gastos com propaganda para os meses de Janeiro a Outubro.
Mês Vendas (Y) Gastos (X)

Jan 20 2
Fev 28 4
Mar 35 6
Abr 48 8
Mai 54 10
Jun 58 12
Jul 60 14
Ago 61 16
Set 60 18
Out 62 20
∑
Ajustar um modelo geométrico aos dados.
Temos Y = a Xb
Transformando os dados (ln - logaritmo neperiano) vem: ln Y = ln a + b ln X
Fazendo: y = ln Y x = ln X A = ln a
Temos: y = A + bx → modelo linear.
Fazendo os cálculos obtém-se:

∑x = 22,03 ∑xy = 86,79 ∑x2 = 53,39 n = 10
∑y = 38,23 ∑y2 = 147,56
Determinação dos parâmetros

Temos,
n ∑ XY − ∑ X ∑Y 10 × 86,79 − 22,03 × 38,23 867,9 − 842,2 25,7

b= b= = = ⇒ b= 0,52
n∑ X − ( ∑ X ) 10 × 53,39 − ( 22,03) 533,9 − 485,32 48,58
2 2 2
A = y − bx A = 38,23/10 - 0,52 x 22,03/10 A = 3,823 - 1,145 ⇒ A = 2,67
Temos então:
A = ln a ⇒ a = antilog A = eA = 2,7182,67 ⇒ a = 14,32
Então o modelo estimado Y$ = a Xb será: Y$ = 14,32 . X 0,52

↑ ↑
a b
Curva Exponencial Forma Teórica ⇒ Y = abX , onde: a>0 e b>1
Transformando vem: log Y = log a + X log b

Fazendo: y = log Y A = log a B = log b vem: y = A + BX
Exemplo-5: A tabela a seguir reflete a evolução do Índice Geral de Preços(IGP) no Brasil, no período de
1958 a 1967.
Anos (X) IGP (Y)

1958 229
1959 316
1960 407
1961 559
1962 848
1963 1473
1964 2811
1965 4416
1966 6125
1967 7946
Ajustar os dados pela seguinte função Y = abX. Completando a tabela vem:
Anos (X) IGP (Y) y = logY X2 Xxy y2

1 229 2,35984 1 2,35984 5,56884
2 316 2,49969 4 4,99938 6,24845
3 407 2,60959 9 7,82877 6,80996
4 559 2,74741 16 10,98964 7,54826
5 848 2,92840 25 14,642 8,57553
6 1473 3,16820 36 19,0092 10,03749
7 2811 3,44886 49 24,14202 11,89464
8 4416 3,64503 64 29,16024 13,28624
9 6125 3,78711 81 34,08399 14,3422
10 7946 3,90015 100 39,0015 15,21117
55 31,09428 385 186,21658 99,52278
Determinação do valor de B
n ∑ XY − ∑ X ∑ Y
Temos: b= n = 10 substituindo, vem:
n∑ X 2 − (∑ X ) 2
10 × 186,2165 − 55 × 31,0942 1862 ,165 − 1710,181 151,984
B= = B= ⇒ B = 0,18422
10 × 385 − (55) 2 3850 − 3025 825
31,0942 55
A= Y-Bx X A= − 0,18422 × A = 2,09622
10 10
A equação da reta ajustada será então: y = A + B.X
Logo, y = 2,09622 + 0,18422.X
Como A = log a ⇒ a = antilog A = 10A = 10 2,09622 = 124,80288

Como B = log b ⇒ b = antilog B = 10B = 10 0,18422 = 1,52834
Então, o modelo original ajustado será dado por:
Y = a.bX , ou seja Y = 124,80288 x (1,52834)X

↑ ↑
a b
Regressão Polinomial - Ajuste por Parábola
Das funções não lineares que não podem ser linearizadas (transformadas em retas) as mais importantes
são as parábolas.
Modelo Teórico: Y = a + bX + cX2

Ajustamento: Y$ = a + bX + c X2
Da mesma forma que nos outros modelos, a determinação dos parâmetros da parábola é feita
utilizando-se o método dos mínimos quadrados.
Assim deve-se minimizar:
∑ (Y − Y$) 2
Aplicando-se as condições de mínimo vem:
∂ ∑ (Y − Y$ ) 2 ∂ ∑ (Y − Y$ ) ∂ ∑ (Y − Y$ )
2 2
=0 , =0 , =0
∂ a ∂ b ∂ c
Obtém-se então as equações de ajustamento:
∑Y = n.a + b ∑ x + c ∑ x2
∑XY = a ∑X + b ∑X2 + b ∑X3
∑ X2Y = a ∑X2 + b ∑X3 + c ∑X4
Resolvendo-se esse sistema com três equações e três incógnitas, obtém-se o valor dos parâmetros da
parábola: a, b e c.
Para facilitar a resolução do sistema de equações é conveniente centrar a variável X na média, uma vez
que os momentos centrados de ordem ímpar são nulos.
Efetuando-se a transformação x = X - X obtém-se:
∑x = ∑ (X - X ) = 0
∑x = ∑ (X - X )3 = 0
∑x = ∑ (X - X )5 = 0
Rescrevendo as equações, vem:

∑Y = n.a + c ∑ x2
∑xY = b ∑ x2
∑ x2Y = a∑x2 + c ∑ x4
Exemplo-6: A tabela seguinte apresenta o preço do litro de gasolina observado por um período de sete
semestres consecutivos:
Datas Preço($)
Ago/77 6,00
Fev/78 6,30
Ago/78 7,30
Fev/79 9,60
Ago/79 10,20
Fev/80 22,60
Ago/80 38,00
Ajustar os dados por uma parábola do segundo grau.
Temos então:
X Y x =(X - X) xY x2 x2Y x4 Y2
1 6,00 -3 -18,0 9 54,0 81 36,00
2 6,30 -2 -12,6 4 25,2 16 39,69
3 7,30 -1 -7,3 1 7,3 1 53,29
4 9,60 0 0 0 0 0 92,16
5 10,20 1 10,2 1 10,2 1 104,04
6 22,60 2 45,2 4 90,4 16 510,76
7 38,00 3 114,0 9 342,0 81 1444,00
∑ 100,00 0 131,5 28 529,1 196 2279,94
Temos o seguinte sistema:

∑Y = n.a + + c ∑ x2
∑xY = b ∑ x2
∑ x Y = a∑x2 +
2
+ c ∑ x4
Onde: ∑Y = 100 ∑ x2 = 28 ∑xY = 131,5 ∑ x2Y = 529,1 ∑ x4 = 196
100 = 7.a + c.28

131,5 = 28b
529,1 = a.28 + c.196
Resolvendo o sistema vem:

b = 131,5/28 ⇒ b = 4,696
c = 1,536 ⇒ a = 8,138
Logo a parábola ajustada será:

Y$ = 8,138 + 4,696X + 1,536X2
↑ ↑ ↑
a b c
Poder Explicativo do Modelo (R2)
O poder explicativo do modelo tem por objetivo avaliar a “qualidade” do ajuste. O seu valor fornece a
proporção da variação total da variável dependente Y, explicada pela variável independente X, através
da função ajustada. A medida do poder explicativo é denominada coeficiente de determinação (R2), e
é assim definida:
b 2 × S XX
R =
2
, onde
SYY
n∑ X 2 − (∑ X ) 2 n∑Y 2 − (∑Y ) 2
S XX = e SYY =
n n
Coeficiente de Determinação (r2) é o quadrado do Coeficiente de Correlação de Pearson (r).
Demonstra-se que R2 varia entre 0 e 1 ⇒ [ 0 ≤ R2 ≤ 1]
Quando R2 = 0, a variação de Y explicada por X é zero, ou seja, a reta ajustada é paralela ao eixo da
variável X. Se R2 = 1, a variável independente X explicará toda a variação de Y. Então, quanto mais
próximo de 1 estiver o valor de R2, melhor será a “qualidade“ do ajuste da função aos pontos do
diagrama de dispersão. Quanto mais próximo de zero for R2, pior será a “qualidade” do ajuste. Se
R2 = 0,96, por exemplo, significa que 96% da variação de Y é explicada pela variável X através da função
escolhida para relacionar as duas variáveis, e os 4% restantes são atribuídas a causas aleatórias.
Exemplo-7: Seja Y uma variável que representa o valor do frete rodoviário de determinada mercadoria, e
X a variável distância (em Km) ao destino da mercadoria. Uma amostra de 10 observações das variáveis
apresentou os seguintes resultados:
n = 10 ∑XY = 842060
∑X = 1200 ∑Y2 = 4713304,03
∑Y = 6480,50 ∑X2 = 186400
Determinar a regressão Y = a + bX e o coeficiente de determinação.

Temos:
n ∑ XY − ∑ X ∑ Y
b= a= Y-b X
n∑ X 2 − (∑ X ) 2
x
Y = 6480,50/10 = 648,05 X = 1200/10 = 120

Substituindo vem:
10 × 842060 − 1200 × 6480,50 644000
b= ⇒ b= ⇒ b = 1,52
10 × 186400 − (1200) 2 424000
a = 648,05 − 1,52 × 120 ⇒ a = 465,65
Logo, Y = 465,65 + 1,52.X
Cálculo do R2
b 2 × S XX
R2 =
SYY
n∑ X 2 − (∑ X ) 2 n∑Y 2 − (∑Y ) 2
S XX = e SYY =
n n
10 × 186400 − (1200) 2
S xx = ⇒ Sxx = 42400
10
10 × 4713304,03 − (6480,50) 2
SYY = ⇒ Syy = 513616
10
(1,52) 2 × 42400
R2 = ⇒ R2 = 19,07% → significa que apenas 19,07%
513616
da variação da variável dependente Y é explicada pela variável independente X.
Análise dos Resíduos

Uma técnica que também é usada para avaliar a aderência do modelo utilizado (linear, potência,
exponencial, polinomial) ao conjunto de dados é plotar os resíduos ( ei ) contra os valores preditos ( Yˆ )

pelo modelo. Por exemplo, se foi utilizado um modelo linear de regressão e a análise do gráfico dos
resíduos (desvios) contra os valores preditos apresenta uma forma exponencial significa que o modelo
linear utilizado não foi o mais adequado para o conjunto de dados. Nesse caso deve-se introduzir no
modelo um termo exponencial. A mesma análise se aplica a todos os modelos, o que significa que essa
análise gráfica é fundamental para se determinar o grau de aderência do modelo utilizado aos dados
amostrais.
EXERCÍCIOS-08 - CORRELAÇÃO E REGRESSÃO
CORRELAÇÃO
01- O coeficiente de correlação linear entre as variáveis X e Y da tabela abaixo vale:
X Y
2 6
4 8
6 10
8 12
10 14
a. 0,5 b. 1,0 c. -1,0 d. -0,5 e. 0
02- O coeficiente de correlação linear entre X e Y é r. Se Y = 4 - 2X então:
a. r = 1 b 0 < r < 1. c. r = 0 d. -1 < r < 0 e. r = -1
03- Se as variáveis aleatórias X e Y são tais que Y = 2X, o coeficiente de correlação linear entre X e Y vale:
a. r = 1 b. r = 0 c. r = -1 d. 0 < r < 1 e. -1< r < 0
04-(AGU-ESTATÍSTICO-2006/NCE) As notas de cinco alunos em português (X) e em matemática (Y)

foram observadas e os seguintes resultados foram obtidos:
O coeficiente de correlação entre essas notas é aproximadamente igual a:
(A) - 0,55;
(B) - 0,2;
(C) - 0,05;
(D) 0,3;
(E) 0,5.
05-(BC-ANALISTA-2002/ESAF) Considere duas variáveis aleatórias X e Y. Sejam 45 e 65 as médias de

X e de Y, respectivamente. Sejam 4 e 16 as variâncias de X e Y respectivamente e 3 a covariância entre
essas variáveis. Assinale a opção que dá a variância da diferença X-Y.
a) 26
b) 20
c) 23
d) 14
e) Não é possível calcular a variância de X-Y com a informação dada
06-(IBGE-ANALISTA CENSITÁRIO-2000/NCE) Se X é uma variável aleatória e Y = 5 - 2X, então o

coeficiente de correlação linear entre X e Y é igual a:
a. 2,5
b. 1,0
c. 0
d. -0,4
e. -1,0
EXERCÍCIO-08-CORRELAÇÃO E REGRESSÃO
07-(MP-RO-ESTATÍSTICO-2005/CESGRANRIO) Analise as afirmativas a seguir, a respeito do
coeficiente de correlação linear de Pearson entre duas variáveis positivas X e Y:
I. é positivo;
II. não se altera quando adicionamos uma constante positiva aos valores de X;
III. não se altera quando multiplicamos por uma constante positiva os valores de X.
Está(ão) correta(s) a(s) afirmativa(s):
(A) II somente
(B) I e II somente
(C) I e III somente
(D) II e III somente
(E) I, II e III.
08-(MP-RO-ESTATÍSTICO-2005/CESGRANRIO) Se var(X) = 3, var(Y) = 2 e cov(X,Y) = 1, então

var(X-Y) é igual a:
(A) 1
(B) 3
(C) 4
(D) 5
(E) 6
09-(IBGE-ANALISTA CENSITÁRIO-2000/NCE) Sejam X e Y variáveis aleatórias discretas com função de

probabilidade conjunta dada pela seguinte tabela de dupla entrada:
Y
X -1 1
0 0,1 0,2
1 0,3 0,1
2 0,2 0,1
A covariância entre X e Y vale:

a. -0,3
b. -0,2
c. 0,1
d. 0,5
e. 1,0
10-(MPU-ANALISTA DOCUMENTAÇÃO-2004/ESAF) Considere a distribuição conjunta abaixo de duas variáveis

aleatórias discretas X e Y. Assinale a opção que dá o valor da covariância entre X e Y.
X/Y Y1 Y2
X1 0,25 0,25
X2 0,25 0,25
a) -6,40
b) -0,87
c) -0,05
d) 0,00
e) 0,25
11-(MP-RO-ESTATÍSTICO-2005/CESGRANRIO) O vetor aleatório (X,Y) tem distribuição conjunta com

matriz de variâncias-covariâncias
Assinale a opção que dá o valor do coeficiente de correlação entre X e Y.

a) 0,85
b) 0,25
c) 0,65
d) 0,95
e) 0,75
12- (PREFEITURA MANAUS-ESTATÍSTICO-2004/CESGRANRIO) A tabela a seguir mostra os valores
de duas variáveis X e Y, notas em Matemática e em Português, dos alunos de uma turma de 8 alunos.
Aluno 1 2 3 4 5 6 7 8
X 10 9 6 8 7 5 4 3
Y 1 2 6 4 5 7 8 10
O Coeficiente de Correlação Linear de Pearson entre X e Y:

(A) vale 1
(B) está compreendido entre 0 e 1
(C) vale 0
(D) está compreendido entre –1 e 0
(E) vale –1
13-(PREFEITURA MANAUS-ESTATÍSTICO-2004/CESGRANRIO) Se Var(X)=3, Var(Y)=2 e

Cov(X,Y) = 1, então Var(2X-Y) é igual a:
(A) 2
(B) 6
(C) 8
(D) 10
(E) 12
14-(ELETROBRÁS-ESTATÍSTICO-2002/NCE) A tabela de dupla entrada a seguir apresenta a função de

probabilidade conjunta de duas variáveis aleatórias discretas X e Y. Por exemplo, P[X=2;Y=0]=0,3.
A covariância entre X e Y é igual a:
(A) -0,2
(B) -0,1
(C) 0
(D) 0,1
(E) 0,2
15-(FINEP-ANALISTA-2006/NCE) O trabalho desenvolvido por uma pesquisadora envolve duas

variáveis aleatórias. Uma delas, variável X, pode assumir os valores 1 e 2. A outra, variável Y, pode
assumir os valores –2, –1, 4 e 5. A distribuição conjunta destas variáveis aparece abaixo.
A média de Y e a covariância entre X e Y são respectivamente:

(A) 1; 1,2;
(B) 1,5; 0,8;
(C) 0,8; - 0,3;
(D) 1; - 0,5;
(E) 1; 0,3.
16-(SEFAZ-AFTE-MS-2006/FGV) Analise as afirmativas a seguir, a respeito de duas variáveis aleatórias
X e Y.
I. Se X e Y são independentes, então Cov(X;Y) = 0.
II. Se Cov(X;Y) = 0, então X e Y são independentes.
III. Se X e Y são independentes, então E(XY) = E(X).E(Y).
IV. Se E(XY) = E(X).E(Y), então X e Y são independentes.
Está(ão) correta(s) a(s) afirmativa(s):

(A) I, somente.
(B) I e III, somente.
(C) I e IV, somente.
(D) II e IV, somente.
(E) I, II, III e IV.
17-(SEAD-AM-ESTATÍSTICO-2005/CESGRANRIO) Se var(X)=4, var(Y)=2 e cov(X,Y)= -1, então var(2X-Y)

é igual a:
(A) 10
(B) 12
(C) 18
(D) 22
(E) 24
18-(SEAD-AM-ESTATÍSTICO-2005/CESGRANRIO) Se Y = 1-X, o Coeficiente de Correlação Linear de

Pearson entre as variáveis X e Y:
(A) é igual a -1.
(B) está compreendido entre -1 e 0.
(C) é igual a 0.
(D) está compreendido entre 0 e 1
(E) é igual a 1.
19- (IBGE- ANALISTA MÉTODOS QUANTITATIVOS-2002/NCE) X e Y são duas variáveis aleatórias

com variâncias 144 e 64 respectivamente. Assinale o item que NÃO indica um valor possível para a
covariância entre X e Y:
(A) 87,5
(B) 18,7
(C) 0
(D) – 0,3
(E) – 100
20-(SESPA-ESTATÍSTICO-2006/NCE) O diagrama de dispersão entre duas variáveis X e Y é:
Dos valores a seguir, o que melhor representa o coeficiente de correlação linear amostral associado a
esse diagrama é:
(A) 0,80;
(B) 0,35;
(C) - 0,42;
(D) - 0,78;
(E) - 1,0.
21-(SMA-RIO/RJ-TÉCNICO CONTROLE INTERNO/99) Duas variáveis aleatórias X e Y têm coeficiente
de correlação 0,80. O coeficiente de correlação entre as variáveis (3+X) e 4Y é:
a. 0,80
b. 0,70
c. 0,50
d. 0,30
e. 0,20
22-(TRF-1RF-ESTATÍSTICO-2001/FCC) Sejam X e Y variáveis aleatórias com coeficiente de correlação ρ.

Se Z = X/2 + 3 e W = -Y+2 os coeficientes de correlação de Z e W e de W e Y são dados, respectivamente,
por:
(A) -ρ/2 e -1
(B) -ρ/2 e 1
(C) -ρ e -1
(D) ρ e -1
(E) ρ e 1
23-(ATRFB-2006/ESAF) O coeficiente de correlação entre duas variáveis Y e X é igual a + 0,8.

Considere, agora, a variável Z definida como: Z = 0,2 − 0,5 X. O coeficiente de correlação entre as
variáveis Z e X, e o coeficiente de correlação entre as variáveis Z e Y serão iguais, respectivamente, a:
a) – 1,0; – 0,8
b) + 1,0; + 0,8
c) – 0,5; – 0,8
d) – 0,5; + 0,8
e) – 0,2; – 0,4
24-(ATRFB-2006/ESAF) Para 5 pares de observações das variáveis X e Y obteve-se os seguintes

resultados:
Sabendo-se que esses 5 pares de observações constituem a totalidade da distribuição conjunta

populacional dessas duas variáveis, o valor do coeficiente de correlação entre X e Y é igual a
a) + 1,000
b) + 0,709
c) + 0,390
d) - 0,975
e) - 0,600
25-(BACEN-ANALISTA-2005/FCC) Sejam X e Y duas variáveis aleatórias e
I. E(X) e E(Y) as expectâncias de X e Y, respectivamente;
II. Var(X) e Var(Y) as variâncias de X e Y, respectivamente;
III. Cov(X,Y) a covariância de X e Y.
Tem-se, em qualquer situação,

(A) E(2X + 5) = 4E(X)
(B) se E(XY) = E(X) . E(Y), então X e Y são independentes.
(C) Var(X + 10) = Var(X) + 10
(D) E(X) . E(Y) = E(XY) – Cov(X,Y)
(E) Cov(X,Y) = Var(X) . Var(Y)
26-(AFRF-2005/ESAF) Para uma amostra de dez casais residentes em um mesmo bairro,

registraram-se os seguintes salários mensais (em salários mínimos):
Sabe-se ainda que:
Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os salários das
mulheres.
a) 0,72
b) 0,75
c) 0,68
d) 0,81
e) 0,78
27- (ICMS-RJ-2010) Duas variáveis aleatórias x e y têm coeficiente de correlação linear igual a 0,8. Se w
e z são tais que w = 2x - 3 e z = 4 - 2y então o coeficiente de correlação entre w e z será igual a:
(A) -0,8.
(B) -0,64.
(C) 0,36.
(D) 0,64.
(E) 0,8.
28- (ICMS-RJ-2008) Sejam X, Y e Z três variáveis com correlações de Pearson expressas pela matriz
abaixo:
Pode-se, então, afirmar que:

(A) X e Z são independentes.
(B) a correlação parcial entre X e Y, após a correção para Z, é negativa.
(C) o coeficiente de determinação da regressão de Y em X é maior do que 60%.
(D) a correlação entre V = a + b.X e W = c + d.Z, com a ≠ 0, c ≠0, b > 0 e d < 0 é negativa.
(E) a covariância entre X e Y e igual a 0,64.
REGRESSÃO
29- Sabendo-se que: ∑X = 10; ∑Y = 36; ∑XY = 100; ∑X2 =30 e n = 4, a reta de regressão para
esses valores será:
a. Y = -4X + 2
b. Y = -4X – 2
c. Y = 2X + 4
d. Y = 4X + 2
e. Y = -2X - 4
30- Dada a tabela abaixo, estimar a reta de regressão:
X Y
1 1
2 2
3 4
4 5
5 8
a. Y= -1,1 + 1,7X
b. Y= -1,7 + 1,1X
c. Y= -1,1 - 1,7X
d. Y= -1,7 - 1,7X
O enunciado seguinte deverá ser usado para responder as questões de 31 a 37.

A reta de mínimos quadrados para um conjunto de pontos é yˆ = 3 + 2 x .
31- Em relação a covariância pode-se afirmar que:

a. é positiva pois o coeficiente angular é negativo
b. é positiva pois o coeficiente angular é positivo
c. é negativa pois o coeficiente angular é negativo
d. é negativa pois o coeficiente angular é positivo
e. é igual a zero pois o coeficiente angular é nulo
32- Em relação ao coeficiente de correlação da reta do exercício anterior pode-se afirmar que:
a. r = 1 b. r = -1 c. 0 < r < 1 d. -1 < r < 0
33- O coeficiente angular da reta vale:
a. 3 b. -2 c. 0 d. 2
34- O coeficiente linear (intercept) da reta vale:

a. 2 b. 0 c. 3 d. -3
35- O valor estimado de y para x = -1,5 é:

a. 0 b. 3 c. 2 d. -1,5
36- A reta corta o eixo dos x no ponto:

a. 3 b. -1,5 c. 1,5 d. 2
37- O valor estimado yˆ = 1 corresponde a um valor da variável independente de:

a. 1 b. -2 c. -1 d. 0
38- (ACE-ESAF) A tabela abaixo exibe o consumo de determinado item no período de 1999 a 2007.
Ano Consumo
1999 1
2000 2
2001 4
2002 4
2003 5
2004 7
2005 8
2006 9
2007 12
Sabendo-se que os valores dos parâmetros para a reta ajustada são a = - 0,57 e b = 1,27, e que as
condições de mercado permanecem inalteradas, a previsão de consumo para 2008 será:
a. 37,53
b. 13,27
c. 12,13
d. 46,61
e. 14,79
39- (ACE-ESAF) O coeficiente de correlação do exercício anterior é 0,98. Este resultado significa que a
previsão:
a. pode ser efetuada com relativa margem de segurança, pois o valor de r está muito próximo de 1
b. não pode ser efetuada, dado que o valor de r está distante de 100
c. não pode ser efetuada, pois este resultado expressa uma relação linear
d. pode ser efetuada, dada a importante significância deste resultado
40- (BACEN) Das afirmações:

I. O coeficiente de determinação (R2) mede o quanto da variação da variável independente, é
explicada pela variável dependente.
II. O coeficiente de determinação é um real no intervalo [0,1].
III. A qualidade do ajuste de um modelo é medida pelo coeficiente de variação entre as variáveis
dependente e independente.
IV. O método dos mínimos quadrados consiste em minimizar a soma dos quadrados dos desvios entre
os valores observados e os valores estimados, pelo modelo ajustado.
V. O processo de determinação dos parâmetros de uma reta de regressão é chamado de ajustamento.
a. Todas são corretas

b. Todas são incorretas
c. II e III são incorretas
d. I, II e V são corretas
e. II, IV e V são corretas
41- (AFPS-ESAF) Assinale a alternativa incorreta:
a. Se a covariância entre duas variáveis é negativa, então a correlação linear entre essas variáveis
será também negativa.
b. O valor do coeficiente angular no modelo linear de regressão é equivalente a tangente do ângulo
que a reta de regressão forma com o eixo dos X.
c. Um valor nulo para o coeficiente linear, significa que a covariância linear entre a variável
dependente e a variável independente é zero.
d. A correlação linear perfeita ocorre quando os pontos observados estão perfeitamente alinhados
sobre uma reta.
42- (ACE-ESAF) A tabela abaixo exibe o consumo de determinado item no período de 1999 a 2007.
Ano-X Consumo-Y
1999 1
2000 2
2001 4
2002 4
2003 5
2004 7
2005 8
2006 9
2007 12
Para obter-se um modelo de regressão linear do consumo contra o tempo são fornecidas as seguintes
informações:
∑i X i = 45 ∑i Yi = 52 ∑ (X ∑ (Y ∑ (X − X )(Yi − Y ) = 76
∑ t X t = 459 , 4 ; ∑ t Y t = 59 ; ∑ t (X t − M x ) 2
= 0 , 444 ; ∑ t (Y t − M y ) 2
= 1600 , 9
i i − X ) 2 = 60 i i − Y ) 2 = 99,56 i i
Assinale a opção que representa a equação da reta de mínimos quadrados ajustada: yˆ i = aˆ + bˆ.x i + ε i
onde aˆ e bˆ são parâmetros desconhecidos e εi são não correlacionados e provenientes de
2
distribuições com média zero e variância constante σ .
a. yˆ i = 0,57 + 1,27.xi
b. yˆ i = −0,57 + 1,27.x i
c. yˆ i = −0,78 + 1,27.xi
d. yˆ i = −0,57 + 1,37.x i
e. yˆ i = 0,57 + 2,78.x i
43- (ACE-ESAF) Assinale a opção que representa o valor do coeficiente de correlação linear entre as
variáveis X e Y da questão anterior.
a. 0,964
b. 0,903
c. 0,892
d. 0,983
e. 0,912
(AFRF-ESAF) Para efeito das duas questões 44 e 45, considere a seguinte tabela que apresenta valores
referentes às variáveis x e y porventura relacionadas.
Valores das variáveis X e Y relacionadas
X Y X2 Y2 XY
1 5 1 25 5
2 7 4 49 14
3 12 9 144 36
4 13 16 169 52
5 18 25 324 90
6 20 36 400 120
∑ 21 75 91 1111 317
44- Marque a opção que representa o coeficiente de correlação linear entre as variáveis X e Y.
a. 0,90
b. 0,926
c. 0,947
d. 0,967
e. 0,989
45-(AFRF-96/ESAF) Marque a opção que representa a equação da reta ajustante de mínimos

$
quadrados y$ i = a$ + b . xi .
a. y$ i = 1,601 + 3,114. xi
b. y$ i = 1,643 + 3,482. xi
c. y$ i = 1,685 + 3,271. xi
d. y$ i = 1,713 + 2 ,992. xi
e. y$ i = 1,726 + 2 ,864. xi
46-(AFRF-98/ESAF) O logaritmo neperiano (ln) de um índice de produção Y está associado ao logaritmo

neperiano de um índice de insumos Q através da relação linear: ln(Y) = α + β ln(Q) + e. Para uma
amostra de 100 observações envolvendo dados de produção e quantidade, encontraram-se como
estimadores de α e β as quantidades 1 e 2, respectivamente. Assinale a opção correta.
a) A variação logarítmica esperada na produção por unidade de variação em Q será de ln(2).

b) A variação esperada no logaritmo do produto Y por unidade de variação no logaritmo de Q depende
de Q e quando Q=exp(2) vale 4.
c) A variação esperada no logaritmo do produto Y por unidade de variação no logaritmo de Q não
depende de Q e é constante igual 2.
d) A variação esperada em ln(Y) por unidade de variação em ln(Q) não está definida.
e) A variação esperada no logaritmo do produto Y por unidade de variação no logaritmo de Q depende
de Q e quando Q=exp(2) vale 5.
47-(ACE-98/ESAF) Uma empresa tem interesse em estudar o efeito dos gastos com propaganda X (em
R$ 10.000,00) no volume de vendas Y (em R$ 10.000,00). Não há sazonalidade aparente na evolução
de Y e o modelo linear Yt = α + βXt + εt representa uma aproximação plausível para o ajuste dos
dados da tabela abaixo. Tais dados representam pares de observações (Xt , Yt) ao longo de 10 meses
escolhidos ao acaso. Na equação do modelo linear α e β são parâmetros desconhecidos e εt são não
correlacionados e provenientes de distribuições com média zero e variância constante σ2.
Mês X Y
1 1,2 101
2 0,8 92
3 1,0 110
4 1,3 120
5 0,7 90
6 0,8 82
7 1,0 93
8 0,6 75
9 0,9 91
10 1,1 105
Pretende-se utilizar a técnica de mínimos quadrados para estimar os parâmetros do modelo linear. Com
este fim calcularam-se as quantidades seguintes:
∑ t X t = 9,4; ∑ t Yt = 959; ∑ t ( X t − M x )
2
= 0,444; ∑ t (Yt − M y )
2
= 1600 ,9 ∑ t ( X t − M x )(Yt − M y ) = 23 ,34
Nestas expressões Mx representa a média aritmética dos valores Xt e My a média aritmética dos valores
Yt. Assinale a opção que corresponde à estimativa do aumento esperado no nível de vendas (em R$
10.000,00) decorrente do aumento de R$ 10.000,00 de gastos com publicidade.
a. 60,31
b. 53,43
c. 51,26
d. 52,57
e. 57,00
48-(ELETROBRÁS-ESTATÍSTICO-2002/NCE) Para verificar a adequação do modelo de regressão

utilizado, o gráfico a seguir, dos resíduos contra os valores ajustados, foi observado:
Essa configuração indica que:
(A) o modelo utilizado é adequado, com um coeficiente de determinação elevado;

(B) a variância não é constante, embora oscile numa faixa definida de valores;
(C) existe uma autocorrelação positiva que, entretanto fica atenuada com o passar do tempo;
(D) é necessária a inclusão de termos extras no modelo ou uma transformação da variável dependente;
(E) a suposição de normalidade dos resíduos não se verifica.
49-(ICMS-SP-2006/FCC) Em um determinado país, deseja-se determinar a relação entre a renda
disponível (Y), em bilhões de dólares, e o consumo (C), também em bilhões de dólares. Foi utilizado o
modelo linear simples Ci = α + βYi + εi, em que Ci é o consumo no ano i, Yi é o valor da renda disponível
no ano i e εi o erro aleatório com as respectivas hipóteses para a regressão linear simples. α e β são
parâmetros desconhecidos, cujas estimativas foram obtidas através do método dos mínimos quadrados.
Para obtenção desta relação considerou-se ainda as seguintes informações colhidas através da
observação nos últimos 10 anos:
Para o cálculo do coeficiente de correlação de Pearson (R), usou-se a fórmula: em
que Cov(Y,C) é a covariância de Y e C, DP(Y) é o desvio padrão de Y e DP(C) é o desvio padrão de C.
Então,
(A) o coeficiente de explicação (R2) correspondente é igual a 64%.

(B) utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, em um ano,
caso a renda disponível seja igual a 15 bilhões de dólares, o consumo será igual a 13 bilhões de dólares.
(C) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões de dólares, significa
que a renda disponível considerada foi de 12,5 bilhões de dólares.
(D) o valor da estimativa encontrado para o parâmetro β é igual a 0,4.
(E) o valor da estimativa encontrado para o parâmetro α é igual a 10.
50-(AFPS-2002/ESAF) Uma empresa presta serviços de manutenção de eletrodomésticos em domicílio.

Para cada um de 18 atendimentos coletou o tempo gasto em minutos (y) com a manutenção e o número
de máquinas servidas (x). Postula-se que o modelo linear seja adequado, onde
α e β são parâmetros desconhecidos e os εi são componentes de erro não diretamente observáveis,
2
não correlacionados, com média nula e variância σ desconhecida. As estimativas de mínimos
quadrados dos parâmetros do modelo linear são dadas por αˆ = 10 , βˆ = 2 e σˆ = 4 .
2
A estimativa do aumento esperado de tempo por máquina adicional servida por chamada é de
a) 2 minutos.
b) 10 minutos.
c) 12 minutos.
d) 5 minutos.
e) 6 minutos.
51-(AFPS-2002/ESAF) Para o modelo de regressão linear y = α + βx + ε onde y é a variável

resposta, x a variável independente, α e β são parâmetros desconhecidos e ε é uma componente de
erro aleatória com média zero. Assinale a opção que corresponde à interpretação do parâmetro α.
a) É o valor predito de y, dado que x = 0, desde que esse valor de x seja compatível com o conjunto de
observações da variável exógena.
b) Mede a variação esperada em y por unidade de variação na variável exógena.
c) É o valor esperado de y, quando se padroniza a variável exógena.
d) Mede a variação da reta de regressão.
e) Mede o coeficiente angular da reta de regressão.
52-(MP-ENAP-2006/ESAF) Com o objetivo de estimar-se o modelo Y = α + X, foi retirada uma amostra
com cinco pares de observações (X,Y), obtendo-se os seguintes resultados:
Desse modo,
a) Y = - 2 - 2X
b) Y = 2 - 2X
c) Y = 2X
d) Y = 2 + 2X
e) Y = - 2 + 2X
53-(PETROBRÁS-ECONOMISTA JR-2005/CESGRANRIO) Heterocedasticidade refere-se à situação

onde a variância dos erros é:
(A) constante e igual a 1
(B) constante
(C) variável
(D) variável entre 0 e 1
(E) infinita sempre.
54-(AGENTE FISCAL-SEFAZ-PI-2001/ESAF) Um investigador toma uma amostra de 10 carregamentos

levados a efeito em caminhões de uma firma de transporte. Para cada carregamento (i) anota a
distância percorrida pelo caminhão em 1.000 Km (xi) e o tempo de entrega do carregamento em dias
(yi). Neste contexto postula que o modelo de regressão linear
yi=α+βxi+εi se ajusta a suas observações, onde α e β são parâmetros desconhecidos e os εi são
componentes estocásticas (resíduos) não diretamente observáveis, não correlacionadas, com média
zero e variância σ2>0.Foram encontradas as estatísticas seguintes no ajuste do modelo de regressão
linear: ∑i xi = 8 ∑i xi2 = 12 ∑i xi yi = 26 ∑i yi = 29 ∑i yi2 = 100

Assinale a opção que corresponde à estimativa do aumento esperado no tempo de entrega decorrente
da adição de 1.000 Km na distância percorrida.
a) 0,5 dias
b) 1,0 dias
c) 3,0 dias
d) 5,0 dias
e) 4,5 dias
)
55- (AFRF-2009) Na análise de regressão linear simples, as estimativas α e β dos parâmetros α e
βˆ da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores
dessas estimativas são obtidos através de uma amostra de n pares de valores Xi Yi com (i =1, 2,....,n),
) ) ) )
obtendo-se: Yi = α + β . X i onde Yi é a estimativa de Yi = α + β . X i . Para cada par de valores Xi Yi
com (i =1, 2,...,n) pode-se estabelecer o desvio ou resíduo aqui denotado por ei − entre a reta de
)
regressão Yi e sua estimativaYi . Sabe-se que o Método de Mínimos Quadrados consiste em adotar
como estimativas dos parâmetros α e β os valores que minimizam a soma dos quadrados dos desvios
(ei). Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:
[ ] ∑ [Y ]
n 2 n 2
a) ∑ Yi − (αˆ − βˆ . X i ) i − Yˆi
2 2
d)
i =1 i =1
∑[ ] ∑ [Yi 2 − (α − β . X i ) 2 ]
n 2 n
b) (Yi − αˆ − βˆ . X i ) e)
i =1 i =1
n 2
c) ∑ [Yi − (α − β . X i )]
i =1
Exercício-08 Exercício-08
01- B 31- B
02- E 32- C
03- A 33- D
04- A 34- C
05- D 35- A
06- E 36- B
07- D 37- C
08- B 38- C
09- B 39- D
10- D 40- E
11- B 41- C
12- D 42- B
13- D 43- D
14- B 44- E
15- D 45- A
16- B 46- C
17- D 47- D
18- A 48- D
19- E 49- B
20- A 50- A
21- A 51- A
22- C 52- D
23- A 53- C
24- E 54- A
25- D 55- B
26- B
27- A
28- C
29- C
30- A
MÓDULO-09 - TEORIA ELEMENTAR DA AMOSTRAGEM - INTERVALO DE CONFIANÇA
Introdução
A teoria da amostragem é um estudo das relações existentes entre uma população e as amostras
dela extraídas. É útil para a avaliação de grandezas desconhecidas da população, freqüentemente
chamadas de parâmetros populacionais, através do conhecimento das grandezas correspondentes
das amostras, denominadas estatísticas amostrais.
Nem sempre é possível incluir no estudo todos os elementos de uma população, seja em decorrência
dos altos custos implicados, por premência de tempo, por questões operacionais, etc. Nestes casos, a
solução é estudar um grupo (amostra) desta população. Por mais adequado que seja o planejamento e
a execução do processo de amostragem, os resultados obtidos a partir de amostras raramente são
iguais aos da população. A média, o desvio padrão e outros parâmetros da amostra serão
provavelmente próximos aos da população de origem, mas dificilmente iguais. Esta diferença se deve
ao acaso, fenômeno também chamado de erro amostral. Considerando que o processo de seleção da
amostra foi realizado de forma técnica correta, o tamanho da amostra (n) passa a ser o principal
responsável para diminuir a importância do erro amostral. Amostras com pequeno número de casos
geram dados mais imprecisos; quanto maior o tamanho da amostra (n) mais seus parâmetros se
aproximarão dos valores dos parâmetros reais da população. Assim, quanto maior o tamanho da
amostra (n), menor será o erro das estimativas geradas a partir da mesma. Daí a importância de um
bom dimensionamento da amostra durante a elaboração do projeto e também do chamado Intervalo
de Confiança para os resultados obtidos a partir da mesma.
A relação existente entre os parâmetros (média e variância) da população e das amostras podem ser
deduzidas a partir de um exemplo bastante simples.
Na Tabela 1 são apresentadas as idades de uma população de crianças com uma doença muito rara.
Caso Idade(X) X2
paciente 1 2 4
paciente 2 4 16
paciente 3 6 36
paciente 4 8 64
Soma 20 120
Tabela 1 - Idades (anos)
Como estes quatro pacientes formam uma população, seus parâmetros são:
Média ⇒ μ =
∑ x = 20 = 5
n 4
Variância ⇒ σ2 =
∑ x2 − μ2 =
120
− 5 2 = 30 − 25 = 5
n 4
MÓDULO-09-AMOSTRAGEM-INTERVALO DE CONFIANÇA
Se não pudéssemos estudar todas as crianças, poderíamos sortear amostras com um, dois ou três
elementos. Sabemos que amostras com n=1 serão imprecisas, com n=3 muito melhor, mas vamos
estudar o comportamento de amostras com n=2. Considerando um processo de amostragem com
reposição, teremos 16 possibilidades de composição, cada uma com sua média e desvio padrão.
Como tomamos todas as amostras possíveis, neste caso temos uma "população de amostras" e uma
"população de médias das amostras". As amostras e suas médias são apresentadas na Tabela 2.
Amostras
(em anos)
Média da amostra ( x ) (x )2
2e2 2 4
2e4 3 9
2e6 4 16
2e8 5 25
4e2 3 9
4e4 4 16
4e6 5 25
4e8 6 36
6e2 4 16
6e4 5 25
6e6 6 36
6e8 7 49
8e2 5 25
8e4 6 36
8e6 7 49
8e8 8 64
∑ 80 440
Tabela 2 - Distribuição das amostras de 2 elementos e suas médias (anos)
Obs. São 16 possibilidades, pois são arranjos com repetição de 4 elementos 2 a 2.
Anr = n r A42 = 42 = 16
Os parâmetros desta população de médias amostrais (Tabela-2) são:
μx =
∑ x = 80 = 5
Média ⇒
n 16
Variância ⇒ σ 2
x =
∑ x2
− μ2 =
440
− 5 2 = 27,5 − 25 = 2,5
n 16
Assim, obtemos os seguintes resultados:
1- A média da população de médias das amostras ( μ x ) é igual à média da população ( μ )
2- A variância das médias amostrais ( σ ) (2,5) é menor que a da população inicial ( σ ) (5,0).
2 2
x
A razão entre a variância da população e a variância das médias amostrais é:
⇒ tamanho das amostras (n=2).
3- As médias amostrais tem distribuição aproximadamente normal. Observe a figura abaixo.
Assim, temos uma população de origem com sua média e desvio padrão; várias amostras cada qual
com sua média e desvio padrão, e agora uma população de médias amostrais com sua média e
desvio-padrão. Para não confundir, o desvio-padrão da população de médias amostrais por
convenção recebe o nome de Erro Padrão da Média (EP).
Neste pequeno e prático estudo partimos do conhecimento da população e conseguimos determinar a
média de todas as possíveis amostras e estudar a sua distribuição. Na pesquisa o caminho é
diferente: só conhecemos alguns dados de uma das possíveis amostras e desejamos inferir os
parâmetros da população. Como isto é possível?
Resultados Fundamentais
1- A média de uma amostra obtida em condições técnicas razoáveis é um bom estimador do

parâmetro da média da população que a originou.
2- A variância de uma amostra quando calculada com n-1 casos é um bom parâmetro da
variância da população que a originou (BESSEL).
3- Quando a população de estudo tem distribuição normal, as médias amostrais têm
distribuição normal. Nos casos em que a população de estudo não tem distribuição normal, a
distribuição das médias amostrais tem distribuição aproximadamente normal se o tamanho das
amostras for grande (n>30).
Desvio Padrão da Amostra - Erro Padrão da Média
σ2 σ2
Transformando-se algebricamente a fórmula =n obtemos ⇒ σ x =
2
.
σ 2x n
σ2
Assim, a variâncias das médias amostrais é dada por: σ 2x =
n
σ2 σ
Logo o desvio-padrão das médias amostrais é dado por: σx = =
n n
Por convenção o desvio-padrão das médias amostrais é chamado de Erro Padrão (EP).
σ
Temos então ⇒ EPx =
n
S
Aplicando-se essa fórmula para uma amostra qualquer com desvio-padrão (S) temos: EPx = .
n
A partir da média da amostra e do Erro Padrão (EP) pode-se determinar o INTERVALO DE
CONFIANÇA da média da população.
Exemplo-1 Uma amostra de 40 crianças do sexo masculino aos quatro anos tem média de altura igual
a 100,0 cm e desvio padrão 5,0 cm. A probabilidade de se obter uma amostra de 40 elementos com
média menor que 98 cm é calculada da seguinte forma:
1- Inicialmente determinamos o Erro Padrão da Média (EP) das amostras compostas por 40 casos.
5
EPx = = 0,790
40
2- Como n (40) é maior que 30 as médias das amostras tem distribuição normal ou aproximadamente
normal. A seguir calculamos o valor de z equivalente a 98 cm considerando a média 100,0 cm e o
erro padrão igual a 0,790 cm. Temos então:
x − μ 98 − 100
z= = = −2,531
EPx 0,790
Da tabela Normal obtemos para z = 2,531 o valor da probabilidade p = 0,005676, ou 0,56%. Assim a
probabilidade de se obter uma amostra com 40 elementos e que tenha uma média menor que 98 é
aproximadamente 0,56%.
Intervalo de Confiança da Média Populacional
A primeira aplicação prática destes conceitos é a determinação do intervalo de confiança [IC] da

média populacional a partir das informações obtidas de uma amostra de tamanho n. Não
conhecemos a média (μ) e o desvio padrão da população (σ), porém dispomos de suas estimativas
obtidas a partir da amostra ( x e S ). Substituímos o valor de σ na fórmula do EP por S, EP passa a
S
ser: EPx = .
n
Amplitude do Intervalo de Confiança
A amplitude do intervalo de confiança [IC] está relacionada com a precisão desejada. Para uma
distribuição Normal usamos os seguintes valores de z quando desejamos os seguintes intervalos de
confiança:
Intervalo de Confiança [IC] Valor de z
90% 1,645
95% 1,960
99% 2,575
Determinação de z para IC = 90%
Observe o gráfico abaixo para um intervalo de confiança de 90%.

Como a curva é simétrica temos que dividir 10% / 2 = 5% [0,05].
Como na Tabela Normal não existe o valor correspondente a 0,45 [0,50 - 0,05] usamos a média entre
os valores 0,4495 e 0,4505 para o valor de z, ou seja [ 1,64 + 1,65 ] / 2 = 1,645.

Como a curva é simétrica temos que dividir 5%/2 = 2,5% [0,025].
Para o valor 0,475 obtemos na Tabela Normal um valor de z = 1,96.

Como a curva é simétrica temos que dividir 1% / 2 = 0,5% [0,005].
Como na Tabela Normal não existe o valor correspondente a 0,495 [0,500-0,005] usamos a média
entre os valores 0,4949 e 0,4951 para o valor de z, ou seja [ 2,57 + 2,58 ] / 2 = 2,575.
Exemplo-02- Uma amostra de 120 crianças tem média 120 cm e desvio padrão 5,6 cm. Qual o
intervalo de confiança de 95% para a média populacional ?
Temos: n = 120 Média = 120 Desvio Padrão = 5,6
s 5,6 5,6
O Erro padrão é dado por ⇒ EP = = = = 0,511
n 120 10,95
Para 95% de confiança o valor de z obtido da Tabela Normal padrão é z = 1,96.
O intervalo de confiança é dado por:
S
x − ε ⇔ x + ε onde ε é o erro da estimativa dado por ε = z × EP ou ainda ε = z ×
n
Assim, os limites do intervalo de confiança são:
S
Limite Inferior ⇒ x − z×
n
S
Limite Superior ⇒ x + z×
n
Temos então:
Limite Inferior ⇒ 120 – 1,96 × 0,511 = 118,99
Limite Superior ⇒ 120 + 1,96 × 0,511 = 121,00
Logo [ IC 95% ] = [118,99 a 121,00].
Critérios adotados para determinação do Intervalo de Confiança
Tamanho da Variância
Amostra Populacional Distribuição a ser usada
Grande Conhecida Normal

(n > 30) Desconhecida Normal
Pequeno Conhecida Normal
(n ≤30) Desconhecida t-Student
Assim, só usamos a Distribuição t-Student quando a amostra é pequena ( n ≤30 ) e a variância da

população é desconhecida.
Ou seja,
• Se n > 30 ou σ for conhecido ⇒ usamos distribuição Normal;
• Se n ≤ 30 e σ for desconhecido ⇒ usamos distribuição t-Student;
A tabela da distribuição t-Student é bi-paramétrica, ou seja, necessita de dois parâmetros:

α ⇒ nível de significância
ϕ ⇒ número de graus de liberdade = n - 1 (número de elementos da amostra subtraído de 1).
Fórmula para cálculo do erro da estimativa (ε)
σ
1) Distribuição Normal, σ conhecido ⇒ ε = zα ×
2 n
S
2) Distribuição Normal, σ desconhecido. Usamos S (desvio padrão amostral)⇒ ε = zα ×
2 n
S
3) Distribuição t-Student ⇒ ε = tα ×
2 n
Exemplo-03- Estatístico ELETROBRÁS/2002-NCE Uma amostra aleatória simples X ,X ,..., X , de
1 2 25
tamanho 25, de uma distribuição normal forneceu os seguintes dados:
25 25 2
∑x
i =1
i = 123 ∑ (x
i =1
i − x ) = 96
Um intervalo de 95% de confiança para a média populacional será dado aproximadamente por:
(A) ] 3,59 ; 6,25 [
(B) ] 4,40 ; 5,44 [
(C) ] 2,18 ; 7,66 [
(D) ] 4,09 ; 5,75 [
(E) ] 4,88 ; 4,96 [
Como a amostra é pequena, n = 25 (n < 30) e a variância populacional é desconhecida, devemos
utilizar para o cálculo do intervalo a distribuição t-Student.
O intervalo será dado por x − t × EP ⇔ x + t × EP , onde t é o valor da distribuição t-Student.

Temos então:
25
∑x i
123
Média Amostral ⇒ x= i =1
= = 4,92
n 25
25 2
∑ ( xi − x ) 96
Variância Amostral ⇒ S2 = i =1
= =4
n −1 24
Como a Tabela t-Student é uma tabela de dupla entrada temos:
α = 100 - 95% = 5% ⇒ 5%/2 = 2,5% ⇒ nível de significância

ϕ = n - 1 = 25-1 = 24 ⇒ graus de liberdade
Da Tabela t-Student para α = 2,5% e ϕ = 24 obtemos t = 2,0639.

2
Assim ε = 2,0639 × = 0,83
25
O intervalo de confiança para a média amostral será: [4,92 - 0,83 ; 4,92 + 0,83] = [4,09 ; 5,75].
Tamanho da Amostra - Intervalo de Confiança da Média Populacional
Em muitas questões de prova é pedido o tamanho da amostra para que o erro de estimação não
ultrapasse determinado valor.
S S S2
Temos que ε = z× ⇒ n = z× ⇒ n = z2.
n ε ε2
2
S2 ⎛ S⎞
Logo,o tamanho da amostra é dado por: n=z . 2
ou n = ⎜ z. ⎟ onde ε é o erro máximo
ε2 ⎝ ε⎠
desejado.
Exemplo-4- Estatístico ELETROBRÁS/2002- NCE - Se o desvio padrão populacional é igual a 1,2 o

tamanho de uma amostra aleatória simples para que se possa garantir, com 96% de confiança, que o
valor da média amostral não diferirá do da média populacional por mais de 0,05 é, no mínimo,
aproximadamente:
(A) 2.420
(B) 3.080
(C) 3.755
(D) 4.340
(E) 4.755
Temos:
96% de confiança ⇒ temos 48% antes da média e 48% depois da média.
A partir da Tabela Normal obtemos para 48% (0,4798) o valor de z=2,05.
S = 1,2 ⇒ desvio padrão
ε = 0,05 ⇒ erro
2 2
⎛ S⎞ ⎛ 1,2 ⎞
Como n = ⎜ z. ⎟ temos n = ⎜ 2,05. ⎟ ⇒ n = (49,2)2 ⇒ n ≅ 2.420
⎝ ε⎠ ⎝ 0,05 ⎠
Intervalo de Confiança para Proporção Populacional
Seja θ a proporção de elementos de uma população com N elementos que possuem uma
determinada característica (x). Ao extrairmos uma amostra com n elementos dessa população,
obteremos uma proporção de elementos com essa característica.
Essa proporção amostral ( p’ ) é dada por:
x
p' = , onde x é o número de elementos na amostra que possuem a característica e n é o tamanho da
n
amostra. Na estimação por intervalo para a proporção populacional não há necessidade (como na
estimação da média) de nos preocuparmos com o tamanho da amostra. Nesse caso usaremos sempre a
tabela da Distribuição Normal Padrão para arbitrar o valor da abscissa na fórmula do erro da estimativa.
Para um elemento da amostra escolhido ao acaso, poderá acontecer: sucesso (esse elemento tem a
característica x) ou fracasso (o elemento não tem a característica x). Assim, se p’ é a proporção dos
elementos que têm determinada característica x, a proporção dos que não apresentam essa característica
será: q’ = 1 - p’, pois p’ + q’ = 1.
σ
Na estimação por intervalo da média populacional, a fórmula do erro é dada por: ε = zα × .
2 n
Na proporção substituiremos o desvio padrão σ por p '.q ' , onde p' será a proporção favorável na
amostra e q' a proporção desfavorável.
p'.q' p'.q'
Assim a fórmula do erro será: ε = zα × ⇒ ε = zα ×
2 n 2 n
Tamanho da Amostra - Intervalo de Confiança para Proporção Populacional

2
⎛z⎞
Nesse caso o tamanho mínimo da amostra (n) para um erro (ε) máximo será: n = ⎜ ⎟ . p '.q '
⎝ε ⎠
Observações:
Se p' = 0,10 ou p' = 0,90 ⇒ p'·q' = 0,09
Se p' = 0,20 ou p' = 0,80 ⇒ p'·q' = 0,16
Se p' = 0,30 ou p' = 0,70 ⇒ p'·q' = 0,21
Se p' = 0,40 ou p' = 0,60 ⇒ p'·q' = 0,24
Se p' = 0,50 ⇒ p'·q' = 0,25 ⇒ valor máximo de p’.q’
Sob condições de completa incerteza, pode-se admitir inicialmente p' = 0,50, o que revelará a maior
quantidade de erro possível. Assim, em questões pedindo o tamanho mínimo de amostra para que o
erro não ultrapasse um determinado valor, não sendo fornecida a proporção amostral, utilizamos
p' = 0,50.
RESUMO - AMOSTRAGEM / INTERVALO DE CONFIANÇA
Critérios adotados para determinação do Intervalo de Confiança
Amostra Populacional Distribuição a ser usada

Intervalo de Confiança da Média Populacional

Usando Distribuição Normal
S S
Limite Inferior ⇒ x − z× Limite Superior ⇒ x + z×
n n
S
Erro ⇒ ε = z ×
n
Usando Distribuição t-Student
S S
Limite Inferior ⇒ x −t× Limite Superior ⇒ x +t×
n n
S
Erro ⇒ ε = t ×
n
Para determinar o valor de t na tabela t-Student usamos dois parâmetros:
ϕ ⇒ número de graus de liberdade = n - 1 (número de elementos da amostra menos 1).
Obs: Em ambos o casos o erro ε é igual a metade da amplitude do Intervalo de Confiança.
Tamanho da Amostra ⇒ Intervalo de Confiança da Média Populacional

2
⎛ S⎞
n = ⎜ z. ⎟
⎝ ε⎠
Intervalo de Confiança para Proporção Populacional
p'.q'
Nesse caso o erro é dado por: ε=z ×
n
Onde:
p’ ⇒ é a proporção dos elementos que têm determinada característica.
q’ ⇒ é a proporção dos elementos que não têm determinada característica.
p’ + q’ = 1 ⇒ q’ = 1 - p’
Tamanho da Amostra ⇒ Intervalo de Confiança para Proporção Populacional

2
⎛z⎞
Tamanho mínimo da amostra (n) para um erro (ε) máximo. n = ⎜ ⎟ . p '.q '
⎝ε ⎠
EXERCÍCIOS - AMOSTRAGEM / INTERVALO DE CONFIANÇA / T-STUDENT
01- (CÂMARA DEPUTADOS/2007) Os preços de um equipamento no mercado têm uma distribuição

normal com um valor médio igual a R$ 1.500,00. Verificou-se que 20% dos preços deste equipamento
são inferiores a R$ 1.290,00. Utilizando os valores das probabilidades P(Z ≤ z) para a distribuição
normal padrão abaixo tem-se que o valor do equipamento em que apenas 10% são superiores a ele é
igual a:
z P(Z ≤ z)
0,25 0,60
0,52 0,70
0,67 0,75
0,84 0,80
1,30 0,90
(A) R$ 1.825,00 (B) R$ 1.805,00 (C) R$ 1.710,00 (D) R$ 1.695,00 (E) R$ 1.650,00
02- (Estatístico ELETROBRÁS/2002-NCE) Suponha que os pesos de trabalhadores de um certo setor

produtivo sigam uma distribuição normal com média 72Kg e desvio padrão 12Kg. Numa obra há um
elevador para transporte exclusivo de trabalhadores projetado para suportar, dentro dos limites de
segurança, no máximo 700Kg. Se nove trabalhadores entrarem simultaneamente no elevador, a
probabilidade de que o limite máximo seja excedido é aproximadamente de:
(A) 2,1%
(B) 7,5%
(C) 12,4%
(D) 16,7%
(E) 19,0%
03- (Estatístico ELETROBRÁS/2002-NCE) Suponha que as notas obtidas por candidatos em uma
prova sigam uma distribuição normal com média 50 e variância 256. Se uma amostra aleatória simples
de cem candidatos for observada, a probabilidade de que a nota média dessa amostra seja superior a
55 é aproximadamente de:
(A) 0,09%
(B) 1,26%
(C) 3,47%
(D) 5,76%
(E) 9,02%
04- (ICMS-2005) Uma amostra de tamanho 25 foi extraída de uma população com média μ e desvio
padrão desconhecido. Suponha que a média amostral seja 4,004 e o desvio padrão amostral seja
0,366. O intervalo para μ com 95% de confiança é:
a) [3,853 ; 4,155]
b) [3,164 ; 4,002]
c) [2,891 ; 4,287]
d) [3,583 ; 4,551]
e) [3,289 ; 4,329]
05- (ICMS-2005) Uma amostra de tamanho 25 foi extraída de uma população com média μ e desvio
padrão desconhecido. Suponha que a média amostral seja 4,004 e o desvio padrão amostral seja
0,366. O intervalo para μ com 99% de confiança é:
a) [3,199; 4,509]
b) [3,923; 4,878]
c) [3,021; 4,789]
d) [3,799; 4,209]
e) [3,782; 4,912]
06- (IBGE-CESGRANRIO/2007) Uma amostra de 120 crianças tem média 120 cm e desvio padrão
5,6 cm. O intervalo de confiança de 95% para a média populacional é:
a) [111,12 a 130,02]
b) [112,91 a 131,45]
c) [109,02 a 131,15]
d) [107,99 a 131,02]
e) [118,99 a 121,00]
07- (IBGE-CESGRANRIO/2006) Uma amostra de 40 ovelhas tem média igual a 100, kg e desvio
padrão 5,0 kg. A probabilidade de se obter uma amostra de 40 ovelhas com média menor que 98 kg
vale:
a) 0,56%.
b) 5,6%
c) 7,93%
d) 8,21%
e) 0,82%
08- (ICMS/MS-2006) Uma amostra aleatória simples de tamanho 25 foi selecionada para estimar a
média desconhecida de uma população normal. A média amostral encontrada foi 4,2, e a variância
amostral foi 1,44. O intervalo de 95% de confiança para a média populacional é:
(A) 4,2 ± 0,49
(B) 4,2 ± 0,64
(C) 4,2 ± 0,71
(D) 4,2 ± 0,75
(E) 4,2 ± 0,81
09- (ICMS/RJ-2010) Suponha que os salários dos trabalhadores numa certa região sejam descritos
por uma variável populacional com média desconhecida e desvio padrão igual a R$200,00. Para se
garantir, com 95% de probabilidade, que o valor da média amostral dos salários não diferirá do valor da
média populacional por mais de R$10,00, a amostra aleatória simples deverá ter no mínimo,
aproximadamente, o seguinte tamanho:
(A) 3.568.
(B) 3.402.
(C) 2.489.
(D) 2.356.
(E) 1.537.
10- (Tecnologista Junior-IBGE/2002-NCE) O tamanho de uma amostra aleatória simples para que
possamos garantir, com 92% de confiança, que o valor da média da amostra não se afastará do da
média populacional por mais de 10% do desvio padrão populacional é, no mínimo, aproximadamente,
igual a:
(A) 254
(B) 282
(C) 306
(D) 458
(E) 560
11-(PETROBRÁS/2009-CESGRANRIO) Seja X a variável que representa a altura de um indivíduo

escolhido aleatoriamente de uma população de adultos do sexo masculino. Suponha que X possua
distribuição normal com média x = 68 polegadas e desvio padrão σ=3 polegadas. Para uma
amostra de tamanho n = 25 selecionada a partir dessa população a probabilidade de que a média
amostral x difira da média populacional em menos de uma polegada é:
a) 0,82
b) 0,90
c) 0,92
d) 0,97
e) 0,37
12- (BNDES/2007-CESGRANRIO) Seja X a variável aleatória que representa a nota média de um

aluno selecionado, ao acaso de uma universidade. Sabe-se que a distribuição de X tem média
x = 2,5 e desvio padrão 0,4. Se tomarmos uma amostra aleatória de 36 estudantes e calcularmos o
valor de x , a probabilidade de que x seja menor que 2,4 é:
a) 0,09
b) 0,20
c) 0,82
d) 0,07
e) 0,66
13- (BNDES/2007-CESGRANRIO) Em relação a questão anterior a probabilidade de que x esteja no

intervalo (2,4 ; 2,7) é:
a) 0,93
b) 0,74
c) 0,91
d) 0,89
e) 0,82
14- (PETROBRÁS/2005-CESGRANRIO) Uma amostra aleatória simples de tamanho 25 foi

selecionada para estimar a média e a variância desconhecidas de uma população normal. A média
amostral encontrada foi 5,2 e a variância amostral foi 1,44. O intervalo de 95% de confiança para a
média populacional é:
(A) 5,2 ± 0,32
(B) 5,2 ± 0,41
(C) 5,2 ± 0,47
(D) 5,2 ± 0,50
(E) 5,2 ± 0,75
15- (PETROBRÁS-ESTATÍSTICO/2005-CESGRANRIO) Uma amostra aleatória simples, de tamanho
16, foi selecionada para estimar a média desconhecida de uma população normal. A média amostral
encontrada foi 4,8 e a variância amostral, 1,44. O intervalo de 90% de confiança para a média
populacional é
(A) 4,8 ± 0,53
(B) 4,8 ± 0,64
(C) 4,8 ± 0,71
(D) 4,8 ± 0,75
(E) 4,8 ± 0,81
16- (PREFEITURA MANAUS-ESTATÍSTICO/2007-CESGRANRIO) Uma amostra aleatória simples de

tamanho 16 foi selecionada para estimar a média desconhecida de uma população normal. A média
amostral encontrada foi 5,2 e a variância amostral foi 1,44. O intervalo de 95% de confiança para a
média populacional é:
(A) 5,2 ± 0,59

(B) 5,2 ± 0,64
(C) 5,2 ± 0,71
(D) 5,2 ± 0,75
(E) 5,2 ± 0,81
17- (SEAD-AM/2006-CESGRANRIO)Uma amostra aleatória simples de tamanho 16 foi selecionada

para estimar a média desconhecida de uma população normal. A média amostral encontrada foi 4,8 e
a variância amostral foi 1,96. O intervalo de 95% de confiança para a média populacional é
(A) 4,8 ± 0,59

(B) 4,8 ± 0,64
(C) 4,8 ± 0,71
(D) 4,8 ± 0,75
(E) 4,8 ± 0,81
18- (AGU-ESTATÍSTICO/2008-NCE) Uma amostra aleatória simples de tamanho 256 de uma

distribuição normal foi observada e revelou os seguintes valores para as estatísticas suficientes:
256 256
∑ X i = 3.072
i =1
∑X
i =1
2
i = 37.119
Um intervalo de 95% de confiança para a média populacional será dado aproximadamente por:
(A) (11,88; 12,12);
(B) (11,62; 12,38);
(C) (11,05; 12,95);
(D) (10,46; 13,54);
(E) (10,20; 13,80).
19- (ICMS/MS-2006) Uma amostra aleatória de tamanho 400 revelou que 64% dos torcedores
brasileiros acham que conquistaremos o hexacampeonato mundial de futebol. O intervalo de 95% de
confiança para a proporção de torcedores na população que acreditam no hexacampeonato é:
(A) 64% ± 3,9%
(B) 64% ± 4,2%
(C) 64% ± 4,7%
(D) 64% ± 5,1%
(E) 64% ± 5,6%
20- (SEAD-AM/2006-CESGRANRIO) Amostra aleatória de 900 consumidores de detergentes revelou
36% de preferência pela marca X. O intervalo de 95% de confiança para a preferência, na população,
pela marca X é:
(A) 36% ± 1%
(B) 36% ± 2%
(C) 36% ± 3%
(D) 36% ± 4%
(E) 36% ± 5%
21- (PETROBRÁS-CESGRANRIO/2007) Supõe-se que a variância do peso das pessoas adultas de

sexo masculino de uma determinada região seja 144. Em uma amostra de 36 pessoas, foi encontrada
uma média de 63,4 kg. O intervalo de confiança de 90% para a média dos pesos dessas pessoas é:
a) [ 60,11 ; 66,69 ]
b) [ 62,19 ; 67,88 ]
c) [ 59,89 ; 65,69 ]
d) [ 60,19 ; 66,96 ]
e) [ 60,45 ; 68,37 ]
22- (IBGE-ESTATÍSTICO-NCE/2008) Considere uma amostra com os valores: n = 25, x = 5 e S = 0,5.

O intervalo de confiança a 95% para a média μ da população é:
a) 4,7936 ≤ μ ≤ 5,2064
b) 4,0132 ≤ μ ≤ 5,7091
c) 4,3426 ≤ μ ≤ 5,2982
d) 4,7019 ≤ μ ≤ 5,0064
e) 4,7219 ≤ μ ≤ 5,3124
23- (IBGE-ESTATÍSTICO-NCE/2008) Uma pesquisa em uma amostra de 100 pessoas da população

de uma determinada região, sobre a preferência entre a cerveja de marca A e a cerveja de marca B,
resultou em 60 pessoas a favor da marca A. O intervalo de confiança a 95% para essa proporção é:
a) [0,502 ; 0,782]
b) [0,608 ; 0,827]
c) [0,501 ; 0,672]
d) [0,504 ; 0,696]
e) [0,504 ; 0,601]
24-(ANS-ESTATÍSTICO-FCC/2007) O projetista de uma indústria tomou uma amostra de 36

funcionários para verificar o tempo médio gasto para montar um determinado brinquedo. A média
amostral encontrada foi 19,9 e desvio padrão 5,73. O intervalo de confiança com 0,95 para μ é:
a) 17,1 ≤ μ ≤ 20,8
b) 19,1 ≤ μ ≤ 20,3
c) 18,5 ≤ μ ≤ 21,1
d) 18,9 ≤ μ ≤ 21,2
e) 18,0 ≤ μ ≤ 21,8
25-(ELETRONORTE-ESTATÍSTICO-NCE/2007) Um analista tomou uma amostra de 36 auditores para

verificar o tempo médio gasto para analisar uma determinada declaração. A média obtida foi 21,39 e o
desvio padrão 5,38. Dado que o projetista não tem conhecimento da variabilidade da população, um
intervalo de confiança 95% para a média μ é:
a) [18,74 ; 21,26]
b) [19,56 ; 23,21]
c) [17,82 ; 20,16]
d) [19,56 ; 26,72]
e) [19,79 ; 22,21]
26-(AFC/CGU-ESTATÍSTICO-ESAF/2008) Construa um intervalo de 95% de confiança para a média
de uma população normal a partir dos dados de uma amostra aleatória simples de tamanho 64 desta
população, que forneceu uma média de 48 e um desvio-padrão amostral de 16, considerando que
φ(1,96) = 0,975, onde φ(z) é a função de distribuição de uma variável aleatória normal padrão Z.
a) 44,08 a 51,92.
b) 41,78 a 54,22.
c) 38,2 a 57,8.
d) 35,67 a 60,43.
e) 32,15 a 63,85.
27-(ANS-ESTATÍSTICO - FCC/2007) O índice de massa corpórea é calculado dividindo o peso da

pessoa pelo quadrado de sua altura. Para a população de homens de meia idade que mais tarde
desenvolvem a doença de diabetes, a distribuição dos índices básicos de massa corpórea é
aproximadamente normal com média μ e desvio padrão σ desconhecidos. Para uma amostra de 25
homens selecionados desse grupo, observou-se um índice médio x = 25,2 kg/m2 com desvio padrão
S = 2,5 kg/m2. Um intervalo de confiança de 95% para a média μ da população é dado por
(A) 25,2 ± 2,15
(B) 25,2 ± 1,56
(C) 25,2 ± 1,03
(D) 25,2 ± 0,86
(E) 25,2 ± 0,68
28-(ANS-ESTATÍSTICO-FCC/2007) Para estimar a proporção de cura de um medicamento

antiparasitário realizou-se um experimento clínico, aplicando o medicamento em n doentes escolhidos
ao acaso. Nesta amostra foi constatado que 80% dos doentes foram curados. Com base nestas
informações e utilizando o Teorema Central do limite, o valor de n, para que o erro cometido na
estimação seja no máximo 0,08, com confiança de 89%, é de
(A) 16
(B) 25
(C) 36
(D) 49
(E) 64
29-(MP-PE-ESTATÍSTICO-FCC/2006) Seja X a média de uma amostra aleatória simples com

reposição, de tamanho 64, retirada de uma população Normal com média 200 e variância 400. Usando
o fato que P(Z>1,64) = 0,05, onde Z é a Normal Padrão, o valor de a para que
P ( I X – μ I ≤ a ) = 0,90 é igual a:
(A) 6,4
(B) 5,2
(C) 4,8
(D))4,1
(E) 3,6
30-(MP-PE-ESTATÍSTICO-FCC/2006) Um engenheiro encarregado do controle de qualidade deseja

estimar a proporção p de lâmpadas defeituosas de um lote, com base numa amostra de tamanho 400.
Sabe-se, com base em experiências anteriores, que p deve estar próximo de 0,5. Usando o teorema
central do limite para estimar a amplitude do intervalo de confiança de 90% para p, podemos afirmar
que tal amplitude é, aproximadamente, igual a
(A) 0,041
(B) 0,045
(C) 0,058
(D) 0,070
(E))0,082
31-(MP-PE-ESTATÍSTICO-FCC/2006) Supondo-se que a porcentagem da receita investida em
educação, dos 600 municípios de uma região, tem distribuição normal com média μ, deseja-se estimar
essa média. Para tanto se sorteou dentre esses 600, aleatoriamente e com reposição, 16 municípios e
se observou os percentuais investidos por eles em educação. Os resultados indicaram uma média
amostral de 8% e desvio padrão amostral igual a 2%. Um intervalo de confiança para μ, com
coeficiente de confiança de 96%, é dado por:
(A) (8 ± 1,124)%
(B) (8 ±1,117)%
(C) (8 ± 0,877)%
(D) (8 ± 0,870)%
(E) (8 ± 0,755)%
32-(MP-PE-ESTATÍSTICO-FCC/2006) Em uma pesquisa de mercado foi estimado que 50% das

pessoas entrevistadas preferem a marca X de um produto. Se, com base no resultado dessa pesquisa,
quisermos fazer outra para estimar novamente esta preferência, o tamanho de amostra aleatória
simples necessário, para que tenhamos um erro amostral de 0,02 com probabilidade de 95%, deverá
ser
(A) 1000
(B) 1024
(C) 2500
(D) 1900
(E) 2000
Dados: utilize a aproximação: P(-2 ≤ Z ≤ 2 ) = 0,95, onde Z é a Normal Padrão
33-(MPU-ESTATÍSTICO-FCC/2007) Uma nova marca de lâmpada está sendo estudada. Baseado em

estudos anteriores com outras marcas similares, pode-se admitir que a vida média segue uma
distribuição Normal com desvio padrão de 8 meses. Tendo como base estes resultados, o tamanho de
amostra necessário para que a amplitude do intervalo de 95% de confiança (utilize a aproximação:
P (-2 ≤ Z ≤2) = 0,95, onde Z é a Normal Padrão) para a vida média seja de 4 meses é de:
(A) 8
(B) 12
(C) 16
(D) 64
(E) 128
34-(TJ-PA-ESTATÍSTICO-FCC/ 2008) A vida de determinado equipamento apresenta uma distribuição

normal com um desvio padrão populacional de 400 horas. Extrai-se uma amostra aleatória de 100
equipamentos e obtém-se uma vida média de 2.000 horas para este equipamento. Considerando a
população de tamanho infinito e a informação da distribuição normal padrão (Z) que P(Z > 1,64) = 5%
tem-se um intervalo de confiança de 90% para a vida média dos equipamentos igual a:
(A) [1.800,00; 2.200,00]

(B) [1.967,20; 2.032,80]
(C) [1.934,40; 2.065,60]
(D) [1.639,20; 2.360,80]
(E) [1.344,00; 2.656,00]
35- (TRF-1R-ESTAT-FCC/2001) Um engenheiro encarregado do controle de qualidade deseja estimar
a proporção p de lâmpadas defeituosas de um lote, com base numa amostra de tamanho
suficientemente grande. Sabe-se, com base em experiências anteriores, que p deve estar próxima de
0,5. Que tamanho deve ter a amostra se ele deseja que o erro de estimação seja no máximo 0,02, com
confiança de 90%?
(A) 800
(B) 1082
(C) 1241
(D) 1530
(E))1681
36-(ELETRONORTE-MATEMÁTICO-NCE/2006) Deseja-se estimar a média de uma população

usando-se uma amostra suficientemente grande que garanta um erro de estimação de no máximo dez
por cento (10%) do desvio-padrão (σ) com probabilidade de pelo menos 80%. Nesse caso, o tamanho
da amostra deve ser, aproximadamente:
(A) 71
(B) 164
(C) 271
(D) 422
(E) 542
37- (IBGE-ANALISTA CENSITÁRIO-NCE/2000) Uma certa característica populacional é descrita por

uma variável aleatória com média μ e variância 16. Se observamos uma amostra aleatória simples de
tamanho 900, a probabilidade de que a média amostral não se afaste de μ por mais de 0,3 unidades é
de, aproximadamente:
(A) 56%
(B) 73%
(C) 85%
(D) 90%
(E) 98%
38-(MIN CIDADES ESTATÍSTICO-NCE/2005) Para estimar a média de uma densidade normal, uma
amostra aleatória simples de tamanho 225 foi observada. Os valores da média e da soma dos
quadrados dos desvios foram:
225
x = 66 ∑ (xi − x )2 = 322,56
i =1
Uma estimativa de intervalo de 95% de confiança para a média populacional será dada por:
(A) (63,555 ; 68,445);
(B) (65,843 ; 66,157);
(C) (64,888 ; 67,112);
(D) (61,500 ; 70,500);
(E) (64,125 ; 67,875).
39- (ICMS-RJ-FGV/2009) Para examinar a opinião de uma população sobre uma proposta, foi montada
uma pesquisa de opinião em que foram ouvidas 1680 pessoas, das quais 51,3% se declararam
favoráveis à proposta. Os analistas responsáveis determinaram que a margem de erro desse
resultado, em um determinado nível de confiança, era de 2 pontos percentuais, para mais ou para
menos. Considerando que fosse desejada uma margem de erro de 1 ponto percentual, para mais ou
para menos, no mesmo nível de confiança, assinale a alternativa que indique o número de pessoas
que deveriam ser ouvidas.
(A) 840
(B) 2520
(C) 3360
(D) 5040
(E) 6720
40-(ICMS-SP-FCC/2008) Uma revenda de automóveis vende carros montados no Brasil. O proprietário

está interessado em estimar o valor médio θ dos gastos extras com opcionais casados com a compra
de carros novos. Uma amostra de 16 vendas produziu um valor médio de R$1.062,00 com desvio
padrão de R$ 144,00. Assinale a opção que dá os limites de confiança para θ com coeficiente de 98%.
A tabela abaixo dá os quantis x, de ordem γ, P {Tr ≤ x} = γ , da distribuição Tr de Student com r graus
de liberdade. Despreze centavos.
a) [R$ 955,00; R$ 1.168,00]

b) [R$ 968,00; R$ 1.155,00]
c) [R$ 990,00; R$ 1.134,00]
d) [R$ 997,00; R$ 1.124,00]
e) [R$ 938,00; R$ 1.186,00]
GABARITO
01 - A 11 - B 21 - A 31 - A
02 - B 12 - D 22 - A 32 - C
03 - A 13 - A 23 - D 33 - D
04 - A 14 - D 24 - E 34 - C
05 - D 15- A 25 - B 35 - E
06 - E 16- B 26 - A 36 - B
07 - A 17- D 27 - C 37 - E
08 - A 18- A 28 - E 38 - B
09 - E 19 -C 29 - D 39 - E
10 - C 20 -C 30 - E 40 - A
MÓDULO-10 - TESTE DE HIPÓTESES
Definição: É uma regra de decisão utilizada para aceitar ou rejeitar uma hipótese estatística com
base em elementos amostrais.
Hipóteses: Temos sempre duas hipóteses, H0, que é a HIPÓTESE NULA e H1 que é a
HIPÓTESE ALTERNATIVA. Geralmente a hipótese alternativa (H1) representa a suposição
que o pesquisador quer provar, sendo a hipótese nula (H0) formulada com o expresso
propósito de ser rejeitada. Conseguindo rejeitar H0, a hipótese alternativa H1 terá de ser
aceita, conseguindo então o pesquisador provar o que queria. A hipótese nula H0 é sempre a
hipótese a ser examinada. Se a aceitarmos, implicitamente estaremos rejeitando H1 e se
rejeitarmos H0, então não podemos rejeitar H1, devendo esta ser aceita.
H0 : Hipótese Nula ⇒ a que deve ser examinada (e rejeitada se for o caso).
H1 : Hipótese Alternativa ⇒ o que queremos provar.
Tipos de erro
Dois tipos de erro podem ser cometidos num Teste de Hipóteses:
• Erro Tipo I (α) ⇒ A hipótese nula (H0) é verdadeira e o pesquisador a rejeita.
• Erro Tipo II (β) ⇒ A hipótese nula (H0) é falsa e o pesquisador a aceita.
O Erro Tipo I (α) é mais grave que o Tipo II e a probabilidade que ele aconteça deverá ser
minimizada. Essa probabilidade chama-se Nível de Significância do Teste, dado por α. Já a
probabilidade de β do Erro Tipo II não pode ser calculada, a menos que se especifique um valor
alternativo para μ. O poder (ou potência) do teste é dado por (1-β).
QUADRO RESUMO
Hipótese Nula (H0)

VERDADEIRA FALSA
Pesquisador
Comete o Erro
Aceita H0 Decisão Correta
Tipo II (β)
Comete o Erro
Rejeita H0 Decisão Correta
Tipo I (α)
MÓDULO-10 - TESTE DE HIPÓTESE
TIPOS DE TESTE DE HIPÓTESES PARA A MÉDIA
Bicaudal ou Bilateral
H0: μ = μ0
H1: μ ≠ μ0
Onde: μ é a média populacional e μ0 é o valor suposto para a média populacional.
Gráfico do teste bilateral
RA ⇒ Região de Aceitação da hipótese NULA H0

RC ⇒ Região Crítica ⇒ Rejeição rejeição de H0
Essas regiões são dadas por valores tabelados (NORMAL ou T-STUDENT).
Teste Unicaudal ou Unilateral à direita

H0: μ = μ0
H1: μ > μ0
Gráfico do teste unicaudal à direita
Teste Unicaudal ou Unilateral à esquerda
H0: μ = μ0
H1: μ < μ0
Gráfico do teste unicaudal à esquerda
OBS: Na hipótese NULA sempre temos uma igualdade (=) e na hipótese ALTERNATIVA uma desigualdade
(<, > ou ≠).
QUAL DISTRIBUIÇÃO USAR: NORMAL OU T-STUDENT

A decisão em relação ao tipo de distribuição a ser usada é semelhante ao utilizado no cálculo do Intervalo
de Confiança.
2 Distribuição a ser usada
Amostra Populacional (σ )
Assim, só usamos a Distribuição t-Student quando a amostra é pequena ( n ≤30 ) e a variância

(ou desvio padrão) da população é desconhecida.
Ou seja,
2
• Se n > 30 ou σ for conhecida ⇒ usamos distribuição Normal;
2
• Se n ≤ 30 e σ for desconhecida ⇒ usamos distribuição t-Student;
A tabela da distribuição t-Student é bi-paramétrica, ou seja, necessita de dois parâmetros:

ϕ ⇒ número de graus de liberdade = n - 1 (número de elementos da amostra subtraído de 1).
ROTEIRO PARA O TESTE DE HIPÓTESES
1º Passo ⇒ Pelo enunciado do problema, estabelecer a Hipótese Nula (H0) e a Hipótese
Alternativa (H1);
2º Passo ⇒ Também pelos dados do enunciado, definir a distribuição que será utilizada: Normal
ou t-Student;
3º Passo ⇒ Utilizando a Tabela Normal Padrão ou a Tabela t-Student, encontrar o valor de ZTAB
ou tTAB;
ZTAB ⇒ Valor de Z encontrado usando a Tabela Normal
tTAB ⇒ Valor de t encontrado usando a Tabela t-Student
4º Passo ⇒ Fazer o desenho da curva, plotando no eixo das abscissas o valor tabelado, que será
a fronteira entre a área de aceitação (RA) e a(s) área(s) de rejeição (RC-Região Crítica);
5º Passo ⇒ Calcular a estatística teste (ZCALC ou tCALC) utilizando as seguintes fórmulas:
Se o desvio padrão populacional (σ) for conhecido (NORMAL)

X −μ
⇒ Z CALC =
σ
n
Se o desvio padrão populacional (σ) for desconhecido e a amostra for grande (n≥ 30) (NORMAL)
X −μ
⇒ Z CALC = onde S é o desvio padrão da amostra.
S
n
Se o desvio padrão populacional (σ) for desconhecido e a amostra for pequena (n<30) (t_Student)
X −μ
⇒ t CALC = onde S é o desvio padrão da amostra.
S
n
6º Passo: Comparar o valor calculado com o valor tabelado e concluir pela aceitação ou
rejeição da Hipótese Nula.
EXEMPLOS
Supondo que usaremos a Distribuição Normal Padrão (Z):
1- TESTE BILATERAL
Se – ZTAB < ZCALC <ZTAB ⇒ aceitaremos H0.
Se Z <-Z , ou Z <Z ⇒ rejeitaremos H .

CALC TAB TAB CALC 0
2- TESTE UNILATERAL À DIREITA
3- TESTE UNILATERAL À ESQUERDA
O mesmo procedimento vale para os casos em que usarmos a Distribuição t-Student, a única
diferença é que a comparação será feita entre tCALC e tTAB.
UTILIZAÇÃO DAS TABELAS - PRINCIPAIS NÍVEIS DE SIGNIFICÂNCIA (α) UTILIZADOS
Tabela da Distribuição NORMAL PADRÃO
Teste Bilateral
a) Se α = 1%, teremos α/2 = 0,5% = 0,005 (para cada lado) e a área de aceitação será de 99%
(0,99), sendo 0,495 à esquerda e 0,495 à direita do ponto máximo da curva (a Distribuição Normal
é simétrica). Verificando a Tabela Normal, temos 0,4949 para uma abscissa de 2,57 e 0,4951 para
uma abscissa de 2,58. Logo, por interpolação, a abscissa correspondente à área de 0,495 será a
média das duas abscissas, ou seja, 2,575. Mas para facilitar, vamos adotar, no teste bilateral,
quando α = 1%, ZTAB = 2,58. Observe o gráfico da curva normal.
Nesse caso, H só será aceita se o valor de Z estiver entre -2,58 e 2,58.

0 CALC
b) Se α = 5%, teremos α/2 = 2,5% = 0,025 (para cada lado) e a área de aceitação será de 95%
(0,95), sendo 0,475 à esquerda e 0,475 à direita. Verificamos, na Tabela Normal, que uma área de
0,475 corresponde à abscissa 1,96. Logo, no teste bilateral, quando α = 5% então ZTAB=1,96.
Observe o gráfico da curva normal.
Aceitaremos H se: -1,96 < Z < 1,96

0 CALC
c) Se α = 10%, α/2 = 5% = 0,05 (para cada lado). Área de aceitação igual a 0,90, sendo 0,45 à
esquerda e 0,45 à direita. Na Tabela Normal uma área de 0,4495 corresponde à abscissa 1,64 e
uma área de 0,4505 corresponde à abscissa de 1,65. Logo, com precisão, a abscissa seria 1,645.
Mas para facilitar vamos adotar no teste bilateral, quando α = 10%, ZTAB = 1,64. Observe o gráfico
da curva normal.
Aceitaremos H se: -1,64 < Z < 1,64

0 CALC
Teste Unilateral
Vamos considerar apenas o teste à direita, pois o teste à esquerda é semelhante, bastando
inverter os lados.
a) Se α = 1% (0,01), a área de aceitação será de 99% (0,99) à esquerda. Mas até a metade da
curva (a Distribuição Normal é simétrica) temos 50% (0,5) de área. Logo, queremos a abscissa
correspondente a uma área de 0,49. Verificando, na Tabela Normal, o valor mais próximo é de
0,4901, correspondente à uma abscissa de 2,33. Assim, no teste unilateral à direita, quando
α = 1%, teremos ZTAB = 2,33. e no teste unilateral à esquerda para o mesmo α, -ZTAB = -2,33.
b) Se α = 5% (0,05), teremos área de aceitação = 0,95 à esquerda. Procuraremos, na tabela
normal a área de 0,45 (0,95 - 0,50), que corresponde à abscissa de 1,64. Portanto, no teste
unilateral à direita, quando α = 5%, então ZTAB = 1,64 e no teste unilateral à esquerda para o
mesmo α, -ZTAB = -1,64. Observe o gráfico da curva normal.
c) Se α = 10% (0,10), área de aceitação = 0,90 à esquerda. Na Tabela Normal o valor mais
próximo de 0,40 (0,90 – 0,50) é de 0,3997, que corresponde à abscissa de 1,28. Portanto, no teste
unilateral à direita, para α = 10%, ZTAB = 1,28 e no teste unilateral à esquerda, -ZTAB = -1,28.
Tabela da Distribuição t-STUDENT
Nesta tabela, temos que levar em consideração dois parâmetros: α (alfa), que é o nível de
significância e ϕ (fi) que é o número de graus de liberdade dado por: n (número de elementos
da amostra) menos 1 unidade, ou seja: ϕ = n – 1.

Temos que ter atenção também para o tipo de tabela, que pode ser: bilateral ou unilateral. Assim,
no teste bilateral o α da tabela será o próprio α utilizado no teste. Mas para o teste unilateral
teremos que procurar, nesta tabela, o dobro do α.
Teste Bilateral
Supondo uma amostra de 25 elementos (n = 25) temos que ϕ = n -1 = 25 – 1 ⇒ ϕ = 24.
Para um α = 5%, vemos na tabela que a célula interseção de α = ,05 e ϕ = 24 nos fornece 2,0639.
Portanto: t = 2,0639 para α = 5% e n = 25. Observe o gráfico da t-Student.
TAB
Teste Unilateral
Tamanho de amostra = 25 e α = 0,05 (5%).
Nesse caso não poderemos pegar diretamente a interseção de α=0,05 com ϕ = 24, pois o valor
fornecido é para um teste bilateral. Teremos que pegar a interseção de ϕ = 24 com α = 0,10, pois
nesta tabela (bilateral), o α = 0,05 corresponde a 0,025 de cada lado. Teremos que pegar α=0,10,
que corresponderá a 0,05 de cada lado. Assim a célula interseção de α = 0,10 com ϕ = 24
fornecerá t = 1,7109. Observe o gráfico da t-Student.
TAB
EXEMPLO-1 Uma amostra de 36 elementos de uma variável X normalmente distribuída forneceu:
X (média) = 42,3 e S = 5,2. Testar, no nível de significância 0,05, a hipótese de que μ > 40.
Temos:
H : μ = 40
0
H : μ > 40 (teste unilateral à direita)

1
α = 0,05 n = 36
Média = 42,3 Desvio Padrão (S) = 5,2
Como n > 30 ⇒ TABELA NORMAL
Passo-1 Cálculo do valor de Z Tabelado (ZTAB)
Temos: α = 0,05 ⇒ 0,50 - 0,05 = 0,45
Da Tabela Normal obtemos para 0,45 ZTAB = 1,64
Passo-2 Cálculo da Estatística de Teste ZCALC

X −μ
Z CALC = onde: X = 42,3 μ = 40 S = 5,2 n = 36
S
n
42,3 − 40 2,3 13,8
Z CALC = = = = 2,65
5,2 5,2 5,2
36 6
Como ZCALC > ZTAB (2,65 > 1,64) REJEITAMOS a HIPÓTESE H0 (μ = 40) com nível de
significância de 0,05 ⇒ logo, μ > 40.
EXEMPLO-2 Uma amostra de 20 elementos de uma variável X normalmente distribuída forneceu:
X = 53,4 e S = 7,5. Testar, no nível de significância 0,05, a hipótese de que μ = 50.
Temos:
H : μ = 50;
0
H : μ ≠ 50 (teste bilateral);
1
α = 0,05
Média = 53,4 Desvio Padrão (S) = 7,5
n = 20 ⇒ Como n < 30 ⇒ TABELA T-STUDENT
Passo-1 Cálculo do valor de t Tabelado (TTAB)

Temos: n = 20 ⇒ ϕ = 19 α = 0,05
Da Tabela T_Student obtemos TTAB = 2,09
Passo-2 Cálculo da Estatística de Teste TCALC

X −μ
TCALC = onde: X = 53,4 μ = 50 S = 7,5 n = 20
S
n
53,4 − 50 3,4
TCALC = = ≅ 2,027
7,5 7,5
20 20
Como - TTAB < TCALC < TTAB (-2,093 < 2,027 < 2,093) ACEITAMOS a HIPÓTESE H0 (μ = 50), com
nível de significância de 0,05 ⇒ logo, μ = 50.
EXEMPLO-3 Uma indústria produz lâmpadas cuja duração segue uma distribuição Normal com
Média = 788 e Variância = 1.600. Testar a hipótese de que μ = 800 contra a alternativa de μ ≠ 800
se uma amostra aleatória de 30 lâmpadas tem um tempo médio de vida de 788 horas. Adotar
α = 0,05.
Temos:
H : μ = 800;
0
H : μ ≠ 800 (teste bilateral);

1
2
Média = 788 Variância σ = 1.600 ⇒ σ = 40
Como a amostra tem 30 elementos e a variância populacional é conhecida usamos a distribuição
Normal
Passo-1 Cálculo do valor de Z Tabelado (ZTAB)

Temos: α = 0,05 ⇒ α = 0,05 / 2 = 0,025 pois o teste é bilateral. Assim 0,50 - 0,025 = 0,475
Da Tabela Normal obtemos para 0,475 ZTAB = 1,96
Observe o gráfico abaixo.
Passo-2 Cálculo da Estatística de Teste ZCALC

X −μ
Z CALC = onde: X = 788 μ = 800 S = 40 n = 30
S
n
788 − 800 − 12
Z CALC = = = −1,64
40 40
30 30
Como - ZTAB < ZCALC < ZTAB ( - 1,96 < 1,64, < 1,96) ACEITAMOS a HIPÓTESE H0 (μ = 800) com
nível de significância de 0,05 ⇒ logo, μ = 50.
EXEMPLO-4 Uma amostra de tamanho n = 18 de população normal tem média X = 31,5 e desvio
padrão S = 4,2. Ao nível de significância de 5%, estes dados sugerem que a média populacional
seja superior a 30 ?
Temos:
H : μ = 30
0
H : μ > 30 (teste unilateral à direita)

1
Média = 31,5 Desvio Padrão = 4,2

Como n = 18 (<30) e desvio padrão da população desconhecido ⇒ T-Student.
Passo-1 Cálculo do valor de t Tabelado (TTAB)

Temos: n = 18 ⇒ ϕ = 17 α = 5 %
Da tabela obtemos TTAB = 1,7396
Passo-2 Cálculo da Estatística de Teste TCALC

X −μ
TCALC = onde: X = 31,5 μ = 50 S = 4,2 n = 18
S
n
31,5 − 30 1,5
TCALC = = ≅ 1,515
4,2 4,2
18 18
Como - TTAB < TCALC < TTAB (- 1,7396 < 1,515 < 1,7396) ACEITAMOS a HIPÓTESE H0 (μ = 30),
com nível de significância de 0,05 ⇒ logo, μ = 30.
EXERCÍCIOS - TESTE DE HIPÓTESES
01-(AFC-ESAF) Em uma amostra de 10 elementos a média da amostra observada foi de 230.

Sabe-se que a variância da população é igual a 160. Nesse caso para testar a hipótese de
μ = 218 contra a alternativa μ > 218 ao nível de significância de 10% os valores da estatística
tabelada e calculada são respectivamente:
a) 1,28 e 3,00
b) 1,28 e 2,09
c) 1,96 e 1,28
d) 3,00 e 3,00
e) 1,64 e 3,00
02-(BACEN-ESAF) O diâmetro médio de parafusos em uma amostra de 400 parafusos forneceu o

valor de 25 mm. Sendo 4 mm o desvio padrão do processo de fabricação, pode-se afirmar, ao
nível de significância de 5%, que o diâmetro médio de todos os parafusos seja inferior a 25,4 mm
a hipótese nula será ?
a) Rejeitada com um valor calculado de -2

b) Aceita com um valor calculado de -2
c) Rejeitada com um valor calculado de -1,64
d) Aceita com um valor calculado de -1,64
e) Rejeitada com um valor tabelado de -2
03-(ICMS-SP-FCC) Um ensaio de tensões de ruptura de 6 cabos produzidos por uma companhia

mostrou a tensão média de ruptura de 7.750 kg e o desvio padrão de 145 kg, ao passo que o
fabricante declara que aquela tensão média é de 8.000 kg. A um nível de significância α = 0,05 a
afirmação do fabricante é:
a) Falsa com um valor calculado de -4,223

b) Verdadeira com um valor calculado de
c) Falsa com um valor calculado de -2,64
d) Falsa com um valor calculado de -1,66
e) Verdadeira com um valor calculado de -4,223
04-(BNDES-CESGRANRIO) Suponhamos que em indivíduos normais quanto à visão, a pressão

intra-ocular seja uma variável aleatória normalmente distribuída com média 20 e variância 4 (em
unidade de mm de mercúrio). Um cientista, querendo por à prova a sua hipótese de que o
glaucoma causa um aumento tencional, mediu as pressões de 16 pacientes portadores de
glaucoma, obtendo uma média igual a 24. Com um nível de significância α = 0,005 o cientista
deve:
a) Rejeitar H0 e aceitar a hipótese alternativa H1
b) Rejeitar H1 e aceitar a hipótese nula H0
c) Rejeitar H0, pois o valor calculado é 2,58
d) Aceitar H0, pois o valor calculado é 2,58
e) Aceitar H1, pois o valor calculado é menor que 2,58
EXERCÍCIO-10-TESTE DE HIPÓTESES
05-(AFC-ESAF)) Os graus dos alunos de Estatística têm sido baixos, com média de 5,2 e desvio
de 1,2. Optou-se por um curso de revisão e com ele pretende-se aumentar o rendimento dos
alunos. Entre 36 alunos que freqüentaram tal curso, a média foi de 6,4. Pode-se dizer, ao nível de
significância de 8%, que o curso é:
a) Eficiente e aceitar a hipótese alternativa H1
b) Não eficiente e aceitar a hipótese nula H0
c) Eficiente, pois o valor calculado é menor que 5,2
d) Não eficiente, pois o valor calculado é menor que 5,2
e) Eficiente e aceitar a hipótese nula H0
06) (BACEN-FCC) Uma amostra aleatória de 9 valores de salários extraída de uma população,
considerada normal e de tamanho infinito, apresentou média igual a R$800,00 com um desvio
padrão igual a R$120,00. Os registros históricos indicam que a média dos salários da população é
igual a R$740,00. Deseja-se testar a hipótese, ao nível de significância α, se o valor da média
verificada na amostra difere do valor de R$740,00. Seja H0 a hipótese nula do teste (μ = 740), H1
a hipótese alternativa (μ ≠ 740) e t > 0 o quantil da distribuição "t" de Student, no nível de
α/2
significância α, para testes bicudais com 8 graus de liberdade. Sabendo-se que H0 foi rejeitada,
tem-se que:
(a) t < 1,5.
α/2
(b) t > 1,5.
α/2
(c) para qualquer nível de significância H0 seria rejeitada, pois (800 − 740) ≠ 0.
(d) o valor da variável do teste (t calculado) obtido através da amostra e necessário para
comparação com −t e t é igual a 0,5.
α/2 α/2
(e) a um nível de significância β, β > α, H0 não teria sido rejeitada.
07) (IBGE-NCE) Considere uma amostra aleatória de tamanho 36 de uma distribuição normal com
média μ e desvio padrão 1,8. Deseja-se testar H0: μ ≤ 10 versus H1: μ > 10. O teste
uniformemente mais poderoso de tamanho 1% rejeitará H0 se a média amostral for, no mínimo,
igual a:
(a) 10,7
(b) 11,1
(c) 11,5
(d) 11,9
(e) 12,3
08) (SUSEP-ESAF) Em uma distribuição de sinistro S, formulando-se a hipótese de que não há

diferença entre a freqüência esperada e a observada (hipótese nula: H1). Donde, segundo um
determinado nível de significância, podemos afirmar que ocorreu:
(a) um erro do tipo I, se for aceita a hipótese H0.
(b) um erro do tipo II, se for rejeitada a hipótese H0.
(c) um erro do tipo I, se for aceita a hipótese H1, sendo esta correta.
(d) um erro do tipo II, se for rejeitada a hipótese H0, sendo esta correta.
(e) um erro do tipo I, se for rejeitada a hipótese H0, sendo esta correta.
09) (SEFAZ-MS-FGV) Um teste de hipóteses apresentou p-valor igual a 0,03. Portanto, nos níveis
de significância de 1% e 5%, respectivamente, a hipótese nula:
a) deve ser aceita e aceita
b) deve ser aceita e rejeitada
c) deve ser rejeitada e aceita
d) deve ser rejeitada e rejeitada
e) pode ou não ser rejeitada, dependendo de a hipótese ser simples ou não
10) (SEFAZ/RJ-FGV) Uma empresa afirma que os pacotes de bala que ela produz pesam em
média 25g. Para testar essa hipótese, foram selecionados ao acaso 16 pacotes produzidos pela
16
empresa, registrados seus pesos X1, X2, ..., X16 e calculadas as estatísticas: ∑ X i = 320 e
i =1
16
∑ X i2 = 7360 . O valor da estatística t (a ser comparado com o ponto desejado da distribuição t
i =1
de Student) para o teste é:
(A) -0,8
(B) -1,2
(C) -2,0
(D) -2,5
(E) -3,2
11) (IRB-ESAF) Num estudo do consumo de combustível para uma determinada marca de
automóvel, supõe-se que a distribuição do consumo é aproximadamente normal com média
desconhecida μ Km/l e desvio padrão de 3 km/l. Uma amostra de 36 veículos produziu a média de
consumo de 16 km/l. Deseja-se testar a hipótese H: μ = 15 contra a alternativa A: μ > 15.
Considerando os valores da função de distribuição normal padrão dados abaixo, assinale a opção
que dá o valor probabilístico (p-valor) do teste.
a) 0,500 z F(z)
b) 0,977 1,0 0,841
c) 0,050 1,2 0,885
d) 0,023 1,4 0,919
e) 0,010
1,6 0,945
1,8 0,964
2,0 0,977
2,2 0,986
2,4 0,992
12) (SEFAZ-RS-FGV) A comissão de planejamento de um aeroporto está pensando em remodelar
as instalações do estacionamento de carros. A idéia inicial é realocar a área de estacionamento
rápido se, dentre os carros que permanecem menos de 3 horas estacionados, o tempo médio de
estacionamento for inferior a 30 minutos. Para avaliar a situação, uma amostra composta de 25
canhotos de estacionamento (com o horário de entrada e de saída do veículo) foi selecionada
aleatoriamente dentre todos os carros que, em um determinado dia, ficaram estacionados menos
de 3 horas. Observou-se, então, que o tempo médio de estacionamento de 25 veículos
selecionados foi de 28 minutos com variância igual a 4. Para analisar este problema, foi realizado
o Teste t de Student (unilateral e a = 0,05). Qual o valor da estatística deste teste ?
a) -2,5
b) -3,3
c) -5,0
d) -12,5
e) -25,0
13) (SEFAZ-MS-FGV/2006) Em um teste de hipóteses, a hipótese nula foi rejeitada no nível de

3%. Portanto a hipótese nula:
a) será aceita no nível de 1%
b) será aceita no nível de 5%
c) pode ser aceita ou rejeitada no nível de 5%
d) será rejeitada no nível de 1%
e) será rejeitada no nível de 5%
14) (ECONOMISTA-FGV) Um teste de hipóteses apresentou p-valor igual a 0,07. Portanto, nos
níveis de significância de 10% e 5%, respectivamente, a hipótese nula:
a) deve ser aceita e aceita
b) deve ser aceita e rejeitada
c) deve ser rejeitada e aceita
d) deve ser rejeitada e rejeitada
e) pode ou não ser rejeitada, dependendo de a hipótese ser simples ou não
15) (AFRE-MG-ESAF) Um fabricante afirma que pelo menos 95% dos equipamentos que fornece
à indústria encontram-se dentro de suas especificações. Uma amostra de 200 itens escolhidos ao
acaso revelou 10 itens fora de especificação. Assinale a opção que corresponde ao valor
probabilístico (p-valor) do teste de H:θ ≥ 0,95 contra A: θ < 0,95, sendo θ a proporção populacional
de itens dentro de especificação.
a) 0,500
b) 0,050
c) 0,025
d) 0,010
e) 0,100
16) (GESTOR-MG-ESAF) Lança-se uma moeda 20 vezes e observa-se a ocorrência de 7 caras.
Seja θ a probabilidade de cara. Assinale a opção que dá o valor da estatística teste
correspondente ao teste da hipótese H: θ ≥ 0,5 contra a alternativa A: θ < 0,5.
a) - 0, 3 20
b) - 0, 2 20
c) 0, 3 20
d) 0, 2 20
e) 0, 5 20
17) (BACEN-ESAF) Um teste de hipótese rejeitou a hipótese nula H0 no nível de significância de

5%. O que aconteceria com H0 nos níveis de significância de 1% e 10% ?
a) Rejeitaríamos - Rejeitaríamos
b) Nada poderíamos afirmar - Rejeitaríamos
c) Não rejeitaríamos - Rejeitaríamos
d) Rejeitaríamos - Rejeitaríamos
e) Nada poderíamos afirmar - Nada poderíamos afirmar
18) (BACEN-FCC) O nível de significância de um teste populacional é a probabilidade:

a) De que o parâmetro populacional seja nulo
b) De uma hipótese nula ser rejeitada, quando é verdadeira
c) De uma hipótese nula ser rejeitada, quando é falsa
d) De que o parâmetro populacional escolhido seja inferior à probabilidade correspondente à
hipótese 1 (H1)
e) De que o parâmetro populacional escolhido seja superior à probabilidade correspondente à
hipótese 1 (H1)
19) (ICMSRJ-2010-FGV) Para testar H0: p ≤ 0,5 contra H1: p > 0,5, sendo p a proporção de pessoas que
são protegidas por planos de previdência privada numa certa população, uma amostra aleatória simples de
tamanho 400 será obtida e será usado como critério de decisão rejeitar a hipótese H0 se a proporção de
pessoas com essa proteção na amostra for maior ou igual a um certo número k.
Ao nível de significância de 5%, o valor de k é aproximadamente igual a:
(A) 0,508
(B) 0,541
(C) 0,562
(D) 0,588
(E) 0,602
20) (ICMSRJ-2010-FGV) Para testar H0: μ ≤ 10 contra H1: μ > 10, sendo μ a média de uma variável
populacional suposta normalmente distribuída com variância igual a 100, uma amostra aleatória simples de
tamanho 25 foi obtida e resultou num valor da média amostral igual a 15,76. Ao nível de significância de 5%,
o valor-p (nível crítico) correspondente e a decisão a ser tomada são respectivamente:
(A) 0,102 e não rejeitar H0.
(B) 0,01 e rejeitar H0.
(C) 0,058 e não rejeitar H0.
(D) 0,002 e rejeitar H0.
(E) 0,154 e não rejeitar H0.
GABARITO
01-A
02-A
03-A
04-A
05-A
06-A
07-A
08-E
09-B
10-D
11-D
12-C
13-E
14-C
15-A
16-A
17-B
18-B
19-B
20-D

TABELA NORMAL PADRÃO
Quantis da distribuição Normal Padrão: P(0 ≤ Z ≤ z)
Segunda decimal de z
0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
Parte inteira e primeira decimal de z
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
TABELA T-Student - BICAUDAL
Distribuição de Student - Valores de t no corpo da Tabela

Graus de Liberdade
1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 40 50 100 1000 Normal
0,1% 636,58 31,60 12,92 8,61 6,87 5,96 5,41 5,04 4,78 4,59 4,32 4,07 3,85 3,73 3,65 3,55 3,50 3,39 3,30 3,29
0,2% 318,29 22,33 10,21 7,17 5,89 5,21 4,79 4,50 4,30 4,14 3,93 3,73 3,55 3,45 3,39 3,31 3,26 3,17 3,10 3,09
0,4% 159,14 15,76 8,05 5,95 5,03 4,52 4,21 3,99 3,83 3,72 3,55 3,39 3,25 3,17 3,12 3,05 3,02 2,95 2,88 2,88
0,5% 127,32 14,09 7,45 5,60 4,77 4,32 4,03 3,83 3,69 3,58 3,43 3,29 3,15 3,08 3,03 2,97 2,94 2,87 2,81 2,81
1,0% 63,66 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,05 2,95 2,85 2,79 2,75 2,70 2,68 2,63 2,58 2,58
1,5% 42,43 8,07 5,05 4,09 3,63 3,37 3,20 3,09 3,00 2,93 2,84 2,75 2,66 2,61 2,58 2,54 2,52 2,48 2,44 2,43
2,0% 31,82 6,96 4,54 3,75 3,36 3,14 3,00 2,90 2,82 2,76 2,68 2,60 2,53 2,49 2,46 2,42 2,40 2,36 2,33 2,33
2,5% 25,45 6,21 4,18 3,50 3,16 2,97 2,84 2,75 2,69 2,63 2,56 2,49 2,42 2,38 2,36 2,33 2,31 2,28 2,24 2,24
3,0% 21,21 5,64 3,90 3,30 3,00 2,83 2,71 2,63 2,57 2,53 2,46 2,40 2,34 2,30 2,28 2,25 2,23 2,20 2,17 2,17
3,5% 18,17 5,20 3,67 3,14 2,87 2,71 2,61 2,53 2,48 2,44 2,38 2,32 2,26 2,23 2,21 2,18 2,17 2,14 2,11 2,11
4,0% 15,89 4,85 3,48 3,00 2,76 2,61 2,52 2,45 2,40 2,36 2,30 2,25 2,20 2,17 2,15 2,12 2,11 2,08 2,06 2,05
4,5% 14,12 4,55 3,32 2,88 2,66 2,52 2,44 2,37 2,33 2,29 2,24 2,19 2,14 2,11 2,09 2,07 2,06 2,03 2,01 2,00
5,0% 12,71 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,18 2,13 2,09 2,06 2,04 2,02 2,01 1,98 1,96 1,96
5,5% 11,55 4,09 3,06 2,68 2,49 2,38 2,30 2,24 2,20 2,17 2,13 2,08 2,04 2,01 2,00 1,98 1,96 1,94 1,92 1,92
6,0% 10,58 3,90 2,95 2,60 2,42 2,31 2,24 2,19 2,15 2,12 2,08 2,03 1,99 1,97 1,95 1,94 1,92 1,90 1,88 1,88
6,5% 9,76 3,73 2,85 2,53 2,36 2,25 2,19 2,14 2,10 2,07 2,03 1,99 1,95 1,93 1,92 1,90 1,89 1,87 1,85 1,85
7,0% 9,06 3,58 2,76 2,46 2,30 2,20 2,14 2,09 2,06 2,03 1,99 1,95 1,91 1,89 1,88 1,86 1,85 1,83 1,81 1,81
7,5% 8,45 3,44 2,68 2,39 2,24 2,15 2,09 2,05 2,01 1,99 1,95 1,91 1,88 1,86 1,84 1,83 1,82 1,80 1,78 1,78
8,0% 7,92 3,32 2,61 2,33 2,19 2,10 2,05 2,00 1,97 1,95 1,91 1,88 1,84 1,82 1,81 1,80 1,79 1,77 1,75 1,75
8,5% 7,45 3,21 2,54 2,28 2,14 2,06 2,00 1,96 1,93 1,91 1,88 1,84 1,81 1,79 1,78 1,77 1,76 1,74 1,72 1,72
9,0% 7,03 3,10 2,47 2,23 2,10 2,02 1,97 1,93 1,90 1,88 1,84 1,81 1,78 1,76 1,75 1,74 1,73 1,71 1,70 1,70
9,5% 6,65 3,01 2,41 2,18 2,06 1,98 1,93 1,89 1,87 1,84 1,81 1,78 1,75 1,74 1,72 1,71 1,70 1,69 1,67 1,67
10,0% 6,31 2,92 2,35 2,13 2,02 1,94 1,89 1,86 1,83 1,81 1,78 1,75 1,72 1,71 1,70 1,68 1,68 1,66 1,65 1,65
11% 5,73 2,76 2,25 2,05 1,94 1,87 1,83 1,80 1,77 1,75 1,73 1,70 1,67 1,66 1,65 1,63 1,63 1,61 1,60 1,60
Probabilidade Bicaudal
12% 5,24 2,62 2,16 1,97 1,87 1,81 1,77 1,74 1,72 1,70 1,67 1,65 1,62 1,61 1,60 1,59 1,58 1,57 1,56 1,55
13% 4,83 2,50 2,07 1,90 1,81 1,75 1,72 1,69 1,67 1,65 1,63 1,60 1,58 1,57 1,56 1,55 1,54 1,53 1,52 1,51
14% 4,47 2,38 2,00 1,84 1,75 1,70 1,66 1,64 1,62 1,60 1,58 1,56 1,54 1,52 1,52 1,51 1,50 1,49 1,48 1,48
15% 4,17 2,28 1,92 1,78 1,70 1,65 1,62 1,59 1,57 1,56 1,54 1,52 1,50 1,49 1,48 1,47 1,46 1,45 1,44 1,44
16% 3,89 2,19 1,86 1,72 1,65 1,60 1,57 1,55 1,53 1,52 1,50 1,48 1,46 1,45 1,44 1,43 1,43 1,42 1,41 1,41
17% 3,66 2,10 1,80 1,67 1,60 1,56 1,53 1,51 1,49 1,48 1,46 1,44 1,42 1,41 1,41 1,40 1,39 1,38 1,37 1,37
18% 3,44 2,03 1,74 1,62 1,56 1,52 1,49 1,47 1,45 1,44 1,42 1,41 1,39 1,38 1,37 1,36 1,36 1,35 1,34 1,34
19% 3,25 1,95 1,69 1,58 1,52 1,48 1,45 1,43 1,42 1,41 1,39 1,37 1,36 1,35 1,34 1,33 1,33 1,32 1,31 1,31
20% 3,08 1,89 1,64 1,53 1,48 1,44 1,41 1,40 1,38 1,37 1,36 1,34 1,33 1,32 1,31 1,30 1,30 1,29 1,28 1,28
21% 2,92 1,82 1,59 1,49 1,44 1,40 1,38 1,36 1,35 1,34 1,32 1,31 1,30 1,29 1,28 1,27 1,27 1,26 1,25 1,25
22% 2,78 1,76 1,55 1,45 1,40 1,37 1,35 1,33 1,32 1,31 1,29 1,28 1,27 1,26 1,25 1,25 1,24 1,23 1,23 1,23
23% 2,65 1,71 1,50 1,41 1,37 1,34 1,31 1,30 1,29 1,28 1,26 1,25 1,24 1,23 1,23 1,22 1,22 1,21 1,20 1,20
24% 2,53 1,65 1,46 1,38 1,33 1,30 1,28 1,27 1,26 1,25 1,24 1,22 1,21 1,20 1,20 1,19 1,19 1,18 1,18 1,18
25% 2,41 1,60 1,42 1,34 1,30 1,27 1,25 1,24 1,23 1,22 1,21 1,20 1,18 1,18 1,17 1,17 1,16 1,16 1,15 1,15
25% 2,41 1,60 1,42 1,34 1,30 1,27 1,25 1,24 1,23 1,22 1,21 1,20 1,18 1,18 1,17 1,17 1,16 1,16 1,15 1,15
27% 2,21 1,51 1,35 1,28 1,24 1,22 1,20 1,19 1,18 1,17 1,16 1,15 1,13 1,13 1,12 1,12 1,12 1,11 1,10 1,10
28% 2,13 1,47 1,31 1,25 1,21 1,19 1,17 1,16 1,15 1,14 1,13 1,12 1,11 1,10 1,10 1,10 1,09 1,09 1,08 1,08
29% 2,04 1,43 1,28 1,22 1,18 1,16 1,14 1,13 1,12 1,12 1,11 1,10 1,09 1,08 1,08 1,07 1,07 1,06 1,06 1,06
30% 1,96 1,39 1,25 1,19 1,16 1,13 1,12 1,11 1,10 1,09 1,08 1,07 1,06 1,06 1,05 1,05 1,05 1,04 1,04 1,04
35% 1,63 1,21 1,10 1,06 1,03 1,01 1,00 0,99 0,99 0,98 0,97 0,96 0,96 0,95 0,95 0,95 0,94 0,94 0,94 0,93
40% 1,38 1,06 0,98 0,94 0,92 0,91 0,90 0,89 0,88 0,88 0,87 0,87 0,86 0,86 0,85 0,85 0,85 0,85 0,84 0,84
45% 1,17 0,93 0,87 0,84 0,82 0,81 0,80 0,79 0,79 0,79 0,78 0,78 0,77 0,77 0,77 0,76 0,76 0,76 0,76 0,76
50% 1,00 0,82 0,76 0,74 0,73 0,72 0,71 0,71 0,70 0,70 0,70 0,69 0,69 0,68 0,68 0,68 0,68 0,68 0,67 0,67
55% 0,85 0,71 0,67 0,65 0,64 0,63 0,63 0,62 0,62 0,62 0,62 0,61 0,61 0,61 0,60 0,60 0,60 0,60 0,60 0,60
60% 0,73 0,62 0,58 0,57 0,56 0,55 0,55 0,55 0,54 0,54 0,54 0,54 0,53 0,53 0,53 0,53 0,53 0,53 0,52 0,52
65% 0,61 0,53 0,50 0,49 0,48 0,48 0,47 0,47 0,47 0,47 0,47 0,46 0,46 0,46 0,46 0,46 0,46 0,46 0,45 0,45
70% 0,51 0,44 0,42 0,41 0,41 0,40 0,40 0,40 0,40 0,40 0,39 0,39 0,39 0,39 0,39 0,39 0,39 0,39 0,39 0,39
75% 0,41 0,37 0,35 0,34 0,34 0,33 0,33 0,33 0,33 0,33 0,33 0,32 0,32 0,32 0,32 0,32 0,32 0,32 0,32 0,32
80% 0,32 0,29 0,28 0,27 0,27 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,26 0,25 0,25 0,25 0,25
85% 0,24 0,21 0,21 0,20 0,20 0,20 0,20 0,20 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19
90% 0,16 0,14 0,14 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13
95% 0,08 0,07 0,07 0,07 0,07 0,07 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06
100% 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Estatística Afrf Apostila p2

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística Afrf Apostila p2

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística Afrf Apostila p2

Enviado por

Direitos autorais:

Formatos disponíveis

MÓDULO - 5A - PROBABILIDADE

Evento - é qualquer subconjunto do espaço amostral S de um experimento aleatório.

Probabilidade - chama-se probabilidade de um evento A, A ⊂ S ao número real P(A) tal que:

Exemplo: Qual é a probabilidade de se obter cara no lançamento de uma moeda?

Temos: Espaço Amostral S = {Ca, Co} n(S) = 2

Seja A o evento “aparecer cara”, então, A é dado por: A = {Ca} e n(A) = 1.

Logo, P(A) = n(A)/n(S) P(A) = ½ = 0,5 ou 50%.

Temos: Espaço Amostral ⇒ S = {1,2,3,4,5,6} ⇒ n(S) = 6

Exemplo: Qual é a probabilidade de se tirar um rei em um baralho de 52 cartas ?

Evento A ⇒ aparecer um rei

OBS: A probabilidade de um evento A pode também ser definida da seguinte maneira:

Número de casos favoráveis a ocorrência de A

Eventos Complementares ⇒ dois eventos de um espaço amostral S são complementares quando o

Exemplo: No lançamento de uma moeda, se definirmos os eventos:

E1 e E2 são eventos complementares, pois E1 ∪ E2 = S (Espaço Amostral)

Exemplo: Se a probabilidade de ocorrer 4 no lançamento de um dado é p =1/6, a probabilidade de não

Exemplo: Lançamento de dois dados. A probabilidade de obtermos 1 no primeiro dado é p1 = 1/6. A

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

Eventos Mutuamente Exclusivos - dois ou mais eventos são mutuamente exclusivos se a

Exemplo: Lançamento de um dado. A probabilidade de se tirar o 3 ou o 5 é:

p = 1/6 + 1/6 = 2/6 = 1/3.

1 - A probabilidade de um evento A é um número maior ou igual a zero e menor ou igual a 1.

Podemos definir os seguintes eventos:

P(A) = 13 / 52 ⇒ 13 cartas de copas.

P(A ∪ B) = P(A) + P(B) = 26 / 52 = 50%.

Podemos definir os seguintes eventos:

será dada então por: P(A ∪ B) = P(A) + P(B) - P(A ∩ B).

P(A) = 13/52 ⇒ 13 cartas de paus.

P(A ∩ B) = 1/52 ⇒ 1 rei de paus.

P(A ∪ B) = P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 13/52 + 4/52 - 1/52 = 16/52.

P(A ∩ B) ⇒ é a probabilidade de A e B ocorrerem simultaneamente.

P(B) ⇒ é a probabilidade de B ocorrer.

Se o número sorteado for par, qual a probabilidade de que seja o número 6 ?

P(B) = 7/15 ⇒ sete números pares em 15.

P(A∩Β) = 1/15 ⇒ o número 6 em 15, ou seja, uma chance em 15.

Eventos Dependentes ⇒ Se dois eventos A e B são dependentes então:

P(A∩B) = P(B) × P(A/B) ou P(A∩B) = P(A) × P(B/A)

Precisamos calcular P(A∩B), ou seja, a ocorrência simultânea de A e B.

Temos: P(A∩B) = P(A) × P(B/A).

P(A) = 6/10 ⇒ seis defeituosas em 10.

P(B/A) = 5/9 ⇒ a 1ª era defeituosa - sobram 5 defeituosas em um total de 9.

Então, P(A∩B) = 6/10 × 5/9 = 30/90 = 1/3.

Se dois eventos são independentes então: P(A∩B) = P(A) × P(B)

A = {a 1ª carta é de paus} ⇒ P(A) = 13/52.

P(A∩B) = 13/52 × 13/52 = ¼ × ¼ = 1/16.

Sejam E1 , E2 , ... , En eventos mutuamente exclusivos tais que E1 ∪ E2 ∪ ... ∪ En = S. Sejam P ( Ei ) as

E2 = a 2ª caixa foi escolhida.

P(E1) = P (E 2) = ½ ⇒ a probabilidade de sortear cada caixa é ½ = 50%.

Assim, arranjos de n elementos n a n são chamados de Permutações.

Exemplo: Com as letras A, B, C, D, E, F, G, quantos arranjos de 3 letras podemos formar?

A probabilidade desejada P(E) será: nº casos favoráveis/ nº de casos possíveis.

P (E) = 1.287 / 2.598.960 = 0,0005 ou 0,05 %

02-(ELETROBRÁS-ESTATÍSTICO-2002/NCE) A e B são eventos independentes com P[A] = 0,5 e P[B]=0,3.

04-(IBGE-ANALISTA-2002/NCE) Dois eventos A e B são independentes, P[A] = 0,16 e P[B] = 0,5. A

05-(IBGE-ANALISTA CENSITÁRIO-2000/NCE) Se A e B são eventos independentes com probabilidades de

07-(MIN-CIDADES-ESTATÍSTICO-2006/NCE) Se A e B são eventos com probabilidades 50% e 60%

09-(PETROBRÁS-ECONOMISTA-JR-2005/CESGRANRIO) Jogando-se um dado duas vezes, a

10-(PETROBRÁS-ESTATÍSTICO-2005/CESGRANRIO) Os eventos A e B são independentes e suas

11-(SEAD-AM-ESTATÍSTICO-2005/CESGRANRIO) Os eventos A e B são independentes e suas