O Que É Estatística
O Que É Estatística
O Que É Estatística
• O Que é Estatística?
Estatística Descritiva ou
A estatística divide-se Análise Exploratória de Dados
em duas áreas:
Inferência Estatística ou
Exemplo: Estatística Inferencial
1
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Tipos de Dados
Exemplo:
Dados = matéria prima da estatística.
Pesquisa eleitoral → estimação dos
percentuais de intenções de voto em todo A identificação da ferramenta estatística
o universo eleitoral, a partir de uma adequada para tratá-los depende da
amostra de, digamos, 2.000 pessoas. identificação correta do tipo dos dados.
• Dados primários são aqueles obtidos • Dados em corte (transversal) são aqueles
de forma direta, mediante observação, referentes ao mesmo instante de tempo.
pesquisas ou experimentos controlados.
• Dados de séries temporais são aqueles
• Dados secundários são aqueles que não registrados ao longo de um período de
são obtidos diretamente, e sim mediante tempo, com determinada frequência.
publicações (como relatórios ou artigos).
2
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
3
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Exemplo 1.2
• Gráfico de Barras
Número de reclamações diárias x frequência
em certo mês, no SAC de uma empresa:
Representação gráfica apropriada para
variáveis que representam contagens.
Exemplo 1.3:
• Gráfico de Pizza ou de Setores
4
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Medidas de Posição
Média
Uma medida de posição é um valor em
torno do qual os dados estão concentrados. É a soma das observações dividida
pelo número de observações:
n
Sinônimos: medida de localização ∑x i x 1 + x 2 + ... + x n
ou de tendência central. µ= i =1
= .
n n
Principais medidas de posição:
no de i-ésima
Média , Mediana e Moda. observações observação
Exemplo 1.4:
No exemplo 1.1, o faturamento médio
é µ = 307,7/30 = 10,3 milhões. Salários de economistas recém-formados
(em R$ 1.000): 2,8; 6,0; 2,6; 3,1; 3,0.
Note que o valor 10,3 não ocorre.
Salário médio (destes 5 economistas):
µ = 3,5 (R$ 3.500,00).
Nenhum problema!
A média de um conjunto de dados não
Este número é representativo
precisa ser um dos valores observados.
dos salários desses 5 economistas?
5
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
6
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
7
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
8
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
n ∑ ( x − µ)
i
amplitude total = máximo - mínimo. ∑ ( x − µ) ou i =1
.
i
i =1 n
Uma forma mais completa de definir Solução:
uma medida de dispersão é: valor que Problema: trabalhar com
os módulos
nos informa o quanto os dados variam n ou quadrados
em torno de uma medida de posição. ∑ (x − µ) = 0, sempre!
i =1
i
dos desvios!
σ2)
Variância (σ Forma alternativa para o cálculo de σ2:
∑ (x i
− µ) 2
σ2 = i =1
. σ2 = i =1
= i =1
− µ2.
n n n
9
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
13
17
21
25
29
33
37
41
45
49
1
9
-2
Neste contexto, o desvio padrão é uma medida -4
-6
do risco do ativo, chamada volatilidade. -8
DIAS
10
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Curtose
Percentis (ou Quantis)
A curtose é uma medida do
“achatamento” da distribuição dos dados. O p-ésimo percentil ou percentil p de
um conjunto de dados é o valor x tal que
referência
p% dos dados são menores ou iguais a x.
11
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
∆Q = Q3 – Q1.
12
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Análise Bidimensional
Diagrama de Dispersão
É a análise estatística que envolve 2 variáveis.
13
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Interpretação do
Coeficiente de Correlação Coeficiente de Correlação:
1 - varia entre -1 e 1
Neste caso, quanto maior a intensidade da
2 - é adimensional (não possui unidade)
associação, mais próximo ρXY está de -1.
3 - representa a força da relação
linear (apenas) entre 2 variáveis.
Por exemplo, um coeficiente de correlação
igual a -0,1 indica uma relação linear
negativa e fraca entre X e Y. Obs - correlação x causalidade.
14
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Experimento Aleatório
Embora o resultado de um experimento
aleatório não possa ser pré-determinado,
Um experimento aleatório é uma ação
é possível descrever o conjunto dos
cujo resultado não pode ser previsto.
resultados que podem ocorrer.
Exemplos:
2.1 - Lançar um dado e observar a
Este conjunto é chamado
face que fica voltada para cima.
espaço amostral.
2.2 - Selecionar uma bolinha de uma urna com
bolinhas vermelhas e azuis e verificar sua cor. Notas de Aula - Professor Eduardo
Lima Campos.
15
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
A∪B = {2,4,5,6}.
Seja A um evento definido em um espaço
amostral S. A probabilidade de A, denotada
O evento ´A e B ocorrem` é dado pela por P(A), é uma função que satisfaz a 3
interseção do evento A com o evento B. Axiomas, os quais são apresentados a seguir.
A∩B = {4,6}.
Notas de Aula - Professor Eduardo
Lima Campos.
16
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
casos favoráveis
S = {(CA,CA,CA);(CA,CA,CO);
#A (CA,CO,CA);(CO,CA,CA);(CA,CO,CO);
P( A ) = ao evento A
(CO,CA,CO);(CO,CO,CA);(CO,CO,CO)},
#S casos possíveis
totalizando #S = 8 casos possíveis.
Lei da Adição
(Probabilidade do ´OU`) Exemplo 2.4 - Um aluno estuda para um
exame por 2 livros. O primeiro aborda
Sejam A e B dois eventos, com interseção
30% do programa. O segundo, 28%. 24%
A∩B. Qual a probabilidade de A∪B?
do programa é abordado pelos dois livros.
(ou seja, de que A ou B ocorram)
A Lei da Adição fornece a solução deste Qual a probabilidade de que determinado
problema, por meio da seguinte fórmula: tópico do programa esteja em pelo menos
um dos dois livros utilizados pelo aluno?
∪B) = P(A) + P(B) - P(A∩
P(A∪ ∩B)
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.
17
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
18
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
∩B)/P(B).
P(A|B) = P(A∩ R: 2/3.
19
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Lei da Multiplicação
(Probabilidade do ´E`) Solução do exemplo 2.8, item a:
Sejam A e B dois eventos, com P(B)>0. Qual A = segunda bolinha azul e B = primeira
a probabilidade de que A e B ocorram? bolinha vermelha. Do enunciado, temos
que: P(A|B) = 8/11 e P(B) = 4/12.
A Lei da Multiplicação fornece a solução
deste problema, por meio da fórmula a seguir:
Assim:
P(A∩B) = 8/33.
∩B) = P(A|B)P(B)
P(A∩
Notas de Aula - Professor Eduardo
Lima Campos.
20
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
P(A|B) A P(A|B) A
P(B) B P(B) B
P(Ac|B) Ac P(Ac|B) Ac
P(A|Bc) A P(A|Bc) A
P(Bc) P(Bc)
Bc Bc
P(Ac|Bc) Ac P(Ac|Bc) Ac
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.
21
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Assim:
P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)
P(A) = 2/3.
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.
Solução:
a) Qual a probabilidade de que o concorrente
a) Pela Lei da Multiplicação, temos que:
introduza o serviço e que, mesmo assim, ele
seja lucrativo para a empresa X? P(A∩B) = P(A|B)P(B) = 0,3*0,5 = 0,15.
22
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
23
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
A = ´ser selecionado`
B = ´ter cursado o MFEE`. Pede-se P(A).
Solução do Item b:
Exemplo 2.11 (cont.)
Pede-se P(B|A)
b) Se um candidato foi selecionado
para a vaga, qual a probabilidade P(B|A) = P(A|B)P(B)/P(A)
de que ele tenha cursado o MFEE?
= 0,9*0,7/0,72 = 0,875.
24
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
25
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
26
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
∫ f ( x )dx
6.000
2) A área total sob o gráfico é igual a 1.
x
A figura mostra: P(6.000≤X≤8.000).
27
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
28
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
E[g( X)] = ∑ g ( x )P (X = x )
Solução: x
k3 2 3k 2 E[g(X )] = ∫ g ( x )f ( x )dx
∫ x dx = 0,5 ⇒ ∫ x dx = 0,5 ⇒
08 80
3
k
= 0,5 ⇒ k 3 = 4 ⇒ k = 3 4. O caso mais importante é do da função
8 g(X) = [X-E(X)]2, que define a variância.
29
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Isto se chama padronizar a v.a. X (ou seja, Exemplo 3.12 - Ache F(x) para a v.a. do
transformá-la em uma nova v.a., chamada exemplo 3.5 (relembrando a distribuição:
de Z, que possui média zero e variância 1). P(X=0) = 1/2, P(X=1) = 1/3, P(X=2) = 1/6).
30
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Para x ≥ 1, F(x) = 1.
Determine:
P.1) Cov(X,X) = V(X). a) Cov(X,Y) R:8.
P.2) Cov(aX,cY) = acCov(X,Y). b) Cov(X,Z) R: 12.
c) Cov(Y,Z) R: 24.
P.3) Cov(aX+b,cY+d) = acCov(X,Y). d) Corr(X,Z) R: 1.
e) Corr(Y,Z) R: 1.
31
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Distribuição de Bernoulli
Um dos resultados é chamado
Experimento de Bernoulli é um “sucesso”, e o outro, “fracasso”.
experimento aleatório que possui
apenas dois resultados possíveis.
A probabilidade de sucesso
é designada por p.
Exemplos:
4.2 - Lançar uma moeda e Como consequência, a
observar a face voltada para cima. probabilidade de fracasso é 1-p.
4.3 - Observar se um atirador acerta o alvo. .
Seja agora uma v.a. X que assume valor Fórmula da Distribuição de Bernoulli:
0, se ocorre um fracasso, e 1, se ocorre
um sucesso. A distribuição desta v.a. é:
32
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
probabilidade de
n! obter x sucessos
n (número de realizações) e p (probabilidade = . em n realizações
x!( n − x )!
de sucesso) são os parâmetros da distribuição. independentes
2 1
3 1 1 3
P(X = 2) = = .
2 2 2 8
33
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
Exemplo 4.6 - Considere um exame com A v.a. de interesse é: X = número de acertos.
20 questões de múltipla escolha, cada uma
com 5 alternativas. Se um aluno que não Logo: X ~ Bin(20;0,2). Daí:
estudou nada resolve “chutar” todas as
20
respostas, qual é a probabilidade de que P(X = 6) = (0,2) (0,8) = 0,1091.
6 14
34
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
x P(X=x)
Seja agora Y uma outra v.a.,
representando o preço final da ação.
0 0,0256
Note que, se a ação cair todos os dias
1 0,1536
(X=0), Y será igual a R$ 96,00.
2 0,3456
Por outro lado, se a ação subir todos os
3 0,3456 dias (X=4), Y será igual a R$ 104,00.
Assim:
e aplicando a fórmula do valor
esperado de aX+b (capítulo 3):
E(Y) = 2*2,4+96 = 100,8.
35
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Distribuição Hipergeométrica
Em princípio, poderíamos pensar na
extração de cada bolinha como um
Exemplo 4.8 - Considere 4 extrações sem experimento de Bernoulli, e a v.a. X de
reposição de bolinhas, de uma urna que interesse (número de bolinhas azuis na
contém 8 bolinhas azuis e 5 vermelhas. amostra) seguindo distribuição binomial.
Calcule a probabilidade de que 3 sejam azuis. Pergunta: o que nos impede de fazer isto?
36
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
Exemplo 4.9
Seja X o número de peças defeituosas
na amostra de tamanho 5. Então:
Considere um lote de 10 peças, das quais
4 6
4 são defeituosas. Se extrairmos 5 peças,
P(X = 2) = = 0,4762.
sem reposição, qual a probabilidade de 2 3
que 2 sejam defeituosas? 10
5
37
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
5 10
r
E( X ) = n
P(X = 0) = = 0,1539.
0 4
N
15
r r N − n
4 V(X) = n 1 −
N N N − 1
38
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
Exercício (Resolvido) 4.1 - Um jogador
converte 10% dos pênaltis que cobra. a) Seja X o número de pênaltis
que o jogador acerta. Então:
a) Qual a probabilidade de que ele acerte
X ~ Bin(5;0,1).
apenas uma cobrança em 5 tentativas?
Pede-se P(X=1).
b) Qual a probabilidade de que ele precise
bater 5 pênaltis até acertar o primeiro? 5
P(X = 1) = (0,1)1 (0,9) 4 = 0,32805.
1
39
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
X ~ BNeg(2,2/3).
E(X) = r/p
2 2
V(X) = r(1-p)/p2
3 2 2
P(X = 4) = 1 − = 0,1481.
1 3 3
40
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
• Aproximação da Binomial pela Poisson
3 2 e −3
a ) P ( X = 2) = = 4,5e −3 .
2!
Se n for grande e p for pequeno, o
b) Aqui deve - se converter o λ para o período de número de sucessos em n realizações
20 minutos (= 1/3 de hora) ⇒ se ocorrem, em média, independentes de experimentos de
3 acidentes em uma hora, então ocorre em média 1 a Bernoulli pode ser aproximado pela
cada 20 minutos. Assim, o λ para 20 minutos é 1, e :
distribuição de Poisson, com λ = np.
41
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
P[(X ≤ 5) ∩ (X > 3)]
P(X ≤ 5 | X > 3) = =
P(X > 3)
Um olhar desatento poderia nos levar a
calcular P(X=4) + P(X=5), quando o que
é pedido é uma probabilidade condicional:
P(X = 4) + P(X = 5)
P(X ≤ 5 | X > 3), =
1 − [P(X = 1) + P(X = 2) + P(X = 3)]
sendo X ~ Geom(0,1).
0,1385
Esta probabilidade é = 0,19.
0,729
calculada da seguinte forma:
42
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
É a distribuição contínua
5. DISTRIBUIÇOES mais simples que existe.
β-α
P(a≤X≤b) = (b-a)/(β α)
Parâmetros: α e β.
Notação: X ~ Unif(α,β).
R: 1/6.
43
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Fórmula da Exponencial:
λ
E(X) = 1/λ
f ( x ) = λe , x > 0; λ > 0.
− λx λ2
V(X) = 1/λ
= (− xe−λx ) 0 + ∫ e −λx dx
∞
0
Esta integral deve ser resolvida por partes, ∞
− λx
e 1
= (− xe )
fazendo u = x e dv = e-λxdx. ∞
− λx
+ − = .
Temos então que: du = dx e v = -e-λx/λ. λ 0 λ
0
Assim:
Demonstração da Variância:
Função Distribuição
V(X) = E(X2)
– E2(X). Acumulada da Exponencial:
E(X2) é calculado da seguinte forma:
∞ ∞
44
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
F( x ) = P(X ≤ x ) = ∫ λe −λx dx =
0
b) De que demore menos do que 7 minutos
para ele ser atendido? R: 1-e-0,7.
x
1 − e −λx
λ ∫ e −λx dx = λ = 1 − e − λx .
0 λ c) E entre 7 e 12 minutos? R: e-0,7-e-1,2.
d) De que ele espere mais do que 10 minutos Exemplo 5.3 - O tempo (em horas) de
(isto é, mais do que a média E(X))? duração das lâmpadas de uma marca segue
uma distribuição exponencial com λ = 0,01.
R: 69,31 horas.
O resultado do item d) indica que a média da
exponencial é sempre maior que a mediana! Interpretação: 50% das lâmpadas desta
marca duram mais do que 69,31 horas.
45
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Distribuição Normal
Demonstração da Falta de Memória:
( x −µ ) 2
1 −
P(X>x+s|X>x) = f (x) = e 2 σ2
; x ∈ ℜ; µ ∈ ℜ, σ2 > 0.
P[(X>x+s)∩(X>x)]/P(X>x) = σ 2π
σ 2π
não possui solução analítica!
46
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
que possui média 0 e variância 1 P(0 < Z < 0,46) é encontrada na tabela.
(como vimos no capítulo 3 do curso).
47
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
P(-1 < Z < 1)
Considerando µ=
Solução: do slide anterior, E(X) e σ = DP(X).
P(-1 < Z < 1) = 0,6826.
f) E entre 160 e 180 cm? h) E maior do que 175 cm? P(Z > 0)
Solução: P(160 < X < 180) = Solução: P(X > 175) = P(Z > 1) = 0,5 -
P(-2 < Z < 2) = 2*0,4772 = 0,9544. P(0 < Z < 1) = 0,5 - 0,3413 = 0,1587.
48
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
b)
P(79 < X < 82) =
79 − 80 X − µ 82 − 80
P < < =
4 σ 4
P(− 0,25 < Z < 0,5) =
P( −0,25 < Z < 0) + P(0 < Z < 0,5) =
P(0 < Z < 0,25) + P(0 < Z < 0,5).
Resposta do item b):
Por causa da simetria!
0,0987+0,1915 = 0,2902.
49
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
Exemplo 5.6 - A rentabilidade de uma Seja X1 = rentabilidade da estratégia.
estratégia financeira no mercado futuro,
referente a certo período, possui distribuição P ( X1 < 0) =
Normal, com média 5% e desvio padrão 3%. X −µ 0−µ
P 1 < =
σ σ
a) Qual a probabilidade da rentabilidade 0−5
ser negativa, no período considerado? P Z < =
3
P(Z < −1,67 ) =
0,0475.
Solução:
50
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Fórmula:
• Distribuição Lognormal
1
1 − (ln y−µ )2
f ( y) = e 2 σ2
; y > 0, µ ∈ ℜ, σ > 0.
Seja uma v.a. Normal yσ 2π
X ~ N(µ,σ2) e seja Y = eX.
A distribuição lognormal
A distribuição de Y é chamada apresenta assimetria positiva.
lognormal, com parâmetros µ e σ2. σ2
µ+
Valor Esperado: E ( Y ) = e 2
Fórmula:
E(X) = υ
1 υ
−1 −
x υ
V(X) = 2υ
f (x) = υ x 2 e 2 ; x > 0; υ > 0.
2 2
π
Relação entre a Qui-Quadrado e a Normal:
51
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Soma de V.A.`s
Exemplo 6.1 - Um elevador suporta
um peso máximo de 500Kg. Podemos
estar interessados na probabilidade do
6. FUNÇÕES peso limite ser ultrapassado quando 7
pessoas entram neste elevador.
LINEARES DE V.A.`s Neste caso, a v.a. de interesse é:
7 peso da
S = ∑ Xi , i-ésima pessoa.
i =1
52
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
n
P(S > 49.960) = P Z >
49.960 − 50.000
∑ Xi
40 X= i =1
.
n
= P(Z > −1) = P(−1 < Z < 0) + 0,5 =
P(0 < Z < 1) + 0,5 = 0,8413. Note que, assim como a soma, a média de n
v.a.`s é, também uma variável aleatória.
53
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
R: 0,9772. R: 0,2843.
54
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Exemplo 6.6 - Seja X a v.a. que Considere uma carteira com 60% do capital
representa o retorno de uma ação 1, Y a alocado na ação 1 e 40% na ação 2.
v.a. que representa o retorno de uma ação
2, e C o retorno de uma carteira composta A ação 1 possui retorno esperado 3% e
pelas ações 1 e 2: C = aX+bY. volatilidade (desvio padrão) 7%. A ação 2
possui retorno esperado 6% e volatilidade
10%. Os retornos das ações possuem
coeficiente de correlação igual a -0,5.
pesos ⇒ proporções do
capital alocadas em cada ação.
Calcule o retorno esperado e a
volatilidade desta carteira.
55
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Começaremos mostrando que, se ρXY = 1, a Daí, é fácil ver que para qualquer ρXY < 1 :
volatilidade da carteira é igual à combinação
linear das volatilidades das ações:
σC < aσX + bσY.
σC = aσX + bσY.
Demonstração: note da fórmula de V(C), que, Ou seja, para qualquer valor da correlação (<
se ρXY = 1: V(C) = (aσX + bσY)2. Portanto, 1), a volatilidade da carteira será menor que a
o desvio padrão é σC = aσX + bσY, c.q.d. combinação linear das volatilidades das ações.
56
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
57
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
População Parâmetro
58
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Estimador x Estimativa
Estimador
Quando substituímos no estimador os
valores observados de X1, X2, ..., Xn,
Estimador é uma estatística (função das
obtemos uma estimativa do parâmetro.
v.a.`s da amostra) usada para obter um
valor “plausível” para um parâmetro. Exemplo 7.1 (cont.) - Considere a amostra
O estimador “natural” para µ é: observada de tamanho 5: x1 = 174, x2 =
186, x3 = 186, x4 = 180 e x5 = 174 (cm).
n
∑X
o chapéu significa média da 5
que estamos i amostra ∑ xi
estimando µ µˆ = X = i =1
. ou média
amostral
A estimativa de µ é: x = i =1
= 180.
n 5
59
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
B(θˆ ) = E (θˆ ) − θ.
não viciado viciado p/ baixo viciado p/ cima Do inglês: bias = vício.
µ-εε µ µ+εε
• Erro Padrão
Quanto menor a
variância, maior será: O desvio padrão de um estimador
é denominado erro padrão (EP).
P(µ − ε < µˆ < µ + ε),
Vimos no capítulo 6 que:
σ 2 e assim: σ
V (X ) = EP ( X ) = .
para um ε arbitrário, > 0. n n
60
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Estimação de σ2
Isto porque:
∑ (X − X ) i
2
∑ X − nX
2
i
2
σˆ * =
2 i =1
= i =1
. O vício do estimador é:
n n
σ2
Problema: B(σˆ *2 ) = E (σˆ *2 ) − σ 2 = − .
o estimador acima é viciado. n
n n
Se 2 estimadores são não viciados para
∑ (X i − X ) 2 ∑X 2
i − nX 2 um parâmetro, qual deles é o melhor?
S2 = i =1
= i =1
.
n −1 n −1
R: o que tiver menor variância.
Este estimador é chamado variância amostral.
Este estimador é dito mais eficiente.
S = S2 é chamado desvio padrão amostral.
V(θˆ 2 )
Ef (θˆ 1 , θˆ 2 ) = . Se Ef = 1, os estimadores
V(θˆ 1 ) são igualmente eficientes.
61
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Estimador Consistente
• Estimador Linear
Um estimador é dito consistente se
Estimador linear é aquele que é uma satisfaz a uma das seguintes condições:
função linear de variáveis aleatórias. 1) É não viciado e:
Lim V(θˆ ) = 0.
n →∞
assintoticamente
Exemplo : X. não viciado.
ou 2) É viciado, mas:
Lim
n →∞
B(θˆ ) = 0 e Lim
n →∞
V(θˆ ) = 0.
62
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
63
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
λ 2e − λ
P(X = 2) = .
Mas o problema aqui é inverso: 2!
0
A idéia do método a ser apresentado é
0,01
0,64
1,27
1,9
2,53
3,16
3,79
4,42
5,05
5,68
6,31
6,94
7,57
8,2
8,83
9,46
10,1
10,7
11,4
12
12,6
13,2
13,9
14,5
64
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
0,2
• Função de Verossimilhança (caso discreto) Exemplo 8.1 (cont.) no caso de uma AAS
de tamanho n de uma população Poisson(λ):
n
O produto é pelo fato de ser uma ∑ x i − nλ
AAS (v.a.´s independentes!) λ i=1 e
n L (λ ) = .
P(X1 = x1 , X2 = x 2 ,...,Xn = x n ) = ∏ P(Xi = xi ),
n
i =1
∏x ! i
∀(x1,x2,...,xn). i =1
65
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Maximizando a Função
de Log-Verossimilhança: Exemplo 8.1 (cont.) - A derivada da função
de log-verossimilhança encontrada é:
O ponto de máximo de l(λ)
é o valor de λ tal que: n
∑ xi
l`(λ) = 0 e l``(λ) < 0. l`(λ) = i =1
−n
λ
Um facilitador: em geral, l(λ) é
côncava, o que garante que: l``(λ) < 0,
∀ λ. Portanto, basta resolver: l`(λ) = 0.
n λˆ MV = X.
∑ xi
cuja solução é: λ = i =1
= x.
n
66
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
n i =1
L(λ) = ∏ f (x i ) = Derivando e igualando a zero :
i=1
n
∑xi n n n 1
n −λ
l`( λ ) = − ∑ xi = 0 ⇔ λ = n = .
∏λe = λ e
−λx n i i=1
. λ i =1
i=1 ∑ xi x
i =1
Obtenha o EMV de p.
1
λˆ MV = .
X R:
p̂ MV = X.
67
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
A função de verossimilhança é:
n
A idéia aqui é derivar a função de log- L(µ, θ = σ2 ) = ∏ f (x i ) =
verossimilhança em relação a µ e θ = σ2 i=1
n
( x i −µ ) 2
( x i −µ )
∑
2
(que são os parâmetros a serem estimados). n −
1
− −
n −
∏ (2πθ) e =(2πθ) e
2θ 2θ
2 2 i=1
.
i =1
Derivando em relação à µ:
A função de log-verossimilhança é:
n
∂l(µ, θ) ∑ (x − µ) i
n −∑ ( xi −µ)
n 2
= i =1
.
− θ ∂µ θ
l(µ, θ) = ln (2πθ) 2 e i=1 =
2
n Igualando a zero:
n ∑(xi − µ)2
− ln(2πθ) − i =1 n
2 2θ
.
∑ (x
i =1
i − µ) = 0 ⇔ µ = x ⇒ µˆ MV = X.
68
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Derivando em relação à θ:
Assim, os EMV`s de µ e σ2 da Normal são:
n
(xi − µ)2
∂l(µ, θ) n i∑
=− + =1
µˆ MV = X.
∂θ 2θ 2θ2 n
θ= i =1
. Obs - note que o EMV de σ2 é viciado.
n
Bernoulli : p̂ MV = X.
1) Não são necessariamente não viciados, mas
Poisson : λˆ = X.
são assintoticamente não viciados e consistentes. MV
1
exp onencial : λˆ MV = .
2) São assintoticamente eficientes. X
1
geométrica : p̂ MV = .
3) Seguem distribuição aproximadamente X
n
Normal, para grandes amostras ∑ (X i −X )
2
q̂ MV = 1 − p̂ MV = 1 − X.
69
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Obtenha o EMV de α. n
l(α) = nln(α) + (α −1)∑ln(x i ).
i=1
n
R : αˆ MV = −
n
n n
n
. l`(α) = + ∑ln(x i ) = 0 ⇔ α = − .
∑ ln(X i ) α i=1 n
i =1 ∑ln(xi )
i=1
70
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Obtenha os estimadores de
No caso de populações com 2 parâmetros momentos de µ e σ2.
(ex.: Normal), o estimador de momentos é
obtido igualando os 2 primeiros momentos n
Dica para a solução do exercício 8.3: Exercício 8.4 - Seja uma AAS de tamanho
n de uma população referenciada pela
Para obter o estimador da variância, você distribuição: f(x) = αxα-1, 0<x<1, α>0.
precisará usar que E(X2) = V(X) + E2(X), e:
Obtenha o estimador de momentos de α.
n n
∑X 2
i ∑X 2
i
R : αˆ MM =
X
.
σ +X =
2 2 i =1
⇒ σˆ 2
MM = i =1
− X2 1− X
n n
n n
∑X 2
− nX 2 ∑ (X − X)2 Obs − passo intermediário :
i i
= i =1
= i =1
. α
n n verificar que E(X) = .
α +1
71
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
72
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Construção de um IC para a
X −µ
Média de uma População Normal P − z α ≤ ≤ z α = (1 − α)
2 σ/ n 2
Parte-se do seguinte resultado (conhecido):
z α é o valor da v.a. Z ~ N(0,1)
2
σ2
X −µ α
X ~ N (µ , )⇒Z= ~ N(0,1). tal que : P(Z ≥ z α ) = .
n σ 2 2
n
O passo seguinte é manipular esta probabilidade
a partir do qual, pode-se escrever: de tal forma que µ situe-se no centro do evento.
X −µ
P( − z α ≤ ≤ z α ) = (1 − α) O que esta última probabilidade nos informa?
2 σ/ n 2
P( X + z α
σ
≥ µ ≥ X − zα
σ
) = (1 − α)
[x − z α ; x + zα ],
n n 2 n 2 n
2 2
σ σ
P( X − z α ≤ µ ≤ X + zα ) = (1 − α) µ estará contido em 100(1-α)% destes intervalos.
2 n 2 n
Suponha agora que, com base em uma única Resposta: não! Embora tenhamos visto que:
amostra observada (a qual, note, é só o que
temos na prática) seja calculado o intervalo: P( X − ε ≤ µ ≤ X + ε) = (1 − α), (I)
σ σ
[x − z α ;x + zα ]. é completamente errado afirmar que:
2 n 2 n
P( x − ε ≤ µ ≤ x + ε) = (1 − α ). (II)
Pergunta: está correto afirmar que:
σ σ Justificativa: não há nenhuma v.a. em (II),
P( x − z α ≤ µ ≤ x + zα ) = (1 − α) ? somente números, e assim não podemos
2 n 2 n falar em probabilidade, como em (I).
73
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Significado de “Confiança”
2 - Na prática, temos apenas uma amostra No que você confiaria mais: “3” ou “4”?
(aquela que selecionamos pra observar).
74
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Valores Importantes da Normal para IC`s: Achando z0,025 = valor de k tal que P(Z>k) = 0,025:
k 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
Para o IC de 95% (α = 0,05) ⇒ z0,025 = 1,96.
Achando z0,05 = valor de k tal que P(Z>k) = 0,05: Achando z0,005 = valor de k tal que P(Z>k) = 0,005:
k 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 k 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
75
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
σ σ
IC95% (µ) = x − 1,96 ; x + 1,96 , 2. A probabilidade de que o parâmetro
5 5 pertença ao intervalo é 0,95.
76
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
77
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Substituindo na fórmula do IC, temos: Exemplo 9.3 - Foi tomada uma amostra
de 25 trabalhadores de uma fábrica.
6 6 Esta amostra forneceu salário médio de
IC95% (µ) = 180 − 2,776 ;180 + 2,776 R$ 400,00 e desvio padrão R$ 450,00.
5 5
Considerando a população Normal,
= [172,55;187,45]. obtenha o IC de 90% p/ o salário médio
dos trabalhadores da fábrica. Interprete.
Interpretação: temos 95% de confiança Obs - como seria este enunciado para o
de que µ esteja no intervalo acima. caso em que o desvio padrão é conhecido?
78
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
• Consultando a Tabela t: x = 400; s = 450.
O valor na tabela t é t 24;0,05 = 1,711.
O IC solicitado é :
450 450
IC 90% (µ) = 400 − 1,711 ;400 + 1,711 =
25 25
[ 246,01;553,99].
Interpretação: com 90% de confiança, o salário médio µ de
todos os trabalhadores da fábrica encontra-se neste intervalo.
O IC de 95% é : O IC de 99% é :
500 500 500
IC95% (µ) = 8.900 − 2,131
500
;8.900 + 2,131 = IC99% (µ) = 8.900 − 2,947 ;8.900 + 2,947 =
16 16 16 16
[8.633,6;9.166,4].
[8.531,6;9.268,4].
Interpretação: com 95% de confiança, a vida útil média desta
marca de tubos de imagem encontra-se neste intervalo. O intervalo aumentou, como tinha que ser!
79
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução (99%):
• Consultando a Tabela t para 95%:
x = 45, s = 30.
O valor na tabela é t 8;0,005 = 3,355. t 8; 0 , 025 = 2,306.
O IC de 99% é :
30 30
IC99% (µ) = 45 − 3,355 ;45 + 3,355 =
9 9
[11,5;78,5].
Interpretação: com 99% de confiança, o índice médio de
endividamento das empresas deste setor está entre 11,5 e 78,5.
Solução (95%):
• Consultando a Tabela t para 90%:
O valor na tabela é t 8;0,025 = 2,306.
t 8; 0 , 05 = 1,86.
O IC de 95% é :
30 30
IC95% (µ) = 45 − 2,306 ;45 + 2,306 =
9 9
[21,9;68,1].
80
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução (90%):
• Relação entre a Distribuição t e a Normal
O valor na tabela é t 8;0,05 = 1,86.
Por isso a tabela t que vocês receberam No caso do IC para a média com σ
vai só até 30 e depois começa a “pular”. desconhecido, vimos a distribuição a ser
Para 30 ou mais graus de liberdade, utilizada é a t com υ = n-1 graus de liberdade.
costuma-se usar a Normal como aproximação.
Note, em particular, que a última linha da tabela Desta forma, quando o tamanho da amostra
t (graus de liberdade = ∞) corresponde aos n for grande (>30), um IC aproximado pode
valores usados nos IC para σ conhecido! ser obtido utilizando a distribuição Normal
(e o ponto é: mesmo com σ desconhecido!).
(isto permite evitar aquele procedimento chato
para extrair esses valores da tabela Normal)
81
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
82
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Determinando o Tamanho
Já no caso da estimação de p, a
de uma Amostra
condição para determinar ε é:
Um aspecto importante da estatística é a
P(−ε ≤ p̂ − p ≤ ε) = (1 − α).
determinação do número de unidades a
serem selecionadas = tamanho da amostra.
Assim, a margem de erro para
estimar uma proporção é: A partir da especificação da margem de erro ε
(erro máximo considerado tolerável, com uma
p(1 − p) probabilidade 1-α), chega-se ao tamanho de
ε = zα . amostra necessário, invertendo-se a fórmula da
n
margem de erro para obter n em função de ε.
2
• Tamanho de Amostra para Estimar µ Note que não faz sentido usar a estimativa
de σ nesta fórmula, uma vez que ainda não
No caso da média de uma população Normal: temos a amostra (a fórmula é para definir
o tamanho da amostra que será coletada!).
σ z 2α σ 2 Há 2 soluções “paliativas”:
ε = zα ⇒ n= 2 .
n ε2
2
1 - Utilizar a estimativa do σ em uma
pesquisa anterior com característica similar.
Problema: σ na prática não é conhecido,
2 - Utilizar estimativa do σ
portanto não há como obter o valor de n.
em uma amostra “piloto”.
83
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
0,36
0,42
0,48
0,54
0,66
0,72
0,78
0,84
0,96
0,3
0,6
0,9
0
Exemplo 9.8 - Qual o tamanho de amostra E se reduzirmos esta margem para 5%?
necessário para estimar uma proporção 1
com uma margem de erro de 10% (a 95% Solução: n ≅ = 400.
ε2
de confiança), com base em uma AAS? Conclusão: para reduzir a margem
de erro pela metade, é necessário
quadruplicar o tamanho da amostra!
Solução (considerando zα/2 ≅ 2):
Questão: Pesquisas eleitorais, cuja margem
22 1 1 de erro usual é 2%, costumam trabalhar
n≅ 2 = 2 = = 100.
4ε ε (0,1) 2 com amostras em torno de 2.500 pessoas.
Este tamanho de amostra é adequado?
84
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
valor k1 na tabela valor k 2 na tabela 1 σ2 1
qui - quadrado tal que : qui - quadrado tal que : P 2 ≥ ≥ 2 = (1 - α)
χ α (n − 1)S
2
χ α
α α n −1, 1− n −1,
P(X < k1 ) = P(X > k 2 ) = 2 2
2 2
1 σ2 1
P 2 ≤ ≤ = (1 - α)
χ α (n − 1)S
2
χ2 α Passo 2 - Substituindo agora S2
n −1, n −1, 1−
2 2
pela estimativa correspondente
s2, obtém-se o IC a seguir.
(n − 1)S 2 (n − 1)S 2
P 2 ≤ σ2 ≤ 2 = (1 - α)
χ α χ α
n −1, n −1, 1−
2 2
• IC para a Variância de
uma População Normal Exemplo 10.1 - Uma amostra de 30 alunos
de uma universidade apresenta variância
amostral das notas dada por: s2 = 132,7.
s2 s2
IC 100(1−α)% (σ ) = (n − 1) 2 ; (n − 1) 2
2
.
χ α χ α
n −1,
2
n −1,
2
1−
Supondo que a população é Normal,
valor k 2 na tabela valor k1 na tabela obtenha o IC de 95% para σ2.
qui - quadrado tal que : qui - quadrado tal que :
α α
P(X > k 2 ) = . P(X < k1 ) = .
2 2
85
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
.
Substituindo na fórmula do IC:
132,7 132,7
IC 95% (σ 2 ) = 29 ;2 9 = [84,21;240 ,52].
χ 2
= 16 e χ 2
= 45,7. 45, 7 16
29;0,975 29;0,025
86
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
T=
(X 1 )
− X 2 − (µ1 − µ 2 )
,
1 1 IC100(1−α)% (µ1 − µ2 ) =
Sp +
n1 n 2 1 1 1 1
(x1 − x2 ) − t n +n −2;αsp + ; (x1 − x2 ) + t
+ −
α sp + ,
1 2
2 n1 n2 n n 12 ;2
2 n1 n2
com Sp = S . Esta estatística segue distribuição t
2
p
Solução:
• Consultando a Tabela t:
[
IC 99% (µ1 − µ 2 ) = ( x1 − x 2 ) m t 16;0 , 005s p 1
n1 ]
+ n12 =
[
= ( 4.600 − 4.000) m t 16;0 , 005s p 1
8 + 101 ]
= [(600) m 2,921 * 223,26 * 0,4743]
= [(600 ) m 309,33] = [290,67;909,33].
87
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
88
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
89
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
f4,3;0,025 =
σ 22 15,10.
Ache o IC de 95% para 2 .
σ1
σ 22
IC95% 2 = [0,1293;19,4839].
σ1
90
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
f 5 , 5; 0 , 95 = 1 / 5,05 = 0,198.
E o intervalo solicitado é:
σ2
f5,5;0,05 =
IC90% 22 = [0,1831;4,6713].
5,05.
σ1
• Testes de Hipóteses
91
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Esta é uma primeira diretriz para formular Isto porque o sistema considera mais
hipóteses: H1 representa aquilo que se quer grave condenar um eventual inocente
tentar evidenciar e H0 é a premissa que se quer do que absolver um eventual culpado.
contestar, colocar em xeque, ou ainda, julgar.
92
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
93
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Exercício 11.1 - Uma amostra de tamanho a) Uma pessoa resolve utilizar a média
16 é selecionada de um lote de lâmpadas, e da amostra para conduzir este teste,
deseja-se saber se as lâmpadas são da marca estipulando a seguinte regra de decisão:
A (cuja duração média é 3.000 horas) ou da
marca B (cuja duração média é 5.000 horas). Se a média amostral for menor que 4,
O parâmetro de interesse é µ e as hipóteses considera-se que as lâmpadas são da marca A.
de interesse são: H0: µ = 3 x H1: µ = 5.
Se a média amostral for maior ou igual a 4,
Suponha que a população (dos tempos de considera-se que as lâmpadas são da marca B.
duração) seja Normal com variância 4.
94
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Determine:
R: α = β = 0,0228.
a1) o nível de significância do teste.
a2) a probabilidade do erro tipo II do teste. Comente o resultado. Como você faria
para reduzir o valor de α em relação a β?
Obs - a partir das definições, note que:
α = PH0 (X ≥ 4) e β = PH1 (X < 4) . Por exemplo, recalcule α se o ponto de corte
é 4,5, ao invés de 4. O que explica a redução?
considerando considerando
H0 verdadeira H1 verdadeira
R: b1) X ≥ 3,8225.
Em seguida é que a regra de rejeição
b2) β = 0,0094.
é especificada, de tal forma que a
probabilidade de erro tipo I seja α. Esta configuração parece fazer sentido?
De que forma parece natural proceder?
95
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
96
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução: As hipóteses de interesse são: Exemplo 11.3 - (exemplo 9.4) Suponha que a
H0: µ = 600 (hipótese nula); vida útil de uma marca de tv`s de LED seja
H1: µ ≠ 600 (hipótese alternativa). normalmente distribuída. A partir de uma
amostra de 16 tv`s, estimou-se uma vida
O IC90%(µ) foi (exemplo 9.3): útil média de 8.900 horas, e um
[246,01;553,99]. desvio padrão igual a 500 horas.
Basta verificar se este intervalo contém
o 600. De imediato, vemos que não. Teste se o tempo médio das tv`s desta marca
é igual a 9.000, ao nível de significância 0,05.
Assim, rejeitamos H0, ao nível α = 0,1.
97
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
O valor observado de Z é:
Quais valores de z0 são pouco prováveis
se H0 é verdadeira, isto é, se Z ~ N(0,1)?
x−k
z0 = .
σ/ n
Ora, os valores que correspondem
Se z0 é um valor que teria baixa probabilidade às “caudas” da distribuição N(0,1),
caso Z seguisse uma N(0,1), isto representa aos quais chamamos região crítica.
evidência contra Z ~ N(0,1) e, assim, contra H0.
98
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Exemplo 11.1 (cont.) - Vamos agora aplicar o Como α = 0,05, usamos z0,025 = 1,96,
método da RC para conduzir o teste H0: µ = 175 e assim: RC = (-∞,-1,96]∪[1,96,∞).
x H1: µ ≠ 175, ao nível de significância α = 0,05.
Considere σ = 6. A amostra observada é a Cálculo de z0:
do exemplo 9.2 (n = 5 e média = 180 cm.). x − 175 180 − 175
z0 = = = 1,8634.
Solução - os valores críticos possíveis são os 6/ 5 6/ 5
mesmos dos respectivos IC`s de 100(1-α)%:
Para α = 0,01 ⇒ z0,005 = 2,575. Este valor não pertence à RC.
Para α = 0,05 ⇒ z0,025 = 1,96.
Para α = 0,1 ⇒ z0,05 = 1,645. Conclusão: não rejeitamos H0, ao nível 0,05.
x−k estimativa
t0 = . do erro Assim como no caso do IC, se a amostra é grande
s/ n padrão (>30), pode-se usar a Normal como aproximação.
99
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução:
Exemplo 11.2 (cont.) - Aplique o método
da RC para testar a hipótese de que o 1 - As hipóteses de interesse são:
salário médio dos empregados da fábrica H0: µ = 600 (hipótese nula);
seja igual a R$ 600,00, ao nível α = 0,1. H1: µ ≠ 600 (hipótese alternativa).
O nível de significância pedido é α = 0,1.
2 - A região crítica do teste é:
RC = (-∞,-t24;0,05]∪[t24;0,05,∞).
No exemplo 9.3, vimos que t24;0,05 = 1,711.
100
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
3 - Cálculo de t0:
Em algumas situações específicas, não
x − 600 400 − 600 200 estaremos preocupados em evidenciar
t0 = = =− = −2,2222. se o parâmetro de interesse (µ, nos
s / 25 450 / 5 90
exemplos até aqui) é diferente de k, e
sim se ele é maior ou menor do que k.
4 - Verifica-se que t0 pertence à RC.
5 - Conclusão: rejeitamos H0, ao nível 0,1. Isto conduz ao estudo de testes unilaterais.
Valores Críticos da Normal Achando z0,01 = valor de k tal que P(Z > k) = 0,01.
(achar na tabela o valor correspondente a 0,49).
para Testes Unilaterais: k
101
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
102
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
103
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
104
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Note que:
Se uma hipótese é rejeitada a um certo Podemos definir um “ponto de corte”, isto é,
nível de significância, também o será a um valor de α abaixo do qual não rejeitamos
níveis superiores (pois a RC aumentará). H0, e a partir do qual passamos a rejeitar H0.
105
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
α = P(Z ≥ zα)
Considere, agora, z0 < zα (situação
p-valor = P(Z ≥ zo)
em que o método da RC nos
conduz a não rejeitar H0).
106
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
α = P(Z ≥ zα)
Exercício 11.5 (p-valor para teste de
proporção) - No exemplo 11.6, calcule o
p-valor = P(Z ≥ zo)
p-valor do teste, e use-o para formular a
conclusão do teste aos três níveis usuais.
R: 0,0207.
Conclusão: se z0 < zα (situação em que o
método da região crítica nos conduz a não
rejeitar H0) o p-valor é, de fato, maior que α.
107
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
S2
fazendo σ2 = k: Q = (n − 1) . s2
k q0 = (n −1) ,
k
Sob H0, Q segue distribuição
qui-quadrado com n-1 g.l.. e verificar se q0 pertence ou não
à RC, definida no slide a seguir.
Solução:
• Teste de Diferença de Médias
s2 (3,63) 2
q 0 = (n − 1) = 29 = 23,88. Considere 2 populações Normais com
k 16 médias µ1 e µ2 e desvios padrão σ1 e σ2.
RC = (0,16] ∪ [45,7, ∞).
O objetivo aqui é testar:
Conclusão? H0: µ1 = µ2 contra H1: µ1 ≠ µ2.
Estas hipóteses podem ser reescritas como:
Exercício 12.1 - Teste H0: σ2 = 16 contra
H1: σ2 < 16, ao nível 0,05 (RC = (0, χ 2n −1,1−α ]). H0: µ1-µ2 = 0 contra H1: µ1-µ2 ≠ 0.
108
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
σ12 σ22
(X1 − X2 ) ~ N(µ1 − µ2 , + ). É obtida substituindo em Z o valor do
n1 n2 parâmetro (que no caso é µ1-µ2) sob H0
(ou seja, zero, pois H0 diz que µ1-µ2 = 0):
Padronizando:
109
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
110
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Solução Parcial:
Implementação no Excel
p (1 − p1 ) p2 (1 − p2 )
p̂1 − p̂2 ≈ N p1 − p2 , 1 + .
n2
Considere 2 populações com proporções
p1 e p2 a serem comparadas. n1
aproximada para n1 e n2 grandes
As hipóteses do teste são
Padronizando:
H0: p1 = p2 contra H1: p1 ≠ p2,
Z=
(p̂ − p̂ 2 ) − (p1 − p 2 )
1
≈ N(0,1).
o que pode ser reescrito da forma:
p1 (1 − p1 ) p 2 (1 − p 2 )
H0: p1-p2 = 0 contra H1: p1-p2 ≠ 0. +
n1 n2
111
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
112
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
S12 σ 22 S12
~ Fn1−1,n 2 −1. F= .
S22 σ12 S22
Solução:
113
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
f3,4;0,025 = Conclusão?
Invertendo: f4,3;0,975 =
9,98.
1/9,98 = 0,1002.
5,05. 0,198.
114
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Correlação x Regressão
115
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
Y = β0 + β1X,
Isto é, se X for a renda de uma família,
o gasto com alimentação Y desta família
sendo β0 o intercepto e β1 a inclinação.
não será necessariamente Y = β0 + β1X.
Se a relação acima fosse perfeita, É para isto que serve o termo de erro,
poderíamos, a partir do valor de X, que aqui será designado pela letra ε.
determinar o valor exato de Y.
116
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
• Interpretação da Inclinação β1
Seja Y1 o valor de Y em resposta a X:
Y1 = β0 + β1X + ε1,
Considere que a variável explicativa
X aumente uma unidade (X → X+1).
∆Y =
. = β1.
E(∆Y)
[β0 + β1(X+1) + ε2] - (β0 + β1X + ε1) =
β0 + β1X + β1+ ε2 - β0 - β1X - ε1 =
β1 é a variação esperada em Y
β1 + ε2 - ε1. quando X varia uma unidade.
i-ésima Ŷi = βˆ 0 + βˆ 1X i
estimativa de E(Y|X) = previsão de Y. observação de Y
117
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
n n
( I) ⇒ ∑ εˆ i = 0 ∑ (Xi − X)(Yi − Y) SXY ˆ
i =1 βˆ 1 = i =1
n
= , β0 = Y − βˆ 1X.
S2X
∑ ( Xi − X) 2
n
( II) ⇒ ∑ εˆ i X i = 0
i =1
i =1
118
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
119
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
O teste da significância
IC100(1−α)%(β0 ) = βˆ 0 − t α EP(βˆ 0 );βˆ 0 + t α EP(βˆ 0 ) da estimativa de β1 é:
n−2; n −2;
2 2 H0: β1 = 0 x H1: β1 ≠ 0.
120
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
121
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2019 - Professor: Eduardo Lima Campos
É o modelo de regressão
com k variáveis explicativas. O teste F para a significância conjunta
das estimativas de β1, β2, ... e βk,
consiste nas seguintes hipóteses:
Y = β0 + β1X1 + β2X2 +...+ βkXk + ε.
H0: β1 = β2 = ... = βk = 0
βj, j = 1, 2, ..., k, é a variação esperada x
em Y quando Xj varia uma unidade, se as
H1: ao menos um βj é diferente de zero.
demais variáveis permanecem constantes.
122