Estatística para Engenharia de Materiais I
Estatística para Engenharia de Materiais I
Estatística para Engenharia de Materiais I
Luciana Maria de
Oliveira
DEPARTAMENTO DE ESTATÍSTICA
NOTAS DE AULAS
NATAL/RN - 2010
1
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
UNIDADE I
ESTATISTICA DESCRITIVA
Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados quantitativos, de tal
forma que seja possível efetuar julgamentos sobre os mesmos.
Ramos da Estatística:
a) Estatística descritiva → trata da observação de fenômenos de mesma natureza, da coleta de
dados numéricos referentes a esses fenômenos, da sua organização e classificação através de
tabelas e gráficos, bem como da análise e interpretação.
b) Probabilidade estatística · utilizada para analisar situações que envolvem o acaso
(aleatoriedade).
c) Inferência estatística → estuda as características de uma população com base em dados obtidos
de amostras.
OBS: Estatística Indutiva pode ser denominada como inferência. Portanto, a estatística indutiva estuda as
características de uma população, com base em dados obtidos de amostras.
Análise e
Apresentação Tabelas e interpretação
dos dados → Gráficos → dos dados
3) Coleta de Dados → consite na busca ou compilação dos dados . Pode ser classificado, quanto ao
tempo em:
• Contínua (inflação, desemprego, etc);
• Periódica (Censo);
• Ocasional (pesquisa de mercado, eleitoral)
4) Crítica dos dados → objetiva a eliminação de erros capazes de provocar futuros enganos. Faz-
se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento.
5) Apresentação dos dados → a organização dos dados denomina-se “Série Estatística”. Sua
apresentação pode ocorrer por meio de tabelas e gráficos.
6) Análise e Interpretação dos Dados → consite em tirar conclusões que auxiliem o pesquisador a
resolver seu problema, descrevendo o fenômeno através do cálculo de medidas estatísticas,
especialmente as de posição e as de dispersão.
3
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Séries Estatísticas
São os dados organizados em forma de tabelas. De acordo com o fenômeno, local e a época de
ocorrência classificam-se, respectivamente, em : Temporal, Especificativa e Geográfica.
a) SérieTemporal (históricas ou cronológicas): os dados são observados segundo a época de sua
ocorrência
4
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
b) Série Geográfica (espaciais, territoriais ou de localização): os dados são observados segundo o local
onde ocorreram.
5
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
- POPULAÇÃO E AMOSTRA
POPULAÇÃO:
É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada característica.
Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, como o número de
vezes que se pode jogar um dado.
AMOSTRA:
- NOÇÕES DE AMOSTRAGEM
X X: determinada característica de
interesse da população;
θ θ: parâmetro populacional;
Como já vimos, a inferência estatística tem como objetivo a estimação de parâmetros para uma população
tendo como base as informações extraídas através de uma amostra. Neste contexto, o estudo dos mais
diversos tipos de procedimentos de amostragem se faz necessário.
As técnicas de amostragem podem ser classificadas em dois grandes grupos: a amostragem probabilística
e a amostragem não probabilística.
6
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
a) Amostragem Probabilística: neste grupo encontram-se os planos amostrais que utilizam mecanismos
aleatórios de seleção dos elementos da amostra, atribuindo a cada um deles uma probabilidade,
conhecida à priori, de pertencer a amostra.
b) Amostragem Não Probabilística: neste grupo encontram-se os planos amostrais que não utilizam
mecanismos aleatórios de seleção dos elementos da amostra, e dessa forma, não existe nenhuma
probabilidade associada a seleção desses elementos.
Ambos os procedimentos têm vantagens e desvantagens. A grande vantagem das amostras probabilísticas
é medir a precisão da amostra obtida. Tais medidas já são bem mais difíceis para os procedimentos do
outro grupo. Diante disso, amostras probabilísticas são comumente utilizadas na prática. Os tipos de
planos de amostragem probabilísticos são os seguintes:
1. Amostragem Aleatória Simples: cada elemento da população tem a mesma chance (ou
probabilidade) de ser selecionado. Os elementos são escolhidos através de sorteio. Para isso, tabelas
de números aleatórios são freqüentemente utilizadas. Por exemplo, selecionar 5 alunos de uma turma.
2. Amostragem Estratificada: a população é dividida em estratos (ou grupos) homogêneos, sendo
selecionada uma amostra aleatória simples de cada estrato. Por exemplo, selecionar alunos de 5ª a 8ª
série de uma determinada escola. Neste caso, cada série corresponde a um estrato, e de cada estrato
uma amostra aleatória simples dos alunos é extraída.
3. Amostragem Sistemática: os elementos são selecionados segundo um regra pré-definida. É bastante
utilizada quando os elementos da população estão arranjados um ordem. Por exemplo, selecionar um
aluno a cada 15 que forem sorteados.
É condição inerente a uma população natural existir variação quanto aos atributos que lhe podem ser
estudados. Portanto, a variabilidade é uma característica comum a dados de observação e experimentos.
Um atributo sujeito à variação é descrito em Estatística por uma variável.
Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua
7
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Variável Qualitativa: os dados podem ser distribuídos em categorias mutuamente exclusivas. Por
exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sangüíneo, etc..
Variável Quantitativa: os dados são expressos através de números. Por exemplo, idade, estatura, peso,
etc..
Exercícios
- Distribuições de Freqüências
Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do
fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de distribuição de
freqüências.
8
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Distribuição de Freqüências: série estatística em que os dados são agrupados em classes, com suas
respectivas freqüências absolutas, relativas e percentuais, com o objetivo de
facilitar ao analista o seu estudo.
Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados.
Rol: são os dados apresentados em ordem crescente.
A = LS - LI
Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os elementos
do rol. Para determinar c, utiliza-se a fórmula de Sturges:
c = 1 + (3,33333.....).log(n)
i = A/c
9
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Exemplos
1) (Dados Simples) Numa pesquisa feita para detectar o número de filhos de empregados de uma
multinacional, foram encontrados os seguintes valores:
1 4 2 5 3 2 0 3 2 1
5 4 2 5 0 3 2 4 2 3
2 3 2 1 4 2 1 3 4 2
Solução:
X f fr f% F↓ F↑ F% ↓ F% ↑
0 2 0,067 6,7 2 30 6,7 100
1 4 0,133 13,3 6 28 20 93,3
2 10 0,333 33,3 16 24 53,3 80
3 6 0,2 20 22 14 73,3 46,7
4 5 0,167 16,7 27 8 90 26,7
5 3 0,1 10 30 3 100 10
Total 30 1 100 - - - -
Algumas considerações ou conclusões:
Quantos empregados têm "x" filhos? A resposta é dada através de f (freqüência absoluta simples).
a) Quantos empregados têm menos de "x" filhos? A resposta é dada através de F ↓ (freqüência absoluta
acumulada "abaixo de").
b) Quantos empregados têm mais de "x" filhos? A resposta é dada através de F ↑ (freqüência absoluta
acumulada "acima de").
10
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02
Solução:
Rol (dados em ordem crescente):
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68
1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86
1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34
11
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Construção da Tabela:
Classes fi Pm fr f% f%↓ f%↑ F↓ F↑
1,08 - 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 - 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 - 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 - 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 - 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 - 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 - 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
OBS:
(1) O melhor valor para representar cada classe é o ponto médio (Pm), o qual se obtém pela fórmula:
Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2
(3) 1,08 -- 1,26, intervalo fechado à esquerda (pertencem a classe valores iguais ao extremo inferior) e
aberto à direita (não pertencem a classe valores iguais ao extremo superior).
a) Quantos pacientes têm quantidade de creatinina no intervalo de "x"? A resposta é dada através de f
(freqüência absoluta simples). Ex.: Quantas pacientes tem quantidade de creatinina no intervalo [1,44;
1,62)? R.: 32 pacientes.
b) Quantas pacientes tem quantidade de creatinina inferior ao intervalo "x"? A resposta é dada através de
F↓ (freqüência absoluta acumulada "abaixo de"). Ex.: Quantas crianças tem quantidade de
creatinina inferior ao intervalo [1,80; 1,98)? R.: 68 pacientes.
12
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
c) Quantas pacientes tem quantidade de creatinina superior ao intervalo "x"? A resposta é dada através
de F ↑ (freqüência absoluta acumulada "acima de"). Ex.: Quantas crianças tem quantidade de
creatinina superior ao intervalo [1,80; 1,98)? R.: 5 pacientes.
3) Construir uma distribuição de freqüências, utilizando a fórmula de Sturges e analisá-la com base nos
elementos abaixo, correspondente ao faturamento bruto mensal (US$ mil) de 38 pequenas empresas:
2,1 4,4 2,7 32,3 9,9 9,0 2,0 6,6 3,9 1,6 14,7 9,6 16,7 7,4
8,2 19,2 6,9 4,3 3,3 1,2 4,1 18,4 0,2 6,1 13,5 7,4 0,2 8,3
0,3 1,3 14,1 1,0 2,4 2,4 18,0 8,7 24,0 1,4 8,2 5,8 1,6 3,5
11,4 18,0 26,7 3,7 12,6 23,1 5,6 0,4
– REPRESENTAÇÃO GRÁFICA
13
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
a) Gráfico de barras
É um gráfico formado por retângulos horizontais de larguras iguais, onde cada um deles
representa a intensidade de uma modalidade ou atributo.
O objetivo deste gráfico é de comparar grandezas e é recomendável para variáveis cujas
categorias tenham designações extensas.
b) Gráfico de colunas
É o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico de barras por
serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando as
designações das categorias são breves. O número de colunas ou barras do gráfico não deve ser
superior a 12 (doze).
c) Gráfico de setores
Tipo de gráfico onde a variável em estudo é projetada num círculo, de raio arbitrário, dividido em
setores com áreas proporcionais às freqüências das suas categorias. São indicados quando se deseja
14
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
comparar cada valor da série com o total. Recomenda-se seu uso para o caso em que o número de
categorias não é grande e não obedecem a alguma ordem específica.
Para encontrarmos a medida dos ângulos (em graus) de cada setor do círculo (de cada fatia da
pizza), devemos estabelecer a seguinte regra de três:
1.1.1.1.1
Total observado 360º
1.1.1.1.2
Cada parcela X
d) Gráfico de linhas
Sua aplicação é mais indicada para representações de séries temporais sendo por tal razão,
conhecidos também como gráficos de séries cronológicas. Sua construção é feita colocando-se no eixo
vertical (y) a mensuração da variável em estudo e na abscissa (x), as unidades da variável numa ordem
crescente. Este tipo de gráfico permite representar séries longas, o que auxilia detectar suas flutuações
tanto quanto analisar tendências. Também podem ser representadas várias séries em um mesmo
gráfico.
15
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
a) Histograma:
Os histogramas são gráficos construídos para representar dados agrupados em
intervalos de classes e podem ser utilizados, considerando qualquer tipo de freqüência, simples
ou acumuladas, absolutas ou percentuais.
Assim, há histogramas com diversos contornos, informando sobre distintos aspectos do
comportamento dos dados.
14
12
10
8
6
4
2
0
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |--| 40
Distribuição Simétrica: ocorre quando a concentração dos dados está no centro da figura.
12
10
8
6
4
2
0
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45
16
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
12
10
8
6
4
2
0
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45
b) Polígono de freqüência
É um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de abscissas
correspondentes aos pontos médios de cada classe e as ordenadas, às freqüências absolutas ou
relativas dessas mesmas classes.
O polígono de freqüência é um gráfico que deve ser fechado no eixo das abscissas. Então, para
finalizar sua elaboração, deve-se acrescentar à distribuição, uma classe à esquerda e outra à direita,
ambas com freqüências zero. Tal procedimento permite que a área sob a linha de freqüências seja igual
à área do histograma.
Uma das vantagens da aplicação de polígonos de freqüências é que, por serem gráficos de
linhas, permitem a comparação entre dois ou mais conjuntos de dados por meio da superposição dos
mesmos.
12
10
8
6
4
2
0
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45
17
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Exercício
Construção da Tabela:
Classes fi Pm fr f% f%↓ f%↑ F↓ F↑
1,08 - 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 - 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 - 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 - 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
18
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
A média será: ∑x i
soma de todos os elementos do rol
X= i=1
=
n número de elementos do rol
Ex.: Peso em gramas de ratos (50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74) X = 67
Análise: o peso médio dos 12 ratos observados é de 67 gramas.
∑x f i i
A média será: X =
i=1
n
∑f i =1
i
19
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
∑x f i i
(0).(2) + (1).(4) + (2).(10) + (3).(6) + (4).(5)
X= i=1
n
= = 2,3
27
∑f
i =1
i
Análise: Verifica-se que o número médio de cáries das 27 crianças observadas no estudo é de 2,3.
Exercício: As informações abaixo apresentam a idade dos usuários de drogas internos numa clínica para
tratamento. Determine a idade média dos internos.
Idade fi
17 6
18 4
19 8
20 12
21 10
22 7
23 3
Total 50
∑P f
m i
A média será: X =
i =1
n
∑f i =1
i
Classes Pm fi
1,5 - 2,0 1,75 3
2,0 - 2,5 2,25 16
2,5 - 3,0 2,75 31
3,0 - 3,5 3,25 34
3,5 - 4,0 3,75 11
4,0 - 4,5 4,25 4
4,5 - 5,0 4,75 1
Total
20
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
∑P f
m i
(1,75).(3) + (2,25).(16 ) + + (4,75).(1)
X= i=1
n
= =3
100
∑f i =1
i
Análise: Verifica-se que o peso médio dos 100 nascidos vivos observados é 3 kg.
Mediana
Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é, é o
valor que ocupa o centro da distribuição, de onde conclui-se que 50% dos elementos ficam abaixo dela e
50% ficam acima.
Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou população,
em duas partes iguais.
0 Med 100%
a) Variável Discreta: os dados estão dispostos em forma de rol ou em uma distribuição de freqüência
simples.
Se "n" for ímpar:
Med = elemento central (de ordem [(n + 1)/2]º)
X fi F↓
1 1 1
2 3 4
3 5 9
4 2 11
Total 11 -
21
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
n = 11 (ímpar)
Elemento mediano: [(n+1)/2]º = 6º elemento
3ª classe contém o 6º elemento Med = 3
b) Variável Contínua: os dados estão agrupados em uma distribuição de freqüências em classes, então:
(1º Passo) Calcular a ordem (n/2)º. Como a variável é contínua não importa se é par ou ímpar.
(2º Passo) Através da F ↓ identificar a classe que contém a mediana, isto é, a posição da mediana.
(3º Passo) Utilizar a fórmula:
PMed − F ↓−
Med = LI Med + .i Med
f Med
F ↓- = freqüência absoluta acumulada "abaixo de" da classe anterior a classe que contém a mediana;
fMe = freqüência absoluta da classe que contém a mediana;
iMe = intervalo da classe que contém a mediana;
Ex.: No exemplo acima (nascidos vivos segundo peso ao nascer, em kg) a mediana é dada por:
Classes Pm fi F↓
1,5 - 2,0 1,75 3 3
2,0 - 2,5 2,25 16 19
22
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Moda
É o valor que ocorre com maior freqüência, ou seja, aquele que mais se repete.
Ex.: Na série 3, 4, 5, 7, 7, 7, 9, 9 Mo = 7
23
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
3 15
6 25
10 8
Total 61
Mo = 6
Ex2.:
Tipo de Sangue f
O 547
A 441
B 123
AB 25
Total 1136
24
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Mo =3.Med - 2. X
Ex.: Calcule a moda de Pearson para os seguintes dados X = 1,61 e Med = 1,57.
25
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
d1 d 1 =f máx −f ant
M oC = li Mo +
d +d
.i Med onde
1 2 d 2 =f máx −f post
Ex.: Baseado no exemplo da distribuição de freqüência apresentada no primeiro processo (moda bruta)
calcule as modas de King e de Czuber.
Moda de King:
f post
M oK = li Mo + .i Med =1,44 +
18
f +f 13 +18
.0,18 =1,54
ant post
Moda de Czuber:
d1 19
M oC = li Mo + .i Mo = 1,44 + .0,18 = 1,54
d1 + d 2 14 + 19
Análise: valores próximos ou iguais a 1,54 ocorrem com maior freqüência.
26
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
– MEDIDAS DE DISPERSÃO
Introdução
Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são
suficientes para caracterizar totalmente uma seqüência numérica.
Se observarmos as seguintes seqüências:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a média aritmética de cada um desses conjuntos, obtemos:
X=
∑x i
⇒X =
350
= 70
n 5
Y=
∑y i
⇒Y =
350
= 70
n 5
Z=
∑z i
⇒Z =
350
= 70
n 5
Observamos, então, que os três conjuntos apresentam a mesma média aritmética: 70.
No entanto, são seqüências completamente distintas do ponto de vista da variabilidade de dados.
Na seqüência X, não há variabilidade dos dados. A média 70 representa bem qualquer valor da série.
Na seqüência Y, a média 70 representa bem a série, mas existem elementos da série levemente
diferenciados da média 70.
Na seqüência Z, existem muitos elementos bastante diferenciados da média 70.
Concluímos que a média 70 representa otimamente a seqüência X, representa bem a seqüência Y, mas
não representa bem a seqüência Z.
27
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Nosso objetivo é construir medidas que avaliem a representatividade da média. Para isto,
usaremos as medidas de dispersão.
Observe que na seqüência X os dados estão totalmente concentrados sobre a média 70, não há
dispersão de dados. Na seqüência Y, há forte concentração dos dados sobre a média 70, mas há fraca
dispersão de dados. Já na série Z há fraca concentração de dados em torno da média 70 e forte dispersão
de dados em relação à média 70.
As principais medidas de dispersão absolutas são: amplitude total, variância, desvio padrão e
coeficiente de variação.
Variância
È a medida de dispersão mais utilizada. É definida como sendo o quociente entre a soma dos
quadrados dos desvios e o número de elementos. É classificada em dois tipos:
∑(X ) ( X)
∑ − ∑N
2 2
i −X 1 i
Variância Populacional ( σ ) ⇒
2
2 σ = = X i2
N N
∑(X −X ) 2
1
(∑X ) 2
∑
i i
Variância Amostral (s )2
⇒ S2 =
n −1
=
n −1
X i2 −
n
Exemplo: Calcular a variância das notas obtidas por quatro alunos em cinco provas
∑(X −X )
2
1
(∑X i )
Variância
2
∑
2 i
S = = X2 −i
n −1 n −1
∑X i ∑X i 2 n
Alunos Notas Amostral(S2)
2
Antônio 5 5 5 5 5 25 =1/4 . [(125)-(25) /5] = 0
João 6 4 5 4 6 129 1
2
José 10 5 5 5 0 25 =1/4. [( 175) – (25) /5]= = 12,5
Pedro 10 10 5 0 0 225 25
(preencha os espaços em branco realizando os cálculos necessários)
Comentários:
• As notas de Antônio não variaram ⇒ s2 = 0;
• As notas de João variaram menos que as notas de José;
• As notas de Pedro variaram mais que as outras.
IMPORTANTE: Quando os dados estão dispostos em uma tabela de distribuição de freqüência, utiliza-
se a fórmula:
28
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
1
(∑Pm ⋅ f ) 2
1 (∑Pm ⋅ f ) 2
s2 =
n −1 ∑ Pm 2 ⋅ f −
n
σ2 =
N ∑ Pm 2 ⋅ f −
N
Em algumas situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo,
em que os dados são expressos em litros. A variância será expressa em litros quadrados.
Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja:
variância não tem interpretação.
Desvio Padrão
Medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de
medida dos dados. É a raiz quadrada da variância.
Notações: 1) Quando a seqüência de dados representa uma população a variância será denotada por σ 2 e
o desvio padrão correspondente por σ .
2) Quando a seqüência de dados representa uma amostra a variância será denotada por S 2 e o
desvio padrão correspondente por S .
∑( X ) 2
• Desvio Padrão Populacional ( σ ) ⇒ i −X
σ =
N
∑( X )
2
−X
• Desvio Padrão Amostral (s) ⇒ S =
i
n −1
OBS: Quanto maior o valor do desvio padrão significa que mais dispersos estão os elementos em torno da
média.
29
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Exemplo: Calcular o desvio padrão das notas obtidas por quatro alunos em cinco provas
Desvio padrão
Alunos Notas ∑X i ∑X i
2
amostral ( σ )
2
Antônio 5 5 5 5 5 25 =1/4 . [(125)-(25) /5] = 0 0
João 6 4 5 4 6 129 =1
=1/4. [(175) -
José 10 5 5 5 0 25 (25)2/5]=5
Pedro 10 10 5 0 0 225 =25 5
(preencha os espaços em branco realizando os cálculos necessários)
30
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
OBS.: um CV alto indica que a dispersão dos dados em torno da média é muito grande.
Exemplo: Calcule a média, o desvio padrão e o coeficiente de variação dos dados apresentados na tabela
abaixo. Comente os resultados, apontando quais os dados que apresentaram maior variabilidade, ou seja,
qual a variável mais homogênea (peso ou comprimento).
Peso (em kg) e comprimento (em cm) de 10 cães
Peso Comprimento X2 Y2
23,0 104 529 10816
22,7 107
21,2 103
21,5 105
17,0 100
28,4 104
19,0 108
14,5 91
19,0 102
19,5 99
Solução:
a) Para a variável PESO (x)
Média
31
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Variância
1
(∑X ) 2
∑ − n
2 i
S = X i2
n −1
Desvio padrão
Coeficiente de variação
Variância
1
(∑Y ) 2
∑
i
S2 = Yi 2 −
n −1 n
Desvio padrão
Coeficiente de variação
Conclusão:
32
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
EXERCÍCIOS:
1 – Calcule a variância, o desvio padrão e o coeficiente de variação dos dados apresentados nas tabelas
abaixo:
Medição
• MEDIÇÃO: conjunto de operações que tem por objetivo determinar um valor de uma
grandeza.
• Medição é fundamental para quem trabalha com movimento humano
• Avaliar um sujeito, um atleta, uma classe, uma equipe...
• Uma avaliação correta depende da seleção, aplicação e interpretação correta dos resultados
de uma medição...
Lembre-se, para tomar uma decisão adequada, primeiro obtenha informações válidas...
Metrologia
• METROLOGIA: Ciência da medição.
• GRANDEZA: Atributo de um fenômeno, corpo ou substância que pode ser qualitativamente
distinguido e quantitativamente determinado.
33
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Unidades de medida
• UNIDADE DE MEDIDA: Grandeza específica, definida e adotada por convenção, com a qual
outras grandezas de mesma natureza são comparadas para expressar suas magnitudes em
relação àquela grandeza.
• O resultado da medição de uma grandeza é expresso pelo número de vezes que a unidade
de medida, tomada como referência, está contida na grandeza a ser determinada.
• O resultado da medição é composto por duas partes: o número e a unidade padrão em que a
grandeza foi expressa.
• Claramente, a informação de que uma pessoa saltou “15” de distância está incompleta,
porque se foram 15 cm, 15 polegadas ou até 15 m, é completamente diferente.
34
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
35
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Medida e erro
Em geral em teoria de erros assume-se que:
1. O valor verdadeiro é independente do valor de erro;
2. A média dos valores de erro é zero (descontados os erros sistemáticos);
3. Os valores de erro de diferentes resultados de medição são independentes.
36
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
– Por exemplo, é errado reportar a massa de uma pessoa determinada por uma balança
analógica (de ponteiro, com resolução de 1 kg) como sendo 70,215 kg. O correto seria 70,2 kg
(são 3 algarismos significativos e 2 é o algarismo de incerteza pois esse valor é estimado já
que não havia uma escala com essa resolução).
– A medida e o erro da medida poderia ser reportado como: 70,2±0,5 kg.
37
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
1. Para que uma expressão da reprodutibilidade seja válida, é necessário que sejam
especificadas as condições alteradas.
2. As condições alteradas podem incluir:
• Princípio, método e instrumento de medição;
• observador;
• padrão de referência;
• condições de utilização;
• local e tempo;
3. Reprodutibilidade pode ser expressa, quantitativamente, em função das características da
dispersão dos resultados.
Exatidão e Precisão
• EXATIDÃO (ACURÁCIA) DE MEDIÇÃO: Grau de concordância entre o resultado de uma
medição e um valor verdadeiro do mensurando. Exatidão é um conceito qualitativo.
• PRECISÃO DE MEDIÇÃO: Grau de concordância entre resultados de medição obtidos sob as
mesmas condições (repetitividade). Precisão é um conceito qualitativo.
Estimativas de fidedignidade/confiabilidade
• TESTE/RETESTE: aplicação do mesmo teste mais de uma vez nos mesmos sujeitos e
comparar os resultados.
• CONSISTÊNCIA INTERNA: aplicação de subgrupos do teste que medem o mesmo conceito.
Por exemplo, aplicar dois grupos de questões que avaliam o mesmo conceito e comparar os
resultados.
Tipos de validade
Validade pode ser dividida em:
1. Lógica
2. De conteúdo
3. De critério
4. De constructo
Validade lógica
• Diz-se de uma medição que utiliza na medição a própria variável que está sendo
determinada.
• Por exemplo, um teste de força muscular, que consiste em medir com um dinamômetro a
força que uma pessoa produz, tem validade lógica.
Validade de conteúdo
• As medidas do teste devem estar relacionadas ao que se pretende avaliar.
• Exemplo: uma prova de um curso deve avaliar todo o conteúdo do curso. Uma peneira no
futebol deve ser um teste que avalie domínio de bola, posicionamento no campo, chute, e não
um teste que avalie número de flexões.
39
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Validade de critério
• Relação do resultado de uma medição com um padrão ou critério reconhecidamente aceito
• Validade concorrente: validade de duas medidas que estão sendo aplicadas ao mesmo
tempo. Exemplo: validação do teste de cooper em relação ao teste de VO2 (referência, padrão
ouro).
• Validade preditiva: validade de uma medida como preditora de um resultado. Exemplo:
detecção de talento, predição da gordura corporal por dobras cutâneas.
Validade de constructo
• Grau que um teste mede uma variável que não pode ser observada diretamente, um
contructo (por exemplo, inteligência, ansiedade).
• A validade de constructo é estabelecida relacionando o resultado do teste com o
comportamento esperado.
40
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
UNIDADE II
INTRODUÇÃO A PROBABILIDADE
A Estatística está ligada à Teoria da Probabilidade e vice-versa. Ela se faz presente em várias
situações, como por exemplo, nas técnicas de amostragem. Na Estatística Indutiva, a probabilidade é um
ferramental indispensável, pois todo o processo de inferência ocorre com uma determinada margem de
incerteza. Sendo assim, se faz necessário aos usuários de Estatística adquirir pelo menos, noções básicas
sobre essa teoria.
i) Uma injeção contendo uma substância letal, altamente eficaz, que tem efeito em apenas 10 minutos, é
aplicada em 10 cobaias. Após duas horas, o número de sobreviventes é contado.
ii) Um recipiente com água é colocado para ferver, na cidade de Santos (ao nível do mar). A temperatura
de ebulição da água é registrada.
E. 2) Experimentos do tipo 2:
ii) Medir o tempo de sobrevida de um paciente com câncer, após aplicação de quimioterapia.
Podemos dizer que nos experimentos do tipo I, os resultados são conhecidos à priori, ou seja,
antes de se realizar o experimento. Assim, fatalmente não haverá sobreviventes no primeiro exemplo,
assim, como se sabe que água ferve a 100º C, ao nível do mar. Esses experimentos são chamados de
deterministicos e não são de interesse do ponto de vista da probabilidade. Já os experimentos do tipo 2,
são chamados aleatórios e, por mais que nos esforcemos em prever o resultado, ele só e determinado após
a realização do experimento. Portanto, os experimentos aleatórios são aqueles que repetidos sob as
mesmas condições podem, levar a resultados distintos. Estes sim, são objeto de interesse da Teoria da
Probabilidade.
41
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Embora nos experimentos aleatórios não seja possível identificar com exatidão o resultado à priori
, é possível descrever todos os possíveis resultados. A esse conjunto, da-se o nome de espaço amostral.
Aqui, denotaremos espaço amostral pela letra grega Ω .
i) E = jogar um dado e observar o número da face superior
Ω = { cara, coroa}
ii) Medir o tempo de sobrevida de um paciente com câncer, após aplicação de quimioterapia.
Ω = { t ∈ R / t ≥ 0}
Eventos complementares
Dado um evento A de Ω , o evento complementar de A, denotado A, é formado por todos os
elementos de Ω , que não estão em A .
Considerando os exemplos anteriores temos:
A = { coroa} , B = { t ∈ R / t > 0}
Esquema ilustrativo
42
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Exemplo: No lançamento de um dado honesto, os eventos “número par” e “número ímpar” são
mutuamente exclusivos.
simultaneamente, isto é, (A ∩ B) = ∅.
v) Eventos complementares são sempre mutuamente excludentes, mas a recíproca nem sempre é
sempre verdadeira.
c) Conceito clássico
ou ainda,
N.C.F.
P ( A) = Onde, N.C.F. é o nº de casos favoráveis
N.T .C.
N.T.C. nº total de casos
43
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Exemplos:
1) Lança-se um dado. Qual é a probabilidade de sair um número ímpar? Qual é a probabilidade de sair o
número 2?
2) Uma carta é extraída ao acaso de um baralho com 52 cartas. Qual é a probabilidade de sair um às?
NOTAS:
a) A probabilidade varia entre 0 e 1 ou entre 0 e 100%;
b) Se é certo de ocorrer determinado evento, a P (desse evento) = 1 ou 100%. Se é impossível ocorrer
determinado evento a P (desse evento) = 0. Exemplo, lança-se um dado:
P (ocorrer um nº menor que 8) =
P (ocorrer um nº maior que 8) =
TEOREMAS:
Calcule: P(A), P(B), P(C), P(A ∪ B), P(A ∪ C), P(B ∩ C),
44
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
1 2 - Probabilidade Condicional:
Exemplo:
Dois dados são lançados, registrando-se os resultados com (x1, x2 ). Considere os seguintes eventos:
A = { (x1, x2); x1 + x2 = 10} e B = { (x1, x2); x1 > x2}
Calcule P ( A ) , P ( B ) , P ( A\ B ) e P ( B\ A )
Espaço amostral:
Espaço amostral de A:
Espaço amostral de B:
Qual a P(A ∩ B) ?
Resp.: (A ∩ B) = { (x1, x2); x1 + x2 = 10 e x1 > x2}
Ω (A ∩ B) = {(6,4)} P(A ∩ B) = 1/36.
45
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
1 3 - Independência Probabilística
Dois eventos A e B, de Ω , são independentes se e somente se:
P ( A\ B ) = P ( A )
P ( B\ A ) = P ( B )
Ou seja, a ocorrência de um deles não condiciona a ocorrência do outro e vice-versa. Desse modo, temos
também que:
P ( A ∩ B ) = P ( A) ⋅ P ( B )
1 4 - Teorema de Bayes
Esse resultado é dado pelo teorema da Bayes também conhecido como “regra das probabilidades
das hipóteses” e é uma das relações mais importantes envolvendo probabilidades condicionais:
P ( C i ) ⋅ P ( A \ Ci )
P ( Ci \ A) =
∑ P ( C ) gP ( A \ C )
j
j j
46
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Exemplo: Numa Faculdade funcionam três cursos C1, C2, C3. Sabe-se que a proporção de alunos
fumantes nos três cursos é de 0,25; 0,55 e 0,40; respectivamente. Um aluno é selecionado ao acaso e
sabe-se que ele é fumante. Nessas condições, qual é a probabilidade de que ele seja do curso C3?
Trata-se de um problema típico para a aplicação do Teorema de Bayes. Costuma ser elucidativo,
nesses casos, a árvore das possibilidades da situação descrita:
Então;
P ( C i ) ⋅ P ( A \ Ci )
P ( Ci \ A) =
∑ P ( C ) gP ( A \ C )
j
j j
1 2
⋅
3 5 1
P ( CursoC3 \ que é fumante ) = =
1 1 1 11 1 2 3
⋅ + ⋅ + ⋅
3 4 3 20 3 5
C1 C2
C3
47
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
UNIDADE III
As variáveis aleatórias (que descrevemos de modo abreviado: v. a .) podem ser de dois tipos:
discretas ou continuas. Uma v.a. é dita discreta quando ela assume somente valores num conjunto
enumerável de pontos do conjunto real. Ela é uma v.a . continua se for do tipo que pode assumir qualquer
valor em um intervalo real.
função X , que associe a cada elemento ω ∈ Ω um número real, X ( ω ) , é denominada variável aleatória.
É toda variável influenciada pelo acaso.
Ω R
X X ( ω) X
ω
(Ω )
Ex. 1: Consideremos o experimento aleatório: extraem-se duas bolas, sem reposição, de uma urna
que contem: 2 bolas brancas (B) e 3 vermelhas (V). Vamos definir a v. a . X como:
X = “o numero de bolas vermelhas obtidas nas duas extrações”. Portanto os valores possíveis que a v. a.
X pode assumir são :
48
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
n n
E (X ) =∑X ⋅P
i X( i ) para v. a’ s discretas E ( X ) = ∫X ⋅i f ( X ) para v. a’ s contínuas
i =1 i =1
Ex. 4: Consideremos o novamente o exemplo da urna com 3 bolas vermelhas e 2 brancas, de onde se
extraem sem reposição duas bolas.
A v. a . X é definida como:
X = “o numero de bolas vermelhas obtidas nas duas extrações”.
Portanto: X ( Ω ) = { 0,1, 2}
1 6 12
E( X ) = 0⋅ + 1 ⋅ + 2 ⋅ = 1,2
10 10 10
Ex. 5: Consideremos o novamente o exemplo do lançamento de uma moeda “honesta” duas vezes. Seja a
v. a. Y , definida como:
49
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
2.3 – Propriedades
1) A média de uma constante é a própria constante:
E( K) = K
2) Multiplicando uma v.a. X por uma constante, sua média fica multiplicada por essa constante:
E ( KX ) = KE ( X )
3) Somando ou subtraindo uma constante a uma v.a. a sua média fica somada ou subtraída da mesma
constante.
E( X ± K) = E( X ) ± K
Ex. 6: Seja o experimento: Lançar um dado “honesto” e observar o número que ocorre na face superior.
a) v. a. X b) v. a. Y
X P( X ) X ⋅P( X )
2 1/6 2/6
4 1/6 4/6
6 1/6 6/6
8 1/6 8/6
10 1/6 10/6
12 1/6 12/6
Σ 1 42/6=7
50
Y P(Y ) Y ⋅ P( Y )
1 1/2 1/2
3 1/2
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de 3/2
Oliveira Σ 1 42/6=7
42 4
Logo: E ( X ) = =7 e E(Y) = =2
6 2
E ( Z ) = E ( 4 ⋅ Y ) = 4E ( Y ) = 4 ⋅ 2 = 8, desde que E ( Y ) = 2 .
Z ( 1) = Z ( 3 ) = Z ( 5 ) = 4 ⋅ 1 = 4
Z P( Z) Z ⋅P( Z)
4 1/2 4/2
12 1/2 12/2
Σ 1 16/2 = 8
16
Logo, E ( Z ) = = 8, portanto , realmente o resultado as propriedade (2) foi verificado.
2
V ( 1) = V ( 3 ) = V ( 5 ) = 4 + 1 = 5
V ( 2) = V ( 4) = V ( 6 ) = 4 + 3 = 7
Portanto temos:
V P(V ) V ⋅ P(V )
5 1/2 5/2
51
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
7 1/2 7/2
Σ 1 12/2 = 6
12
Logo, E ( V ) = = 6. Desta forma se verifica o resultado da propriedade (3).
2
E ( T ) = E ( X +Y ) = E ( X ) + E( Y ) =7 + 2 = 9
T ( 1) = 2 + 1 = 3
T ( 2) = 4 + 3 = 7
T ( 3) = 6 + 1 = 7
T ( 4 ) = 8 + 3 = 11
T ( 5 ) = 10 + 1 = 11
T ( 6 ) = 12 + 3 = 15
T P(T ) T ⋅P(T )
3 1/6 3/6
7 2/6 14/6
11 2/6 22/6
15 1/6 15/6
Σ 1 54/6 = 9
E, concluímos que o resultado da propriedade (4) se verifica para os valores deste exemplo.
maneira:
V ( X ) = E( X − E( X ) ) = E( X 2 ) −( E( X ) )
2 2
2.5 – Propriedades
V ( X +C) =V ( X )
V ( CX ) = C 2V ( X )
V ( X +Y ) = V ( X ) +V ( Y ) .
Em muitos problemas teóricos e aplicados, e a primeira vista, sob diversas condições, várias
funções de densidade (ou distribuição) de probabilidade aparecem com tanta freqüência que merecem ser
estudadas.
S
SS
...
SF
FF
...
F
Um resultado particular (RP):
k n −k
Logo,
kn
n −k
P(X = k) =
k
p .q
A variável X tem distribuição Binomial, com parâmetros n e p, e indicaremos pela notação X~B(n,p).
53
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Ex. Uma prova tipo teste tem 50 questões independentes. Cada questão tem 5 alternativas. Apenas uma
das alternativas é a correta. Se um aluno resolve a prova respondendo as questões, qual a probabilidade de
tirar nota 5, sabendo-se que a prova vale 10?
22 55
5 1 4 0
P( X = 25 ) =
. . = 0, 0 0 0 0 2
2 5 5 5
• Esperança (média) e Variância
n n −k
Se X ~ B( n, p ) ⇒ P(X = k) =
k
k
p .q , logo ;
E(X) = n.p
Var(X) = n.p.q
Consideremos uma população com N elementos, dos quais r tem uma determinada característica
(a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição,
uma amostra de tamanho n.
Seja X: nº de sucessos na amostra (saída do elemento com a característica). Qual a P(X = k)?
N r
Podemos tirar
n
amostras sem reposição. Os sucessos na amostra podem ocorrer de
k
maneiras e
N − r
fracassos de
modos.
n − k
Logo,
54
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
r N − r
k
n − k
P(X = k ) =
,0≤ k≤ n e k≤ r
N
n
E( X ) = n.p
(N − n) r
Var( X ) = n.p.(1-p) ( N −1) onde p =
N
Ex.: Pequenos motores são guardados em caixas de 50 unidades. Um inspetor de qualidade examina cada
caixa, antes da posterior remessa, testando 5 motores. Se nenhum motor for defeituoso, a caixa é aceita.
Se pelo menos um for defeituoso, todos os 50 motores são testados. Há 6 motores defeituosos numa
caixa. Qual a probabilidade de que seja necessário examinar todos os motores dessa caixa?
N = 50; r = 6; n = 5
6 44
0
5
P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) = 1 - P(X = 0) = 50 = 1 – 0,5126 = 0,4874
5
e −λ.λk
P( X = k ) =
k!
55
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
E( X ) = λ
Var( X ) = λ
Ex.: Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade de que uma página
contenha pelo menos 3 erros?
= 1 – 0,919698 = 0,080302
EXERCÍCIOS
2) Seja X uma v. a. correspondente ao número de caras em quatro lançamentos de uma moeda. Qual a
probabilidade de se obter:
2) Seja X uma v. a. correspondente ao número de caras em quatro lançamentos de uma moeda. Qual
a probabilidade de se obter:
3) Se o número de chamadas telefônicas que um operador recebe entre 9:00 e 9:05 segue uma
distribuição de Poisson com λ = 2, qual é a probabilidade de que o operador não receba nenhuma
chamada amanhã, no mesmo intervalo?
56
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
4) Em estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A
e 5 da espécie B. A evolução de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos
pesquisadores através de capturas periódicas. Determinar a probabilidade de, em três jacarés capturados
de uma vez, obtemos:
a) Todos da espécie ª
e −5 5k
P(N = k ) = , k = 0,1,2,...
K!
b) Determine a probabilidade de que pelo menos uma partícula seja emitida em um minuto.
57
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
20
nº de estudantes
15
10
0
pressão sistólica
A curva sob o gráfico acima pode ser interpretada como um limite teórico para a descrição dos
dados, pois à medida que aumentamos o tamanho da amostra mais as características amostrais se
aproximam dos parâmetros populacionais, de tal sorte que podemos supor uma linha totalmente polida,
simétrica e mesocúrtica para o verdadeiro tamanho da população. A essa curava dá-se o nome de curva
normal ou curava gausiana e os dados que aderem a ela seguem a chamada distribuição normal.
A distribuição normal, como já foi dito, é a principal distribuição de variável aleatória contínua.
A caracterização de distribuições contínuas se dá através de uma função densidade de probabilidade. É
através dessas funções, por exemplo, que podemos calcular a probabilidade de uma variável aleatória
pertencer a um determinado intervalo.
58
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Notação: X~N( µ , σ 2)
Gráfico: A figura abaixo ilustra uma particular curva normal, determinada por valores particulares
de µ e σ 2.
a) E(X) = µ
b) Var(X) = σ 2
c) f(x) → 0 quando x → ±∞
1
e) x = µ é ponto de máximo de f(x), e o valor máximo é σ 2π ;
f) f(x) é simétrica ao redor de x = µ , isto é, f(µ + x) = f(µ - x), para todo −∞ < x < + ∞
i) a área total sob a curva vale 1, porque essa área corresponde à probabilidade de a variável
aleatória assumir qualquer valor real.
j) como a curva é simétrica em torno da média, os valores maiores do que a média e os valores
menores do que a média ocorrem com igual probabilidade.
59
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
A Normal-Padrão
Para o cálculo das probabilidades, surgem dois grandes problemas: primeiro, para integração de
f(x), pois para o cálculo é necessário o desenvolvimento em séries; segundo, seria a elaboração de uma
tabela de probabilidades, pois f(x) depende de dois parâmetros, fato este que acarretaria um grande
trabalho para tabelar essas probabilidades considerando-se as várias combinações de µ e σ 2.
Os problemas foram solucionados por meio de uma mudança de variável obtendo-se, assim, a
distribuição normal padronizada ou reduzida:
X −µ
Z=
σ
É fácil demonstrar que Z tem média 0 e variância 1. A normalidade de Z já não é imediata e não
será provada aqui. A figura abaixo ilustra a N(0,1).
60
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
A integral acima não pode ser calculada exatamente, por métodos numéricos. No entanto, para
cada valor de µ e cada valor de σ , teríamos que obter P(a ≤ X ≤ b) para diversos valores de a e b.
X −µ
Esta tarefa é facilitada através do uso de Z = , de sorte que somente é necessário construir uma
σ
Vejamos, então, como obter probabilidades a partir da Tabela da Distribuição Normal Reduzida.
Esta tabela dá as probabilidades sob uma curva normal padrão que nada mais são do que as
correspondentes áreas sob a curva. A figura ao abaixo ilustra a probabilidade fornecida pela tabela , a
saber,
61
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
P(0 ≤ Z ≤ zc),
Exercícios:
1) Usando a tábua da Normal padrão, ou seja, se Z ~ N(0,1) estabeleça as seguintes probabilidades:
a) P (0<Z<2,13)
b) P (-2,13<Z<0)
c) P ((-2,13<Z<2,13)
d) P (Z ≥2,13)
e) P (Z< -2,13)
2) Numa população, o peso dos indivíduos é uma variável aleatória X que segundo estudos anteriores
segue o modelo normal com média 78 kg e desvio-padrão 10 kg. Uma pessoa é escolhida ao acaso
nessa população. Determine a probabilidade de que seu peso:
62
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
DISTRIBUIÇÃO GAMA:
Idéias gerais:
Muitas variáveis atmosféricas são distintamente assimétricas, e possuem uma
assimetria para a direita. Muitos de vocês encontraram essas distribuições quando analisaram
seus dados para o seminário. Um dos exemplos mais comuns dessa situação é a precipitação.
Sabemos que não existem precipitações negativas, certo? Então vamos analisar a seguinte
situação: suponha que uma certa localidade tenha uma média de precipitação diária de 1.96 in
e desvio-padrão de 1.12 in. Utilizando a tabela de distribuições acumuladas Gaussiana
podemos calcular a probabilidade de precipitações negativas como Pr { Z ≤ (0.00 – 1.96)/1.12}
= Pr{Z≤ -1.75} = 0.040. Esta probabilidae calculada não é especialmente grande, mas por outro
lado não pode ser considerada zero. AGORA, SABEMOS PELA NATUREZA QUE
PRECIPITAÇÕES NEGATIVAS SÃO IMPOSSÍVEIS!
Uma escolha comum para representar distribuições contínuas que são assimétricas é utilizar a
distribuição GAMMA. Esta distribuição é definida pela PDF:
63
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
( x / β)α−1 exp( −x / β)
f ( x) , onde x, α, β > 0
βΓ(α)
Fig. 5.3. Funções densidade de probabilidade GAMMA para 4 valores do parâmetro de forma α
(adaptado de Wilks, cap 5)
Isto permite que a tabela distribuída em sala de aula seja utilizada indefinidamente. Por
exemplo, Γ(3.5)= Γ(2.5) Γ(2.5)=(2.5)(1.5) Γ(1.5)=(2.5)(1.5)(0.8862)=3.323.
A PDF da distribuição Gamma pode apresentar uma grande variedade de formas, dependendo,
portanto, do parâmetro de forma α. Para valores de α muito altos, a distribuição gamma tende à
Gaussiana
64
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
1 n
D =ln( x ) −
n
∑ln( xi ) , (5.14)
i =1
1) A primeira das duas aproximações (conhecida por estimadores de Thom – Thom (1958))
para o parâmetro de forma é dada por:
1 + 1 + 4D / 3
αˆ = (5.15)
4D
x
βˆ = (5.16)
αˆ
Para 0≤ D ≤0.5772,
Ou
8.898919 +9.059950 D +0.9775373 D 2
α
ˆ = (5.18)
17 .79728 D +11 .968477 D 2 + D 3
Para 0.5772 ≤ D ≤ 17
probabilidades gama será disponível para uma distribuição gama padrão com β=1. Portanto, é
sempre necessário fazer uma transformação para re-escalonar a variável X de interesse
(caracterizada por uma gama com parâmetro de escala arbitrário β) para a variável
x
ξ= (5.19)
β
Que segue uma distribuição gama com β=1. A variável padrão ζ é admensional (lembre-se que
β possui a dimensão de seus dados). O parâmetro de forma α será o mesmo para X ou para ζ.
Veja que este procedimento é equivalente à transformação para a variável padronizada z no
caso da distribuição Gaussiana.
Entretanto, as PROBABILIDADES CUMULATIVAS para a distribuição gama padrão são dadas
pela função matemática conhecida como “FUNÇÃO GAMMA INCOMPLETA, P(α,ζ )= Pr
{Θ≤ζ}=F(ζ). Esta é a função que foi utilizada para calcular as probabilidades que aparecem na
tabela B.2. Ou seja, as probabilidades cumulativas para a distribuição gama padronizada na
tabela B.2 estão arranjadas de forma INVERSA DO QUE É FEITO COM AS
PROBABILIADDES GAUSSIANAS. Quer dizer, os quantis (ou valores transformados ζ) é que
estão apresentados no corpo da tabela, enquanto as probabilidades cumulativa é que estão
sendo mostradas na primeira linha da tabela. Na primeira coluna da tabela, a entrada é o valor
de alfa.
Vamos analisar o exemplo dado pelo Wilks. Considere a tabela de dados da precipitação de
Janeiro para a cidade de Ithaca durante 50 anos (1933-1982). Queremos avaliar o quão ‘não
usual” foi a precipitação observada em Ithaca em 1987 (fornecida numa tabela separada). Para
esta finalidade, procedemos da seguinte maneira:
1) Calculamos a média aritmética como de costume (no presente caso, a média é igual a
1.96in)
2) Calculamos o valor da média dos logaritmos dos totais mensais (igual a 0.5346)
3) Obtemos o valor de D como na Eq. 5.14 (igual a 0.139)
4) O método de Thom (Eq. 5.15 e 5.17) estimam α=3.76 e β=0.52in.
5) Avaliamos qual usual foi a precipitação em janeiro de 1987 (=3.15in) com a ajuda da
Tab. B2 para os parâmetros da Gama que obtivemos anteriormente. Para esta
finalidade, vamos primeiro fazer a transformação de variáveis indicado na Eq. 5.19. No
presente caso, ζ=3.15in/0.52in= 6.06.
66
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
67
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
68
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
69
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
UNIDADE IV
INFERENCIA ESTATÍSTICA
ESTATÍSTICA: Ciência que diz respeito à coleta, apresentação, análise e interpretação de dados
experimentais.
ESTATÍSTICA DESCRITIVA
PROBABILIDADE ESTATISTICA
INFERÊNCIA ESTATÍSTICA
1. Introdução
Nas últimas unidades vimos como construir modelos probabilísticos para descrever alguns fenômenos.
Nessa parte, iremos estudar um ramo muito importante da Estatística conhecido como Inferência
Estatística, ou seja, como fazer afirmações sobre características de uma população, baseando-se em
resultados de uma mostra.
Inferência Estatística é o ramo da Estatística que refere-se ao processo de obter informações sobre
uma população a partir de resultados observados na amostra.
θ θ̂
Inferência Estatística
POPULAÇÃO: conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum observável.
Pode ser finita como o conjunto de alunos de uma escola em um determinado ano, ou infinita, como o
número de vezes que se pode jogar um dado.
70
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
CASOS GERAIS:
Verificar o sabor de um bolo;
Verificar a temperatura da água de uma piscina;
Avaliar a qualidade de um livro;
A grande maioria das pesquisas realizadas nas mais variadas áreas do conhecimento humano são
feiras com amostras. O pesquisador, no entanto, almeja generalizar seus resultados, ou seja, saber se o
que obteve com amostras é válido para toda a população. Essa é, sem dúvida, a essência da inferência
estatística. Formalmente, a Inferência ou Estatística Indutiva é a parte da Estatística que estuda a
estimação e os testes sobre os parâmetros populacionais.
PARÂMETRO: medida usada para descrever uma característica da população [ µ,σ 2 ( x ), σ( x ),... ].
ESTIMAÇÃO PONTUAL
71
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Em geral é INSUFICIENTE!
ESTIMAÇÃO INTERVALAR
A partir da amostra procura-se construir um intervalo de variação, θˆ1 ≤ θ ≤ θˆ2 , com uma certa
probabilidade de conter o verdadeiro parâmetro populacional.
TESTES PARAMÉTRICOS
A hipótese é formulada com respeito ao valor de um parâmetro populacional.
TESTES NÃO-PARAMÉTRICOS
A hipótese é formulada com respeito à natureza da distribuição da população.
ESTIMAÇÃO INTERVALAR
INTERVALOS DE CONFIANÇA
É um intervalo real, centrado na estimativa pontual que deverá conter o parâmetro com determinada
probabilidade.
Assim como as estimações pontuais, os intervalos de confiança podem ser vistos como uma técnica
para se fazer inferência estatística. Ou seja, a partir de um intervalo de confiança, construído com os
elementos amostrais, pode-se inferir sobre um parâmetro populacional.
72
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
θ : Parâmetro populacional
θ̂ : Estimador de θ
O valor da probabilidade (1 −α) que usualmente assume os valores 90%, 95%, 98%, etc., é
denominado NÍVEL DE CONFIANÇA, e o valor α é chamado NÍVEL DE SIGNIFICÂNCIA, isto é,
representa o erro que se está cometendo quando se afirma que a probabilidade do intervalo, θˆ1 ≤ θ ≤ θˆ2 ,
conter o verdadeiro valor do parâmetro populacional é (1 −α) .
VANTAGEM:
Permite uma idéia da precisão com que foi calculada a estimativa do parâmetro, pois expressa o
erro aceito ao calculá-la.
Suponha,
n = 25, X = 12 e S =1.2
73
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
Métodos
Fatores
Distribuição Normal Distribuição t-Student
Tamanho da amostra n ≥ 30 n < 30
Variância conhecida σ2 S2
Variável utilizada Z T
A Distribuição t de Student
Trata-se de um modelo de distribuição contínua que se assemelha à distribuição normal padrão, N(0,1).
É utilizada particularmente, quando se tem amostras com tamanhos inferiores a 30 elementos.
Possui um parâmetro chamado "grau de liberdade"
Se a distribuição de uma população é essencialmente normal (com a forma aproximadamente de
um sino), então a distribuição de
X −µ
t= , com (n-1) graus de liberdade,
s/ n
74
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
OBS: O número de graus de liberdade para um conjunto de dados corresponde ao número de valores que
podem variar após terem sido impostas certas restrições a todos os valores.
1. A distribuição t de Student tem a mesma forma geral simétrica (curva em forma de sino)que a
distribuição normal, mas reflete maior variabilidade que é esperada em pequenas amostras.
2. A distribuição t de Student tem média t = 0 (tal como a normal padronizada, com média Z = 0).
3. O desvio-padrão da distribuição t de Student varia com o tamanho da amostra, mas é superior a 1 (ao
contrário da distribuição normal padronizada).
4. Na medida em que aumenta o tamanho da amostra, a distribuição t de Student se aproxima mais e
mais da distribuição normal padronizada. Para valores n > 30, as diferenças são tão pequenas que
podemos utilizar os valores críticos Z.
CONDIÇÕES PARA A UTILIZAÇÃO DA DISTRIBUIÇÃO t DE STUDENT:
1. O tamanho da amostra é pequeno n ≤ 30 ;
2. σ é desconhecido;
3. A população original tem distribuição essencialmente normal (como a distribuição da população
original normalmente é desconhecida, estimamo-la construindo um histograma dos dados amostrais).
Sabe-se que, a variância de uma amostra deve ser calculada pr, s2 (x)= ∑(x i ) (n −1) . A
2
−x
necessidade dessa correção esta relacionada com o número de G.L, por exemplo: µ = x = ∑ xn e
σ2= [∑ ( x − µ ) ] ( n ) .
i
2
são estatísticas com "n" graus de liberdade, pois existem n valores xi livres que devem ser considerados
para podermos calcular o valor da estatística.
A estatística s2(x), por usar x ao invés de µ , tem um grau de liberdade a menos. Isso ocorre porque
para o cálculo de s2(x) é necessário que se tenha calculado x , ou seja, já utilizamos uma vez todo os
valores da amostra; estes estiram sendo usados pela Segunda vez para o cálculo de s2.
Exercício: Com base na tabela t de Student determine o valor da distribuição nos seguinte casos:
a) t (5; 1%) b) t (6; 2%) c) t (19; 5%)
75
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira
d) t (21; 10%)
e) t (28; 5%)
f) t (12; 1%)
76
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
CASO 1:
σ2 N −n
µ, n . N −1
X ~ N , para populações finitas
X −µ
Então, Z = ~ N ( 0,1)
σ/ n
P ( − Zα / 2 ≤ Z ≤ Zα / 2 ) = 1 − α
X −µ
P − Zα / 2 ≤ ≤ Zα / 2 = 1 − α
σ/ n
σ σ
P − Z α / 2 . − X ≤ −µ ≤ Zα / 2 . − X = 1 −α
n n
www.estatistica.ccet.ufrn.br 78
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
σ σ
P X − Zα / 2 . ≤ µ ≤ X + Zα / 2 . = 1 −α
n n
Exemplo: O departamento de Recursos Humanos de uma grade empresa informa que o tempo de
execução de tarefas que envolvem participação manual varia de tarefa para tarefa, mas que o
desvio padrão permanece aproximadamente constante em 3 min. Uma nova tarefa está sendo
implantada na empresa. Uma amostra aleatória do tempo de execução de 50 dessas novas tarefas
forneceu o valor médio de 15 min. Determine o intervalo de confiança de 95% para o tempo
médio de execução dessa nova tarefa.
CASO 2:
www.estatistica.ccet.ufrn.br 79
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
≥ 30) S ≅ σ
Quanto menor a amostra mais necessária se torna a introdução de uma correção: t(n-1) ao
invés de Z.
X −µ
Sabe-se que, X ~ N ( µ, σ 2 / n ) e Z = ~ N ( 0,1)
σ/ n
X −µ
Então, t n−1 =
S/ n
P( − tα / 2 ≤ t ≤ tα / 2 ) = 1 − α
X −µ
P − tα / 2 ≤ ≤ tα / 2 = 1 − α
S/ n
S S
P − tα / 2 . − X ≤ −µ ≤ tα / 2 . − X = 1 −α
n n
S S
P X − tα / 2 . ≤ µ ≤ X + tα / 2 . = 1 −α
n n
www.estatistica.ccet.ufrn.br 80
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
S N −n S N − n
P X − tα / 2 . . ≤ µ ≤ X + tα / 2 . . = 1 −α
n N −1 n N −1
OBS: Quanto menor o tamanho da amostra, mais necessário se torna a introdução de uma
correção, a qual consiste em usar a variável t-Student (t(n-1)) ao invés de usar a variável Z.
Exemplo: A amostra 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população normal.
Construir um intervalo de confiança para a média ao nível de 95%.
Solução:
S S
P X − tα / 2 . ≤ µ ≤ X + tα / 2 . = 1 −α
n n
2 2
P8.7 − ( 2.2622 ). ≤ µ ≤ 8.7 + ( 2.2622 ). = 95 %
10 10
P ( 7.27 ≤ µ ≤ 10 .13 ) = 95 %
Interpretação:
Podemos afirmar que o intervalo [7.27; 10.13] contém a verdadeira média com 95% de
confiança;
A precisão dessa estimativa nos permite afirmar , com 95% de certeza, de que não
estamos errando por mais de 1,43 nessa estimação.
www.estatistica.ccet.ufrn.br 81
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
^
p ~ N( p, p /qn ) , para populações infinitas.
^
p qN − n
p ~ N p, . , para populações finitas.
n N − 1
^
p− p
Z= ~ N ( 0,1)
p q/ n
www.estatistica.ccet.ufrn.br 82
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
^ ^
p q p q
^ ^
I.C= p− Zα/2. ≤ p + Zα/2. = 1− α
n n
Exemplo: Uma pesquisa recente efetuada com 300 habitantes de uma grande cidade revelou que
128 pessoas apresentavam insuficiência respiratória. Determine um intervalo de confiança de
95% para a proporção de habitantes dessa cidade que apresentaram insuficiência respiratória.
TESTES DE HIPÓTESES
Suponha que numa determinada região, o peso de crianças aos 12 anos, seja modulado
pela distribuição normal, tal que X ~N (48, 16). Um pesquisador da área médica desconfia que
devido a mudanças nos hábitos alimentares, o peso médio seja maior. Para tentar comprovar sua
suposição o pesquisador seleciona, por processo aleatório, uma amostra de 100 crianças dessa
população, obtendo como peso amostral x = 51,3 kg. Será que ele tem razão? A resposta deve
www.estatistica.ccet.ufrn.br 83
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
ser analisada cuidadosamente e uma decisão mais segura só é possível depois de submeter seu
dados a um teste estatístico, também conhecido como teste de hipóteses.
Regra de decisão que permite aceitar ou rejeitar uma hipótese, decisão esta que é tomada
em função dos valores amostrais. Em outras palavras, formula-se uma hipótese quanto ao valor
do parâmetro populacional, e pelos elementos amostrais faz-se um teste que indicará a rejeição,
ou não, da hipótese nula (H0).
HIPÓTESE ESTATÍSTICA
TIPOS DE HIPÓTESES
H 0 : é aquela que será testada, sendo sempre contrária ao resultado do experimento amostral;
TIPOS DE TESTES
a) H 0 : µ = 1.65 m
(Teste bicaudal)
H 1 : µ ≠ 1.65 m
www.estatistica.ccet.ufrn.br 84
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
H 1 : µ < 1.65 m
c) H 0 : µ = 1.65 m
(Teste unicaudal à direita)
H 1 : µ > 1.65 m
TIPOS DE ERROS:
Decisão
Realidade
Aceitar H 0 Rejeitar H 0
H 0 é verdadeira Decisão Correta (1 −α) Erro Tipo I (α)
H 0 é falsa Erro Tipo II ( β) Decisão Correta (1 − β)
ERRO TIPO I ⇒ cometido quando rejeitamos H0 , quando na verdade, ela é verdadeira. Esse
tipo de erro é o mais importante a ser evitado. A probabilidade de se cometer um erro tipo I é o
que se chama de nível de significância de um teste. α =P(erro tipo I)
ERRO TIPO II ⇒ cometido quando não rejeitamos H0, quando na verdade ela é falsa.
www.estatistica.ccet.ufrn.br 85
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
TESTES PARAMÉTRICOS
1. Enunciar as hipóteses:
H 0 : µ = µ0
µ ≠ µ 0 (a )
H 1 : µ > µ 0 (b)
µ < µ (c )
0
www.estatistica.ccet.ufrn.br 86
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
X −µ
4. Calcular a variável do teste t cal =
S/ n
5. Conclusões
Exemplo:
Os registros de um colégio atestam para calouros admitidos uma nota média de 115. Para testar a
hipótese de que a média de uma nova turma é a mesma, tirou-se ao acaso, uma amostra de 20
notas, obtendo-se média 118 e desvio padrão 20. Admitir α =5% para efetuar o teste.
Solução:
1. Enunciar as hipóteses
H 0 : µ = 115
H1 : µ ≠ 115
2. α =5%
Variável: t ( n −1) = t (19 ) tα / 2 = 2.093
3. Determinar RA e RC:
X − µ 118 −115
4. Calcular a estatística do teste: t cal = = = 0.67
S/ n 20 / 20
5. Conclusão: como − 2.09 ≤ t cal ≤ 2.093 não se pode rejeitar H 0 com esse nível de
significância. Logo, a média da nova turma é a mesma.
www.estatistica.ccet.ufrn.br 88
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
^
p − p0
4. Calcular a variável do teste Zc a l =
p0 q 0 / n
5. Conclusões
Exemplo:
As condições de mortalidade de uma região são tais que a proporção de nascidos vivos
que sobrevivem até 60 anos é 0.6. Testar essa hipótese ao nível de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos.
Solução:
^
p 0 = 0.6 , n = 1000 , α = 0.05 e
p = 5 3/ 1 0 0 = 00.50 3
1. Enunciar as hipóteses
H 0 : p = 0.6
H1 : p ≠ 0.6
www.estatistica.ccet.ufrn.br 89
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
2. α = 0.05
3. Determinar RA e RC:
^
p− p0 0.5 3− 0.6
Zc a l = = = − 4. 4 2
p0q0 / n ( 0.6)( 0.4) / 1 0 0 0
TESTES NÃO-PARAMÉTRICOS
TESTE QUI-QUADRADO
Teste de Associação
www.estatistica.ccet.ufrn.br 90
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
e que de acordo com as regras de probabilidade, era de se esperar que esses eventos ocorressem
com freqüências esperadas, e1 , e2 , , ek .
Eventos E1 E2 E3 ... Ek
Freqüências
o1 o2 o3 ok
Observadas ...
Freqüências
e1 e2 e3 ek
Esperadas ...
Objetivo: verificar de modo significativo se as freqüências observadas diferem das
esperadas.
CONCEITOS IMPORTANTES:
1. Enunciar as hipóteses
H 0 : não há discrepâncias entre as freqüências oi e ei .
www.estatistica.ccet.ufrn.br 91
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
χ cal
2
=
( o1 − e1 ) 2 + ( o2 − e2 ) 2 + + ( ok − ek ) 2 =∑
k
( oi − ei ) 2
e1 e2 ek i =1 ei
5. Conclusões
a) Se χcal < χsup , não se pode rejeitar H 0 .
2 2
Exemplo:
Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a hipótese de a moeda
ser honesta adotando-se α = 5%.
Solução:
1. Enunciar as hipóteses
H 0 : A moeda é honesta
2. α = 5%.
Variável: χ( k −1) = χ( 2 ) χtab = 3.84
2 2 2
χ cal
2
=
( 35 − 50 ) 2 + ( 65 − 50 ) 2 =9
50 50
www.estatistica.ccet.ufrn.br 92
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
5. Conclusão: Como χcal > 3.84 , rejeita-se H 0 , concluindo-se com risco de 5%, que a
2
2. Fixar o nível de significância α . A variável escolhida é χ(2L −1).(C −1) , onde L é o número
de linhas da tabela de contingência e C é o número de colunas.
χ 2
L
= ∑∑
C (o ij − eij )
2
cal
i =1 j =1 eij
www.estatistica.ccet.ufrn.br 93
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
5. Conclusões
Bairros
Sabor da Pasta ∑
A B C
Limão 70 44 86 200
Chocolate 50 30 45 125
Hortelã 10 06 34 50
Outros 20 20 85 125
∑ 150 100 250 500
Solução:
1. Enunciar as hipóteses
H 0 : A preferência pelo sabor independe do bairro
2. α = 5%.
Variável: χ( L −1)( C −1) = χ( 6 ) χtab = 12 .6
2 2 2
www.estatistica.ccet.ufrn.br 94
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
Bairros
Sabor da Pasta
A B C
Limão 60 40 100
Chocolate 37.5 25 62.5
Hortelã 15 10 25
Outros 37.5 25 62.5
χ cal
2
=
( 70 − 60 ) 2 + ( 50 − 37.5) 2 + +
( 85 − 62.5) 2 = 37.88
60 37 .5 62.5
5. Conclusão: Como χcal > 12 .6 , rejeita-se H 0 , concluindo-se com risco de 5%, que há
2
Distribuição Qui-Quadrado
χ2 =
( n − 1) s 2
σ2
www.estatistica.ccet.ufrn.br 95
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
σ2 = variância populacional;
Os valores críticos são encontrados a partir da tabela da distribuição qui-quadrado, cujo número
de graus de liberdade é definido como sendo (n-1).
BIBLIOGRAFIA
MEYER, Paul L. Probabilidade: aplicações à estatística. 2ed. Rio de Janeiro, LTC S/A, 1984.
BUSSAB, W. O e MORETTIN, P. A Estatística Básica. São Paulo: Atual, ed. 4, 1987.
STONE, Hoel Port. Introduction to stochastic process. Boston, Houghton Misslyn Company,
1972.
VIEIRA, Sônia. Planejamento de Experimentos.
VIEIRA, Sônia. Princípios de estatística. São Paulo, pioneira, 1999.
www.estatistica.ccet.ufrn.br 96
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
LISTA DE EXERCÍCIOS
2. Um psicólogo que trabalha com a situação do problema anterior deseja verificar qual é o
tempo máximo de realização dessa tarefa ao nível de confiança de 80%. Qual foi o valor
obtido por ele?
3. Uma revista semanal, em artigo sobre a participação das mulheres em curso superior de
Ciências Biológicas, afirmou que a proporção de mulheres neste curso é superior à dos
homens. Uma pessoa interessada em testar essa afirmação levantou uma amostra ao acaso de
100 estudantes de Ciências Biológicas e obteve na amostra uma porcentagem de 40% de
mulheres.
a) Qual é o IC para a proporção de mulheres não população ao nível de 98%?
b) Baseando-se nesse IC, a afirmação da revista é certamente falsa?
4. Para estudar o grau de satisfação com o setor de serviço em uma empresa, um consultor
levantou uma amostra aleatória de 50 pessoas na empresa. Sabe-se, por experiências
anteriores, que o desvio padrão para o grau de satisfação com o setor de serviço é
aproximadamente constante e igual a 40. O grau médio de satisfação amostral foi calculado
em 245. Determine um intervalo de confiança de 94% para o grau médio de satisfação nesta
empresa.
6. Uma amostra aleatória de 60 elementos obtidos de uma população normal apresentou média
de 46 e desvio padrão de 8. Calcular:
www.estatistica.ccet.ufrn.br 97
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
7. Um guarda de trânsito vistoriou 200 carros em um bairro de uma cidade e constatou que 25
motoristas não estavam usando o conto de segurança no momento da vistoria. Determine um
intervalo de confiança de 95% para a proporção de motoristas que usam regularmente o
cinto de segurança neste bairro.
9. Um vendedor consegue entrevistar 120 pessoas num dia, e resolve testar a aceitação de um
novo produto. Para isso, escolheu 32 pessoas e mostrou o produto, conseguindo uma
proporção de respostas positivas de 25%. Qual seria a estimativa da proporção de respostas
positivas entre as 120 pessoas, ao nível de 85%?
10. Uma população normalmente distribuída apresenta média histórica de 6 unidades e desvio
padrão de 0,5 unidades. Uma amostra de 15 elementos selecionados ao acaso forneceu
média 4 e desvio padrão 1. Teste ao nível de 5% o valo da média histórica, contra a
alternativa em que a média diminuiu.
11. De uma população normal com média histórica de 18 unidades, 12 elementos forma
selecionados ao acaso, fornecendo média de 17 unidades e desvio padrão de 3 unidades.
Teste ao nível de significância 10% a hipótese µ =18.
Um fabricante de inseticida afirma no rótulo da embalagem que sua eficiência é de 70% contra
todos os tipos de insetos. Um agente da Secretaria de Defesa do Consumidor encomenda a um
laboratório um teste de toxicidade do inseticida, e quer testar a hipótese de que a eficiência é de
70% contra a alternativa de ser maior que 70%. O laboratório informou que de 120 insetos
tratados com este inseticida 32 sobreviveram. A toxicidade do inseticida está controlada ao nível
de 2,5% de significância?
www.estatistica.ccet.ufrn.br 98
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
www.estatistica.ccet.ufrn.br 99
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
www.estatistica.ccet.ufrn.br 100
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
www.estatistica.ccet.ufrn.br 101
Simétrica
Assimétric
a Positiva
Negativa
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira
www.estatistica.ccet.ufrn.br 102