Módulo 7
Módulo 7
Módulo 7
Módulo 7
Estatística indutiva
O conhecimento do Cálculo de probabilidades, Estatística descritiva, e Amostragem, são
fundamentais para o aprendizado da Estatística indutiva, que é a parte da Estatística que tira
conclusões a respeito dos parâmetros de uma população, através da análise dos resultados obtidos nas
amostras, extraídas da população que contém a variável em estudo. As grandezas estatísticas
calculadas nas populações são chamadas de “parâmetros” enquanto que as calculadas nas amostras são
chamadas de “estatísticas”. É claro que pelo fato de fazermos uma indução (raciocínio em que de fatos
particulares se tira uma conclusão genérica) a respeito dos parâmetros populacionais, a partir de uma
amostra, estamos sujeitos a cometer erros de avaliação.
É justamente nesta parte que entram os conhecimentos de probabilidades, para que possamos
calcular o quanto estamos errando em nossas avaliações. É intuitivo que, quanto maior for o tamanho
da amostra, mais precisos e confiáveis serão os resultados obtidos, propiciando, dessa forma, melhor
avaliação do parâmetro que desejamos estimar, sendo este processo denominado de amostragem. Se
examinarmos toda a população, o resultado, então, será o verdadeiro e, neste caso, fizemos um censo.
Na prática, porém, costuma-se fazer amostragem, que consiste em retirar uma amostra da população e,
através dela, chegarmos às conclusões desejadas a respeito dos parâmetros populacionais.
Amostragem
A teoria e as técnicas empregadas para se obterem amostras, que sejam as mais representativas
possíveis da população, são muito complexas para serem expostas nesse curso. Vamos apenas dar uma
idéia concisa a esse respeito, o suficiente para entendermos o prosseguimento do curso. As amostras
podem ser obtidas de duas maneiras: as probabilísticas e as não probabilísticas.
Casual: são as amostras formadas por elementos que pertencem à população, que são
numerados e obtidos por simples sorteio ou pelo uso dos dígitos aleatórios.
Estratificada: são obtidas em faixas que denominamos estratos. Essa técnica é empregada
para a retirada dos elementos em populações que possuem uma divisão natural, e queremos que eles
apareçam convenientemente representados na amostra. A amostragem estratificada pode ser uniforme
ou proporcional aos elementos pertencentes a cada estrato.
As amostras não probabilísticas são aquelas, cujos elementos não são obtidos por métodos de
sorteios como os que foram citados anteriormente. As formas mais comuns de amostras não
probabilísticas são: a esmo e intencional, meios contínuos, etc.
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 58
A esmo: é a maneira mais comum de se obter uma amostra, principalmente quando a
população é muito grande, e é obtida, simplesmente, escolhendo os elementos da forma mais aleatória
possível.
Intencionais: são aquelas retiradas de uma população, sendo os seus elementos, escolhidos
pelo pesquisador, que devido à sua grande experiência, os escolhe de tal forma que a amostra assim
obtida produz resultados equivalentes ao de uma amostra obtida por métodos probabilísticos.
Meios contínuos: são aqueles cuja amostragem é feita em meios fluidos de qualquer natureza.
Exercícios de aplicação
1) Uma indústria especializada em montagem de grandes equipamentos industriais recebeu 70
dispositivos de controle do fornecedor A e outros 30 dispositivos do mesmo tipo do fornecedor B. O
aspecto relevante, que se deseja controlar, relativo a esses dispositivos, é a resistência elétrica de certos
componentes críticos. Vamos admitir que os cem dispositivos recebidos fossem numerados de um a
cem, ao darem entrada no almoxarifado, e que os 70 primeiros foram recebidos do fornecedor A.
Vamos admitir, também, que os valores reais da variável de interesse que é a resistência elétrica do
componente crítico dos cem elementos recebidos sejam os valores abaixo, respectivamente, na ordem
de entrada no almoxarifado. Sabemos que a média real destes valores é igual a 36,23 e o desvio padrão
3,59.
33 38 34 34 31 36 35 32 37 32
35 34 30 36 36 33 43 43 39 36
33 33 33 34 31 32 36 32 33 34
34 35 34 33 35 35 35 37 35 38
A 43 43 35 34 33 32 38 34 33 36
31 33 34 30 37 37 30 30 35 34
36 33 33 34 33 37 34 32 35 39
40 40 42 39 38 40 40 40 40 39
B 37 32 40 41 45 41 40 39 41 41
40 42 38 39 40 41 40 40 42 39
a) Tire uma amostra simples, ao acaso, de dez dispositivos dessa população com o auxílio dos
números aleatórios. O dígito escolhido para início do processo deve ser escolhido aleatoriamente por
sorteio.
Dígitos
aleatórios
Valores da
amostra
Calcule a média e o desvio padrão destes valores e escreva aqui, para você lembrar quando
preciso o roteiro de teclas para calcular a média e o desvio padrão na sua máquina de calcular
e, não a esqueça em casa nem de trazê-la na prova.
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 59
b) Suponha agora que você decida fazer uma amostragem estratificada. Em sua opinião, isso
seria razoável? Caso afirmativo, indique como você procederia, usando os números aleatórios. O
tamanho da amostra ainda continua sendo dez.
Monte aqui a amostra
Dígitos
aleatórios
Valores da
amostra
Distribuições amostrais
Em nosso estudo, suporemos sempre que as amostras que conseguimos da população foram
obtidas por métodos que nos garantam a sua representatividade. Neste caso, o que nos interessa
estudar é como se distribuem as estatísticas calculadas nas amostras, tais como a média, variança,
proporção, etc. As estatísticas são variáveis aleatórias e, portanto, possuem uma distribuição de
probabilidade. Vamos estudar algumas distribuições amostrais de interesse:
x1 x 2 .... xn
μ
N
σ (xi μ )2
N
Vamos supor que, dessa população, extraímos uma amostra de "n" elementos, de média " x ",
desvio padrão "S", e que seja representativa da população. Vamos supor que as amostras retiradas
sejam feitas com reposição ou que a população seja muito grande, de forma que a retirada de cada
elemento para pertencer à amostra não seja perceptível à população. Demonstra-se que a distribuição
amostral das médias, no caso dessa amostragem, fica dada por:
σ2
x ≡ N µ;
n
No caso da amostragem for feita sem reposição, a distribuição amostral das médias fica:
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 60
σ2 N − n
x ≡ N µ; ⋅
n N −1
Exercício de aplicação
1) Para a população constituída dos elementos {1,2,3,4}, verifique se a distribuição amostral
das médias obedece às expressões deduzidas anteriormente para as duas situações:
a) com reposição
b) sem reposição
σ
ou então µ = x ± zc
n
σ σ
ou de outra forma: P
x − zc
n
≤ u ≤ x + zc
n
=1−α
Observe que na expressão anterior, aparece o valor do desvio padrão populacional (σ) que, na
maioria das vezes, não conhecemos. A expressão para a construção de intervalos de confiança, quando
não se conhece o (σ), é feita através de sua estimativa obtida na amostra que chamamos de “S” e,
neste caso, a variável a ser usada também não é mais a (z) da normal, e sim, a (t) de Student. Neste
caso, a expressão para a construção do intervalo da média passa a ser:
S S
P
x − tc ≤ u ≤ x + tc
=1 −α
n n
O valor ν = (n-1) é denominado “graus de liberdade” na estatística (S) e, quando não temos o
desvio padrão da população usamos a variável “t de Student” (t) no lugar da variável normal reduzida
(z), e (S) no lugar de ( )
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 62
expressão que fornece o tamanho da amostra, quando o valor do desvio padrão populacional é
conhecido.
2
t ⋅s
n= c
e
Porém, nesta expressão, surge um problema. Como ainda não tiramos a amostra, como
podemos saber o valor de (S)? Neste caso, o que fazemos é tirar uma amostra piloto de n’ elementos,
calculando o valor de (S) e, depois calculamos o valor de n. Se este valor for menor do que o n’
escolhido, então, devemos completar a amostra com o número de elementos que está faltando, caso
contrário, o tamanho da amostra satisfez o exigido e o problema já está resolvido.
Exercícios de aplicação
1) A densidade do ouro é 19,3g/cm3 Uma amostra de metal, que se presume seja ouro, é
examinada mediante as determinações de sua densidade, obtendo-se os valores: 19,7 19,5 19,1 19,2
19,3 19,5 em g/cm3. a) Num nível de confiança de 97%, pode-se concluir que o metal é realmente
ouro? b) Que tamanho de amostra deveríamos pegar para que tenhamos uma precisão de 0,4g/cm 3 e
confiança de 99% na avaliação da densidade?
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 63
2) A distribuição dos diâmetros dos parafusos produzidos por certa máquina é normal, de
desvio padrão igual a 0,15mm. A amostra dos parafusos abaixo, foi retirada da produção, e apresentou
os seguintes diâmetros em mm: 25,4 25,2 25,5 25,3 25,1 25,4. a) Construa intervalos de 87% e
96% de confiança para o diâmetro médio. b) Que tamanho de amostra deveríamos tirar da população
para que tenhamos uma precisão de 0,5mm e confiança de 96% na avaliação do diâmetro?
3) Uma firma está convertendo as máquinas que aluga a uma versão mais moderna. Até agora,
foram convertidas 10 máquinas. O tempo médio de conversão foi de 24 horas, com desvio padrão de 2
horas. a) determine um intervalo de 94% de confiança para o tempo médio de conversão das
máquinas; b) qual o máximo erro esperado da estimativa determinada, através das 10 máquinas
convertidas, num nível de confiança 92%? c) Que tamanho de amostra deveríamos pegar para que
tenhamos um erro de 20 minutos com confiança de 95% na avaliação do tempo de conversão?
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 64
4) Uma estrutura esta sendo planejada para ficar sobre 200 estacas. Foram escolhidas
aleatoriamente algumas dessas estacas e nelas foram aplicadas as seguintes cargas em Kgf até elas se
romperem: 82 85 95 92 88 84 85 80 88. a) Seria essa amostra suficiente para se estimar a
capacidade média dessas estacas, com erro não superior a 2 toneladas e 92% de confiança? b) Se não,
qual o tamanho da amostra necessária para tanto? c) Construa um intervalo de confiança de 97% para a
média populacional das cargas até elas se romperem.
Tarefa mínima
1) Considerando-se que uma amostra de 100 elementos extraída de uma população
aproximadamente normal, cujo desvio padrão é igual a 2, forneceu média 35,6. Construa um intervalo
de confiança de 93% para a média dessa população.
R: P( 35,23 ≤µ≤ 35,96) = 0,93
2) Qual o tamanho de uma mostra necessária para se estimar a média de uma população infinita
cujo desvio padrão é igual a 4, com 98% de confiança e precisão de 0,5?
R: 348
4) Uma empresa tem 1.000 cabos. Um teste executado em 40 deles selecionados ao acaso,
mostrou tensão média de ruptura de 2.400 Kgf, com desvio padrão de 150 Kgf. a) Construa um
intervalo de 95% de confiança para a tensão de ruptura média dos cabos. b) Seria essa amostra
suficiente para se estimar a média com 95% de confiança e precisão de 30 Kgf ?
R: P(2.353,5 ≤µ≤ 2.446,5) = 0,95. Precisa de mais 57
elementos.
5) Uma amostra de 120 elementos retirada de uma população forneceu as seguintes estimativas
para a sua média e desvio padrão, respectivamente: 30,1 e 3,5. Qual o valor do limite mínimo para a
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 65
média real dessa população com 95% de confiança?
R: 29,47
6) No cálculo de uma estrutura de concreto armado, foi admitida uma resistência média à
compressão de 200 Kgf/cm. Uma amostra de 6 corpos de prova dessa obra apresentou os seguintes
resultados: 209 197 195 192 191 203. Com base nesse resultado, pode o engenheiro fiscal
considerar satisfatória a execução da estrutura, num nível de confiança 90%?
R: P( 192,1 ≤µ≤ 203,5) = 0,90; Sim
7) Uma organização deseja estabelecer um seguro de vida para jovens de 20 anos. Sabemos que
este jovem tem uma vida média de 65 anos, com desvio padrão de 10 anos. Qual é o número de
associados que deve ser incluído no grupo, para que a vida média do mesmo difira dos 65 anos, pelo
menos em 2 anos, com 97,5% de confiança?
R: n = 125 pessoas
8) Deseja-se estimar a resistência média de certo tipo de peça com precisão de 2Kgf e 95% de
confiança. Desconhecendo-se a variabilidade dessa resistência romperam-se 5 peças, obtendo-se para
elas os seguintes valores da sua resistência em Kgf: 50 58 52 49 55. Com base no resultado obtido,
determinou-se que deveriam ser rompidas mais 15 peças, a fim de se conseguir o resultado desejado.
Qual a sua opinião a respeito dessa conclusão? R: Não; devem ser
rompidas mais 22 peças.
9) Um gerente de restaurante deseja estimar o tempo médio que os fregueses levam para comer
a salada. Sabe-se que o desvio padrão deste tempo é de 4 minutos. Qual o tamanho da amostra
necessária, se ele deseja estimar a média deste tempo, com erro inferior a 1 minuto, num nível de
confiança 95%? R: 62
10) Foram feitas medidas do tempo total gasto para a precipitação de um sal, em segundos,
numa dada experiência, obtendo-se os valores: (13 15 12 14 17 15 16 15 14 16 17 14 16 15 15
14 15 15). Esses dados são suficientes para se estimar o tempo médio gasto na precipitação com
precisão de 0,5 segundos e 95% de confiança? Caso negativo, qual o tamanho da amostra adicional
necessária? R: Não;
precisa de mais 7 peças.
13) Qual o tamanho da amostra necessária para se estimar a média de uma população com
precisão de um décimo do desvio padrão e com 95% de confiança?
R:385 elementos.
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 66
Como a variável estudada na população segue uma distribuição binominal, “esperamos” que,
na amostra, tenhamos a média e a variância dos elementos desejados, dada por:
2
E[ f ] =np e σ ( f ) =npq
Destas expressões, demonstra-se que a distribuição amostral das proporções na amostra segue
uma distribuição normal dada por:
pq
p′ ≡ N p ;
n
(p me) p
zc pq
p(1 p) portanto e zc
n
n
assim, para a estimação do valor de p, poderíamos escrever que:
pq
p pe ou p p zc
n
Porém, como não temos acesso à população e estamos querendo estimar o valor de p,
adotaremos, então, o valor obtido de p’ na amostra para a estimação de p na população, e dessa forma,
a expressão ficaria:
p ¢q¢
p = p ¢± zc
n
Ou de outra forma, o intervalo de confiança para p também poderia ser expresso na forma:
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 67
æ p ¢q¢ ö
p ¢q¢÷
çp ¢- z
Pç £ p £ p ¢+ zc ÷
ç c ÷= 1- a
ç
è n n ÷÷
ø
Esta expressão nos leva à mesma situação que tínhamos no caso das médias, ou seja, não
temos uma amostra para podermos calcular a sua proporção p’. Portanto, devemos utilizar a mesma
técnica de retirarmos uma amostra piloto de tamanho n′ para podermos calcular p’ nela. Uma outra
forma de calcularmos n é analisar a expressão matemática que determina o tamanho da amostra, e
observar que, se fizermos a substituição y = p′q′ , a expressão de n passaria a ser dada por:
2
z
n= c y
e
2
z
n= c
2e
que determina o máximo tamanho para uma amostra, sem que precisemos saber o valor de p’.
Nos casos em que o custo de obtenção da amostra é caro, esta formula não é a mais indicada,
pois o valor que esta expressão fornece é bem maior do que é calculado através da amostra piloto.
Existem problemas em que se empregam mais do que uma condição para a determinação do tamanho
da amostra; nestes casos, deve-se utilizar como resposta o resultado que der o maior tamanho.
Exercícios de aplicação
1) Uma moeda abaulada foi jogada 400 vezes, obtendo-se 136 caras. Construir um intervalo de
89% de confiança para a probabilidade do resultado cara nessa moeda.
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 68
2) Em uma sondagem de opinião pública para a previsão de uma eleição, foram ouvidos 500
eleitores escolhidos ao acaso, dos quais, 236 declararam que iriam votar no candidato A e os demais
no candidato B. Num nível de confiança 95%, verificar se, com base nesta previsão, podemos concluir
que o candidato B já venceu as eleições?
3) Uma amostra de peças forneceu os seguintes valores do seu comprimento (em milímetros):
80,1 80,3 80,1 79,8 80,0 80,3 79,7 79,9 80,2 80,4. Deseja-se estimar o comprimento médio
dessas peças com erro máximo de 5/100 mm e 98% de confiança, bem como a proporção de peças
com dimensão acima de 80mm, com precisão de 5% e 90% de confiança. Qual o tamanho da amostra
que se deverá tomar?
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 69
4) Numa pesquisa de mercado para estudar a preferência da população de uma cidade em
relação a um determinado produto, colheu-se uma amostra aleatória de 300 indivíduos, dos quais, 180
preferiam esse produto. a) Determine um intervalo de confiança para a proporção da população que
prefere o produto em questão, num nível de confiança 95%; b) determine um intervalo de confiança
para o número de pessoas na população que prefere tal produto, sabendo-se que a população é
constituída de 6.000 elementos.
Tarefa mínima
1) Uma máquina apresenta no mínimo 90% de peças boas em sua produção. Deseja-se, através
de uma única amostra, estimar o diâmetro médio das peças produzidas, com 99% de confiança de se
ter um máximo de estimação igual a 0,1 do desvio padrão dos diâmetros, bem como estimar a
verdadeira proporção de defeituosos da máquina com precisão de 2% e, no mínimo 95% de confiança.
Qual o tamanho da amostra necessário para tanto? R: n = 661
e n = 864; Ficamos com a maior.
3) Qual o tamanho da amostra que o Departamento de Trânsito de uma grande cidade deve
tomar para estimar a porcentagem de parquímetros defeituosos, se o objetivo é ter 95% de confiança
de não errar por mais que 10%?
R: 97 elementos.
5) Deseja-se planejar uma amostra aleatória de uma população, para determinar a porcentagem
de pessoas que estariam dispostas a contribuir para a construção de uma praça esportiva. Determinar o
tamanho da amostra, para poder fazer tal estimação, com uma confiança de 95% e uma precisão de
2,5%, sabendo-se que sondagens prévias permitiram concluir que esta porcentagem não é superior a
40%. R: n = 1.475
Trabalho
Amostragem Eng. M.Sc. Julio Cezar Ribeiro 71
1) Em um experimento sobre percepção extra-sensorial (PES), pede-se a um indivíduo, em uma
sala, que diga a cor (vermelha ou azul) de uma carta escolhida de um baralho de 50 cartas que possui
30 cartas azuis, por outro indivíduo em outra sala. O indivíduo interrogado desconhece quantas cartas
vermelhas e quantas azuis estão no baralho. Se o indivíduo identifica 37 cartas azuis corretamente,
determine se este resultado é significativo ao nível de confiança de 90%. R: É.
3) Os valores abaixo representam as medidas dos diâmetros dos eixos de certa peça, em cm,
2,021 1,990 1,987 2,002 1,990
2,009 2,001 2,005 1,983 1,998
Com o auxilio dessa amostra, deseja-se determinar o número de eixos que devem ser
inspecionados, a fim de se estimar o diâmetro médio com um erro de no máximo 0,004 e confiança de
92%, bem como estimar a proporção de eixos com medidas inferiores a 1,990, com uma confiança de
89%, e de modo que o erro não ultrapasse 5%. Qual o tamanho da amostra a ser retirada?