Medidas de Dispersao
Medidas de Dispersao
Medidas de Dispersao
Medidas de Dispersão
1. Introdução
Conforme dissemos anteriormente, as medidas de tendência central não são suficientes para caracterizar
totalmente uma sequência numérica. Se observarmos as sequências:
Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13.
Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13.
concluiremos que todas possuem a mesma média 13. No entanto, são sequências completamente distintas do
ponto de vista da variabilidade de dados.
Na sequência Z não há variabilidade de dados, visto que todos os valores coincidem com a média. Na sequência Y,
a média 13 representa bem a série, mas existem elementos da série levemente diferenciados da média 13, ou seja,
há baixa variabilidade. Na sequência X existem muitos elementos bastante diferenciados da média 13, indicando
uma alta variabilidade ao redor da média.
Para avaliar o grau de variabilidade dos dados em torno da média, usaremos as medidas de dispersão: desvio
médio, variância e desvio padrão.
2. Desvio Médio
O conceito estatístico de desvio corresponde ao conceito matemático de distância. A dispersão dos dados em
relação à média de uma sequência pode ser avaliada através dos desvios de cada elemento da sequência em relação
à média da sequência. O desvio médio é definido como sendo uma média aritmética dos desvios de cada elemento
da série para a média da série, ou seja,
DM =
∑f .xi i −x
n
Exemplo
Considere as notas 2, 8, 5, 6 obtidas por 4 alunos, numa avaliação de Biologia. Determine o desvio médio.
2+8+5+6
x= = 5,25
4
Agora, calculamos o desvio médio, lembrando que fi = 1, visto que cada um dos quatro valores apareceu uma única
vez.
DM =
∑f .x
i i −x
=
n
| 2 − 5,25 | + | 8 − 5,25 | + | 5 − 5,25 | + | 6 − 5,25 | | −3,25 | + | 2,75 | + | −,025 | + | 0,75 |
= = =
4 4
3,25 + 2,75 + 0,25 + 0,75 7
= = = 1,75
4 4
Interpretação: Em média, cada elemento da sequência está afastado do valor 5,25 por 1,75 unidades.
A variância populacional é representada por σ2 (sigma ao quadrado), enquanto que a variância amostral é
representada por s2. O símbolo σ é a letra grega minúscula sigma. A fórmula geral da variância populacional e da
variância amostral são, respectivamente:
∑ f (x − µ) ∑ f .(x − x)
2 2
2 i. i 2 i i
σ = e s =
n n −1
σ= σ2 ou s = s2 .
DP = Var .
Quando estamos trabalhando com uma amostra, sem conhecermos o verdadeiro valor da média ou do desvio
padrão, admitimos que a média da amostra ( x ) esteja próxima do valor da média populacional, e que a variância
da amostra (variância amostral) esteja próxima da variância populacional. A raiz quadrada da variância amostral é
chamada desvio padrão amostral.
Isso ocorre porque no cálculo da variância, quando elevamos ao quadrado a diferença (xi– x ) ou (xi– µ ), a unidade
de medida da série fica também elevada ao quadrado. Portanto, a variância é dada sempre no quadrado da unidade
de medida da série. Se os dados são expressos em metros, a variância é expressa em metros quadrados. Em algumas
situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados são expressos
em litros. A variância será expressa em litros quadrados.
Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja: variância não
tem interpretação.
Exatamente para suprir esta deficiência da variância é que se utiliza o desvio padrão. Como o desvio padrão é a
raiz quadrada da variância, o desvio padrão terá sempre a mesma unidade de medida da série e, portanto admite
interpretação.
5. Exemplos
Vejamos alguns exemplos de como calcular a variância e o desvio padrão em um conjunto de dados.
Exemplo 1
Considere as notas 2 – 8 – 5 – 6 obtidas por 4 alunos, numa avaliação de Biologia, distribuídas na tabela abaixo.
Calcule o desvio padrão considerando-se uma população.
2+8+5+6
Cálculo da média: µ = = 5,25 .
4
σ = 4,6875 = 2,17 .
Exemplo 2
Calcule o desvio padrão da série abaixo, considerando-se uma população.
xi fi
2 3
3 5
4 8
5 4
Total 20
3 .2 + 5 .3 + 8 .4 + 4 .5
Cálculo da média: µ = = 3,65 .
20
Cálculo da variância populacional:
σ = 0,9275 = 0,96 .
Exemplo 3
Calcule o desvio padrão da série abaixo, representativa de uma amostra.
s = 11,3778 = 3,37 .
ATENÇÃO!
Para a primeira questão, fica evidente que foi o indivíduo B, visto que R$ 5 é maior que R$ 2. Porém, quando
analisamos relativamente, a resposta da questão 2 passa a ser o indivíduo A, pois, percentualmente, A perdeu 2/10
= 0,2 ou 20% do que possuía na carteira enquanto que B perdeu 5/100 = 0,05 ou 5% do que possuía. Esse conceito
de relatividade é exatamente o que propõe o coeficiente de variação.
Transformando o problema anterior em termos estatísticos, se uma série X apresenta 𝜇𝜇𝑋𝑋 =10 e σX= 2 e uma série Y
apresenta 𝜇𝜇𝑌𝑌 = 100 e σY = 5, do ponto de vista da dispersão absoluta, a série Y apresenta maior dispersão que a
série X. No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y que é 5 em relação a
100 é um valor menos significativo que o desvio padrão de X que é 2 em relação a 10.
𝜎𝜎 𝑠𝑠
𝐶𝐶𝑉𝑉 = ou 𝐶𝐶𝐶𝐶 = .
𝜇𝜇 𝑥𝑥̄
2
CVx = = 0,2 ou 20%
10
5
CVy = = 0,05 ou 5%
100
Comparando os valores destes dois coeficientes concluímos que a série X admite maior dispersão relativa. Como a
medida de dispersão relativa leva em consideração a medida de dispersão absoluta e a média da série, é uma
medida mais completa que a medida de dispersão absoluta.
o intervalo [𝜇𝜇 − 𝜎𝜎; 𝜇𝜇 + 𝜎𝜎] contém aproximadamente 68% dos valores da série;
o intervalo [𝜇𝜇 − 2𝜎𝜎; 𝜇𝜇 + 2𝜎𝜎] contém aproximadamente 95% dos valores da série;
o intervalo [𝜇𝜇 − 3𝜎𝜎; 𝜇𝜇 + 3𝜎𝜎] contém aproximadamente 99% dos valores da série.
Esses percentuais 68%, 95% e 99% citados na interpretação serão comprovadas, com maior precisão, no estudo da
distribuição normal de probabilidades. Quando a distribuição não é perfeitamente simétrica estes percentuais
apresentam pequenas variações para mais ou para menos, dependendo do caso.
Se um conjunto tiver média µ = 100 e desvio padrão σ = 5, podemos interpretar estes valores da seguinte forma:
É importante perceber que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contido
no intervalo.
Exemplo
Foi observado que as contas de luz para uma área municipal, no mês de junho, são normalmente distribuídas. Se a
média das contas for $ 42,00 e o desvio padrão populacional foi $ 12,00, entre que intervalo de valores estão 68%
das contas? E 95% das contas?
8. Exercícios
1) Calcule o desvio padrão da distribuição populacional:
Classes fi
2 | 6 5
6 | 10 12
10 | 14 21
14 | 18 15
18 | 22 7
2) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em
Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão?
3) Medidas as estaturas de 1017 indivíduos, obtivemos x = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos
indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura
ou em peso?
4) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de
125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de
variação de cada um dos grupos? Qual o grupo mais homogêneo?
5) Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%.
Qual o desvio padrão desse grupo?
6) Uma distribuição apresenta as seguintes estatísticas: σ = 1,5 e CV = 2,9%. Determine a média da distribuição.
7) Numa fábrica de rolamentos, retirou-se da produção de um determinado dia uma amostra de 10 rolamentos,
dos quais se mediu o diâmetro externo, em mm, obtendo-se:
9) Em 120 experimentos, onde cada um consiste em lançar 3 moedas e contar o número de caras, obtivemos os
seguintes resultados:
Nº de caras 0 1 2 3
Nº de experimentos 18 40 49 13
Calcular a média, a variância e o desvio padrão do número de caras observado nos experimentos.
10) Uma amostra de 900 lâmpadas foi testada para se determinar a durabilidade. Os dados foram:
Na amostra testada
11) A tabela representa as estaturas de 35 crianças nascidas numa mesma maternidade numa certa semana.
12) Um restaurante cobra o almoço de cada cliente através do peso (por quilo) da quantidade de alimento
consumida. Foi observado, durante um mês, que as quantidades de alimento consumidas são normalmente
distribuídas. Se a média consumida for 550 g e o desvio padrão 200 g, calcular:
13) Os pratos produzidos por uma indústria têm diâmetro médio de 19 cm e desvio padrão de 0,2 cm. Dois pratos
A e B cujos diâmetros medem respectivamente 19,8 cm e 18,3cm serão testados pelo Controle Estatístico de
Qualidade, que admite uma tolerância de três desvios acima e três abaixo da média. Assinale a alternativa correta:
a)16
b) 64
c) 256
d) 4
a) 4
b) 256
c) 36
d) 2
a) X: 2, 3, 7, 9, 11, 13.
b) Y: 5, 12, 4, 20, 13, 17.
18) Uma fábrica corta bambus para a confecção de cercas. Cada corte deve ter um comprimento médio de 180cm
e apresenta um desvio-padrão de 1,5cm. Após cortados, os bambus passam por um controle de qualidade que
rejeita cortes que estejam com 2 desvios-padrão acima ou abaixo da média especificada. Seis bambus, A, B, C D, E
e F foram medidos pelo controle de qualidade e os valores obtidos são apresentados na tabela a seguir. Quais deles
o controle deve aprovar e quais deve rejeitar?
bambu comprimento
A 178,5cm
B 183,4cm
C 176,2cm
D 175,8cm
E 182,7cm
F 180,0 cm
19) Considere a tabela seguinte que mostra o número de unidades vendidas por dia de certo produto numa loja:
a) a média;
b) a variância;
c) o desvio-padrão;
d) o coeficiente de variação;
e) o desvio médio.
23) Uma máquina empacota café com média 500g e desvio padrão 12g. O controle de qualidade da empresa
rejeita pacotes cujo peso ultrapasse 2 desvios padrão da média. Qual dos pacotes a seguir serão rejeitados pelo
controle de qualidade?
A = 515 g
B = 490 g
C = 470 g
D = 525 g
E = 477 g
F = 500 g
G = 532 g
24) Os tempos despendidos por 12 alunos, elementos de uma população, em segundos para percorrer certo
trajeto foram
16, 17, 16, 20, 18, 16, 17, 19, 21, 22, 16, 23.
a) a moda;
b) a mediana;
c) a média;
d) a variância;
e) o desvio padrão;
f) o coeficiente de variação.
25) Realizou-se medições das áreas, em metros quadrados, de 50 terrenos. De posse desses dados, calculou-se a
área média, o desvio padrão e a variância das medidas. Os valores obtidos estão representados, respectivamente,
nas unidades:
a) m2, m2, m2
b) m2, m2, m4
c) m2, m4, m2
d) m, m, m2
e) m, m2, m
A distribuição em forma de sino mencionada pelo autor é, na verdade, a Distribuição Normal de Probabilidades.
Com base nessas informações, resolva o problema a seguir, proposto pelo mesmo autor.
Os escores de QI têm uma distribuição em forma de sino, com média de 110 e desvio padrão de 15. Qual a
porcentagem de escores de QI entre 80 e 140? Justifique.
27) Três grupos distintos de estudantes (identificados por I, II e III) realizaram uma mesma prova da disciplina
Probabilidade Avançada. As provas foram corrigidas seguindo um mesmo critério e as notas poderiam variar de 0
a 10. As principais estatísticas obtidas para as provas desses três grupos estão apresentadas na tabela a seguir:
Qual dos três grupos apresentou desempenho mais homogêneo nessa prova? Justifique a sua resposta com
cálculos e/ou com palavras.
Respostas
1) σ =4,45
2) CV(Mat)=0,103 ; CV (Estat)=0,104. Logo a maior dispersão foi na Estatística.
3) CV (altura)=0,0493 ; CV(peso)=0,0442. Maior variabilidade na altura.
4) CV85 = 0,03717 CV125 = 0,03712 grupo de 125 pessoas é mais homogêneo. Porém, como a diferença nos
coeficientes de variação ocorre apenas na quinta casa decimal, dizemos, na prática, que os dois grupos possuem
mesma homogeneidade.
5) 5,4054
6) 51,72
7) x =20,8 ; s2 = 0,9556 ; s=0,9775
8) x =24 ; s2=129,6482 ; s=11,39
9) x =1,475 ; s2=0,7725 ; s=0,88
10) a) 50% b) 1733,3 h c) 298,3 h
11) x =48,5 ; s=1,40
12) a) [150 ; 950] b) [0 ; 1150]
13) B
14) C
15) A
16) a) σ =3,99 b) σ =5,81
17) a) s=2,59 b) s=5,59
18) Aprovados: A, E, F ; Reprovados: B, C, D
19) a) s=1,25 b) 0,88 ou 88% c) 1,0704
20) a) 21,5 b) 55,5263 c) 7,45 d) 34,7% e) 6,5
21) 1,825
22) 300
23) Rejeitados: C, D, G.
24) a) 16 s
b) 17,5 s
c) 18,42 s
d) 5,9097 s2
e) 2,43 s
f) 0,138 ou 13,8%
25) b
26) 95%
27) Grupo I, pois tem o menor coeficiente de variação.
Site: http://www.professorguru.com.br
Facebook: http://www.facebook.com/professorguru