Medidas Separatrizes

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 17

Medidas Separatrizes

Gráfico de Caixas (BoxPlot)

MEDIDAS SEPARATRIZES

Lucas Santana da Cunha


email: [email protected]

Universidade Estadual de Londrina

08 de maio de 2017

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

Para entender bem uma distribuição, pode-se conhecer valo-


res acima ou abaixo dos quais se encontra uma determinada
porcentagem dos dados através das medidas separatrizes.

Separatriz de uma série de n elementos colocados em ordem


crescente de valor, é o elemento da série que a divide em duas
partes quaisquer.

As principais separatrizes são:

Percentis.
Decis;
Quartis;
Mediana;

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

Percentil

O percentil de ordem j = 100p, em que (0 < p < 1), de um


conjunto de valores dispostos em ordem crescente é um valor tal
que (j)% das observações estão nele ou abaixo dele e (1 − j)% estão
nele ou acima dele.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

Decis

Os decis, denotados por D1 , D2 , D3 , . . . , D9 dividem os dados


em 10 grupos com cerca de 10% deles em cada grupo.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

Quartis

Assim como a mediana divide os dados em duas partes iguais, os


três quartis, denotados por Q1 , Q2 e Q3 , dividem as observações
ordenadas em quatro partes iguais:

O primeiro quartil separa os 25% inferiores dos 75% superiores


dos valores ordenados;

o segundo quartil é a própria mediana;

terceiro quartil separa os 75% inferiores dos 25% superiores


dos dados.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

O percentil generaliza qualquer tipo de medida separatriz, logo:

o percentil de ordem 10, 20, 30, . . . , 90, representados por


P10 = D1 , P20 = D2 , P30 = D3 , . . . , P90 = D9 , respectiva-
mente, são chamados decis;

o percentil de ordem 25, 50 e 75, representados por


P25 = Q1 , P50 = Q2 e P75 = Q3 , respectivamente, são chama-
dos quartis;

o percentil de ordem 50, representado por P50 = Md é a me-


diana.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

O p-ésimo percentil, ou de ordem j, é calculado como:

(
y(i) +y(i+1)
2 , se f = 0;
Pj =
y(i+1) , se f > 0.

jn
em que i é a parte inteira e f é a parte fracionária de 100 =i +f.
Aplicam-se aqui os critérios de arredondamento.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

Exemplo 1
As taxas de juros recebidas por uma amostra de 25 ações durante
certo perı́odo foram (medidas em porcentagem):
2,50 2,52 2,53 2,54 2,59 2,60 2,61 2,62 2,64
2,65 2,66 2,68 2,69 2,70 2,72 2,75 2,77 2,80
2,81 2,82 2,83 2,85 2,88 2,89 2,91
Determine os percentis P17 , P40 , P75 , o terceiro decil e o segundo
quartil.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

Exemplo 2
Considere os dados da tabela de distribuição de frequências abaixo:

Tabela 1: Distribuição de frequências do numero de filhos das famı́lias


de um bairro de uma cidade qualquer.
no de filhos ni Fi
0 5 5
1 7 12
2 11 23
3 6 29
4 1 30
TOTAL 30 -

Determine os percentis: P10 , P25 , P90 , o terceiro decil e o terceiro


quartil.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

Dados agrupados (variável contı́nua)

O p-ésimo percentil, ou de ordem j, é calculado por:

 
jn
100 − Fi−1
Pj = Li + ac
ni

em que Li é o limite inferior da classe que se encontra percentil;


Fi−1 é a frequência acumulada da classe anterior a que se encon-
tra o percentil; ni frequência absoluta da classe que se encontra o
percentil.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes Dados não agrupados
Gráfico de Caixas (BoxPlot) Dados agrupados

Exemplo 3
Considere os dados da tabela de distribuição de frequências abaixo:

Tabela 2: Distribuição de frequências do tempo, em minutos, que


usuários de Internet gastaram na rede durante sua mais recente sessão.
Tempo ni Fi
7 ` 20,2 8 8
20,2 ` 33,4 11 19
33,4 ` 46,6 13 32
46,6 ` 59,8 9 41
59,8 ` 73,0 4 45
73,0 ` 86,2 5 50
TOTAL 50 -

Determine os percentis P5 , P18 e P75 , o segundo decil e o primeiro


quartil.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes
Gráfico de Caixas (BoxPlot)

BoxPlot
Uma aplicação interessante para os quartis é a construção do
chamado gráfico de caixa (ou boxplot).

Figura 1: Esboço do gráfico de caixas (BoxPlot)

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes
Gráfico de Caixas (BoxPlot)

BoxPlot

Figura 2: Esboço do BoxPlot dos pesos dos alunos do curso estatı́stica


econômica por sexo.
Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000
Medidas Separatrizes
Gráfico de Caixas (BoxPlot)

Construção do gráfico
1 Calcular o primeiro quartil (Q1 ), a mediana (Md ) e o terceiro quartil (Q3 );

2 Calcular a amplitude interquartı́lica (ou distância interquartı́lica), dada por


dq = Q3 − Q1 ;
3 Calcular:
li = Q1 − 1, 5dq é o limite inferior inicial;
ls = Q3 + 1, 5dq é o limite superior inicial
4 Verificar se há observações discrepantes, ou seja observações que estão
acima do limite superior inicial ou abaixo do limite inferior inicial.
5 Definir:
LI (limite inferior final): é o menor valor dos dados que não
esteja abaixo do li ;
LS (limite superior final): é o maior valor dos dodos que não
esteja acima do ls .

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes
Gráfico de Caixas (BoxPlot)

Exemplo 4

Tabela 3: Distribuição de frequências do peso, em kg, de crianças de um


quarteirão de um bairro qualquer.
Pesos ni fi pi
58,0 ` 63,5 3 0,1875 18,75
63,5 ` 69,0 7 0,4375 43,75
69,0 ` 74,5 5 0,3125 31,25
74,5 ` 80,0 1 0,0625 6,25
TOTAL 16 1,0000 100,00

Esboce o boxplot da tabela de distribuição de frequências acima.


Existem pontos atı́picos?

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes
Gráfico de Caixas (BoxPlot)

Exercı́cio 1
Para facilitar um projeto de ampliação de rede de esgoto de certa
região de Curitiba, as autoridades tomaram uma amostra de tama-
nho 30 dos 250 quarteirões que compõe a região, e foram encontra-
dos os seguintes números de casas por quarteirão (dados em rol):
10 12 13 13 14 15 15 16 18 18
20 21 22 23 24 25 26 27 28 29
30 31 32 36 40 40 42 42 57 60

Esboce o gráfico de caixas (boxplot) e identifique os possı́veis pontos


discrepantes.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000


Medidas Separatrizes
Gráfico de Caixas (BoxPlot)

Exercı́cio 2
Um serviço de teste de consumidores obtém-se as seguintes quilo-
metragens por litro em cinco testes realizados com dois carros de
marcas concorrentes, em rol:
Carro A: 10,0 11,0 12,0 12,7 12,8
13,0 13,1 13,5 13,6 14,0
Carro B: 11,9 12,0 12,2 12,3 12,5
12,5 12,6 12,7 12,8 13,4
Para o conjunto de dados:

a) Faça o boxplot para os dois conjunto de dados;

b) Qual carro você escolheria pelas informações do boxplot?


Justifique.

Lucas Santana da Cunha email: [email protected] ESTATÍSTICA ECONÔMICA A - TURMA 2000

Você também pode gostar