Sumário: Fundamentos de Estatística
Sumário: Fundamentos de Estatística
Sumário: Fundamentos de Estatística
FUNDAMENTOS DE ESTATÍSTICA
Veremos, nesse material didático, os conhecimentos necessários para compreensão do que é estatística e onde
é aplicada. Abordaremos os conceitos fundamentais da estatística e aspectos sobre a coleta, análise e interpretação de
dados.
Sumário
1. Fundamentos de estatística ---------------------------------------------------------------------------------------------------- 01
1.1 O que é estatística? ------------------------------------------------------------------------------------------------------------- 01
1.2 Conceitos e o método estatístico---------------------------------------------------------------------------------------------- 11
2. Apresentação dos dados -------------------------------------------------------------------------------------------------------- 19
2.1 Tabelas e séries ----------------------------------------------------------------------------------------------------------------- 19
2.2 Apresentação de dados qualitativos----------------------------------------------------------------------------------------- 27
2.3 Apresentação de dados quantitativos--------------------------------------------------------------------------------------- 39
Referências--------------------------------------------------------------------------------------------------------------------------- 60
1. Fundamentos de estatística
Para refletir: Mas será que a coleta e apresentação de dados quantitativos citados é o que entendemos por Estatística
hoje?
Em meados do século XVlll, o alemão Gottfried Achenwall difundiu o termo Estatística como sendo a ciência
da constituição do Estado, ou seja, a ciência dos recenseamentos (levantamento de dados referentes ao conjunto de
pessoas) dos constituintes do Estado. Apesar de Achnwall ser o pai da palavra Estatística (Statistik -
Alemão), o que ele entendia como estatística difere do conceito atual, pois ele se preocupava com a
descrição das características sócio-político-econômicas dos diferentes estados.
1
Na atualidade, a Estatística é considerada
multidisciplinar uma vez que pode ser aplicada em praticamente
todas as áreas do conhecimento humano, como: Agricultura,
Farmácia, Educação, Economia e várias outras. Na verdade,
dificilmente encontraremos alguma área do conhecimento que
não conseguimos aplicar a Estatística.
Enfim, vamos saber o que é estatística:
Estatística: É um campo do estudo centrado na produção de metodologia para coleta, organização, descrição, análise
e interpretação de dados bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas
em tais análises.
No Brasil, a Estatística tem sua história associada a história do Instituto Brasileiro de Geografia e Estatística
(IBGE), cujas raízes foram fincadas ainda durante o império.
Saiba mais sobre a história da Estatística no Brasil: http://estatisticaeetag.blogspot.com/
https://www.ibge.gov.br/
Uma das utilidades é a apresentação de dados de uma pesquisa de forma sintetizada, através de tabelas e gráficos.
Além disso, é importante saber como interpretar os dados apresentados.
EXEMPLO 1 Em 2009 foi feita uma pesquisa pelo Comitê Gestor da Internet (CGI) sobre a velocidade de
conexão à internet utilizada em domicílios no Brasil. Veja os gráficos abaixo:
Uma vez que você saiba como interpretar cada gráfico, facilmente se conclui o resultado da pesquisa:
• 34% dos domicílios pesquisados têm velocidade da internet de até 256 Kbps.
2
• 20% dos domicílios pesquisados têm velocidade da internet entre 256 Kbps e 1 Mbps.
• 15% dos domicílios pesquisados têm velocidade da internet de 1 Mbps a 2 Mbps.
• 5% dos domicílios pesquisados têm velocidade da internet entre 2 Mbps a 4 Mbps.
• 1% dos domicílios pesquisados têm velocidade da internet de 4 Mbps a 8 Mbps.
• 1% dos domicílios pesquisados têm velocidade da internet acima de 8 Mbps.
• 24% dos domicílios não sabem a velocidade da internet (ou por, de fato, não saberem a velocidade ou
por não terem respondido a pesquisa).
Para refletir: No dia a dia, somos bombardeados por informações de revistas, jornais, rádios, entre outros. Mas
para que serve tanta informação se não sabemos como interpretá-la?
Acontece que grande parte dessas informações são coletadas através de pesquisas estatísticas, veja outros
exemplos abaixo:
EXEMPLO 2 O G1(Portal de notícias brasileiro mantido pelo grupo Globo) disponibilizou um gráfico, elaborado em
30/08/2016, apresentando uma pesquisa feita sobre a taxa de desemprego por país.
3
estão por trás desses gráficos que utilizamos para descrever e apresentar os dados obtidos numa pesquisa.
Dividimos a Estatística em dois grupos: Descritiva e Indutiva. A nossa disciplina tem como objetivo estudar
aquilo que definimos como Estatística descritiva e Estatística indutiva. Entenderemos o significado de uma e outra e
aprenderemos como utilizá-las no dia a dia.
A DIVISÃO DA ESTATÍSTICA
Para entender como a Estatística descritiva se diferencia da Estatística indutiva, vamos a seguinte situação:
Pedro é um professor de matemática e leciona em três turmas de 3°ano do ensino
médio, turma A, turma B e turma C.
Durante a manhã, Pedro aplicou uma prova para as três turmas e tirou o resto da
tarde para corrigir as provas dos alunos da turma A. No fim da tarde, ele finalizou a
correção dessas provas e fez a média das notas dos alunos da turma.
A média da turma A é um exemplo de estatística descritiva e será utilizada para
resumir ou descrever o desempenho da turma A na prova aplicada. Mas para Pedro fazer
essa descrição da turma, ele antes coletou as notas dos
alunos, pensou em como organizar essas notas (tabela de notas), calculou a média
dos alunos e analisou o resultado obtido.
Isso permitirá ao professor Pedro, interpretar o desenvolvimento da turma
A com relação às provas anteriores, além de estudar o rendimento dessa turma
durante o ano letivo, pensar em outras maneiras de avaliações para seus alunos e,
até mesmo, pensar como serão suas futuras aulas, buscando uma melhora no
entendimento dos alunos.
Por meio dessa situação apresentada acima, conseguimos entender o que a
estatística descritiva nos propõe:
Estatística Descritiva: Envolve conceitos e métodos para coletar, organizar, apresentar, analisar e interpretar dados
obtidos de uma amostra ou população.
Por outro lado, se Pedro sabe a média de uma parte de seus alunos do 3°ano, ou seja, se ele sabe a média dos
alunos da turma A, quando ele for utilizar essa média conhecida como estimativa (avaliação ou cálculo que servirá como
uma suposição) para o valor da média de todos os seus alunos do 3° ano (incluindo as turmas B e C), ele estará fazendo
o que chamamos de indução.
Essa indução, juntamente com processos de estimativa, é uma característica da outra parte da estatística, a
estatística indutiva ou inferencial.
Estatística Indutiva: Propõe processos para estimar informações sobre uma população a partir de resultados de uma
amostra dessa população.
4
Voltando à situação inicial, se Pedro for estudar as notas de todos seus alunos do 3° ano, todos esses alunos são
um exemplo de população, ou seja, todos os alunos da turma A, da turma B e da turma C formam, juntos, uma só
população.
Mais do que isso, também podemos dizer que é uma população finita, pois a quantidade de alunos nessa
população pode ser contada, e se somarmos a quantidade de alunos de cada turma (A, B e C) teremos a quantidade de
elementos (alunos) dessa população.
5
Veja a figura abaixo:
Exemplos de amostras:
• Considerando a população “alunos matriculados nas escolas públicas de Curitiba”, podemos pegar uma escola pública
de Curitiba que chamaremos de escola A e dizer que os “alunos matriculados na escola A” são uma amostra da
população colocada.
• Pensando agora na população do Estado de São Paulo, os habitantes do município de Campinas são um exemplo de
amostra.
• Se considerarmos os alunos do 3° ano de Pedro enquanto uma população, podemos pegar, por exemplo, os alunos
da turma A e dizer que essa turma é uma amostra, pois os alunos da turma A fazem parte da população total, ou
seja, eles formam um subconjunto de alunos extraídos da população.
• Da mesma maneira, dizemos que as turmas B e C também são amostras da nossa população escolhida.
• Já naquela outra situação em que a população são todos os alunos matriculados no 3°ano no Brasil, ao
considerarmos os alunos do 3°ano de Pedro, eles são um exemplo de amostra, pois estão matriculados no 3°ano e,
portanto, fazem parte da população.
Mas será que essa amostra (alunos do 3°ano de Pedro), representa a população (todos os alunos matriculados
do 3°ano)?
Lembre-se que, estamos tentando tirar conclusões sobre uma população muito grande e a pergunta acima, no
fundo, está nos questionando o seguinte:
Se fizermos, por exemplo, a média das notas da nossa amostra escolhida (alunos do 3°ano de Pedro), podemos
utilizar essa média como estimativa para a média de toda a população, ou seja, de todos os alunos de 3° ano do Brasil?
Precisamos então, nos certificar como essa amostra (alunos do 3°ano de Pedro) foi coletada.
6
Existem técnicas de coleta de amostras representativas da população e a essa técnica damos o nome de
Amostragem:
Amostragem: É uma técnica especial usada para recolher amostras que garantem o acaso na escolha, de modo a
garantir à amostra o caráter de representatividade
Garantir o acaso na escolha da amostra é garantir que a escolha da amostra seja feita de forma aleatória (sem
que haja uma maior chance de uma amostra ser escolhida em relação a outra).
Ao girar uma roleta de bingo, por exemplo, qualquer bolinha tem mesma chance de cair.
Pensando a roleta como uma forma de coleta de elementos e as bolinhas como elementos da população, se você
for girando a roleta, estará obtendo, um a um, elementos de forma aleatória para sua amostra.
A urna funciona de forma bem semelhante a roleta: serão misturados os elementos e, em seguida, retirados um
a um, compondo sua amostra.
Se preferir utilizar algum software, o Excel é uma opção, pois ele gera tabelas de números aleatórios. Assim,
cada elemento de sua população será representado por um número e poderá ser gerado um de cada vez, porém de forma
muito mais rápida que as anteriores.
Amostragem sistemática: É utilizada quando a população está naturalmente ordenada, como listas telefônicas, fichas
de cadastramento etc.
Imagine que em uma empresa existam 30 funcionários e que ao chegarem na empresa, eles assinassem seus
nomes em uma lista de acordo com a ordem de chegada. Assim, temos uma lista ordenada com 30 funcionários.
Para criarmos uma amostra de forma sistemática de, por exemplo, 5 pessoas fazemos o seguinte:
7
PASSO 1 Divida o número de funcionários (30) pelo tamanho da amostra (5):
30
=6
5
PASSO 2 Selecione aleatoriamente um número de 1 a 6. Por exemplo, tirei numa urna o número 44. Esse será seu
primeiro número da amostra.
PASSO 3 Some o número obtido no 1°passo com o número obtido no 2°passo:
6 + 4 = 10
Esse será o segundo número da sua amostra.
PASSO 4 Some o número obtido no 1°passo com o número obtido no 3°passo:
(10 + 6 = 16)
Esse será o terceiro número da sua amostra.
PASSO 5 Repita o processo até obter o último número (no nosso caso é o 5°número) de sua amostra (28).
4, 10, 16, 22, 28
Dessa forma criamos uma amostra da população, onde os integrantes são:
4°, 10°, 16°, 22°𝑒 28°
Da lista ordenada dos 30 funcionários.
Após isso, escolhemos aleatoriamente um número no primeiro grupo, ou seja, um número de 1 a 5 (por exemplo
o 4). Desse modo, coletamos aleatoriamente o 4° funcionário para ser o nosso primeiro funcionário para a amostra de 5
funcionários.
Em seguida, fomos coletando os funcionários, simplesmente somando a quantidade de grupos (6) ao número do
funcionário selecionado, veja:
4 + 6 = 10
Assim, o nosso segundo funcionário para a amostra é o 10º.
O terceiro funcionário será obtido somando 6 a 10, ou seja, o 16° funcionário é o nosso terceiro elemento da
amostra. Somando: 6 + 16. Temos o quarto funcionário da amostra (22°)
E o quinto é o: 6 + 22 = 𝟐𝟖° funcionário
Basicamente, fazemos a divisão da população em estratos e depois retiramos uma amostra de cada estrato.
Quando a coleta é feita de maneira proporcional, a amostragem é chamada de estratificada proporcional.
8
EXEMPLO Vamos pensar numa população com 1000 universitários, onde 70% são alunos da área de humanas,
20% biológica e 10% exatas. Se desejamos coletar uma amostra com 500 dos 1000 universitários para fazer uma
determinada pesquisa, utilizando a amostragem estratificada proporcional, precisamos considerar essa proporção dos
estratos (humanas - 70%, biológicas 20% e exatas 10% ). Desse modo, a amostra terá 70% de 500 alunos de humanas
(coletados aleatoriamente), 20% de 500 sendo alunos de biológicas (coletados aleatoriamente) e 10% de 500 sendo alunos
de exatas (coletados aleatoriamente):
350 𝑑𝑒 ℎ𝑢𝑚𝑎𝑛𝑎𝑠 + 100 𝑑𝑒 𝑏𝑖𝑜𝑙ó𝑔𝑖𝑐𝑎𝑠 + 50 𝑑𝑒 𝑒𝑥𝑎𝑡𝑎𝑠 = 500 𝑎𝑙𝑢𝑛𝑜𝑠 𝑛𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
Você também pode fazer a coleta dos 500 alunos, que se utiliza da amostragem estratificada, sem levar em conta a
proporção. Veja abaixo:
Dessa maneira, levamos em conta os extratos, mas não seguimos a proporção que existia nos extratos.
Amostragem por conglomerado: Na amostragem por conglomerado, começamos dividindo a área da população
em seções ou conglomerados. Em seguida, escolhemos aleatoriamente algumas dessas seções e, por fim, tomamos
todos os elementos dessas seções.
9
Outro exemplo de amostragem tendenciosa:
EXEMPLO Imagine que um aluno vá fazer uma pesquisa sobre pessoas que tem cabelo liso em uma escola. Seria
conveniente para esse aluno, por exemplo, coletar somente os dados dos alunos de sua turma e a partir disso concluir
sua pesquisa, porém, o resultado da pesquisa na escola, seguiria uma tendência da turma desse aluno. Basicamente o
que o aluno fez foi coletar informações sobre os alunos que estavam em seu alcance imediato (os alunos de sua classe),
não tendo nenhuma preocupação com o caráter aleatório da amostra.
Portanto, dizemos que a amostragem usada na pesquisa dos alunos 3°ano e na pesquisa sobre o tipo de cabelo
liso é uma amostragem tendenciosa.
E então, o que me diz? Ficou claro os conceitos de população, amostra e amostragem?
Exercícios
Questão 1 – Num estudo sobre o número de irmãos dos alunos de uma escola com 1000 alunos, foi feita uma entrevista
com 60 alunos dessa escola. Qual é a população em estudo e a amostra escolhida respectivamente?
(a) Irmãos dos 1000 alunos da escola e os 60 alunos (c) Os 1000 alunos da escola e os irmãos dos 60 alunos
entrevistados. entrevistados.
(b) Os 1000 alunos da escola e os 60 alunos (d) Irmãos dos 1000 alunos da escola e os irmãos dos 60
entrevistados. alunos entrevistados.
(e) Os 60 alunos entrevistados e os 1000 alunos da escola.
Questão 2 – Considere as populações abaixo:
10
Questão 4 – Um psicólogo da Universidade de New York faz uma pesquisa sobre todos os estudantes de cada uma das
20 turmas selecionada aleatoriamente.
Qual é o tipo de amostragem utilizada acima?
(a) Aleatória (c) Sistemática (e) Por conveniência
(b) Estratificada (d) Por conglomerado
Questão 5 – O gerente comercial da America Online testa uma nova estratégia de vendas selecionando aleatoriamente
250 consumidores com renda inferior a $50 000 e 250 consumidores com renda de ao menos $ 50 000.
Qual é o tipo de amostragem utilizada acima?
(a) Aleatória (c) Sistemática (e) Por conveniência
(b) Estratificada (d) Por conglomerado
As respostas obtidas (Feminino, 22 anos e 1,53 cm) são os dados coletados dessa pessoa.
De outra forma, os dados são os valores obtidos das características que estamos observando, ou seja, são
resultado do que chamamos de variáveis.
No caso da variável sexo temos, feminino como dado dessa variável, 22 anos como dado da variável idade e
1,53 cm como dado da variável altura.
Censo: É uma coleção de dados relativos a todos os elementos de uma população.
Saiba mais: A palavra censo vem do latim census e quer dizer "conjunto dos dados estatísticos dos habitantes de uma
cidade, província, estado, nação". O Censo é a única pesquisa que visita todos os domicílios brasileiros (cerca de 58
11
milhões por 8.514.876,599 km²) para conhecer a situação de vida da população em cada um dos 5.565 municípios do
país. Um trabalho gigantesco, que envolve cerca de 230 mil pessoas, bem diferente da pesquisa amostral, que, como
o próprio nome indica, investiga uma amostra da população e, a partir de modelos estatísticos, chega à representação
do todo.
Site do censo nacional realizado em 2010 no Brasil pelo IBGE:
https://censo2010.ibge.gov.br/materiais/guia-do-censo/apresentacao.html
No Brasil, temos um instrumento de coleta de informações da educação básica chamado Censo Escolar. O Censo
Escolar tem por finalidade ajudar os atores da educação a compreender a situação educacional do país, das unidades
federativas, dos municípios e do Distrito Federal, bem como das escolas e, com isso, acompanhar a efetividade das
políticas públicas.
Site do censo escolar: http://portal.inep.gov.br/censo-escolar
Parâmetro: É uma medida numérica que descreve uma característica da população estudada.
EXEMPLO 1 Os alunos das três turmas de Pedro serão nossa população a ser estudada. Pedro calculou a média das
notas dos seus alunos e chegou em 6,9.
Perceba que a média é um valor numérico e que diz respeito a população estudada
(alunos das três turmas de Pedro), ou seja, descreve uma característica da população
estudada. Com isso, a média 6,9 é um parâmetro da população dos alunos das três
turmas de Pedro.
Uma estatística: É uma medida numérica que descreve uma característica de uma amostra.
EXEMPLO 2 Numa pesquisa com 1000 pessoas, escolhidas ao acaso, de uma população, descobriram que 750 (75%)
dessas pessoas possuem celular. Como o número 750
(75%) diz respeito a uma característica (possuir
celular) da amostra coletada, então esse percentual
trata-se de uma estatística.
12
Para refletir: O que diferencia a estatística de uma estatística?
Uma estatística e A estatística se diferenciam porque a primeira refere-se à uma medida numérica que descreve uma
característica de uma Amostra (por exemplo, a média das notas dos alunos de uma turma é uma medida que descreve a
característica “nota” dessa amostra, logo a média das notas dos alunos é Uma estatística).
Já a segunda, refere-se a todo um campo de estudos centrado na produção de metodologias para coleta, organização,
descrição, análise e interpretação de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis
baseadas em tais análises. A estatística também tem como uma de suas utilidades a apresentação de dados de uma pesquisa
de forma sintetizada, por meio das tabelas e dos gráficos, sendo essencial saber interpretar esses dados.
Variáveis: É a característica que vai ser observada, medida ou contada nos elementos da população ou da amostra e
que pode variar, ou seja, cada membro da população pode assumir um valor diferente.
Curso que pretende fazer: A variável “Curso que pretende fazer” pode
assumir como valores: Medicina, Matemática, Inglês, Direito etc.
Estado civil: A variável “Estado civil” pode assumir como valores: Casado,
Solteiro, Divorciado, Separado e Viúvo.
13
Variáveis qualitativas ordinais: Quando a variável segue uma ordem.
Exemplos
Classe social: A classificação do Instituto Brasileiro de Geografia e Estatística divide as classes sociais em 5 categorias
básicas, segundo a renda familiar mensal: Classe A (acima de 20 salários mínimos), Classe B (de 10 a 20 salários
mínimos), Classe C (de 4 a 10 salários mínimos), Classe D (de 2 a 4 salários mínimos) e a Classe E (recebe até 2 salários
mínimos) – veja mais em https://www.todamateria.com.br/classe-social/. A classe social assume uma ordem natural de
A à E.
Grau de escolaridade: São eles: educação infantil,
fundamental, médio, superior, mestrado, doutorado e
pós-doutorado. Se quisermos chegar no pós-
doutorado, antes passamos por cada grau de
escolaridade anterior e na ordem estabelecida. Assim,
o Grau de escolaridade é uma variável qualitativa
ordinal.
Da mesma maneira, podemos dizer que as variáveis abaixo são qualitativas ordinais, pois não podem ser
contadas nem medidas e além disso assumem valores que possuem uma ordenação.
Cargos em uma empresa: A variável “Cargos em uma Patente militar da marinha: A variável “Patente militar
empresa” pode assumir valores como: Gestor de da marinha” pode assumir valores como: Soldado,
marketing, Gerente, Coordenador de vendas e outros. Sargento, Cabo e outros.
Variáveis Quantitativas: São características de uma população que assumem valores numéricos, ou seja, uma
variável é dita quantitativa quando os valores da variável forem expressos em números.
Variáveis Contínuas: Pode assumir qualquer valor num intervalo razoável de variação.
Exemplos
Altura: Se a população estudada forem os jogadores de Basquete da NBA, esperamos que os valores que essa variável
assume esteja no intervalo [1,60 metro, 2,31 metros], pois o menor jogador de todos os tempos da NBA foi o Muggsy
Bogues com 1,60 metro de altura e o maior foi o Gheorghe Mureşan com 2,31 metros de altura. Outro intervalo que
14
você pode pensar é [1,50 metro, 2,40 metros] pois é um intervalo razoável de variação (de fato é aceitável esperar que
os jogadores tenham estatura nesse intervalo).
Peso corporal: A variável “Peso” pode assumir como valores: 45,60 kg , 75,05 kg , 84 kg …
Qualquer valor no intervalo [1,50 kg , 200 kg]
IMC (índice de massa corporal): A variável “IMC (índice de massa corporal)” pode assumir como
valores 19, 22.5, 24, ... Qualquer valor no intervalo [16, 60].
Cintura: A variável “Cintura” pode assumir como valores: 85 cm, 122,50 cm , 76,94 cm,...
Qualquer valor no intervalo [40 cm, 300 cm]
Você pode se questionar, por exemplo, o motivo da variável “quantidade de eletrodoméstico”, não ser uma
variável quantitativa contínua. A explicação é muito simples: apesar de conseguirmos um intervalo que contém os
valores que a variável assume, como por exemplo [0 , 200], não podemos dizer que a variável “quantidade de
eletrodoméstico”, assume qualquer valor no intervalo [0 , 200]. Tem como alguma pessoa ter em sua residência 22,37
ou 5,5 ou 73,999999... eletrodomésticos? Assim, não podemos dizer que a variável “quantidade de eletrodoméstico” é
uma variável quantitativa contínua.
Agora que entendemos os conceitos fundamentais da estatística (população, amostra, amostragem, censo etc.),
vamos compreender o método estatístico e as fases do método estatístico descritivo.
MÉTODO ESTATÍSTICO
O método científico: Podemos entender o método científico como um conjunto de regras básicas para desenvolver
uma experiência a fim de produzir um novo conhecimento, bem como corrigir e integrar conhecimentos pré-
existentes. Dos métodos científicos, podemos destacar o método experimental e o estatístico.
Nesses casos, lançamos mão de outro método, o método estatístico. O método estatístico, diante da
impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas
variações e procurando determinar, no resultado final, quais influências cabem a cada uma delas.
Conheça as fases do método estatístico descritivo:
DEFINIÇÃO DO PROBLEMA: Nessa fase, precisamos definir e entender o problema que
precisamos resolver.
Exemplo: Imagine que o professor Pedro queira descobrir o esporte preferido de seus alunos. Logo
vamos definir o problema: “Qual o esporte preferido pelos meus alunos?”
PLANEJAMENTO DA PESQUISA: No planejamento, precisamos saber quais dados precisamos obter, de que forma
vamos obter esses dados e se vamos fazer o levantamento de dados de toda a população (levantamento censitário) ou de
uma amostra da população.
Exemplo: Os dados que Pedro precisa obter: Os esportes que cada um de seus alunos preferem ou
se não preferem nenhum. A forma como ele vai obter os dados: Questionário no papel. O
questionário será passado para cada um dos alunos de Pedro, logo trata-se de um levantamento
populacional. Faz parte também do planejamento da pesquisa, o gasto que será preciso para executá-
la. No caso da pesquisa de Pedro, o gasto será com papéis e impressão dos questionários, ou seja,
não deve ser cara essa pesquisa.
15
COLETA DOS DADOS: A coleta de dados é o método pelo qual a informação sobre as variáveis é coletada.
Exemplo: Seguindo a linha do nosso exemplo, a coleta será feita pelo próprio professor (Pedro) e os dados obtidos vão
ser exatamente no local de pesquisa, através de questionários (Escola / sala de aula). O questionário vai conter as
seguintes perguntas:
Você gosta de algum esporte? ( ) Sim ( ) Não
Qual esporte você mais gosta ?
Assim, se a pessoa responder “não” na primeira pergunta, Pedro já entende que essa pessoa não tem preferência nenhuma
de esporte. Se a pessoa responder sim, em seguida vai responder qual é sua preferida.
CRÍTICA DOS DADOS: A crítica dos dados é um processo de detecção de erros por inspeção cuidadosa dos dados
coletados. Em geral, é tida com a responsável por retardar a conclusão dos resultados da pesquisa. No entanto, trata-se
de uma etapa fundamental para garantir a qualidade dos dados.
Exemplo: No nosso exemplo, se a pessoa responder o questionário de forma inesperada, como:
Qual esporte você mais pratica?
Resposta: Dormir.
Precisamos detectar esse erro e descartar esses dados, ou pedir que responda o questionário de forma
correta.
APURAÇÃO DOS DADOS: Consiste em resumir os dados através de uma contagem e de um agrupamento. É um
trabalho de coordenação e de tabulação.
Supondo que Pedro possui 40 alunos e que todos eles responderam corretamente a pesquisa, veja a tabela abaixo:
As tabelas são uma das formas que temos para resumir os dados obtidos na pesquisa e a tabela 1 nos diz o esporte que
cada aluno de Pedro prefere. De outra forma, poderíamos fazer uma tabela que agrupa os dados obtidos nos tipos de
esportes, veja:
16
Devemos interpretar a tabela 2 da seguinte maneira: 12 alunos têm o futebol como esporte preferido, 5 alunos
têm o vôlei como esporte preferido, 3 alunos têm a natação como esporte preferido, 8 alunos têm o basquete como
esporte preferido, 8 alunos preferem outros esportes e 4 alunos não têm preferência nenhuma de esporte.
EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: A apresentação dos dados é de fundamental importância para
uma pesquisa. Estes devem ser apresentados de forma adequada, por meio de tabelas e/ou gráficos que permitam
sintetizar grandes quantidades de dados, tornando mais fácil a compreensão do atributo em estudo e permitindo uma
futura análise.
Logo, podemos utilizar as tabelas não só para organizar, Interpretamos o gráfico 1 da mesma maneira que
mas também para apresentar nossos dados de forma interpretamos a tabela 2, porém o gráfico é uma maneira
resumida, veja: mais ilustrativa e chamativa de sintetizar os dados obtidos.
A mesma interpretação serve para o gráfico de barras
abaixo:
ANÁLISE DOS RESULTADOS: O objetivo de uma análise estatística é tirar conclusões que ajudem o pesquisador a
resolver o problema proposto. O significado exato de cada um dos valores obtidos através do cálculo das várias medidas
estatísticas disponíveis deve ser bem interpretado.
As tabelas e gráficos que fizemos, já nos ajudaram a responder o problema
proposto inicialmente, pois através delas já sabemos qual é o esporte favorito dos
alunos. Porém há uma medida estatística por trás disso chamada “moda”:
A moda de um conjunto de dados é o valor que ocorre com maior frequência.
17
Perceba que a resposta para o problema do professor Pedro é exatamente a moda
do conjunto de valores que ele obteve, pois a moda é o valor que mais aparece nos conjuntos
de dados, ou seja, é o esporte favorito dos alunos.
Com ajuda das tabelas e gráficos, conseguimos perceber que o futebol é a moda do
nosso conjunto de dados, pois foi o esporte que os alunos mais responderam como favorito.
Junto a moda vamos estudar várias outras medidas estatísticas, que vão nos ajudar
a fazer as análises e tirar nossas conclusões para solucionarmos nosso problema.
Essas medidas são chamadas de medidas de posição e medidas de dispersão.
Medidas de posição - Exemplo: Moda, média e mediana.
Medidas de dispersão - Exemplo: Desvio padrão e variância.
Mas até chegar nessas medidas, precisamos entender como fazer a apresentação de nossos dados, ou seja, saber
montar tabelas e gráficos.
Exercícios
Questão 1 - Numa pesquisa feita num bairro com 300 pessoas, chegou-se à conclusão de que 70% (210 pessoas) dessas
pessoas utilizam o aplicativo uber. Qual é a população estudada e a amostra escolhida para a pesquisa? Além disso,
podemos dizer que 70% é um parâmetro ou uma estatística?
a) A população estudada são as pessoas do Bairro, a amostra são as 300 pessoas entrevistadas no bairro e 70%
corresponde a uma estatística, pois trata-se de um valor numérico que corresponde a uma característica da
amostra.
b) A população estudada são as 300 pessoas do Bairro, a amostra são todas as pessoas do bairro e 70% corresponde
a uma estatística, pois trata-se de um valor numérico que corresponde a uma característica da população.
c) A população estudada são as pessoas do Bairro, a amostra são as 300 pessoas entrevistadas no bairro e 70%
corresponde a um parâmetro, pois trata-se de um valor numérico que corresponde a uma característica da
amostra.
d) A população estudada são as 300 pessoas do Bairro, a amostra são todas as pessoas entrevistadas no bairro e
70% corresponde a uma estatística, pois trata-se de um valor numérico que corresponde a uma característica da
amostra.
e) A população estudada são as pessoas do Bairro, a amostra são as 300 pessoas entrevistadas no bairro e 70%
corresponde a um parâmetro, pois trata-se de um valor numérico que corresponde a uma característica da
população.
Questão 2 - Com o objetivo de fazer um estudo sobre o número de irmãos dos alunos de uma escola, foi feita uma
pesquisa em que responderam 60 alunos. Qual é a variável em estudo e o tipo da variável, respectivamente?
a) A variável é a “número de irmãos” e o tipo é “qualitativa ordinal”
b) A variável é a “irmãos dos alunos” e o tipo é “qualitativa nominal”
c) A variável é a “irmãos dos alunos” e o tipo é “qualitativa ordinal”
d) A variável é a “número de irmãos” e o tipo é “quantitativa contínua”
e) A variável é a “número de irmãos” e o tipo é “quantitativa discreta”
Questão 3 - Em um questionário para um concurso público recolheram-se dados referentes às variáveis
• idade
• sexo
• curso
• ano de ingresso
• peso
• grau de escolaridade
Classifique cada uma das variáveis acima respectivamente:
18
a) Quantitativa discreta, qualitativa nominal, qualitativa nominal, quantitativa contínua, quantitativa discreta,
qualitativa ordinal.
b) Quantitativa contínua, qualitativa ordinal, qualitativa nominal, quantitativa contínua, quantitativa discreta,
qualitativa ordinal.
c) Quantitativa contínua, qualitativa nominal, qualitativa nominal, quantitativa contínua, quantitativa discreta,
qualitativa ordinal.
d) Quantitativa contínua, qualitativa nominal, qualitativa nominal, quantitativa contínua, quantitativa discreta,
qualitativa ordinal.
e) Quantitativa contínua, qualitativa nominal, qualitativa nominal, quantitativa discreta, quantitativa contínua,
qualitativa ordinal.
Questão 4 - No estado de São Paulo foi feita uma pesquisa eleitoral para saber o candidato que estava a frente nas
eleições presidenciais. Foi perguntado o candidato de 1500 eleitores. Qual é a população em estudo, a amostra escolhida,
a variável estudada e a classificação da variável, respectivamente?
a) População de São Paulo, 1500 eleitores, candidato dos eleitores de São Paulo, qualitativa nominal.
b) População de São Paulo, 1500 eleitores, candidato dos eleitores de São Paulo, qualitativa ordinal.
c) População de São Paulo, eleitores de São Paulo, candidato dos eleitores de São Paulo, qualitativa nominal.
d) Eleitores de São Paulo, 1500 eleitores, candidato dos eleitores de São Paulo, qualitativa nominal.
e) Eleitores de São Paulo, 1500 eleitores, candidato dos eleitores de São Paulo, qualitativa ordinal.
Questão 5 - Numa pesquisa feita entre todos os 500 alunos de uma escola, resultou-se que 80% utilizam transporte
público. A pesquisa foi feita numa população ou amostra? Qual é essa população ou amostra? 80% corresponde a uma
estatística ou parâmetro?
a) População, a população são os 500 alunos da escola e 80% corresponde a uma estatística, pois descreve uma
característica populacional.
b) Amostra, a população são os 500 alunos da escola e 80% corresponde a uma estatística, pois descreve uma
característica populacional.
c) Amostra, a população são os 500 alunos da escola e 80% corresponde a um parâmetro, pois descreve uma
característica amostral.
d) População, a população são os 500 alunos da escola e 80% corresponde a um parâmetro, pois descreve uma
característica populacional.
e) Amostra, a população são os 500 alunos da escola e 80% corresponde a um parâmetro, pois descreve uma
característica populacional.
19
TABELAS
Além de sintetizar e organizar dados, as tabelas nos auxiliam na observação de relações entre as variáveis.
Destacamos algumas linhas da tabela, para que possamos fazer uma pequena análise de algumas das variáveis
da tabela. Vamos analisar as variáveis IMC e cintura da seguinte maneira:
20
✓ o indivíduo com maior IMC = 31,9 também tem
maior comprimento de cintura igual a 105,5 cm.
✓ O indivíduo com o segundo maior IMC = 31,4
também possui o segundo maior comprimento de cintura
igual a 103,3 cm.
✓ O indivíduo com menor IMC = 21,5 possui o
segundo menor comprimento de cintura igual a 78,8 cm.
Perceba que quanto maior o IMC, maior tende a ser o comprimento de cintura dos indivíduos e de forma
análoga, quanto menor o IMC, menor tende a ser o comprimento de cintura dos indivíduos. Assim, parece haver
uma relação de dependência entre as variáveis IMC e cintura.
Por outro lado, temos certeza sobre uma relação de dependência entre IMC, altura e peso, pois o IMC é
diretamente proporcional ao peso e inversamente proporcional ao quadrado da altura.
𝑝𝑒𝑠𝑜
𝐼𝑀𝐶 =
(𝑎𝑙𝑡𝑢𝑟𝑎)2
Desse modo, se pegarmos indivíduos de alturas semelhantes como 168,9 𝑐𝑚 = 1,689 𝑚 e 170,7 𝑐𝑚 =
1,707 𝑚, mas com pesos discrepantes 61,2 kg e 91,4 kg respectivamente, teremos uma grande variação no IMC, veja:
61,2 kg
𝐼𝑀𝐶(1°) = ≅ 21,5 𝑘𝑔/ m2
(1,686 m)
91,4 kg
𝐼𝑀𝐶(2°) = ≅ 31,4 𝑘𝑔/ m2
(1,070 m)
Observe que a altura dos dois indivíduos são praticamente a mesma, porém como o peso do segundo é muito
maior e o IMC é diretamente proporcional ao peso, temos que o IMC (2°) é muito maior que o IMC (1°).
Mais alguns exemplos de tabelas:
21
Observando a tabela 5, notamos que ela dispõe o faturamento de cada produto (Arroz,
Feijão, Óleo, Farinha) de uma empresa A, em cada mês do segundo semestre
Assim, conseguimos concluir, por exemplo, que o faturamento de arroz em setembro (R$
1054,35 reais) foi inferior aos demais meses.
Conseguimos perceber que em setembro a empresa A teve o menor faturamento do
semestre com a venda de seus produtos (R$ 3592,53 reais).
Veremos agora, com quais elementos uma tabela precisa ser composta:
Título: Indica o que foi estudado, quando foi estudado e Coluna Indicadora: evidencia a natureza, conteúdo de cada
onde foi estudado. linha.
Cabeçalho: Parte da tabela na qual é designada a natureza Casa ou célula: Parte da tabela formada pelo cruzamento de
do conteúdo de cada coluna. uma linha com uma coluna.
Corpo: Parte da tabela composta por linhas e colunas. Rodapé: Espaço aproveitado em seguida ao fecho da tabela,
em que são colocadas as notas de natureza informativa
Linhas: Parte do corpo que contém uma sequência (fonte, notas e chamadas).
horizontal de informações
Fonte: Refere-se à entidade que organizou ou forneceu os
Colunas: Parte do corpo que contém uma sequência vertical dados expostos.
de informações.
22
SÉRIES ESTATÍSTICAS
São todas as tabelas que apresentam a distribuição de um conjunto de dados estatísticos em função da época,
do local e da espécie, além de determinar o surgimento de quatro tipos fundamentais de séries estatísticas:
Série temporal ou cronológica: É a série cujos dados estão dispostos em correspondência com o tempo.
Série geográfica ou territorial: É a série cujos dados estão dispostos em correspondência com o local.
23
Série específica ou qualitativa: É a série cujos dados estão dispostos em correspondência com a espécie ou
qualidade.
Veja os exemplos abaixo:
Série mista ou composta: É a série cujos dados estão dispostos em correspondência com a espécie ou qualidade,
ou seja, varia o fato e permanecem constantes a época e o local.
Veja os exemplos abaixo:
24
Exercícios
Questão 1 – Para qual das fases do método estatístico descritivo, as tabelas são mais importantes?
(a) Definição do problema (d) Apresentação dos dados
(b) Coleta de dados (e) Planejamento da pesquisa
(c) Crítica dos dados
Questão 2 – Observe a tabela e responda: quais são as variáveis apresentadas, a classificação das variáveis e o tipo de
série de dados?
(a) “Anos” e “Quantidade de alunos matriculados” são (d) “Anos” e “Alunos matriculados” são as variáveis
as variáveis apresentadas na série, as duas variáveis são apresentadas na série, a variável “Ano” é quantitativa
quantitativas contínuas e a série é mista. discreta, a variável “Alunos matriculados” é
quantitativa contínua e a série é temporal.
(b) “Anos” e “Alunos matriculados” são as variáveis
apresentadas na série, as duas variáveis são (e) “Anos” e “Alunos matriculados” são as variáveis
quantitativas contínuas e a série é temporal. apresentadas na série, as duas variáveis são
quantitativas discretas e a série é específica.
(c) “Anos” e “Quantidade de alunos matriculados” são
as variáveis apresentadas na série, as duas variáveis são
quantitativas discretas e a série é temporal.
Questão 3 – Quais são as variáveis apresentadas, a classificação das variáveis e o tipo de série dados?
25
(a) “Países” e “Produto interno bruto (PIB)” são as qualitativa nominal e a variável “PIB” quantitativa
variáveis apresentadas na série, a variável “Países” é discreta e a série é mista.
qualitativa ordinal e a variável “PIB” quantitativa
(d) “Países” e “Produto interno bruto (PIB)” são as
contínua e a série é geográfica.
variáveis apresentadas na série, a variável “Países” é
(b) “Países” e “Produto interno bruto (PIB)” são as qualitativa nominal e a variável “PIB” quantitativa
variáveis apresentadas na série, a variável “Países” é contínua e a série é mista.
qualitativa nominal e a variável “PIB” quantitativa
(e) “Países” e “Produto interno bruto (PIB)” são as
discreta e a série é mista.
variáveis apresentadas na série, a variável “Países” é
(c) “Países” e “Produto interno bruto (PIB)” são as qualitativa nominal e a variável “PIB” quantitativa
variáveis apresentadas na série, a variável “Países” é contínua e a série é geográfica.
Questão 4 – Sobre a tabela abaixo responda qual é o tipo de série apresentada, qual foi o refrigerante que trouxe maior
lucro para o supermercado no 1°semestre e de quanto foi o lucro.
(a) Série temporal, pois os dados estão somente em (c) Série mista, pois os dados estão em função do tempo
função do tempo, o refrigerante que trouxe maior lucro e espécie, o refrigerante que trouxe maior lucro foi o
foi o Guaraná e o lucro foi de R$ 6.319,95 reais. Guaraná e o lucro foi de R$ 6.319,95 reais.
(b) Série específica, pois os dados estão somente em (d) Série mista, pois os dados estão em função do tempo
função da espécie ou qualidade, o refrigerante que e região, o refrigerante que trouxe maior lucro foi a
trouxe maior lucro foi a Coca-Cola e o lucro foi de R$ Fanta e o lucro foi de R$ 6.262,95 reais.
6.419,95 reais.
(e) Série mista, pois os dados estão em função do tempo
e espécie, o refrigerante que trouxe maior lucro foi a
Coca - Cola e o lucro foi de R$ 6.319,95 reais.
Questão 5 – Qual é o tipo de série apresentada, qual mês apresentou maior faturamento para a empresa A e de quanto
foi esse faturamento?
26
(a) A Série é a temporal, agosto foi o mês de maior faturamento e o faturamento foi de R$ 4.402,39 reais.
(b) A Série é a mista, dezembro foi o mês de maior faturamento e o faturamento foi de R$ 4.402,39 reais.
(c) A Série é a específica, novembro foi o mês de maior faturamento e o faturamento foi de R$ 4.111,85 reais.
(d) A Série é a mista, janeiro foi o mês de maior faturamento e o faturamento foi de R$ 4.402,39 reais.
(e) A Série é a temporal, dezembro foi o mês de maior faturamento e o faturamento foi de R$ 4.402,39 reais.
27
Para refletir: Perceba que a tabela sintetiza bem as respostas de cada aluno da pesquisa, porém e se a pesquisa
fosse feita com um número alto de alunos, por exemplo 150 alunos? Essa tabela de dados seria a única forma para
sintetizar os dados da pesquisa?
DISTRIBUIÇÃO DE FREQUÊNCIA
Veja na tabela 17 abaixo, como se dá a distribuição de frequência da variável “prato principal” e, em seguida,
o que é uma distribuição de frequência.
Perceba que a distribuição de frequência separa a variável estudada (prato principal) em elementos
(Feijoada, estrogonofe, lasanha e galinhada), nos diz quantas vezes cada uma delas aparecem na pesquisa
(frequência absoluta) e também nos diz qual a porcentagem correspondente a cada um dos elementos (frequência
relativa).
Veja a tabela de distribuição das variáveis "sabor do suco" e "sobremesa":
28
Na tabela 19, fizemos a distribuição de frequência de todas as sobremesas, melancia, banana e maçã. Já na
tabela 20, fizemos a distribuição de frequência dos dados em duas classes de sobremesas, doce ou ácida.
Frequência absoluta(𝒇𝒊 ): São os valores que realmente representam o número de dados de cada elemento ou
classe. A soma das frequências simples é igual ao número total dos dados da distribuição.
Frequência relativa (𝒇𝒓𝒊 ): São os valores das razões entre as frequências absolutas de cada elemento ou classe e a
frequência total da distribuição. A soma das frequências relativas é igual a 1 (100 %).
𝒇𝒊
𝒇 𝒓𝒊 =
𝒏
29
A classe 2 (ácida) tem frequência relativa
𝒇𝟐
𝒇 𝒓𝟐 = = 25%
𝒏
Nessa tabela, n é a quantidade de filmes obtidos como resposta. Suponhamos que você teve n = 170 filmes
como resposta, ou seja, algumas pessoas escolheram o mesmo filme como o favorito. Assim, nossa tabela de frequência
terá 170 filmes, portanto 170 linhas.
Logo não conseguimos sintetizar tão bem nossos dados da pesquisa, pois ao olhar para uma tabela de 170 linhas,
não conseguimos interpretá-la com clareza, devido ao tamanho da tabela.
E agora, como podemos sintetizar melhor os dados?
Poderíamos dividir a variável filme em classes:
• Ação • Drama
• Animação • Terror
• Aventura • Outros.
• Comédia
Veja que todos os 170 filmes obtidos podem ser agrupados nessas classes e, dessa forma,
nossa distribuição de frequência ficaria mais resumida do que a anterior.
30
Por exemplo, poderíamos ter como resposta da coleta de dados, 20 filmes de ação, 22 de animação, 3 de
aventura, 25 de comédia, 50 de drama, 15 de terror e 35 outros, totalizando os 170 filmes.
Assim, a função da distribuição de frequência é agrupar os dados ou por elementos (dados isolados) como na
tabela 11 ou por classes de ocorrência como nas tabelas 22 e 22.1, facilitando a análise de um conjunto de dados.
Note que a tabela 22.1 é muito mais apresentável que a tabela 22, porém as duas nos trazem
informações diferentes.
A tabela 22 nos diz qual o filme mais votado como favorito e a tabela 22.1 nos diz qual
gênero de filme é o favorito dos 200 entrevistados no bairro.
No exemplo acima, o gênero Drama é a preferência dos 200 entrevistados
do bairro.
Para refletir: Mas como fazemos essa distribuição de frequência ou agrupamento de dados?
31
DISTRIBUIÇÃO DE FREQUÊNCIA DOS DADOS ISOLADOS
Para fazer a distribuição de frequências para dados agrupados em classes, siga os seguintes passos:
PASSO 1: Escolha a variável que precisa estudar e a separe em elementos ou valores que a variável assume.
PASSO 2: Encontre a frequência absoluta de cada elemento.
PASSO 3: Encontre a frequência relativa de cada elemento.
PASSO 4: Organize em uma tabela de distribuição de frequência
Observe o seguinte exemplo:
PASSO 1: Variável = prato principal.
Elementos: Feijoada, estrogonofe, lasanha e galinhada.
PASSO 3: Observando as frequências absolutas do passo anterior e levando em conta que temos n = 20
dados na variável prato principal, então
𝒇𝟏 𝟔
𝒇 𝒓𝟏 = = = 𝟎, 𝟑 = 𝟑𝟎%
𝒏 𝟐𝟎
𝒇𝟐 𝟐
𝒇 𝒓𝟐 = = = 𝟎, 𝟏 = 𝟏𝟎%
𝒏 𝟐𝟎
𝒇𝟑 𝟕
𝒇 𝒓𝟐 = = = 𝟎, 𝟑𝟓 = 𝟑𝟓%
𝒏 𝟐𝟎
𝒇𝟒 𝟓
𝒇 𝒓𝟒 = = = 𝟎, 𝟐𝟓 = 𝟐𝟓%
𝒏 𝟐𝟎
32
DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS AGRUPADOS EM CLASSES
Para fazer a distribuição de frequências para dados agrupados em classes, siga os seguintes passos:
PASSO 1: Escolha a variável que deseja estudar e a separe em classes.
PASSO 2: Encontre a frequência absoluta de cada classe.
PASSO 3: Encontre a frequência relativa de cada elemento.
PASSO 4: Organize em uma tabela de distribuição de frequência
Observe o exemplo:
PASSO 1: Variável = sobremesa
Classes: Doce e ácida
PASSO 2: Como temos 7 melancias e 8 bananas, temos 15 frutas que são doces e as outras 5 são maçãs e,
portanto, ácidas. Logo a frequência das frutas doces é 15 (ou seja, 𝒇𝟏 = 𝟏𝟓 ), e as ácidas têm frequência 5 (ou
seja, 𝒇𝟐 = 𝟓).
PASSO 3: Observando as frequências absolutas do passo anterior e levando em conta que temos n = 20
dados na variável prato principal, então
𝒇 𝟏𝟓
• Frequência relativa da classe doce 𝒇𝒓𝟏 = 𝟏 = = 𝟎, 𝟕𝟓 = 𝟕𝟓%.
𝒏 𝟐𝟎
𝒇 𝟓
• Frequência relativa da classe ácida 𝒇𝒓𝟐 = 𝟐 = = 𝟎, 𝟐𝟓 = 𝟐𝟓%
𝒏 𝟐𝟎
PASSO 4: Assim, a distribuição de frequência como na tabela 20:
Importante - Saiba mais sobre Arredondamento de Dados, cujas regras são dadas pela Portaria 36 de 06/07/1965 - INPM
- Instituto Nacional de Pesos e Medidas:
• Se o primeiro algarismo após aquele que formos conservamos o algarismo se ele for par ou
arredondar for de 0 a 4, conservamos o algarismo a ser aumentamos uma unidade se ele for ímpar,
arredondado e desprezamos os seguintes. Ex: 7,34856 desprezando os seguintes. Ex: 6,2500 (para décimos)
(para décimos) 7,3 6,2 12,350 (para décimos) 12,4
• Se o primeiro algarismo após aquele que formos • Se o 5 for seguido de outros algarismos dos quais, pelo
arredondar for de 6 a 9, acrescenta-se uma unidade no menos um é diferente de zero, aumentamos uma
algarismo a ser arredondado e desprezamos os unidade no algarismo e desprezamos os seguintes. Ex:
seguintes. Ex: 1,2734 (para décimos) 1,3 8,2502 (para décimos) 8,3 8,4503 (para décimos) 8,5
• Se o primeiro algarismo após aquele que formos
arredondar for 5, seguido apenas de zeros,
Outra utilidade da distribuição de frequência são representações gráficas que fazemos a partir dela, veja:
33
REPRESENTAÇÕES GRÁFICAS PARA VARIÁVEIS QUALITATIVAS
PICTOGRAMA: É uma representação gráfica que é ilustrada com figuras para representar, de forma simplificada,
o estudo da variável trabalhada.
GRÁFICO DE BARRAS OU COLUNAS: é representado por colunas retangulares e os retângulos são dispostos
verticalmente com a mesma medida de base e as alturas são correspondentes à frequência de cada dado. Os valores
da variável são colocados no eixo horizontal, e a frequência no eixo vertical.
34
Diferentemente do gráfico de colunas, o gráfico de Gráfico 7 – Gráfico de colunas da preferência do suco dos 20
barras é representado por barras horizontais, as alturas se mantêm alunos da Universidade A - 2018
constantes e as bases são correspondentes a frequência de cada
dado. Os valores da variável são colocados no eixo vertical e a
frequência no eixo horizontal.
35
GRÁFICO DE SETORES: O gráfico de setores ou gráfico circular é uma forma de apresentar a frequência
relativa dos dados, utilizando de setores proporcionais a frequência relativa de cada dado.
36
Exercícios
Questão 1 – Um professor de literatura passou 3 livros literários (Dom Quixote, Guerra e Paz, A Montanha Mágica) para
seus 20 alunos lerem até o fim do ano letivo. No fim do ano, fez um questionário aos alunos sobre o livro favorito da cada um
deles e obteve como resultado, a distribuição de livros no quadro abaixo:
Qual é a frequência absoluta e relativa de cada um dos livros e qual é o livro mais votado pela turma:
(a) Dom Quixote tem frequência absoluta 8 e relativa 40%, Guerra e Paz tem frequência absoluta 6 e relativa 30%, Montanha
Mágica tem frequência absoluta 6 e relativa 30% e o livro mais votado é o Dom Quixote.
(b) Dom Quixote tem frequência absoluta 9 e relativa 40%, Guerra e Paz tem frequência absoluta 6 e relativa 30%, Montanha
Mágica tem frequência absoluta 5 e relativa 30% e o livro mais votado é o Dom Quixote.
(c) Dom Quixote tem frequência absoluta 9 e relativa 45%, Guerra e Paz tem frequência absoluta 6 e relativa 30%, Montanha
Mágica tem frequência absoluta 5 e relativa 25% e o livro mais votado é o Dom Quixote.
(d) Dom Quixote tem frequência absoluta 7 e relativa 35%, Guerra e Paz tem frequência absoluta 8 e relativa 40%, Montanha
Mágica tem frequência absoluta 5 e relativa 25% e o livro mais votado é o Guerra e Paz.
(e) Dom Quixote tem frequência absoluta 5 e relativa 25%, Guerra e Paz tem frequência absoluta 7 e relativa 35%, Montanha
Mágica tem frequência absoluta 8 e relativa 40% e o livro mais votado é o Montanha Mágica.
Questão 2 – (UFRS) Os resultados de uma pesquisa de opinião foram divulgados utilizando um gráfico de setores
circulares, como o representado na figura a seguir.
Ao setor “a” estão associadas 35% das respostas, ao setor “b”, 270 respostas e, aos setores “c” e “d”, um mesmo número de
respostas. Esse número é
(a) 45 (c) 180 (e) 900
(b) 90 (d) 450
Questão 3 – (UNESP) O número de ligações telefônicas de uma empresa, mês a mês, no ano de 2005, pode ser
representado pelo gráfico.
37
Com base no gráfico, pode-se afirmar que a quantidade total de meses em que o número de ligações foi maior ou igual a
1200 e menor ou igual a 1300 é:
(a) 2 (c) 6 (e) 8
(b) 4 (d) 7
Questão 4 – (ENEM) Uma enquete, realizada em março de 2010, perguntava aos internautas se eles acreditavam que as
atividades humanas provocam o aquecimento global. Eram três alternativas possíveis e 279 internautas responderam à
enquete, como mostra o gráfico.
38
Após um levantamento feito com as famílias de um município, foram obtidos os resultados expressos no gráfico a seguir.
Com base nas informações contidas no gráfico e na tabela, conclui-se que o percentual das famílias que têm renda acima de
R$ 3060,00 é de:
(a) 45% (c) 70% (e) 90%
(b) 60% (d) 85%
39
Agora da variável filme favorito, para dados isolados e para dados agrupados em classes. Veja:
Para Refletir: Como vai funcionar a distribuição de frequência para os dados quantitativos?
Vamos ver que vai depender se a variável é contínua ou discreta e vamos entender como é cada classe dessas
variáveis, como montar as classes e os gráficos, montar a distribuição de frequência e ver alguns gráficos que podemos
fazer a partir da distribuição. Vamos começar pelas variáveis quantitativas contínuas.
DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS QUANTITATIVOS CONTÍNUOS.
Para facilitar o entendimento, vamos pensar juntos na seguinte situação:
Na universidade A, foi feita agora uma outra pesquisa com 20 alunos, em que os dados recolhidos são referentes
à altura (cm) e à idade (anos), sendo estas as variáveis quantitativas contínuas.
Veja o resultado da coleta de dados na tabela 30 na página a seguir.
40
Observação: Observe que os dados da variável
altura estão organizados do menor valor para o maior valor
(ordenado de maneira crescente). Essa ordenação dos dados
quantitativos favorece a análise dos dados, pois com os
dados ordenados podemos verificar quantas vezes cada uma
das alturas aparece nos dados, qual a maior altura, a menor
altura e em torno de qual altura se concentram os dados.
Essa ordenação dos dados, de maneira crescente ou
decrescente, recebe o nome de ROL.
Como vamos trabalhar primeiro com a variável
altura, ordenamos somente a variável altura.
Perceba que a altura 166,7 aparece 2 vezes e os outros 19
dados da variável altura, aparecem 1 vez.
Logo, assim como foi feito para variáveis qualitativas, vamos utilizar as classes para
agrupar uma grande quantidade de dados, de tal forma que nos possibilite a apresentação dessa quantidade
41
Mas como são as classes para variáveis quantitativas contínuas?
As classes para variáveis quantitativas contínuas são intervalos numéricos, veja as classes e suas frequências a
seguir:
𝐶𝑙𝑎𝑠𝑠𝑒 1 = [149.4 , 158.4)
Observações: Todos os dados da variável têm que estar em alguma das classes, e observe que a intercessão
das classes não possui nenhum valor (Vazio), ou seja, nenhum dos dados poderá estar em mais de uma classe.
A classe ou intervalo [ 𝑎, 𝑏) é um conjunto de valores x, onde 𝑎 ≤ 𝑥 < 𝑏. Dizemos que [𝑎, 𝑏) é o intervalo
fechado em “a” e aberto em “b”. Na estatística é comumente representado da seguinte maneira:
[𝑎, 𝑏) = 𝑎 | − − − 𝑏.
𝑓2 7
𝒇𝟐 = 7, pois os valores 163.4 , 165.1 , 165.6 , 165.7 , 𝑓𝑟 2 = = = 0,35 = 35%
166.7 (duas pessoas com essa altura) e 167.1 estão na 𝑛 20
𝐶𝑙𝑎𝑠𝑠𝑒 2 = [158.4 , 167.4) 𝑓3 6
𝑓𝑟 3 = = = 0,30 = 30%
𝑛 20
𝒇𝟑 = 6, pois os valores 169.3, 171.3, 172.2, 173.7,
174.9 e 175.3 estão na 𝐶𝑙𝑎𝑠𝑠𝑒 3 = [167.4 , 176.4) 𝑓4 2
𝑓𝑟 4 = = = 0,10 = 10%
𝑛 20
𝒇𝟒 = 2, pois os valores 176.5 e 178.6 estão na
𝐶𝑙𝑎𝑠𝑠𝑒 4 = [176.4 , 185.4) 𝑓5 2
𝑓𝑟 5 = = = 0,10 = 10%
𝑛 20
𝒇𝟓 = 2, pois os valores 188.9 e 192.2 estão na
𝐶𝑙𝑎𝑠𝑠𝑒 5 = [185.4 , 194.4)
42
Para refletir: No caso de uma tabela com 20 dados de uma variável, com esforço, conseguimos enxergar alguma
tendência , mas e a construção de gráficos para a apresentação desses 20 dados?
Agora imagina se fosse, por exemplo, 150 valores diferentes ou uma quantidade considerável
de valores diferentes. Seria fácil a apresentação desses dados através de tabelas e gráficos?
Assim, podemos notar que a tabela 32 sintetiza os 20 valores em 5 classes e isso nos permite uma tabela mais
apresentável e além disso, conseguimos fazer gráficos com menos acúmulo de informações.
Para construir uma tabela de frequência para os dados quantitativos contínuos agrupados em classes, precisamos
entender alguns elementos:
Classes: são os intervalos de variação da variável. Amplitude total da distribuição: É a diferença entre o
É simbolizada por i e o número total de classes, limite superior da última classe e o limite inferior da
simbolizada por k. primeira classe.
Na tabela 32, por exemplo, o 𝑘 = 5 e o intervalo 𝐴𝑇 = 𝐿(𝑚𝑎𝑥) − 𝑙(𝑚𝑖𝑛)
[176,4 , 185,4) é a 𝑐𝑙𝑎𝑠𝑠𝑒 4, ou seja, 𝑖 = 4.
No nosso exemplo,
Limites de classe: são os extremos de cada classe. 𝐴𝑇 = 𝐿(𝑚𝑎𝑥) − 𝑙(𝑚𝑖𝑛) = 194,4 − 149,4 = 50.
O menor número é o limite inferior de classe (𝑙𝑖 ) e o
maior número, limite superior de classe (𝐿𝑖 ). Amplitude total da amostra (AA): É a diferença entre
A 𝑐𝑙𝑎𝑠𝑠𝑒 4 = [176.4 , 185.4) tem 𝑙4 = 176.4 e o valor máximo e o valor mínimo da amostra , onde:
𝐿4 = 185.4. 𝐴𝐴 = 𝑋(𝑚𝑎𝑥) − 𝑋(𝑚𝑖𝑛)
No nosso exemplo,
Amplitude do intervalo de classe: É obtida através da
diferença entre o limite superior e inferior da classe e é 𝐴𝐴 = 𝑋(𝑚𝑎𝑥) − 𝑋(𝑚𝑖𝑛) = 192,2 − 149,4 = 42,8.
simbolizada por:
𝑙 +𝐿
ℎ𝑖 = 𝐿𝑖 − 𝑙𝑖 Ponto médio da classe: É o ponto 𝑥𝑖 = 𝑖 2 𝑖 que
A amplitude de cada classe é igual, ou seja, todo divide o intervalo da classe em duas partes iguais
intervalo tem a mesma amplitude. Na tabela 32 a .No caso da 𝑐𝑙𝑎𝑠𝑠𝑒 4 = [176.4,185.4), temos
amplitude ℎ𝑖 = 9, pois se fizer a diferença 𝐿𝑖 − 𝑙𝑖 de
qualquer uma das classes 𝑖, o resultado é 9. (185.4 − 𝑙4 + 𝐿4 1764.4 + 185.4 361.8
𝑥4 = = = = 180,9
176.4 = 9) 2 2 2
43
PASSO 1 - Organize os dados brutos em um ROL.
Vamos usar de exemplo a tabela 30 pois os dados da variável altura já estão
dispostos de maneira crescente.
Como o número de classes tem que ser um número inteiro, então vamos arredondar para o inteiro mais próximo de 5,29 que é o
5.
Logo, k = 5.
PASSO 4 - Decidido o número de classes, calcule a amplitude do intervalo de classe dividindo a amplitude total da amostra
pelo número de classes 𝒉 ≈ 𝑨𝑨 / 𝒌.
No cálculo da amplitude do intervalo de classe, quando o resultado não é exato, devemos arredondá-lo para mais.
Temos ℎ = 42.8 /5 = 8,56 ≈ 9, logo consideramos ℎ = 9.
𝐶𝑙𝑎𝑠𝑠𝑒 1 = [𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑜 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠, 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑜 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠 + ℎ) == [149.4 , 149.4 + 9)
== [149.4 , 158.4)
𝐶𝑙𝑎𝑠𝑠𝑒 2 = [ 𝐿1 , 𝐿1 + ℎ) = [158.4 , 158.4 + 9) = [158.4 , 167.4)
𝐶𝑙𝑎𝑠𝑠𝑒 𝑘 = [𝐿𝑘−1 , 𝐿𝑘−1 + ℎ), 𝑐𝑜𝑚𝑜 𝑘 = 5, 𝑡𝑒𝑚𝑜𝑠 𝐶𝑙𝑎𝑠𝑠𝑒 5 = [𝐿4 , 𝐿4 + ℎ) = [185.4 , 194.4).
Veja como fica a tabela 32 com a notação usual dos intervalos na estatística:
44
REPRESENTAÇÕES GRÁFICAS PARA VARIÁVEIS QUANTITATIVAS CONTÍNUAS
GRÁFICOS PARA DADOS AGRUPADOS EM CLASSES: Uma vez que agrupamos os dados em classes,
podemos utilizar alguns gráficos para apresentar, de uma forma mais ilustrativa e intuitiva, o resultado da coleta de
dados, assim como fizemos com as variáveis qualitativas.
Vamos aos gráficos:
HISTOGRAMA: O histograma é um gráfico formado por um conjunto de colunas retangulares sendo que, no eixo
das abscissas, marcamos as classes, cujas amplitudes correspondem às bases dos retângulos e no eixo das ordenadas,
marcamos ou as frequências absolutas ou as frequências relativas, que correspondem às alturas dos retângulos.
Aparentemente o histograma não é diferente do gráfico de colunas que conhecemos, mas a diferença está no
fato de que o histograma é um gráfico de colunas que representa os dados quantitativos contínuos agrupados em classes.
O histograma nos permite estudar se a distribuição de frequência é simétrica ou assimétrica de maneira visual.
Vamos entender do que se trata essa simetria e como identificá-la nos gráficos a seguir:
45
Uma distribuição de frequência dos dados é Observações: Observe que a classe 1 tem a mesma
dita simétrica quando a metade esquerda do seu histograma frequência que a classe 9 (frequência = 2), a classe 2 tem
é aproximadamente uma imagem espelhada da metade frequência 5 e a classe 8 tem frequência = 4, a classe 3 tem
direita. frequência 10 e a classe 7 tem frequência 11, a classe 4 tem
frequência 18 e a classe 6 tem frequência 17.
Veja um exemplo de distribuição de frequência
simétrica no gráfico abaixo: Ou seja, as frequências das classes opostas ou são
Gráfico 14 – Histograma da quantidade de pessoas em função do
iguais ou são próximas. Assim, de forma visual, a
peso (94 pessoas de um bairro A da cidade A) – 2006 distribuição no histograma acima, parece ser simétrica.
Veja de outra forma, como se dá a distribuição de
frequência simétrica:
A distribuição de frequência dos dados é dita assimétrica quando não é simétrica, ou seja, há uma maior
distribuição de dados de um lado do que do outro.
Na distribuição de frequência a seguir, existe uma maior frequência de elementos a direita da coluna central do
que na esquerda. Assim, dizemos que se trata de uma distribuição de frequência assimétrica. Mais que isso, é assimétrica
negativa como na figura abaixo:
46
Gráfico 16 – Histograma da quantidade de pessoas em função do
peso. (94 pessoas de um bairro C da cidade C) - 2008
Acontece que nem sempre fica claro, de maneira visual, a simetria ou assimetria da distribuição de frequência.
Desse modo, vamos contar com algumas medidas estatísticas para nos auxiliar a verificar a simetria ou assimetria da
distribuição de frequência. Essas medidas são chamadas de medidas de tendência central (Média, Moda e Mediana) e
vamos estudá-las mais pra frente nessa disciplina de Matemática e Estatística.
Gráfico 17 – Histograma e Polígono de frequência da altura dos 20 Gráfico 18 – Polígono de frequência da altura dos 20 alunos da
alunos da Universidade A - 2018 Universidade A - 2018
47
O polígono de frequência também pode nos ajudar Gráfico 20 – Polígono de frequência e histograma do Peso de 94
pessoas de uma Bairro B de uma cidade B - 2007
de forma visual a enxergar uma possível simetria ou
assimetria da distribuição de frequência. No caso do
histograma acima, percebemos que há uma assimetria, pois
há uma discrepância entre as frequências das classes
opostas 2 e 4, e a classe 1 tem maior frequência que a
classes 5. Assim, percebemos uma maior frequência de
dados do lado esquerdo da coluna central, ou seja, a
assimetria parece ser positiva.
A seguir, veremos mais exemplos de gráficos com
histogramas e polígonos de frequência, utilizando a
variável peso. Observe que nos gráficos abaixo, a simetria Gráfico 21 – Polígono de frequência e histograma do Peso de 94
ou assimetria é bem mais clara quando utilizamos o pessoas de uma Bairro C de uma cidade C - 2008
polígono de frequência. Podemos notar nele que, assim
como fizemos com o histograma (olhando as classes
opostas), as distribuições de frequência dos Gráficos 19, 20
e 21 parecem ser simétrica, assimétrica positiva e
assimétrica negativa, respectivamente. É como se o
polígono de frequência desenhasse o formato da
distribuição, como nas figuras 1, 2 e 3.
Veja os polígonos de frequência da variável peso
de 94 pessoas das cidades A, B e C:
Gráfico 19 – Histograma e polígono de frequência da quantidade de pessoas em
função do peso. (94 pessoas de um bairro A da cidade A) - 2006
Vamos voltar um pouco e pensar agora nos dados das alturas que encontramos anteriormente nesse texto. Como
já temos as classes e as frequências relativas da variável altura, podemos utilizar o gráfico de setores para apresentação
dos dados agrupados em classes.
Gráfico 22 – Gráfico de setores da altura dos 20 alunos da Universidade A – 2018
Assim como interpretamos o gráfico de setores nas variáveis qualitativas, vamos interpretar também nas
variáveis quantitativas.
48
• 15% dos alunos têm estatura maior ou igual a 149.4cm e menor que 158.4cm.
• 35% dos alunos têm estatura maior ou igual a 158.4cm e menor que 167.4cm.
• 30% dos alunos têm estatura maior ou igual a 167.4cm e menor que 176.4cm.
• 10% dos alunos têm estatura maior ou igual a 176.4cm e menor que 185.4cm.
• 10% dos alunos têm estatura maior ou igual a 185.4cm e menor que 194.4cm.
A distribuição de frequência da tabela 32, nos diz quem são os limites inferiores (𝑙𝑖 ) e superiores (𝐿𝑖 ) de cada
classe i, mas não tem a frequência acumulada, somente a absoluta e relativa.
Então, antes de fazer uma nova ou mais completa tabela de frequência, vamos entender a frequência acumulada:
FREQUÊNCIA ACUMULADA (𝑭𝒊 ): É o total das frequências de todos os valores inferiores ao limite superior do intervalo de
cada uma das classes, ou seja, a frequência acumulada da classe k é:
𝑭𝒌 = 𝒇𝟏 + 𝒇𝟐 + ⋯ + 𝒇𝒌
Exemplo:
FREQUÊNCIA ACUMULADA RELATIVA (𝑭𝒓𝒊 ): É a frequência acumulada da classe dividida pela frequência total da
𝑭𝒊
distribuição, isto é, 𝑭𝒓𝒊 = :
𝒇𝟏 +𝒇𝟐 +⋯+𝒇𝒌
Exemplo:
3 16 20
𝐹𝑟1 = = 0,15 = 15% 𝐹𝑟3 = = 0,80 = 80% 𝐹𝑟5 = = 1,00 = 100%
20 20 20
10 18
𝐹𝑟2 = = 0,50 = 50% 𝐹𝑟4 = = 0,90 = 90%
20 20
49
Agora sim podemos montar uma tabela de frequência mais completa:
Gráfico 24 – Ogiva da quantidade de alunos em função da altura dos 20 alunos da Universidade A - 2018.
• alunos ou 15% dos alunos têm altura maior ou igual a 149.4cm e menor que 158.4 cm.
• 10 alunos ou 50% dos alunos têm altura maior ou igual a 149.4cm e menor que 167.4cm.
• 16 alunos ou 80% dos alunos têm altura maior ou igual a 149.4cm e menor que 176.4cm.
• 18 alunos ou 90% dos alunos têm altura maior ou igual a 149.4cm e menor que 185.4cm.
• 20 alunos ou 100% dos alunos têm altura maior ou igual a 149.4cm e menor que 194.4cm.
50
DISTRIBUIÇÃO DE FREQUÊNCIA DOS DADOS
ISOLADOS DA VARIÁVEL IDADE.
51
GRÁFICOS MAIS USADOS PARA DADOS QUANTITATIVOS SEM AGRUPAMENTO EM CLASSES:
Gráfico 25 – Gráfico da frequência relativa acumulada em função Gráfico 26 – Gráfico de setores da idade dos 20 alunos da
da idade dos 20 alunos da Universidade A - 2018 Universidade A - 2018
52
Gráfico 29 – Gráfico de colunas da frequência acumulada de casais em função do número de filhos.
Por outro lado, vamos pensar no caso de precisar de uma divisão de classes para dados quantitativos discretos.
Exemplo com dados hipotéticos: O quadro abaixo possui dados relativos à quantidade de medalhas olímpicas de 50
atletas brasileiros:
O quadro já está organizado em um ROL para facilitar o agrupamento de dados nas classes.
Para refletir: Mas como são as classes para dados quantitativos discretos?
É natural achar que são intervalos, porém os dados quantitativos discretos não podem assumir qualquer valor
num intervalo.
Exemplo: No intervalo 2| − − − 4, não podemos dizer que uma pessoa
tem 2,5 filhos, 2,35 medalhas, 2,47 brinquedos etc. Assim, os intervalos são as
classes das variáveis quantitativas contínuas.
Dessa forma, a variável quantitativa discreta pode assumir qualquer valor no conjunto (2 medalhas, 2 filhos, 3 filhos etc),
diferentemente dos intervalos.
53
O gráfico de setores fica:
Gráfico 31 – Gráfico de setores da frequência de atletas em função da quantidade de medalhas.
Cartograma: O cartograma é a representação sobre uma carta geográfica (mapa). Este gráfico é empregado
quando o objetivo é o de figurar os dados estatísticos diretamente relacionados às áreas geográficas ou
políticas.
Gráfico 32 – Cartograma do clima de cada uma das 6 regiões do país Gráfico 33 – Cartograma da Participação por região no total da População
(milhões) e do PIB Brasileiro (%) – 2010
Gráfico 34 – Cartograma da importação e exportação de derivados do petróleo, segundo regiões geográficas (mil barris) – 2017
54
Outros gráficos também podem ser utilizados para a comparação de dados. Veja a série e o gráfico abaixo:
A legenda, na parte inferior do gráfico, nos diz que as colunas roxas no gráfico representam o rendimento mensal
de Marcos, as colunas lilás representam o rendimento mensal da Ana Paula e a colunas rosas representam o rendimento
mensal do Paulo.
Desse modo, podemos concluir que em janeiro e abril, o rendimento da Ana Paula
foi superior ao dos seus colegas, pois foi a que mais
vendeu nesses meses.
Em fevereiro, março e maio o rendimento de
Marcos foi superior ao de seus colegas, pois foi o que
mais vendeu nesses meses.
E em junho o rendimento de Paulo foi superior aos de seus colegas, pois
vendeu mais.
GRÁFICO DE LINHAS: Neste gráfico é usada uma linha para representar a série estatística. Seu principal objetivo
é evidenciar a tendência do fenômeno ou a forma como ele está crescendo ou decrescendo através de um período de
tempo. Seu traçado deve ser realizado considerando o eixo “x”, horizontal, que representa a escala de tempo e o eixo
“y”, vertical, que representa a frequência observada dos valores.
55
Gráfico 36 – Gráfico de linhas do rendimento do Marcos no 1°semestre de 2003
(Vendas x meses).
A tabela 37 nos diz que, em janeiro, Marcos vendeu R$ 1000 reais para a empresa B e
em fevereiro R$ 1196,35 reais, ou seja, percebemos que houve um crescimento na venda de
Marcos em fevereiro com relação a janeiro.
O gráfico de linhas expressa esse crescimento através de um segmento partindo do par
ordenado (janeiro, 1000) em direção ao par ordenado (fevereiro, 1196,35) e faz o mesmo de mês em mês.
Assim, o gráfico de linhas representa uma tendência de um mês para o outro através desses segmentos. Desse
modo, percebemos que de fevereiro para março houve um crescimento na venda de Marcos, de março para abril
notamos uma queda expressiva na venda de Marcos, de abril para maio Marcos teve um crescimento expressivo na
venda e de maio para junho uma queda.
• Mês de maior venda de Paulo: junho. • Mês de maior venda da Ana Paula: abril.
• Mês de menor venda de Paulo: janeiro. • Mês de menor venda da Ana Paula: fevereiro.
Gráfico 37 – Gráfico de linhas do rendimento da Ana Paula no Gráfico 38 – Gráfico de linhas do rendimento do Paulo no
1°semestre de 2003 (Vendas x meses). 1°semestre de 2003 (Vendas x meses)
Assim, podemos comparar mês a mês as vendas de cada funcionário, ou seja, da mesma maneira que interpretamos
o gráfico de colunas 35 podemos concluir que em janeiro e abril, o rendimento da Ana Paula foi superior ao dos seus colegas,
pois foi a que mais vendeu nesses meses.
Gráfico 35 – Gráfico de colunas do rendimento dos funcionários de uma empresa A - 2003
Em fevereiro, março e maio o rendimento de Marcos foi superior ao de seus colegas, pois foi o que mais vendeu
nesses meses. E em junho o rendimento de Paulo foi superior aos de seus colegas, pois vendeu mais.
GRÁFICO POLAR OU RADAR: Neste tipo de gráfico, a série de dados é representada por meio de um polígono.
Ideal para representar séries temporais, como a variação da precipitação pluviométrica ao longo do ano.
57
Gráfico 40 – Gráfico polar do rendimento do Marcos no 1°semestre de 2003 (Vendas x meses).
Observações: Observe que o gráfico possui 7 hexágonos regulares (polígono de 6 lados, pois são 6 meses) e 1 hexágono
azul cujo os vértices estão direcionados aos meses e representando a venda do Marcos naquele mês.
O valor 0 da variável venda está centralizado dentro do menor hexágono regular, os R$ 200,00 reais é representado
pelo menor ou 1° hexágono, os R$ 400,00 reais é representado pelo 2° hexágono, os R$ 600,00 reais é representado pelo
3°hexágono, os R$ 800,00 reais é representado pelo 4°hexágono, os R$ 1000,00 reais é representado pelo 5°hexágono, os R$
1200,00 reais é representado pelo 6°hexágono e os R$ 1400,00 reais é representado pelo 7°hexágono. Os valores da variável
mês estão dispostos nos vértices do 7° hexágono.
Assim, em janeiro o vértice do hexágono azul está exatamente sobre 5°
hexágono que representa a venda de R$ 1000,00 reais, logo Marcos vendeu R$ 1000,00
reais em janeiro.
Em fevereiro o vértice do hexágono azul está entre o 5° e o 6° hexágono, porém
bem próximo do 6°, marcando o valor de R$ 1196,35 reais, logo Marcos vendeu R$
1196,35 reais em fevereiro.
A mesma interpretação é válida para cada mês do semestre.
Lembrando que, o polígono tem que ser correspondente a quantidade de meses, no nosso caso são 6 meses no
semestre, portanto tem que ser o hexágono. Se os dados fossem coletados em função de todos os meses do ano, teríamos que
utilizar o dodecágono (polígono de 12 lados) para representar a série de dados.
Gráfico 41 – Gráfico polar do Gráfico 42 – Gráfico polar do Gráfico 43 – Gráfico polar do
rendimento da Ana Paula no 1°semestre de 2003 rendimento do Paulo no 1°semestre de 2003 rendimento dos funcionários da empresa B no 1°
(Vendas x meses). (Vendas x meses). semestre de 2003 (Vendas x meses).
Note que o gráfico polar não ficou muito carregado de informações, e nos permite a comparação dos
rendimentos dos funcionários e a apresentação sintetizada da série (tabela 24).
58
Exercícios
Questão 1 – (UFRJ - ADAPTADA) Um professor de física (d) O número de usuários de banda larga móvel era 50% do
aplicou uma prova, valendo 100 pontos, para os seus 22 alunos e número dos usuários da banda larga fixa em 2009.
obteve como resultado a distribuição das notas, vistas no quadro
seguinte: (e) O número de usuários da banda larga era menor que 23
milhões em março de 2010.
(e) A nota que mais apareceu no quadro foi 50 e a frequência (a) 1998 e 2001. (c) 2003 e 2006 (e) 2003 e 2008.
relativa é 28,7%.
(b) 2001 e 2003. (d) 2003 e 2007.
59
Questão 5 – Os 4 funcionários (Rosa, Pedro, Carlos e Cláudia) Diante do gráfico, qual do funcionário apresentou maior
de uma empresa foram avaliados pelo gerente segundo 5 dinamismo e menor objetividade? Além disso, qual é o
competências (Pontualidade, Dinamismo, Sociabilidade, funcionário menos pontual e com menor dinamismo?
Objetividade e Atendimento). Veja o gráfico abaixo:
(a) Carlos apresentou maior dinamismo e menor objetividade e
Rosa apresentou menos pontualidade e menor dinamismo.
Referências
Apostila feita com base no material didático do curso “Fundamentos de Estatística” do AVAMEC (Ambiente
Virtual de Aprendizagem do Ministério da Educação), oferecido em parceria com o Laboratório de Tecnologia
da Informação e Mídias Educacionais da Universidade Federal de Goiás. Disponível em
https://avamec.mec.gov.br/#/instituicao/capes/curso/10521/informacoes. Acesso em 15/SET/2021.
60