Livro-Texto - Unidade I
Livro-Texto - Unidade I
Livro-Texto - Unidade I
É graduada em Física com habilitação em Astronomia pela Universidade de São Paulo (2001).
É doutora em Astrofísica pela mesma universidade (2006). Em 2009, mudou seu enfoque de
pesquisa para o ensino, ministrando disciplinas para o ciclo básico do Curso de Engenharia na
Universidade Paulista (UNIP), como: Mecânica da Partícula, Cálculo com Geometria Analítica,
Tópicos de Informática, Estática dos Fluidos, Fenômenos de Transporte, Complementos de Física,
Programação de Computadores e Cálculo de Funções de Várias Variáveis. Desde 2009, integra
também a equipe da Comissão de Qualificação e Avaliação (CQA) da UNIP, elaborando e revisando
materiais didáticos e de apoio de diversos cursos, além de realizar a tabulação de resultados de
avaliações internas e externas.
CDU 519.2
U517.13 – 23
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Profa. Sandra Miessa
Reitora
UNIP EaD
Profa. Elisabete Brihy
Profa. M. Isabel Cristina Satie Yoshida Tonetto
Prof. M. Ivan Daliberto Frugoli
Prof. Dr. Luiz Felipe Scabar
Material Didático
Comissão editorial:
Profa. Dra. Christiane Mazur Doi
Profa. Dra. Ronilda Ribeiro
Apoio:
Profa. Cláudia Regina Baptista
Profa. M. Deise Alcantara Carreiro
Profa. Ana Paula Tôrres de Novaes Menezes
Caro aluno,
Neste livro-texto, são apresentados os conceitos essenciais de estatística, necessários para cursos de
diversas áreas.
A estatística é uma área da matemática essencial em situações nas quais precisamos lidar com
dados, compreender a relevância de um resultado ou, ainda, fazer uma estimativa de alguma grandeza.
Boa leitura!
INTRODUÇÃO
7
Na unidade III, exploram‑se a análise combinatória e as probabilidades. No tópico 5 são definidos
alguns conceitos matemáticos fundamentais para estudo de análise combinatória, como o binômio
de Newton, o fatorial de um número, os coeficientes binomiais, o triângulo de Pascal, o somatório, o
teorema binomial e o termo geral do binômio.
Parte‑se, então, para o estudo da análise combinatória em si, abordando o princípio geral da
contagem, os arranjos, as permutações e as combinações. Prossegue‑se para o estudo de probabilidades,
que apresenta os conceitos básicos sobre o tema e define o que são experimento aleatório, espaço
amostral, evento, avaliação, regras do cálculo de probabilidades e exemplos de aplicação das regras.
Na unidade IV, são apresentados os modelos teóricos discretos e contínuos de probabilidade. Fala‑se
sobre inferência, estimação e regressão linear.
O último tópico do material, 8, detalha a regressão linear simples, analisando a relação entre duas
variáveis. Define‑se correlação linear e coeficiente de correlação linear, além de fixar o ajuste de reta aos
dados. Nessa parte, é apresentado o método dos mínimos quadrados, que é aplicado no ajuste de retas
para incertezas diferentes e para incertezas iguais. Define‑se, também, o coeficiente de explicação. Este
livro‑texto é encerrado tratando de funções linearizáveis.
Bom estudo!
8
ESTATÍSTICA
Unidade I
1 CONCEITOS BÁSICOS
Iniciamos este título apresentando alguns conceitos básicos, como as definições de estatística,
amostra, população, processos e dados estatísticos. Definimos, ainda, o que é estatística descritiva, bem
como o que são dados brutos e rol.
Vemos que estatística é um ramo da matemática que visa coletar, analisar e interpretar dados,
usando como ferramentas tabelas e gráficos para analisar fenômenos.
A estatística está presente em nosso dia a dia de forma explícita e implícita. Por exemplo, usamos
estatística para calculam as chances de um time ser campeão Por sua vez, ou as chances de um time
ser rebaixado, para calcular as médias de uma disciplina ou, ainda, para calcular o score de uma pessoa
para a obtenção de crédito.
Observação
Saiba mais
Podemos definir população (ou universo) como um conjunto completo de elementos com um
parâmetro comum. Por exemplo: a população brasileira é formada pelo conjunto de pessoas nascidas
no Brasil ou com nacionalidade brasileira.
10
ESTATÍSTICA
A população pode ser classificada em finita ou infinita. A população finita tem um número
determinado de elementos, já a população infinita não. Por exemplo, ao estudarmos as características da
folha de determinada planta, estamos tratando de uma população infinita, já que não é possível
determinar o número de plantas existentes nem, muito menos, o número total de folhas em todas
essas plantas. Já ao estudar as notas de estatística dos alunos de uma sala, estamos tratando de uma
população limitada e, portanto, finita.
A amostra é um subconjunto da população. Por exemplo, o grupo formado por jovens brasileiros de
12 a 14 anos é uma amostra da população brasileira.
Em estatística, frequentemente não podemos acessar os dados de uma população completa, mas, se
escolhermos uma amostra representativa dessa população, podemos fazer um levantamento estatístico
que a represente. Isso é feito em pesquisas eleitorais, em que apenas uma amostra determinada dos
habitantes do país são entrevistados.
• censo;
• amostragem.
Saiba mais
11
Unidade I
Os dados estatísticos são os elementos fundamentais a partir dos quais a estatística é feita. Define‑se
como variável a característica de interesse de cada dado da amostra ou da população.
• variáveis quantitativas;
• variáveis qualitativas.
As variáveis quantitativas assumem valores numéricos e, a partir deles, podemos realizar cálculos
estatísticos. Elas podem ser classificadas como discretas ou contínuas: as variáveis quantitativas
discretas assumem apenas certos valores (inteiros), enquanto as contínuas podem assumir um
intervalo de valores. Como exemplo de variável quantitativa discreta, podemos ter o número de
pessoas em uma sala de aula (quantidade medida apenas em números inteiros) e, como exemplo
de variável quantitativa contínua, podemos ter a altura de uma pessoa (que pode assumir qualquer
valor dentro de uma faixa de valores).
As variáveis qualitativas contêm informações não numéricas relativas a categorias, por exemplo,
gênero, cargo e endereço, ao tratarmos de pessoas, ou ainda cor, volume e peso, ao tratarmos de produtos.
Note que o CEP de um endereço ou um número de telefone, mesmo representados por algarismos, são
variáveis qualitativas, pois não fazemos operações matemáticas com telefones ou CEP, visto que não
faz sentido.
As variáveis qualitativas ainda podem ser classificadas em ordinais ou nominais. As variáveis ordinais
contêm informações que localizam o dado dentro de uma categoria, como escolaridade ou faixa de
renda. Já as variáveis nominais contêm informações que não localizam o dado em uma categoria, como
cor dos olhos ou endereço.
12
ESTATÍSTICA
Exemplo de aplicação
• estatística descritiva;
• estatística indutiva.
A estatística descritiva tem como objetivo organizar e analisar um conjunto de dados. Ela pode
reduzir uma grande quantidade de dados a informações resumidas que caracterizem determinada
população, e baseia‑se no cálculo de medidas de tendência central (como a média, a moda e a mediana)
e no cálculo de medidas de dispersão dos dados (como o desvio padrão), a variância e os valores máximo
e mínimo, que veremos mais adiante.
Um estudo estatístico completo de uma população deve basear‑se no método estatístico, que é
composto por uma série de etapas, listadas a seguir:
1) Definição do problema.
2) Delimitação do problema.
13
Unidade I
A primeira etapa do método estatístico é a definição do problema. Nessa etapa, deve‑se definir com
clareza o que será pesquisado, qual é o objetivo da pesquisa e qual é o objeto de estudo.
Partimos, então, para a delimitação do problema, etapa na qual é definido onde será realizada a
pesquisa, quais serão os objetos dessa pesquisa e em quais dias e horários ela será conduzida.
No planejamento para a obtenção dos dados é feito o levantamento de como solucionar o problema
proposto, quais dados são necessários e como obter esses dados, além do cronograma das atividades.
Nessa etapa são determinados o tamanho da população ou da amostra analisada e o custo do processo.
Dependendo do objetivo da pesquisa, é preciso elaborar um questionário (ou um roteiro de pesquisa) e
dimensionar a estrutura necessária para a aplicação do questionário ou roteiro em questão.
Já na etapa de coleta de dados, os dados são coletados por meio de observação ou da aplicação
de questionários.
A apuração dos dados é a etapa na qual os dados são analisados de forma crítica, e
determina‑se quais dados serão descartados por algum erro no processo de coleta. Nessa etapa
é feita a tabulação dos dados, processo no qual os dados são resumidos, contados e agrupados
por características semelhantes.
Na sequência, há a apresentação dos dados, em que eles são organizados com objetivo de facilitar
seu entendimento e visualização, sob a forma de tabelas ou gráficos, por exemplo.
Passa‑se, então, para a análise dos dados. Nessa etapa são obtidas conclusões a partir dos dados
coletados para solucionar o problema levantado nas etapas iniciais do estudo.
Na última etapa do processo, a fase de interpretação dos dados, as medidas estatísticas, as tabelas
e os gráficos obtidos a partir dos dados são analisados, levando a algumas generalizações obtidas por
inferência estatística e às incertezas associadas a essas generalizações.
14
ESTATÍSTICA
Chamamos de dados brutos os dados exatamente da forma como são obtidos, sem tratamento
nem organização. Por exemplo: em uma pesquisa de cargos e salários, o conjunto de dados com
cargo do funcionário e o seu salário são dados brutos se não passaram por nenhuma forma
de organização.
Não é incomum que dados brutos – isso é, sem nenhum tipo de tratamento –, apresentem
incompatibilidades que precisam ser resolvidas. Um exemplo clássico está nos dados envolvendo datas,
que podem ser escritas em diversos formatos; esses formatos precisam ser uniformizados para que a
análise dos dados se dê de forma correta. Outro exemplo de incompatibilidade que é frequente ocorre
em dados de nomes de cidades com diversas grafias possíveis, como São Paulo, S. Paulo ou ainda SP, que
se referem à mesma cidade e devem ter a grafia uniformizada.
1.2.6 Rol
Se partirmos de dados brutos e aplicarmos alguma forma de organização, teremos o que chamamos
de rol. No rol, os dados podem ser organizados de forma crescente, decrescente ou em ordem alfabética.
Exemplo de aplicação
Uma turma de alunos de estatística obteve, em uma prova, as notas mostradas na tabela a seguir.
Aluno Nota
Maria 9
Pedro 4
Otávio 6
Mariana 7
Sheila 8,5
Oswaldo 3
Matheus A. 8
Matheus R. 10
Leonardo 10
Se tomarmos as notas dos alunos, sem nenhuma organização, teremos os seguintes dados brutos:
9 4 6 7 8,5 3 8 10 10
Se aplicarmos qualquer processo de organização nesses dados, passaremos a ter um rol. Vamos, por
exemplo, organizar as notas de forma decrescente:
10 10 9 8,5 8 7 6 4 3
15
Unidade I
Dessa forma é possível analisar a distribuição de notas dos alunos com mais facilidade, mas a
informação ainda não está apresentada da melhor maneira, o que pode ser feito a partir de um estudo
de frequências (que veremos mais adiante).
Nem todos os dados, porém, são de natureza numérica. A tabela 2 também apresenta informações
sob a forma de nomes, que são classificados como dados alfanuméricos. Poderíamos obter um rol
organizando o nome dos alunos em ordem alfabética, por exemplo.
2 SÉRIES ESTATÍSTICAS
Definimos como séries estatísticas as tabelas que apresentam os dados organizados em função do
tempo, da localidade ou da espécie do dado. As séries estatísticas são classificadas em:
• séries históricas;
• séries geográficas;
• séries específicas;
• séries conjugadas.
As séries históricas são classificadas em função do tempo; as séries geográficas são classificadas em
função da localidade; as séries específicas são classificadas em função de categorias características dos
dados; e as séries conjugadas, também conhecidas como séries mistas, são uma combinação das séries
temporais, geográficas ou específicas.
Na tabela a seguir é apresentado um exemplo de série histórica, em que os dados são organizados
por ano:
Ano População
1991 146.815.815
2000 169.872.856
2010 190.755.799
16
ESTATÍSTICA
Na tabela a seguir é apresentado um exemplo de série geográfica, em que os dados são organizados
por localidade:
A seguir, temos um exemplo de série específica, onde os dados são organizadospor sexo.
Sexo População
Homens 93.406.990
Mulheres 97.348.809
Ano
Grande Região
1991 2000 2010
Norte 10.027.373 12.911.170 15.864.454
Nordeste 42.494.112 47.782.487 53.081.950
Sudeste 62.740.146 72.430.193 80.364.410
Sul 22.129.131 25.119.348 27.386.891
Centro‑Oeste 9.425.053 11.638.658 14.058.094
Note que, nos quatro exemplos, os dados foram apresentados na forma de tabelas. Detalharemos
esse modo de apresentação de dados a seguir.
17
Unidade I
As tabelas são quadros que contêm um conjunto de dados seguindo determinada ordem ou
determinada classificação. São partes fundamentais de uma tabela:
• título;
• cabeçalho;
• coluna indicadora;
• corpo da tabela:
— linhas;
— células.
O título localiza‑se na parte superior da tabela (ABNT, 2011) e especifica o assunto dos dados da
tabela e, se for o caso, o período ao qual os dados se referem. Assim, todas as tabelas devem ter título.
Abaixo do cabeçalho e à direita da coluna indicadora, temos o corpo da tabela. No corpo da tabela
temos as linhas, que disponibilizam a informação no sentido horizontal. Cada elemento do corpo da
tabela, obtido pelo cruzamento de uma linha com uma coluna, é chamado de célula.
Como elementos complementares de uma tabela, temos a fonte e as notas. Esses elementos
complementares localizam‑se na parte inferior da tabela. A fonte indica a origem dos dados e o método
usado em sua obtenção e em sua elaboração. As notas trazem informações relevantes do conjunto de
dados ou de alguns dados específicos.
18
ESTATÍSTICA
Aqui será discutido como apresentar dados usando uma distribuição de frequência (f). A primeira
etapa envolve variáveis discretas.
Lembrete
Para classificar dados por distribuição de frequências, faz‑se a contagem da ocorrência de cada
evento. A fim de facilitar a contagem das ocorrências, pode‑se organizar os dados brutos em um rol
antes de analisar as frequências.
Exemplo de aplicação
Imagine que esse dado tenha sido lançado 14 vezes e que tenham sido obtidos os seguintes
resultados:
4251352616223
Vamos classificar esses dados por frequência, ou seja, vamos contar o número de ocorrências de
cada resultado.
19
Unidade I
Note que, se somarmos as frequências, devemos recuperar o número total de lançamentos (14).
Os dados também podem ser indicados pela frequência relativa (fr), de forma que o tamanho da
amostra ou da população não fique evidente nos dados. Na frequência relativa, dividimos a frequência
de cada valor pelo número total de dados na amostra ou população.
Exemplo de aplicação
Na tabela a seguir, são expostas as frequências relativas para o resultado do lançamento do dado
estudado no exemplo anterior.
Note que a soma das frequências relativas deve ser igual a 1, ou próxima de 1, no caso de
arredondamento dos valores.
Observação
20
ESTATÍSTICA
Então, para representar 0,3147 com duas casas decimais, deve‑se analisar
o número que está na terceira decimal, que, no caso, é 4. Como esse número
é menor do que 5, arredondamos para baixo. No caso, 0,3147, quando
representado com duas casas decimais, é arredondado para 0,31.
Podemos, ainda, representar um conjunto de dados por sua frequência acumulada (fa), em que
somamos as frequências anteriores àquele valor.
Exemplo de aplicação
Quando os resultados de uma pesquisa se espalham por uma faixa muito grande de valores,
é interessante agruparmos esses dados em classes ou intervalos, que são faixas de valores. Por
exemplo: em uma pesquisa envolvendo as idades de pessoas residentes em certo bairro, podemos
21
Unidade I
ter idades de 0 a cerca de 100 anos, e, por isso, construir uma tabela com 100 linhas pode não
apresentar os dados da melhor forma. Uma solução possível para esse caso seria separar as idades
em intervalos de 10 anos (tabela 10).
Número de
Idade (anos) moradores
0‑9 21
10 ‑ 19 42
20 ‑ 29 543
30 ‑ 39 321
40 ‑ 49 521
50 ‑ 59 321
60 ‑ 69 83
70 ‑ 79 43
80 ‑ 89 56
90 ‑ 99 9
e acima 1
22
ESTATÍSTICA
Note que, para cada faixa de idade, temos um limite inferior, representado por Li, indicado à esquerda,
e um limite superior, representado por Ls, indicado à direita. Não podemos ter um mesmo valor em
intervalos diferentes. O único intervalo sem limite superior é o último, que inclui moradores com idade
igual ou superior a 100 anos.
A quantidade de intervalos (ou classes) é escolhida para representar a grandeza que está sendo
analisada. Usar poucas classes pode causar perda de informação, mas usar classes demais pode dificultar
a visualização dos dados. Normalmente são utilizados de 5 a 20 intervalos (ou classes).
Outra forma de representar intervalos é pelo símbolo ⊢, que indica intervalo fechado à esquerda,
ou seja, quando o limite inferior faz parte do intervalo, mas o superior não. Nessa notação, no intervalo
1 ⊢ 5 está contido o número 1, mas não o número 5.
Reescrevendo a tabela 10 com as idades da população do bairro usando o símbolo para intervalo
fechado à esquerda, temos o que segue:
Número de
Idade (anos) moradores
0 ⊢ 10 21
10 ⊢ 20 42
20 ⊢ 30 543
30 ⊢ 40 321
40 ⊢ 50 521
50 ⊢60 321
60 ⊢ 70 83
70 ⊢ 80 43
80 ⊢ 90 56
90 ⊢ 100 9
100 e acima 1
Os intervalos (ou classes) podem ser escolhidos com base nos valores máximo e mínimo dos dados
que estão sendo analisados e de quantos intervalos desejamos na tabela.
23
Unidade I
Para efeito de análise dos dados, consideramos que todos os dados, quando agrupados em intervalos,
estão associados ao ponto médio (Pm) da classe à qual pertencem. O ponto médio de uma classe é
calculado por:
Ls + Li
Pm =
2
Na equação:
Como fazemos a distribuição de frequências de dados contínuos, ou seja, de dados que estão
distribuídos em uma faixa de valores?
Nesse caso, é fundamental que os dados sejam agrupados em classes ou intervalos como foi feito
com as variáveis discretas. Todas as observações sobre a distribuição de frequência para as variáveis
discretas aplicam‑se também à distribuição de frequências das variáveis contínuas.
Na tabela a seguir, que representa a distribuição dos salários em uma empresa, temos um exemplo
de distribuição de frequência para uma variável contínua.
24
ESTATÍSTICA
Salário Número
(em salários mínimos) de funcionários
0⊢1 0
1⊢2 5
2⊢3 23
3⊢4 53
4⊢5 12
A melhor forma de apresentarmos os dados ou resultados de uma pesquisa costuma ser por
meio de gráficos (figura 4). Os gráficos, independentemente do tipo, precisam ser de fácil
visualização e de rápida interpretação. Assim como as tabelas, eles devem sempre ser identificados
por um título na parte superior, e, se for o caso, a fonte dos dados deve ser identificada na
parte inferior.
25
Unidade I
• gráfico de dispersão;
• gráfico de barras;
• gráfico de colunas;
• gráfico de setores;
• histograma;
• polígono de frequências.
De acordo com os dados que são representados no gráfico, um tipo pode ser mais adequado do
que o outro.
O gráfico de dispersão é um dos tipos mais usado nas ciências exatas. Podemos utilizar gráficos de
dispersão quando queremos mostrar a relação entre duas (ou três) grandezas.
O gráfico de dispersão em duas dimensões tem dois eixos, um na vertical e outro na horizontal. Nos
eixos deve‑se indicar sempre as grandezas representadas neles e, se for o caso, suas unidades.
Pode‑se ter, também, gráficos de dispersão tridimensionais, em que se trabalham três eixos.
26
ESTATÍSTICA
Expectativa de vida
(anos)
80
60
No gráfico da figura 5 tem‑se, no eixo horizontal, o PIB per capita em dólares americanos. Note
que a escala desse eixo começa em 0 e vai até um pouco além de 140k, ou 140 mil dólares. O intervalo
entre os números da escala do eixo é sempre uniforme e os valores são sempre crescentes.
O mesmo comportamento pode ser visto no eixo vertical, que representa a expectativa de vida,
em anos, em que temos como valores da escala do eixo 40, 60 e 80. Veja que a escala vertical não
inicia em 0.
Repare que, como os eixos são independentes, os valores máximo, mínimo e intervalo das escalas
não precisam coincidir.
No gráfico da figura 5, nota‑se que há uma correlação entre a expectativa de vida e o PIB per capita,
de forma que países com menor PIB tendem a ter menor expectativa de vida e que há um espalhamento
desses dados (eles não se apresentam alinhados).
Quando desejamos mostrar a evolução de dada grandeza, ou ainda comparar essa grandeza em
locais e situações diferentes, trabalhamos com gráficos de barras.
Os gráficos de barras também têm dois eixos: no eixo vertical, costuma‑se colocar a variável
categórica (ou qualitativa). No eixo horizontal, costuma‑se colocar a variável quantitativa.
27
Unidade I
Grande região
Nordeste
Sudeste
Norte
Sul
Centro‑Oeste
número de pessoas
Note que o gráfico da figura 6 tem uma variável categórica no eixo vertical – no caso, as grandes
regiões –, e uma variável quantitativa no eixo horizontal – no caso, o número de pessoas analfabetas
em cada grande região.
As barras do gráfico foram ordenadas de forma decrescente, com as grandes regiões com maior
número de analfabetos na parte superior do gráfico. A ordenação das barras facilita a visualização e a
compreensão do gráfico.
A espessura e a separação das barras podem ser ajustadas de forma a facilitar a visualização. Se há
uma grande quantidade de barras, pode‑se trabalhar com barras mais finas, embora barras de maior
espessura tenham visualização melhor.
28
ESTATÍSTICA
O gráfico da figura 7 apresenta as mesmas grandezas do gráfico da figura 6, mas com a população
de pessoas analfabetas representada como percentual do total de cada região.
Porcentegem de pessoas analfabetas, por grade região
Grande região
Nordeste
Norte
Centro‑Oeste
Sudeste
Sul
0 5 10 15
pessoas (%)
Figura 7 – Exemplo de gráfico de barras representando o número de pessoas analfabetas, por grande
região, como porcentagem do número total de pessoas analfabetas por região
Vemos, do gráfico, que cerca de 20% dos analfabetos residem na grande região Nordeste, enquanto
cerca de 6% dos analfabetos residem na região Sul.
Outra forma de representação similar ao gráfico de barras é o gráfico de colunas. A diferença entre
eles é que, no gráfico de colunas, a variável categórica é representada no eixo horizontal, e a variável
quantitativa é representada no eixo vertical.
29
Unidade I
8.000.000
6.000.000
4.000.000
2.000.000
0
este este Nort
e Sul Oest
e
Nord Sud o‑
C entr
Grande região
Figura 8 – Exemplo de gráfico de colunas representando o número de pessoas analfabetas, por grande
região
O gráfico de setores, ou “gráfico de pizza”, é um gráfico polêmico e muitos não gostam de usá‑lo.
O gráfico de setores é apresentado de forma circular e é utilizado para representar a divisão de dada
grandeza em diferentes categorias, em que cada categoria usa uma fatia do círculo. Nesse tipo de
gráfico é interessante representar a grandeza quantitativa sob a forma de porcentagem.
Um cuidado que é preciso ter em gráficos de setores refere‑se ao emprego das cores para
representar cada fatia. Se usamos uma legenda para indicar as diferentes categorias, é fundamental
que sejam usadas cores contrastantes para cada fatia, de forma a não confundir a associação da fatia
com a legenda do gráfico. Uma maneira de minimizar esse problema é indicar as categorias não como
uma legenda, mas ao lado de cada fatia. A desvantagem disso é que o gráfico fica visualmente mais
poluído, o que dificulta a leitura.
Outro cuidado importante quando usamos legenda e código de cores em gráficos é testarmos a
acessibilidade do gráfico para pessoas com distúrbios visuais na identificação de cores.
30
ESTATÍSTICA
Saiba mais
10,53%
89,47%
O gráfico de setores pode não ser adequado se tivermos uma grandeza muito menor do que as
demais de forma que ela ocupe um setor muito pequeno no gráfico, ou, ainda, quando as grandezas são
similares (figura 10).
31
Unidade I
5,22% 8,46%
6,72%
3,29%
5,17%
10,41%
9,7%
14,04%
9,6%
9,74%
16,75%
9,67%
Figura 10 – Exemplo de gráfico em que a representação por setores não é adequada. Temos nesse
gráfico a distribuição da população brasileira por idade, onde os setores ocupam áreas muito
parecidas e a variação dos dados não se torna evidente
Os dados da figura 10 seriam mais bem representados por um gráfico de barras ou um gráfico
de colunas.
Note que só podemos usar gráficos de setores para representar as porcentagens de uma
mesma grandeza. Além disso, é preciso que essas porcentagens somem 100%, senão o gráfico de setores
ficará incompleto.
Uma variação do gráfico de setores é o gráfico tipo rosca (ou donut), em que podemos representar a
distribuição de porcentagens de duas grandezas distintas – uma em uma rosca externa e outra em uma
rosca interna (figura 11). No entanto, muitas vezes, esse tipo de gráfico não é recomendado, por ser de
visualização mais difícil e de interpretação menos direta.
32
ESTATÍSTICA
0a2
2a4
4a6
6a8
8 a 10
turma A turma B
Figura 11 – Exemplo de gráfico de rosca com duas roscas, uma externa e uma interna. Note como a
visualização do gráfico é difícil. O gráfico mostra a distribuição de notas em uma prova para a turma B
na rosca interna e para a turma A na rosca externa. A diferença da posição angular da mesma faixa
de nota dificulta muito a comparação das duas turmas
2.4.5 Histograma
O histograma na figura a seguir foi construído a partir dos dados da tabela 7, que listava possíveis
resultados para 14 lançamentos de um dado de 6 faces, cujas faces são numeradas de 1 a 6.
Distribuição de frequências para lançamento de um dado numérico de 6 faces
frequência
4
1 2 3 4 5 6 face
Figura 12 – Exemplo de histograma construído a partir dos dados da tabela 7, com dados de
frequência absoluta dos resultados de 14 lançamentos de um dado de 6 faces
33
Unidade I
Pode‑se, também, construir histogramas usando a frequência relativa (figura 13). O uso de
frequências relativas em histogramas é mais recomendado, pois o tamanho da amostra/população
não altera o eixo de frequências do gráfico.
Distribuição de frequências para lançamento de um dado numérico de 6 faces
frequência 0,30
relativa
0,20
0,10
1 2 3 4 5 6 face
Figura 13 – Exemplo de histograma construído a partir dos dados da tabela 8, com dados de
frequência relativa dos resultados de 14 lançamentos de um dado de 6 faces
Lembrete
Quando trabalhamos com histogramas, é possível incluir no gráfico o que chamamos de polígono
de frequências, obtido pela ligação dos pontos médios do topo de cada barra do histograma (figura 14).
Distribuição de frequências para lançamento de um dado numérico de 6 faces
frequência 0,30
relativa
0,20
0,10
1 2 3 4 5 6 face
34
ESTATÍSTICA
Resumo
35
Unidade I
ou, ainda, cor ou peso, quando tratamos de produtos. Note que o CEP de
um endereço ou um número de telefone, mesmo sendo representados
por números, são variáveis qualitativas, pois não fazemos operações
matemáticas com telefones ou CEPs, pois não faz sentido. As variáveis
qualitativas ainda podem ser classificadas em nominais e ordinais. As
variáveis qualitativas ordinais contêm informação que localiza o dado
dentro de uma categoria, por exemplo, escolaridade ou faixa de renda. Já
as variáveis qualitativas nominais contêm informações que não localizam
o dado em uma categoria, como cor dos olhos ou endereço.
• Definição do problema.
• Delimitação do problema.
36
ESTATÍSTICA
• título
• cabeçalho
• coluna indicadora
• corpo da tabela
— linhas
— células
37
Unidade I
Ls + Li
Pm =
2
Na equação:
38
ESTATÍSTICA
39
Unidade I
Exercícios
Questão 1. Considere uma moeda, como a apresentada na figura a seguir, em que um dos lados é
chamado de cara e o outro é chamado de coroa.
Cara Coroa
A) I, apenas.
B) II, apenas.
C) III, apenas.
D) II e III, apenas.
E) I, II e III.
40
ESTATÍSTICA
I – Afirmativa incorreta.
Justificativa: obter 4 caras e 2 coroas, e não 3 caras e 3 coroas, em apenas 6 lançamentos não
comprova que a moeda é desonesta. Se o número de lançamentos aumentar muito, o número de caras
e o número de coroas tendem a se tornar muito próximos.
II – Afirmativa correta.
Justificativa: como foram obtidas 4 caras, a frequência absoluta do resultado cara é igual a 4.
2 1
= ≈ 0,33
6 3
5
Quantidade de pessoas
0
Chocolate Morango Creme Flocos Napolitanos
Figura 16
41
Unidade I
A) I, apenas.
B) II, apenas.
C) III, apenas.
D) II e III, apenas.
E) I, II e III.
I – Afirmativa incorreta.
II – Afirmativa correta.
Sabor Quantidade
do sorvete de pessoas
Chocolate 5
Morango 4
Creme 3
Flocos 6
Napolitano 2
Total 20
42
ESTATÍSTICA
Justificativa: como 6 das 20 pessoas preferem sorvete de flocos, o percentual de pessoas que prefere
sorvete de flocos:
6
.100% = 30%
20
43