Bioestatística em Educação Física

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 190

Bioestatística em Educação Física

Prof. Ma. Grazielle Jenske

2016
1 Edição
a
Copyright © UNIASSELVI 2016
Elaboração:
Prof. Ma. Grazielle Jenske

Revisão, Diagramação e Produção:


Centro Universitário Leonardo da Vinci – UNIASSELVI

Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri


UNIASSELVI – Indaial.

J51b
Jenske; Grazielle
Bioestatística em educação física / Grazielle Jenske :
UNIASSELVI, 2016.

181 p. : il

ISBN 978-85-515-0018-7

1. Bioestatística. I. Centro Universitário Leonardo da


Vinci

CDD 519.5024574

Impresso por:
Apresentação
APRESENTAÇÃO

Prezado acadêmico! Bem-vindo à disciplina de Bioestatística


em Educação Física. A estatística é um ramo da  matemática  que surgiu
como Ciência a serviço do Estado, sendo esta tão antiga quanto a própria
matemática.

Ao falarmos em estatística, logo pensamos em dados numéricos


ordenados e sistematizados, pois estamos acostumados com essa ideia
cada vez mais popularmente difundida. Porém, quando tratamos da área
do conhecimento específico em Ciências Biológicas, verificamos que a
bioestatística é uma importante ferramenta científica, porque utiliza os
métodos para coletar os dados biológicos, passando pela classificação, síntese,
correção e análise desses dados. Então, a partir disso, é possível inferir sobre
as análises e tomar decisões.

Desta forma, a bioestatística é uma tentativa de aplicar regras


matemáticas a uma ciência experimental. Para utilizar essa ferramenta,
precisamos nos basear em suposições, que são a base de todo o procedimento,
e serão estudadas com necessário número de detalhes com os quais devemos
ter prudência para tomarmos a decisão correta. Nesta perspectiva, surge
este caderno de estudos, que tem como propósito principal contribuir para
esclarecer e minimizar as dificuldades existentes entre os diversos domínios
deste conhecimento.

Este caderno de estudos está dividido em três unidades que


contemplam partes importantes da Bioestatística em Educação Física, como:
fases do método estatístico, agrupamento de dados, estudo das medidas de
tendência central e de dispersão, estudo das medidas de correlação, análise
de tabelas e gráficos, testes de hipóteses, bem como a aplicação destes
conteúdos.

Na primeira unidade serão apresentados os conceitos iniciais para


a aprendizagem da própria Estatística, assim como definições e maneiras
para organizar e apresentar dados estatísticos, de modo que os objetivos
para a utilização desses métodos sejam alcançados, pois ao organizar
dados coletados por meio de pesquisa, observação ou experimentos, tem-
se a intenção de comunicá-los de maneira coerente e assim facilitar uma
interpretação fidedigna dos dados.

Na unidade seguinte, trataremos sobre as medidas de posição,


elas representam uma série de dados, orientando quanto à posição da

III
distribuição com relação ao eixo horizontal. Dentre as várias medidas de
posição, descreveremos a média, a moda, a mediana, o desvio padrão e o
coeficiente de variação.

Por fim, na terceira unidade, conheceremos as funcionalidades dos


testes estatísticos aplicados à Educação Física. Estes testes são utilizados em
situações em que se faz necessário e útil estabelecer relações entre duas ou
mais medidas.
Queremos aqui lembrar, que este material traz um curso introdutório
da Bioestatística em Educação Física. Você deve se sentir curioso e instigado
a pesquisar outros materiais para ampliar e complementar seu aprendizado.
Durante o texto, deixamos algumas sugestões e outras podem ser verificadas
nas referências bibliográficas.

Você, acadêmico, deve saber que além da curiosidade, existem outros


fatores importantes para um bom desempenho: a disciplina, a organização
e um horário de estudos predefinido são essenciais para que se obtenha
sucesso nesta trajetória.

Esperamos que, ao término deste estudo, você tenha aprimorado os


conhecimentos sobre a Bioestatística, nos seus conceitos e definições, pois
a melhoria constante deve ser o objetivo de todo acadêmico. Desta forma,
esta disciplina pretende oportunizar a compreensão da construção dos
conhecimentos aqui trabalhados e servir de subsídio para as disciplinas
subsequentes.

Bons estudos!
Prof.ª Ma. Grazielle Jenske

IV
NOTA

Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto


para você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há
novidades em nosso material.

Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é


o material base da disciplina. A partir de 2017, nossos livros estão de visual novo, com um
formato mais prático, que cabe na bolsa e facilita a leitura.

O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova
diagramação no texto, aproveitando ao máximo o espaço da página, o que também
contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo.

Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente,


apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade
de estudá-lo com versatilidade nas telas do celular, tablet ou computador.
 
Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para
apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto
em questão.

Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas
institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa
continuar seus estudos com um material de qualidade.

Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de


Desempenho de Estudantes – ENADE.
 
Bons estudos!

V
VI
Sumário
UNIDADE 1 - CONCEITOS BÁSICOS DA ESTATÍSTICA........................................................1

TÓPICO 1 - O MÉTODO ESTATÍSTICO........................................................................................3


1 INTRODUÇÃO..................................................................................................................................3
2 CONCEITO DE ESTATÍSTICA......................................................................................................4
3 GRANDES ÁREAS DA ESTATÍSTICA........................................................................................4
4 O MÉTODO ESTATÍSTICO............................................................................................................6
4.1 MÉTODO EXPERIMENTAL.......................................................................................................6
4.2 MÉTODO ESTATÍSTICO.............................................................................................................7
5 FASES DO MÉTODO ESTATÍSTICO...........................................................................................7
5.1 DEFINIÇÃO DO PROBLEMA....................................................................................................7
5.2 PLANEJAMENTO........................................................................................................................8
5.3 COLETA DE DADOS...................................................................................................................8
5.4 CRÍTICA DOS DADOS................................................................................................................9
5.5 ORGANIZAÇÃO DOS DADOS.................................................................................................10
5.6 ANÁLISE DOS RESULTADOS...................................................................................................10
6 TERMOS BÁSICOS..........................................................................................................................11
6.1 POPULAÇÃO................................................................................................................................11
6.2 AMOSTRA.....................................................................................................................................12
6.3 AMOSTRAGEM............................................................................................................................15
6.3.1 Amostragem probabilística................................................................................................16
6.3.2 Amostragem não probabilística.........................................................................................19
6.4 TAMANHO DE UMA AMOSTRA.............................................................................................20
RESUMO DO TÓPICO 1....................................................................................................................25
AUTOATIVIDADE..............................................................................................................................26

TÓPICO 2 - ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM........................................29


1 INTRODUÇÃO..................................................................................................................................29
2 ARREDONDAMENTO DE NÚMEROS.......................................................................................29
2.1 REGRAS DE ARREDONDAMENTO........................................................................................31
3 FRAÇÕES............................................................................................................................................32
3.1 TRANSFORMAÇÕES..................................................................................................................33
3.2 OPERAÇÕES.................................................................................................................................37
4 PORCENTAGENS.............................................................................................................................46
RESUMO DO TÓPICO 2....................................................................................................................49
AUTOATIVIDADE..............................................................................................................................50

TÓPICO 3 - AGRUPAMENTO DE DADOS...................................................................................51


1 INTRODUÇÃO..................................................................................................................................51
2 VARIÁVEIS ESTATÍSTICAS..........................................................................................................51
2.1 VARIÁVEIS QUALITATIVAS.....................................................................................................52
2.2 VARIÁVEIS QUANTITATIVAS..................................................................................................52
3 AGRUPAMENTO DE DADOS.......................................................................................................54
3.1 DADOS BRUTOS..........................................................................................................................54

VII
3.2 ROL.................................................................................................................................................55
3.3 AGRUPAMENTO SIMPLES OU DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS
DE CLASSE....................................................................................................................................56
3.4 AGRUPAMENTO POR FAIXA DE VALOR OU DISTRIBUIÇÃO DE FREQUÊNCIA COM
INTERVALOS DE CLASSE..........................................................................................................58
RESUMO DO TÓPICO 3....................................................................................................................63
AUTOATIVIDADE..............................................................................................................................64

UNIDADE 2 - MEDIDAS DE POSIÇÃO.........................................................................................65

TÓPICO 1 - MEDIDAS DE TENDÊNCIA CENTRAL..................................................................67


1 INTRODUÇÃO..................................................................................................................................67
2 MÉDIA ARITMÉTICA.....................................................................................................................68
2.1 MÉDIA ARITMÉTICA PARA DADOS NÃO AGRUPADOS.................................................68
2.2 MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM DISTRIBUIÇÃO DE
FREQUÊNCIA SEM INTERVALO DE CLASSE.......................................................................70
2.3 MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM DISTRIBUIÇÃO DE
FREQUÊNCIA COM INTERVALO DE CLASSE.....................................................................77
3 MODA..................................................................................................................................................80
3.1 DADOS NÃO AGRUPADOS......................................................................................................80
3.2 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE
CLASSES........................................................................................................................................81
3.3 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE
CLASSES........................................................................................................................................81
4 MEDIANA...........................................................................................................................................84
4.1 DADOS NÃO AGRUPADOS......................................................................................................84
4.2 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE
CLASSES........................................................................................................................................86
4.3 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE
CLASSES........................................................................................................................................88
RESUMO DO TÓPICO 1....................................................................................................................91
AUTOATIVIDADE..............................................................................................................................93

TÓPICO 2 - MEDIDAS DE DISPERSÃO


1 INTRODUÇÃO..................................................................................................................................95
2 AMPLITUDE TOTAL........................................................................................................................96
3 DESVIO PADRÃO............................................................................................................................96
3.1 DESVIO PADRÃO AMOSTRAL E DESVIO PADRÃO POPULACIONAL.........................96
3.2 CÁLCULO DO DESVIO PADRÃO............................................................................................97
3.2.1 Dados não agrupados.........................................................................................................97
3.2.2 Dados agrupados em distribuição de frequência sem intervalo de classes................99
3.2.3 Frequência de classes..........................................................................................................102
4 COEFICIENTE DE VARIAÇÃO.....................................................................................................106
RESUMO DO TÓPICO 2....................................................................................................................108
AUTOATIVIDADE..............................................................................................................................109

TÓPICO 3 - SÉRIES E GRÁFICOS ESTATÍSTICOS.....................................................................111


1 INTRODUÇÃO..................................................................................................................................111
2 SÉRIE ESTATÍSTICA........................................................................................................................111
2.1 TIPOS DE SÉRIES.........................................................................................................................115
2.1.1 Séries históricas, cronológicas ou temporais...................................................................115
2.1.2 Séries geográficas, espaciais, territoriais ou de localização...........................................115

VIII
2.1.3 Séries específicas ou categóricas........................................................................................117
2.1.4 Séries conjugadas . ..............................................................................................................118
3 GRÁFICO ESTATÍSTICO................................................................................................................119
3.1 GRÁFICOS EM LINHA OU CURVA.........................................................................................120
3.2 GRÁFICOS EM COLUNAS OU EM BARRAS.........................................................................121
3.3 GRÁFICO EM SETORES.............................................................................................................123
3.4 PICTOGRAMAS...........................................................................................................................124
RESUMO DO TÓPICO 3....................................................................................................................125
AUTOATIVIDADE..............................................................................................................................126

UNIDADE 3 - INTRODUÇÃO AOS TESTES ESTATÍSTICOS..................................................127

TÓPICO 1 - INTRODUÇÃO À PROBABILIDADE......................................................................129


1 INTRODUÇÃO..................................................................................................................................129
2 DISTRIBUIÇÃO NORMAL............................................................................................................129
2.1 TABELA Z......................................................................................................................................130
RESUMO DO TÓPICO 1....................................................................................................................136
AUTOATIVIDADE..............................................................................................................................137

TÓPICO 2 - TESTES DE HIPÓTESES..............................................................................................139


1 INTRODUÇÃO..................................................................................................................................139
2 TESTES CLÁSSICOS........................................................................................................................139
3 Erros Do Tipo I E Ii............................................................................................................................142
3.1 ERRO DO TIPO I (α).....................................................................................................................142
3.2 ERRO DO TIPO II (β)...................................................................................................................143
4 EXEMPLOS DE TESTES DE HIPÓTESES....................................................................................144
4.1 TESTE DE HIPÓTESES PARA A MÉDIA QUANDO O DESVIO PADRÃO DA
POPULAÇÃO É CONHECIDO..................................................................................................145
4.1.2 Teste de hipóteses para a média quando o desvio padrão da população é
desconhecido........................................................................................................................149
4.2 TESTE DE HIPÓTESES PARA A VARIÂNCIA POPULACIONAL σ2.................................151
4.3 TESTE DE HIPÓTESES PARA A PROPORÇÃO POPULACIONAL P................................152
RESUMO DO TÓPICO 2....................................................................................................................155
AUTOATIVIDADE..............................................................................................................................156

TÓPICO 3 - REGRESSÕES E CORRELAÇÕES..............................................................................159


1 INTRODUÇÃO..................................................................................................................................159
2 DIAGRAMA DE DISPERSÃO.......................................................................................................159
3 CORRELAÇÃO DE PEARSON.......................................................................................................162
4 REGRESSÃO LINEAR SIMPLES...................................................................................................165
4.1 EQUAÇÃO LINEAR ...................................................................................................................166
RESUMO DO TÓPICO 3....................................................................................................................171
AUTOATIVIDADE..............................................................................................................................172
APÊNDICE A.........................................................................................................................................174
APÊNDICE B.........................................................................................................................................176
APÊNDICE C.........................................................................................................................................178
REFERÊNCIAS......................................................................................................................................179

IX
UNIDADE 1

CONCEITOS BÁSICOS DA ESTATÍSTICA

OBJETIVOS DE APRENDIZAGEM
A partir do estudo desta unidade, você deverá ser capaz de:

• identificar a terminologia, símbolos usuais e conhecimentos básicos


encontrados em bioestatística;

• descrever e interpretar informações do campo da Educação Física sob o


aspecto estatístico;

• compreender os procedimentos técnicos e de cálculos essenciais ao


trabalho estatístico quanto aos dados biológicos;

• utilizar a linguagem bioestatística como instrumento de apoio na execução


de atividades do cotidiano.

PLANO DE ESTUDOS
Esta unidade está dividida em três tópicos, em cada um deles você
encontrará atividades que o auxiliarão a fixar os conhecimentos abordados.

TÓPICO 1 – O MÉTODO ESTATÍSTICO

TÓPICO 2 – ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM

TÓPICO 3 – AGRUPAMENTO DE DADOS

1
2
UNIDADE 1
TÓPICO 1

O MÉTODO ESTATÍSTICO

1 INTRODUÇÃO
Os primeiros registros da Estatística datam de aproximadamente 3000
anos a.C. na Babilônia, China e Egito. Essas civilizações já possuíam a necessidade
de registrarem numericamente questões de seu convívio social, ou seja, já
realizavam uma espécie de censo. Os censos estavam relacionados ao número
de habitantes, registros de nascimento, de óbitos, estimativas de riquezas, taxas
cobradas pelos governos, entre outras.

Esses processos, ao longo dos anos, foram ganhando mais importância,


até que em meados do século XVII o acadêmico alemão Gottfried Achenwall
(1719-1772) acabou atribuindo à Estatística proporção científica. A Alemanha
teve grande influência no desenvolvimento da Estatística, visto que foi na Escola
Alemã que foram feitas as primeiras tabelas mais complexas, representações
gráficas e cálculos de probabilidades.

A partir daí a Estatística foi estabelecida com o propósito de ser um


conjunto de métodos, a fim de sistematizar os processos de organização de dados
que as sociedades necessitavam. As tabelas foram se aprimorando, os primeiros
cálculos foram surgindo e a estatística como conhecemos hoje foi sendo moldada.

Nas últimas décadas, a Estatística tem se mostrado presente nas mais


diversas áreas de conhecimento, como a Educação, a Engenharia, a Administração,
as Ciências Contábeis, a Medicina, a Agronomia, a Educação Física, a Biologia,
a Psicologia e muitas outras. Destacamos ainda que a área da Educação Física
que atua em diversas linhas de pesquisa (saúde, lazer, educação e esporte, entre
outras), também utiliza o tratamento estatístico analítico para inferir sobre seus
parâmetros. 

  Acadêmico, nesta disciplina você terá a oportunidade de aprender


sobre a área da matemática que mais desperta o interesse das pessoas. Seja na

3
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

empresa, com suas metas, ou no período eleitoral, com a antecipação do possível


candidato eleito, a estatística é a área da matemática que mais atrai curiosidade.
Acreditamos que seja o motivo pelo qual a Estatística estar, de alguma forma,
mais próxima do cotidiano das pessoas, pois nenhum dos métodos estatísticos é
restrito a qualquer campo de aplicação, mesmo que alguns problemas necessitem
de técnicas estatísticas mais sofisticadas, ou até mesmo a utilização de softwares
devido à quantidade de informações a serem estudadas.

Serão apresentados alguns dos conceitos iniciais para a aprendizagem da


própria Estatística, assim como definições e maneiras para organizar e apresentar
dados estatísticos de modo que os objetivos para a utilização desses métodos sejam
alcançados, pois ao organizar dados coletados por meio de pesquisa, observação
ou experimentos tem-se a intenção de comunicá-los de maneira coerente, e assim
facilitar uma interpretação fidedigna dos dados.

2 CONCEITO DE ESTATÍSTICA
A Estatística é definida por Crespo (2002) como uma parte da Matemática
Aplicada que fornece métodos para coleta, organização, análise e interpretação
de dados e para a utilização dos mesmos na tomada de decisões.

Aprofundamos essa definição e a conceituamos como sendo o estudo


de um grupo de indivíduos, objetos ou de qualquer comportamento coletivo,
através de métodos, onde interpretamos os resultados deste estudo através de
valores numéricos.

São exemplos de aplicabilidade da Estatística:

a) A média da idade dos alunos ingressantes no curso de Educação


Física é de 23 anos.
b) A taxa de conversão do site da Uniasselvi variou 5% no último mês.
c) Os profissionais da área de Educação Física tem uma renda mensal
média variando entre R$ 1800,00 e R$ 2000,00.

3 GRANDES ÁREAS DA ESTATÍSTICA


A Estatística é uma parte da matemática aplicada que, por meio da coleta,
organização, descrição, análise e interpretação de dados auxilia na tomada
de decisões futuras. Atualmente, a Estatística pode ser dividida em três áreas:
Estatística Descritiva, Probabilidade e Inferência Estatística.

4
TÓPICO 1 | O MÉTODO ESTATÍSTICO

A Estatística Descritiva é definida como um conjunto de técnicas


utilizadas com a intenção de descrever e resumir dados, de modo a possibilitar
que sejam tiradas conclusões a respeito de determinado fenômeno de interesse.
Geralmente, a Estatística Descritiva é utilizada em uma fase inicial da pesquisa,
a partir do primeiro contato com os dados que ainda estão, muitas vezes,
desorganizados, tendo uma grande importância ao lidarmos com quantidades
expressivas de dados. Nesses casos, é necessária a utilização de algumas técnicas
que simplifiquem e representem a totalidade dos dados, como, por exemplo, a
organização destes em tabelas e gráficos.

A probabilidade lida com a incerteza, com a possibilidade de um evento


ocorrer ao acaso, como em jogos de dados ou de cartas, sorteio de uma pessoa
que tem determinada característica em um grupo de pessoas que tem e que não
tem essa característica.

Por último, a inferência estatística é o estudo de técnicas que permite


uma generalização por meio de uma determinada quantidade de dados, que se
aplicam ao total da população envolvida.

Para ser possível a realização de uma inferência a respeito de determinada


situação, inicialmente temos que ter uma problemática bem estabelecida, por
exemplo: a necessidade de abrir uma academia em determinada região da cidade,
e a opinião dos consumidores a respeito de uma nova marca de produtos para a
saúde, pesquisas eleitorais para direcionar as próximas atitudes da assessoria dos
candidatos.

Após definida a problemática, é possível iniciar a coleta de dados, sendo


que esta deve ser muito bem planejada para que a análise não gere informações
incorretas. A coleta de dados pode ser realizada de maneira direta ou indireta,
como veremos adiante.

Após a coleta dos dados, é preciso observá-los com a intenção de


verificar imperfeições e falhas, para que estas não causem erros no resultado.
Frequentemente, acontecem falhas em pesquisas que realizam perguntas
tendenciosas, ou seja, que tentam induzir a resposta do entrevistado. Vejamos
um exemplo de pergunta tendenciosa: fazer exercícios físicos frequentes é mais
importante do que ter uma alimentação saudável? Talvez não percebamos, mas
o modo como essa pergunta é feita induz ao entrevistado que é importante
fazer exercícios físicos e ter uma alimentação saudável, o que na opinião do
entrevistado pode não ser verdade e ainda tentar nos conduzir a responder que é
mais importante fazer exercícios físicos.

5
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Ao formularmos a pergunta que fornecerá os dados para a pesquisa


temos que tomar alguns cuidados. Não se deve utilizar uma linguagem que
possivelmente o entrevistado não compreende e também não devemos fazer
questões que induzam a uma resposta, isso pode alterar os dados, o que levará a
uma pesquisa que gerou um resultado falso.

Após organizar os dados, frequentemente os expomos por meio de


tabelas, quadros ou gráficos, o que facilita, caso seja necessária a aplicação de um
cálculo estatístico.

Por meio da Estatística indutiva ou inferencial podemos tirar conclusões e


realizar previsões relativas ao total da população, mesmo que apenas parte desta
tenha sido entrevistada, ou seja, utilizou-se uma amostra, mas os resultados
podem ser generalizados para toda a população.

Este ciclo descreve as fases do método estatístico, que veremos de forma


mais aprofundada a seguir.

4 O MÉTODO ESTATÍSTICO
No grego, methodos significava caminho para se chegar a um fim.
Atualmente, um método consiste em um conjunto de etapas, ordenadamente
dispostas, a serem vencidas:

• na investigação da verdade;
• no estudo de uma ciência;
• ou para alcançar um determinado fim.

Dos métodos científicos, vamos destacar o método experimental e o estatístico.

4.1 MÉTODO EXPERIMENTAL


As primeiras investigações foram realizadas na primeira metade do
século XIX, por Gustav Ferchner e conforme o próprio termo sugere este método,
através da experimentação, consiste em limitar as áreas investigadas, mantendo
constantes todas as causas, menos uma, variando-a de modo que se possa
descobrir suas implicações, caso existam.

Este método tem um papel importante para o conhecimento do


comportamento humano e animal. Um exemplo de aplicação do método
experimental é na testagem da eficácia de um determinado medicamento, onde

6
TÓPICO 1 | O MÉTODO ESTATÍSTICO

criam-se dois grupos, em que um grupo recebe a medicação em teste e o outro


recebe placebo, ou seja, com as mesmas causas (perfil dos participantes, hábitos,
doenças preexistentes), no entanto, altera-se a composição da medicação.

4.2 MÉTODO ESTATÍSTICO


Em situações em que não é possível manter as causas constantes,
utilizamos o método estatístico. O método estatístico considera todas as causas
envolvidas no processo como variável e procura determinar no resultado final e
que influências cabem a cada uma delas.

Como exemplo, pode-se citar a viabilidade ou não da abertura de uma


academia, a partir de uma pesquisa de mercado. Pelo processo do método
experimental, neste caso, poderia ser custoso e inadequado.

A seguir, vamos detalhar cada uma das fases do método estatístico.

5 FASES DO MÉTODO ESTATÍSTICO


São seis as fases do método estatístico, a saber:

• Definição do problema.
• Planejamento.
• Coleta de dados.
• Crítica dos dados.
• Organização de dados.
• Análise dos resultados.

Adiante detalharemos cada uma delas.

5.1 DEFINIÇÃO DO PROBLEMA


Esta fase consiste na definição e formulação correta do problema a ser
estudado. Outra parte importante desta fase é analisar outros estudos já realizados
sobre a questão para traçar estratégias assertivas para a pesquisa.

São sugestões de temas a tratar:

• Variação de altura, peso.


• Tratamento de dados relativos aos desempenhos dos alunos no salto em
altura, lançamento de pesos.
• Frequência de batimentos cardíacos.
• O tempo necessário para a realização de uma prova.

7
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

5.2 PLANEJAMENTO
Após a definição do problema, neste momento, ocorre o plano de como os
processos serão realizados. É nesta fase que se decide de qual forma serão obtidos
os dados, quais serão as variáveis abordadas, qual a população de interesse e o
tipo de amostragem, termos estes que detalharemos adiante.

5.3 COLETA DE DADOS


Após delimitar o problema de pesquisa e definir um plano de ação, é
preciso pensar em como obter os dados. Para isso, existem duas maneiras: uma é
usar dados já coletados por outra pessoa (dados secundários), outra é coletar os
próprios dados (dados primários). Isso caracteriza a coleta como indireta e direta,
respectivamente.

A coleta indireta é indicada quando há disponibilidade de dados


secundários adequados, assim economiza-se a coleta dispendiosa de dados
primários. No entanto, quando se usam dados secundários, as definições,
a finalidade, a cobertura, a frequência (quantas vezes), a temporalidade
(atualidade), o nível de desagregação (os detalhes) e a exatidão (incluindo o
tamanho da amostra e a tendenciosidade dos questionamentos feitos) podem ser
inadequados aos objetivos propostos. Podemos fazer uso da coleta secundária ao
utilizar, por exemplo, os dados do censo, visto ser esta uma estatística oficial (que
segue os critérios e fases do método estatístico).

A coleta direta ocorre quando não há disponibilidade de dados primários,


sendo necessário obter os dados diretamente da fonte. Um exemplo disso é quando
uma indústria de medicamentos realiza uma pesquisa para saber a preferência
dos consumidores pela sua marca.

A coleta direta de dados pode ser classificada com relação ao fator tempo,
como:

a) Contínua (registro) - quando é feita continuamente, tal como a de


nascimentos, óbitos, os registros da fiscalização eletrônica de velocidade etc.
b) Periódica - quando é feita em intervalos de tempo constantes, como os
censos demográficos, matrículas semestrais e/ou anuais dos estudantes etc.
c) Ocasional - quando feita ocasionalmente, a fim de atender a uma
conjuntura ou uma emergência, como no caso de epidemias, pesquisas eleitorais,
avaliações etc.

8
TÓPICO 1 | O MÉTODO ESTATÍSTICO

A coleta indireta é indicada quando há disponibilidade de dados


secundários adequados, assim economiza-se a coleta dispendiosa de dados
primários. No entanto, quando se usam dados secundários, as definições,
a finalidade, a cobertura, a frequência (quantas vezes), a temporalidade
(atualidade), o nível de desagregação (os detalhes) e a exatidão (incluindo o
tamanho da amostra e a tendenciosidade dos questionamentos feitos) podem ser
inadequados aos objetivos propostos. Podemos fazer uso da coleta secundária ao
utilizar, por exemplo, os dados do censo, visto ser esta uma estatística oficial (que
segue os critérios e fases do método estatístico).

A coleta direta ocorre quando não há disponibilidade de dados primários,


sendo necessário obter os dados diretamente da fonte. Um exemplo disso é quando
uma indústria de medicamentos realiza uma pesquisa para saber a preferência
dos consumidores pela sua marca.

A coleta direta de dados pode ser classificada com relação ao fator tempo,
como:

a) Contínua (registro) - quando é feita continuamente, tal como a de


nascimentos, óbitos, os registros da fiscalização eletrônica de velocidade etc.
b) Periódica - quando é feita em intervalos de tempo constantes, como os
censos demográficos, matrículas semestrais e/ou anuais dos estudantes etc.
c) Ocasional - quando feita ocasionalmente, a fim de atender a uma
conjuntura ou uma emergência, como no caso de epidemias, pesquisas eleitorais,
avaliações etc.

5.4 CRÍTICA DOS DADOS


Realiza-se neste processo uma auditoria dos dados, em busca de possíveis
falhas e imperfeições ou dados a serem desconsiderados (repetições, omissões etc.),
a fim de não incorrer em erros que possam influir sensivelmente nos resultados.

A crítica dos dados pode ser de origem interna ou externa.

a) Crítica Interna: quando visa observar os elementos originais dos dados


da coleta.

b) Crítica Externa: quando visa às causas dos erros por parte do informante,
por distração ou má interpretação das perguntas que lhe foram feitas.

9
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Por exemplo, ao aplicar o questionário, temos que fazer uma crítica


para verificar se as respostas obtidas condizem com a nossa necessidade (crítica
interna), no caso de haver erros precisamos saber o motivo da ocorrência dos
mesmos para futura correção, verificamos se o pesquisado estava desatento, ou
se a questão foi mal interpretada etc. (crítica externa).

5.5 ORGANIZAÇÃO DOS DADOS


Após os processos comentados anteriormente, necessitamos organizá-
los, ou seja, realizar a soma e o processamento dos dados obtidos, bem como sua
disposição mediante critérios de classificação. Este resumo dos dados pode ser feito
através de contagem e/ou agrupamento. A importância desta fase do método se
encontra na facilidade posterior do entendimento das informações.

Já os dados podem ser apresentados de duas formas, que não se excluem


mutuamente: a apresentação tabular, que é uma apresentação numérica dos dados
em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas
pelo Conselho Nacional de Estatística; e a apresentação gráfica, que constitui uma
apresentação geométrica, permitindo uma visão rápida e clara do fenômeno.

5.6 ANÁLISE DOS RESULTADOS


Trata-se do principal objetivo da estatística, apurar resultados e
interpretá-los. Está ligada essencialmente ao cálculo de medidas e coeficientes,
e sua finalidade principal é descrever o fenômeno. Estes números, ao serem
interpretados, irão traduzir informações importantes nas tomadas de decisão
acerca do experimento desejado.

Assim, completamos as fases do método estatístico.

10
TÓPICO 1 | O MÉTODO ESTATÍSTICO

FIGURA 1 - FASES DO MÉTODO ESTATÍSTICO

FONTE: A autora

6 TERMOS BÁSICOS
Até aqui usamos diversos termos característicos da estatística e que irão
nos acompanhar durante o estudo desta disciplina. Desta forma, faz-se necessário
descrevê-los com maior detalhamento. Assim, a seguir, apresentaremos os termos
básicos da Estatística.

6.1 POPULAÇÃO
Definimos população (ou universo estatístico) o conjunto de todos os
indivíduos ou a todos os objetos do grupo em que serão estudados a partir dos
métodos estatísticos.

São exemplos de população:


a) SITUAÇÃO: Um professor quer saber a altura média dos acadêmicos
do terceiro semestre do curso de Educação Física da Uniasselvi.
POPULAÇÃO: Todos os acadêmicos do terceiro semestre do curso de
Educação Física da Uniasselvi.

b) SITUAÇÃO: Analisar os batimentos cardíacos de homens fumantes na


faixa dos 35 a 40 anos, residentes em Indaial – Santa Catarina, quando expostos a
atividades físicas.
POPULAÇÃO: Todos os homens fumantes na faixa dos 35 a 40 anos,
residentes em Indaial – Santa Catarina

c) SITUAÇÃO: O Conselho Federal de Educação Física está realizando

11
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

um censo e quer saber qual a área de intervenção dos profissionais habilitados


em Educação Física.
POPULAÇÃO: Todos os profissionais habilitados em Educação Física no
Brasil.

FIGURA 2 - POPULAÇÃO

FONTE: Adaptado de: <http://revistaepoca.globo.com/Revista/Epoca/


foto/0,,45290355,00.jpg>. Acesso em: 26 jun. 2016.

Em situações em que o número de indivíduos ou elementos for muito


grande, inviabilizando estudar toda a população, utilizamos uma parte da
população que denominamos de amostra.

6.2 AMOSTRA
Amostra é um conjunto que está contido na população estatística. Em
outras palavras, é uma parcela representativa da população a ser estudada. Por este
fato, a amostra deve caracterizar a população através das mesmas configurações,
porém em menor escala de quantidade de elementos a serem estudados.

Certamente você já vivenciou uma situação semelhante à apresentada a seguir:

12
TÓPICO 1 | O MÉTODO ESTATÍSTICO

FIGURA 3 - SITUAÇÃO DE AMOSTRA

FONTE: Disponível em: <http://www.alea.pt/html/nocoes/img/cartoon2_2_3_2.gif>. Acesso


em: 26 jun. 2016.

Ao criar uma amostra referente a uma população ganhamos em tempo e


redução de esforços para realizar os estudos solicitados. Veja os exemplos:

a) Foram entrevistados 400 acadêmicos de uma determinada instituição


para saber sua satisfação com os serviçõs oferecidos por ela.

Note que 400 acadêmicos são uma amostra do total de acadêmicos desta
instituição.

b) Uma empresa coletou 200 cartelas do medicamento X contidas em


diversos lotes de produtos, para testar sua qualidade.

Repare que 200 cartelas não é o conjunto de todas as cartelas de todos os


lotes produzidos pela empresa. Logo, é uma amostra.

13
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

FIGURA 4 - DIFERENÇA ENTRE POPULAÇÃO E AMOSTRA

FONTE: Adaptado de: <http://revistaepoca.globo.com/Revista/Epoca/


foto/0,,45290355,00.jpg>. Acesso em: 26 jun. 2016.

Desta forma, podemos destacar cinco principais razões que levam o


pesquisador a trabalhar com amostras:

a) Economia: Quanto maior a amostra, maior o custo de obtenção dos


dados.
b) Tempo: Muitas vezes o fator tempo é determinante numa pesquisa. Por
exemplo, em uma pesquisa epidemiológica ou de “boca de urna”, não haveria
tempo suficiente para se abordar toda a população, mesmo havendo recursos
financeiros disponíveis.
c) Confiabilidade dos Dados: Considerando o fator “fadiga” como
elemento limitador das potencialidades humanas. No caso de uma amostra, pode
se dedicar mais atenção aos casos individuais, evitando erros de mensuração e/ou
processamento. Atente que geralmente é mais eficiente estudar um grupo pequeno
de forma intensiva do que estudar um grande grupo de maneira superficial –
quantidade versus qualidade.
d) Operacionalidade: É mais fácil realizar operações de pequena escala.
Um dos maiores problemas nos grandes censos é controlar os pesquisadores.
e) População inexistente: Dinossauros.

Em contrapartida, existem três razões fundamentais que não permitem ao


pesquisador optar por amostragem em determinadas pesquisas:

a) População Pequena: Sob o enfoque de amostragens aleatórias, se


a população for pequena, ou seja, inferior a 100 elementos, usar a técnica

14
TÓPICO 1 | O MÉTODO ESTATÍSTICO

da amostragem significaria inserir uma margem de erro sem reduzir


significativamente o tamanho da amostra.
b) Característica de Fácil Mensuração: Mesmo que a população não seja
tão pequena, quando a variável que se quer observar é de tão fácil de mensuração
que não compensa investir num Plano de Amostragem.
c) Necessidade de Alta Precisão: Quando o parâmetro for, por exemplo, o
censo demográfico de um país, esse parâmetro precisa ser avaliado com grande
precisão pois é fundamental para o planejamento desse país. Nesse caso se
pesquisa toda a população. No Brasil isso ocorre a cada dez anos e é desenvolvido
pelo Instituto Brasileiro de Geografia e Estatística - IBGE -, certamente você ou
seus familiares já participaram desta pesquisa.

ATENCAO

Acadêmico, toda pesquisa por amostragem tem o risco de um erro, esse erro é
previsto e determinado, no caso de população pequena, o número de indivíduos da amostra
representa quase toda a população. Mais adiante veremos como esse erro aparece no cálculo
do tamanho da amostra.

Você deve estar se perguntando: Como uma amostra pode representar


uma informação correta de um conjunto muito grande de dados? Por que, em
uma eleição, cidades com altas populações são escolhidas apenas cerca de 2000
pessoas para darem suas intenções de voto e assim prever o candidato eleito?

Dois fatores são fundamentais para que uma amostra represente uma
população, uma delas é o tipo de amostragem utilizada e o outro corresponde
a determinados cálculos estatísticos que devemos fazer para chegar a estas
comprovações. Veremos isto de maneira detalhada a seguir:

6.3 AMOSTRAGEM
Temos várias maneiras de extrair e utilizar amostras. No entanto, o método
a ser utilizado deve estar de acordo com os objetivos do estudo. Em primeiro
lugar, temos de determinar a população-alvo, isto é, se é composta por todos
as pessoas que vivem numa área de influência, os alunos da academia, ou só as
mulheres, por exemplo.

Uma vez definida a população, temos que elaborar uma lista desses
elementos. Por lista entendemos a descrição de todos eles. Isso parece levantar
alguns problemas, por exemplo: como é que obtenho a lista de todos as pessoas
da área de influência de uma academia? Ou: como é que obtenho a lista de todas
as mulheres que praticam atividade física numa determinada cidade?

15
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Nestes casos, temos que dar resposta a esta situação mudando para
um quadro de amostragem que seja compatível com a população a estudar. A
dimensão da amostra é importante, sobretudo se pretendermos realizar inferência
estatística e probabilidades para as médias e proporções que viermos a encontrar.
Mais adiante veremos como isso é possível.

Os passos seguintes serão a extração da amostra e a sua validação, isto


é, a forma de nos assegurarmos que ela é suficientemente representativa. Neste
ponto você verificará os principais métodos de amostragem, através de exemplos
práticos. Numa ideia generalista, as amostragens podem ser divididas em
probabilísticas e não probabilísticas.

6.3.1 Amostragem probabilística


Neste tipo de amostragem, todos os elementos da população possuem
probabilidade de pertencer à amostra. Este é o conjunto de amostragem mais
adequado para um estudo correto e imparcial da maioria dos casos.

Amostragem Aleatória

A amostragem aleatória ocorre quando nos métodos de escolha dos


participantes da amostra é realizado um sorteio aleatório, como o próprio
nome sugere, em que todos os seus elementos possuem a mesma probabilidade
de pertencerem a esta amostra. Este sorteio pode ser realizado por softwares
específicos ou com tabelas de números aleatórios.

Exemplo: Imaginemos uma população com número de indivíduos igual


a 30.000, simbolicamente: N = 30.000. Desejamos coletar dela n = 3.000 elementos
para uma amostra.

Ao realizar a amostragem aleatória, os elementos possuem probabilidade


10
100 (dez a cada cem) de participarem da amostra. Os elementos da população
são numerados de 1 a 30.000 e é realizado um sorteio para a definição dos
participantes.

Este método mostra-se muito útil quando a população é pequena, quando


existe uma listagem disponível e, quando a dispersão geográfica não é um
problema. Porém, não é indicado quando há a necessidade de se possuir uma
lista completa de todos os elementos da população e apresenta um elevado custo
para a obtenção de informação sobre os elementos selecionados.

Amostragem Sistemática

A amostragem sistemática é um processo de amostragem probabilístico


não aleatório, ou seja, é um processo em que se selecionam os sujeitos a incluir
na amostra utilizando um critério. Este tipo de amostragem é utilizado quando

16
TÓPICO 1 | O MÉTODO ESTATÍSTICO

os elementos da amostra se encontram ordenados. Ele consiste em selecionar um


ponto de partida aleatório e em seguida tomar cada “n” elementos de uma lista.

Exemplo: Para realizar uma amostragem sistemática em uma população


de 500 profissionais habilitados em Educação física, inicialmente devemos
numerá-los de 1 até 500. Então realizamos um sorteio e, suponhamos que saiu
o número 37, logo esse funcionário será o primeiro pesquisado. Após efetuar os
cálculos (que aprenderemos posteriormente) verificamos que uma boa amostra
dessa população é formada por 25 indivíduos, então fazemos a divisão de 500 por
25, o que resulta 20. Esse 20 representa o “passo” que daremos para “escolher”
outro profissional, como começamos no profissional de número 37, vamos
somando de 20 em 20 para determinar os outros pesquisados, nesse caso seriam
os funcionários de números: 57, 77, 97, ..., até determinar os 25 indivíduos da
25
amostra. Neste exemplo, cada profissional possui probabilidade 500 de participar
da amostra.
Amostragem Estratificada

A amostragem estratificada é muito indicada para pesquisas em sua área,


acadêmico de Educação Física! Ela é indicada quando evidenciamos que existem
diferenças significativas entre subgrupos da população que pretendemos estudar.
Esses subgrupos são denominados de “estratos” e devem estar representados na
amostra de forma proporcional ao seu “peso” na população.

Para realizar a amostragem estratificada devemos iniciar por identificar


esses subgrupos significativos (estratos), depois calcular o peso relativo (%) de
cada um dos estratos  na população (iremos relembrar estes cálculos no tópico
a seguir) e, por fim, utilizar, em cada um dos estratos, o procedimento de
amostragem aleatória para determinar os sujeitos de cada estrato que irão integrar
a amostra na mesma proporção em que estão representados na população.

E
IMPORTANT

É importante destacar que os estratos devem ser mutuamente exclusivos, isto


é, cada elemento da população apenas deve estar incluído num estrato e exaustivos, ou seja,
nenhum elemento da população pode ficar fora de um estrato.

Utilizar este processo antes do sorteio da amostra é fundamental, ao passo


que esta amostra deve ser representativa. Seria bastante estranho, por exemplo,
numa população de 100 pessoas onde 80% são mulheres, criarmos uma amostra
com 90% de homens. Com certeza esta amostra não representaria “de forma
justa” esta população.

17
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Exemplo: Em uma pesquisa sobre os benefícios do hábito de atividades


físicas na vida das pessoas que têm entre 20 e 40 anos de idade de uma determinada
cidade, precisamos levar em consideração que existem diferenças significativas
entre a população feminina e masculina. Desta forma, é importante que a nossa
amostra inclua um número de homens e de mulheres que fosse proporcionalmente
igual ao que existe na população em estudo.

Vamos supor que esta cidade possui uma população de N = 20.000


habitantes entre 20 e 40 anos e para uma análise acerca do benefício do hábito de
atividades físicas desta população é necessária uma amostra de tamanho n = 500.
Além disto, nos deparamos com 6.000 homens e 14.000 mulheres. Como devemos
escolher de forma justa os elementos desta amostra?

Como já citamos anteriormente, para este caso, devemos ter mais


elementos do estrato de mulheres, pois são maioria nesta cidade. Para realizar
esta separação de forma “justa” utilizaremos a proporcionalidade. Chamaremos
de E1 o estrato dos homens e E2 o estrato das mulheres. Assim:

n  E1  6000
• Para homens: E1    0, 3  30%
N 20000

n  E2 
• Para mulheres: E1  
14000
 0, 7  70%
N 20000

Destes resultados, segue que 30% da amostra deve ser escolhida do grupo
de homens e 70% do grupo de mulheres.

ATENCAO

Veja, acadêmico, que a soma das porcentagens de todos os estratos deve


sempre fechar 100%, que representam o total da população.

Posteriormente, devemos calcular em termos absolutos a quantidade real


de elementos componentes da amostra:

• Homens: n1  n  30%  500  0, 3  150



• Mulheres: n2  n  70%  500  0, 7  350

E assim, a amostra será composta por 150 homens e 350 mulheres,


completando 150 + 350 = 500 participantes, conforme solicitado.

18
TÓPICO 1 | O MÉTODO ESTATÍSTICO

6.3.2 Amostragem não probabilística


Este tipo de amostragem é utilizado quando, no experimento desejado,
é impossível encontrar as probabilidades para que os elementos participem
da amostra ou são escolhidos pela simplicidade de seu processo. Vejamos os
principais casos de amostragem não probabilística.

Inacessibilidade à População

Utilizamos esta amostragem quando a população não é acessível em


sua totalidade. Um exemplo dessa situação é quando se deseja encontrar
uma característica importante de todo o minério coletado em uma jazida. Por
simplicidade e custo iremos coletar o minério existente na parte mais superficial,
sendo que coletá-lo em profundidades maiores seria muito demorado e custoso.
Amostragem a Esmo (ou sem Norma)

Podemos utilizar este processo de amostragem ao passo que a população


que desejamos realizar o experimento seja bastante homogênea. Por exemplo,
se desejamos retirar uma amostra de tamanho n = 300 de uma população de N =
30.000 bolas de voleibol de um mesmo lote, realizar uma amostragem aleatória
seria o ideal, porém, demasiadamente trabalhoso num contexto em que se
necessitam resultados rápidos. Neste caso, realizando uma amostragem a esmo,
podemos selecionar as 300 primeiras bolas, sem talvez perder o valor estatístico
do processo.

Amostragem Intencional

A pessoa responsável pela amostra escolhe, a seu critério, os elementos da


amostra, por aferir os elementos que mais representam a população.

Deixamos claro aqui que este processo é bastante perigoso, por talvez
permitir manipulações e parcialidade em pesquisas importantes, por exemplo,
pesquisas eleitorais.

Assim, fechamos os principais métodos de amostragem. É válido frisar


que a amostragem define a forma (método) com que a amostra é selecionada, de
modo que faça uma representação fidedigna da população, conforme exemplifica
a ilustração a seguir.

19
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

FIGURA 5 - CICLO PARA DETERMINAR UMA AMOSTRA

FONTE: Adaptado de: <http://revistaepoca.globo.com/Revista/Epoca/foto/0,,45290355,00.jpg>.


Acesso em: 26 jun. 2016.

6.4 TAMANHO DE UMA AMOSTRA


Quando iniciamos este tópico fomos questionados sobre como conseguimos
descobrir qual deve ser a quantidade exata de elementos de uma amostra para
que ela realmente represente a população estudada e que seus resultados possam
gerar confiabilidade. Para tanto, deve-se seguir as quatro etapas descritas abaixo:

1
n0 =
E02
1a Etapa: Cálculo da Amostra Ideal:

N  n0
n
N  n0
2a Etapa: Cálculo da Amostra Mínima:
n
3a Etapa: Cálculo do Estimador da Amostra: x =
N

4a Etapa: Aplicação do Estimador aos Estratos (cada categoria):  estrato   x

Sendo:
N = Tamanho da População;
n = Tamanho da Amostra;
no = Tamanho da Amostra Ideal (primeira aproximação);

E0 = Erro Amostral Tolerável (admissível)

20
ATENCAO

7
O erro amostral é tolerável na forma de coeficiente, ou seja: 7%
= = 0, 07
34 100
, ou ainda: . 34=
% = 0, 34
100

Exemplo 1: Numa população de N = 30.000 elementos, qual deve ser o


tamanho n da amostra ideal para que a pesquisa tenha erro inferiror a 4%?

1 1
E0 4=
Resolução: Como = % 0, 04 temos: n0    625
 0, 04 
2
0, 0016

Que representa a amostra ideal para o caso. Incluindo agora o peso da


população, vem: n  625  30000  613
625  30000

UNI

Note que apesar do arredondamento para inteiro do número 612,24489... ser


612, usamos 613. Para tamanho de amostra, sempre arredondamos para cima,
para garantirmos o tamanho mínimo da amostra e ficarmos abaixo do erro amostral admitido.

Sendo assim, a amostra para esta pesquisa deve ter 613 elementos para ter
erro inferior a 4%.

Exemplo 2: Planeja-se um levantamento por amostragem para avaliar


diversas características da população de estudantes da Instituição X. Estas
características (parâmetros) são especialmente: idade média, renda per capita, local
de origem etc. Utilizando a tabela a seguir, com dados referentes a 2016, qual deve
ser o tamanho mínimo de uma amostra aleatória simples, por curso (estratos), tal
que possamos admitir que o risco de estarmos errados não ultrapassem 5%?

21
TABELA 1 - MATRÍCULAS DOS CURSOS DE GRADUAÇÃO DA INSTITUIÇÃO X EM 2016

CURSO ALUNOS AMOSTRA


Educação Física 870
Engenharia Civil 662
Direito 1 555
Finanças 245
Moda 529
Marketing 340
Serviço Social 2 423
TOTAL 6 624

FONTE: A autora

Para determinar o número de indivíduos de cada curso para fornecer a


amostra, seguimos as quatro etapas citadas anteriormente:

1ª etapa: cálculo da Amostra Ideal: (lembrete: E0 = Erro amostral = 5% =


0,05)
1 1 1 1
n0      400 alunos
 E0   0, 05 0, 05  0, 05 0, 0025
2 2

2ª etapa: cálculo da Amostra Mínima: (Lembrete: N = população, ou seja,


soma de todos os alunos dos cursos = 6 624.)
N  n0 6624  400 2649600
n    377, 221  378 alunos
N  n0 6624  400 7024

3ª etapa: cálculo do Estimador da Amostra:

4ª etapa: aplicação do Estimador aos Estratos:  estrato   x

22
E
IMPORTANT

Nesta etapa, deve-se multiplicar a quantidade de alunos de cada curso pelo


valor do estimador.

E
IMPORTANT

Os valores de cada turma foram arredondados em função de ser uma variável


discreta – pessoas – além disso, para garantir o erro mínimo temos que arredondar sempre
para cima, não importando os dígitos decimais.

TABELA 2 - MATRÍCULAS DOS CURSOS DE GRADUAÇÃO DA INSTITUIÇÃO X EM 2016

CURSO ALUNOS AMOSTRA


Educação Física 870 50
Engenharia Civil 662 38
Direito 1 555 89
Finanças 245 14
Moda 529 31
Marketing 340 20
Serviço Social 2 423 139
TOTAL 6 624 381

FONTE: A autora

23
TUROS
ESTUDOS FU

No próximo tópico iremos recordar conceitos de arredondamento, frações e


porcentagens. Caso estejas com dificuldades para compreender estes cálculos, avance para
o Tópico 2 e depois retorne para realizar estas autoatividades.

24
RESUMO DO TÓPICO 1
Neste tópico, vimos que:

• Um método de pesquisa pode ser experimental ou estatístico. O método


estatístico é composto por seis fases: definição do problema, planejamento,
coleta de dados, crítica dos dados, organização de dados e análise dos
resultados. Sobre eles, devemos saber:

o A coleta de dados pode ser direta ou indireta, sendo que a coleta direta
pode ser contínua, ocasional ou periódica.
o A crítica dos dados pode ser externa ou interna.
o A organização de dados nada mais é que um resumo dos dados e pode
ser feito através de contagem e/ou agrupamento. A importância desta
fase do método se encontra na facilidade posterior do entendimento
das informações. Após realizado esse “resumo”, os dados podem ser
apresentados de duas formas: a apresentação tabular e a apresentação
gráfica.
o A análise dos resultados é o objetivo principal da estatística; consiste em
apurar resultados e interpretá-los.

• Quando, em uma pesquisa, decide-se analisar uma amostra, devemos recorrer


aos métodos de amostragem. Estes métodos consistem no processo de seleção
e escolha dos elementos de uma população para formar uma amostra que
represente fidedignamente a população.

• Existem dois grandes grupos dentro da amostragem:

o Amostragem probabilística, que pode ser: amostragem aleatória,


sistemática ou estratificada.
o Amostragem não probabilística: por inacessibilidade à população, a
esmo (ou sem norma) ou intencional.

• Para obter uma amostra ideal, devemos seguir quatro etapas:

1
1a Etapa: Cálculo da Amostra Ideal: n0 =
E02
N  n0
2a Etapa: Cálculo da Amostra Mínima: n 
N  n0
n
3a Etapa: Cálculo do Estimador da Amostra: x =
N

4a Etapa: Aplicação do Estimador aos Estratos (cada categoria):  estrato   x

25
AUTOATIVIDADE

Acadêmico, um dos princípios da Uniasselvi é “Não basta saber, é preciso


saber fazer”. Agora chegou a sua vez de colocar em prática os conceitos sobre
matrizes, estudados neste tópico.

1 A natação é uma atividade física praticada na água que surgiu na Grécia


Antiga e é amplamente praticada até os dias atuais, por ser considerada
um dos esportes mais benéficos ao corpo humano. Ao realizar um estudo
sobre o tempo gasto, em segundos, por 60 indivíduos, na modalidade dos
50 metros Crawl (também conhecido como nado livre), registrou-se o tempo
gasto por 16 desses atletas. Os resultados foram os seguintes:

22,1 23,5 23,0 22,2 21,6 23,7 23,1 22,4


21,6 22,2 21,8 21,9 22,0 22,3 21,9 23,3

Considerando estas informações, responda: Os dados coletados são suficientes


para que a pesquisa tenha um erro amostral de 4%? Se não, qual deveria ser o
tamanho desta amostra?

a) ( ) Sim, os 16 atletas são suficientes para que a pesquisa apresente um erro


amostral de 4%.
b) ( ) Não, será necessário registrar o tempo de 54 atletas.
c) ( ) Não, será necessário registrar o tempo de 55 atletas.
d) ( ) Não, será necessário registrar o tempo de 56 atletas.

2 O atletismo é um conjunto de atividades esportivas de corrida, saltos e


arremessos. A mais tradicional competição do atletismo é a corrida de pista
e envolve várias provas, entre elas, a maratona. A maratona mais famosa no
Brasil e na América Latina é a Corrida Internacional de São Silvestre. Essa
maratona é uma corrida de rua realizada anualmente na cidade de  São
Paulo, no dia 31 de dezembro. Ela foi criada em 1925, atualmente tem um
percurso de 15 km. Apenas a partir de 1945 tivemos a participação de atletas
de outros países e tornou-se uma corrida mista em 1975, quando começou a
participação oficial das mulheres.
Em 2015, a 91ª edição da Corrida de São Silvestre teve a participação
de 30 mil pessoas de 37 países, porém, apenas 23.268 corredores completaram
a prova. Dos corredores que finalizaram a prova, tivemos, aproximadamente,
70% homens e 30% mulheres. Agora, suponha que você fará uma pesquisa por
amostragem estratificada, levando em conta um erro de, no máximo 5%, com
as mulheres que completaram esta prova. Qual deve ser o número mínimo de
mulheres entrevistadas para a amostra?

a) ( ) O número mínimo de mulheres entrevistadas para a amostra deve ser

26
de 119.
b) ( ) O número mínimo de mulheres entrevistadas para a amostra deve ser
de 350.
c) ( ) O número mínimo de mulheres entrevistadas para a amostra deve ser
de 1.164.
d) ( ) O número mínimo de mulheres entrevistadas para a amostra deve ser
de 6.981.

27
28
UNIDADE 1
TÓPICO 2

ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM

1 INTRODUÇÃO
No tópico anterior, tivemos uma noção geral de como planejar uma pesquisa
através do método estatístico. De agora em diante estudaremos ferramentas para
poder efetivar cada uma das seis etapas. Iniciaremos fornecendo os subsídios
matemáticos necessários para que você, acadêmico, possa compreender em
plenitude os cálculos apresentados. Assim, neste tópico, iremos rever como
realizar o arredondamento, como operar com frações e como realizar os cálculos
de porcentagem.

2 ARREDONDAMENTO DE NÚMEROS
Diversas operações matemáticas resultam em números não inteiros,
com várias casas decimais, ou seja, com vários dígitos após a vírgula. Quando
um número desse tipo apresentar uma quantidade de casas decimais maior
que a desejada, devemos realizar o arredondado do número baseado em regras
específicas.

Inicialmente, precisamos saber se o arredondamento desejado é por


inteiro, decimal, centésimo, milésimo etc.

E
IMPORTANT

Se o arredondamento for:
• Inteiro, significa que não teremos casas após a vírgula.
• Decimal, significa que teremos uma única casa após a vírgula.
• Centésimo, significa que teremos duas casas após a vírgula.
• Milésimo, significa que teremos três casas após a vírgula.

29
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Para aplicar qualquer uma das regras, é necessário primeiramente definir


o número de casas a ser trabalhado após a vírgula, conforme acabamos de ver. A
partir daí, devemos identificar qual é o dígito remanescente e analisar os dígitos
posteriores.

• Dígito remanescente é o algarismo da casa decimal a ser conservada.


• Dígitos posteriores são os algarismos que irão indicar se o arredondamento
é “para cima” ou “para baixo”.

Exemplo: Arredondar, para duas casas decimais, o número 7,4318976.


Veja:

Digito remanescente

7,4318976
Digito posteriores

O dígito remanescente indica a posição do decimal que ficará no número


e os dígitos posteriores serão arredondados (serão zeros). Todos esses dígitos
formam a parte decimal a ser considerada. Para todo arredondamento, temos
duas opções, uma “para cima” e outra “para baixo”, com relação à parte decimal
a ser considerada. Nesse caso específico, teríamos:

3,4400000 (arredondamenta para cima)


7,4318976
3,4300000 (arredondamento para baixo ou
inalterado)

E
IMPORTANT

Há duas coisas a observar:


• Somente uma das opções acima é a correta.
• Os zeros à direita de um número decimal não precisam ser escritos.

Vejamos como determinar a forma correta de arredondamento.


30
TÓPICO 2 | ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM

2.1 REGRAS DE ARREDONDAMENTO


Quando for necessário o arredondamento de dados, deve-se proceder de
acordo com a resolução número 886/66, da Fundação IBGE (1993), que orienta:

I- Quando o primeiro algarismo a ser abandonado for 0,1, 2, 3 ou 4, fica


inalterado o último algarismo a permanecer (dígito remanescente).

Exemplos:
a) 13,24 arredondado ao décimo mais próximo será 13,2.
b) 38,473 arredondado ao centésimo mais próximo será 38,47.

II- Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-


se de uma unidade o último algarismo a permanecer (dígito remanescente).

Exemplos:
a) 72,87 arredondado ao décimo mais próximo será 72,9.
b) 3,7 arredondado ao inteiro mais próximo será 4.

III- Quando o primeiro algarismo a ser abandonado for o 5 há duas


situações a considerar:

ATENCAO

Acadêmico, tenha muita atenção nesta situação, pois a maioria dos erros
cometidos na etapa de arredondamento de dados, ocorre aqui.

(i) Se ao 5 seguir em qualquer casa um algarismo diferente de zero,


aumenta-se uma unidade no algarismo a permanecer (dígito remanescente).

Exemplos:
a) 7,352 arredondado ao centésimo mais próximo será 7,4.
b) 45,6501 arredondado ao décimo mais próximo será 45,7.
c) 106,250002 arredondado ao décimo mais próximo será 106,3.

(ii) Se o 5 for o último algarismo ou se ao 5 só seguirem zeros, o último


algarismo a ser conservado (dígito remanescente) só será aumentado de uma
unidade se for ímpar. No caso de ser par, fica inalterado o último algarismo a
permanecer (dígito remanescente).
Exemplos:
a) 56,75 arredondado ao décimo mais próximo será 56,8.
b) 56,65 arredondado ao décimo mais próximo será 56,6.
c) 56,7500 arredondado ao décimo mais próximo será 56,8.
d) 56,6500 arredondado ao décimo mais próximo será 56,6.
31
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

DICAS

Ao realizar cálculos em calculadoras científicas, você pode configurar sua


calculadora para que os resultados já apareçam da forma arredondada para facilitar o
processo.
As calculadoras mais comuns trabalham, normalmente, com 10 dígitos. Ao trabalhar com
valores decimais, você configurará os resultados utilizando a tecla MODE, que normalmente
se encontra na parte superior do teclado. Você deve pressionar esta tecla 3 vezes, até que no
visor apareça:

Para que a máquina apresente os resultados como decimal aperte 1 para escolher “FIX”. Em
seguida aparecerá “FIX 0 ~ 9?”. Neste momento, você escolhe a quantidade de casas decimais
com que deseja realizar os arredondamentos. Simples assim! Por exemplo, caso você tenha
escolhido Fixar em 2 casas: O valor 27,4768 irá aparecer como 27,48.

Além dos números decimais, também haverá em nossos cálculos números


fracionários. Calma, não se desespere, a seguir iremos recordar os conceitos
necessários para que tenhas segurança ao trabalhar com eles.

3 FRAÇÕES
Ao se questionar sobre o motivo de revisar frações e porcentagem
numa disciplina de estatística, basta nos remetermos aos cálculos das amostras
estudados no tópico anterior, em que foram necessárias segmentações de seus
participantes. Um exemplo disso é um caso em que apenas 1/4 (um quarto), ou
25%, de uma população de interesse é acessível para uma pesquisa. Precisamos
saber calcular qual é a quantidade exata dos elementos da população para depois
obter a amostra.

Obviamente, este caso citado acima é apenas um entre vários existentes


em que iremos precisar de um apoio das frações e percentuais para conseguir
resolver problemas com os quais podemos nos deparar.

Sendo assim, neste tópico, revisaremos as transformações entre frações


e números decimais, bem como as operações possíveis com esse conjunto de
números e, em seguida, veremos a aplicação disto nas porcentagens.

32
TÓPICO 2 | ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM

3.1 TRANSFORMAÇÕES
A seguir veremos como realizar a transformação de um número fracionário
em um número decimal e vice-versa.

E
IMPORTANT

Vamos lembrar, neste momento, o que uma fração representa.


Fração é uma palavra que vem do latim “fractus” e significa “partido”, “quebrado”, assim,
podemos dizer que fração é a representação das partes iguais de um todo. Cada fração é
formada por três elementos: o numerador (o número da parte de cima da fração), o traço (que
serve para separar os dois valores e representa uma divisão) e, finalmente, o denominador (o
número da parte de baixo).

numerador
denominador

O denominador representa quantas partes iguais estão contidas no todo (ou seja, em quantas
partes algo foi dividido). E, o numerador representa a quantidade de partes consideradas de
um todo (quantas partes do todo nós possuímos).
Por exemplo:
1) 3
4

2) 9 + +
4

Transformação de Número Fracionário em Número Decimal

Para transformar um número fracionário em número decimal basta dividir


numerador pelo denominador.
Exemplos:

33
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Esse traço sobre os dois últimos seis indicam que se trata se uma dízima
periódica, isto é, que esse valor se repete infinitamente.

Transformação de Número Decimal em Número Fracionário

Para transformar números decimais em um número fracionário, nós


temos três diferentes situações. Atente-se para cada uma delas.

34
TÓPICO 2 | ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM

Situação 1: O número decimal é finito

Inicialmente, vamos observar a leitura de cada um dos seguintes números:

0,6 (lemos, seis décimos), ou seja, 6


.
10

75
0,75 (lemos, setenta e cinco centésimos), ou seja, 100
.

4,38 (lemos, quatro e trinta e oito centésimos), ou seja, .


438
100

0,129 (lemos, cento e vinte e nove milésimos), ou seja, .


129
1000

Verifique que:

6 75
0, 6 = 0, 75 =
10 100
Uma casa decimal – Um zero Duas casas decimais – Dois zeros
438 129
4, 38 = 0,129 =
100 1000
Duas casas decimais – Dois zeros Três casas decimais – Três zeros

Desta forma, o número de zeros colocados no denominador é igual ao


número de casas após a vírgula.

Situação 2: O número decimal é uma dízima periódica simples

Inicialmente, vamos recordar que uma dízima periódica é a parte decimal


infinita (não tem fim). A dízima periódica é dita simples quando for composta
apenas de um período que se repete igualmente, por exemplo: 0,22222...;
2,5656565656... Já a dízima periódica composta é formada por algarismos que
não fazem parte do período, por exemplo, 0,1555...; 2,354444... Esta dízima será
estudada na Situação 3.

Esses números também podem ser escritos em forma de fração, mas


apesar de serem números decimais na sua transformação, é preciso utilizar um
processo diferente da Situação 1. Acompanhe o raciocínio:
 
Exemplo 1: Transformar 0,2222... em fração.

Para isso, chamaremos a dízima de x:


x = 0,2222... (I)

35
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

O objetivo é eliminar as casas decimais. Para isso, andaremos com a vírgula


para a direita uma casa decimal, pois apenas o 2 que repete. Isso é o mesmo que
multiplicar o 0,2222... por 10. Ficando assim:

10x = 2,2222... (II)

Temos duas equações (I) e (II). Iremos subtrair as duas: (II) – (I).

9
Como x = 0,2222.... , então 0,2222... é o mesmo que  2 . Se dividirmos 2 : 9
chegaremos a 0,2222...

Exemplo 2: Transformar a dízima 0, 636363... em fração.

Repetindo o processo, temos: x = 0,636363... (I)

Andando com a vírgula duas casas para a direita, pois o número que 
repete nas casas decimais é o 63. Andar duas casas para a direita é o mesmo que
multiplicar 
por 100. 
100x = 63,636363...(II)

Subtraindo as duas equações (II) e (I) encontradas:

Como x = 0,636363... então 0,636363... é o mesmo que  99 .


63

Acadêmico, note que na prática a quantidade de números nove colocados


no denominador é igual ao número de dígitos que o período possui. Isso se aplica
quando a parte inteira for nula.

Quando tivermos 2, 777..., teremos que separar a parte inteira da decimal


7
para transformar, fazendo 2 + 0,777..., o que resultará em 2 + . Essa soma será
9
estudada adiante.

Situação 3: O número decimal é uma dízima periódica composta.

36
TÓPICO 2 | ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM

O processo é semelhante ao da Situação 2. Acompanhe o raciocínio


utilizado ao transformar a dízima 2,35555... em fração.
x = 2,35555...

Como o 3 não faz parte da dízima, devemos multiplicar a equação por 10


para que o número 3 passe para o outro lado deixando nas casas decimais apenas
a dízima.
10x = 23,5555... (I) 

Agora, multiplicamos a equação (I) por 10 novamente para que possamos


ter um período fazendo parte do lado inteiro.
10 . 10 . x = 235,5555... 
100x = 235,5555... (II)

Subtraindo as equações (II) e (I), teremos:

212
Como x = 2,35555... então 2,35555... é o mesmo que  90

3.2 OPERAÇÕES
Acadêmico, é imprescindível que tenhas domínio das operações
relacionadas neste subtópico. Elas fazem parte do seu cotidiano, da sua jornada
acadêmica e profissional, por este motivo é importante compreendê-las e não
somente resolvê-las.

Adição e Subtração de Frações

Só podemos somar ou subtrair frações que possuam o mesmo


denominador.

ATENCAO

Atente para a definição: só podemos somar ou subtrair frações que possuam


o mesmo denominador. Esta definição permite que você compreenda os artifícios utilizados
adiante.

37
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Exemplo 1:
1 3
+
5 5
Veja a representação geométrica.

Como ambos os “todos” estão divididos em cinco partes, podemos


“transportar” as quantidades, ficando com 4 das 5 partes do todo.

Assim,
1 3 4
 
5 5 5

Exemplo 2:
3 2
+
4 4

Exemplo 3:
3 2

4 4

38
TÓPICO 2 | ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM

3 2 1
 
4 4 4

Assim, para somar ou subtrair frações que possuem o mesmo denominador,


basta manter o denominador e operar o numerador.

1 1
E se quisermos somar, + , como fazer?
2 3

Geometricamente, teremos:

1 1
Note que se “transportarmos” a quantidade 2
para o 3
, não irá caber.
1 1
E, se “transportarmos” a quantidade para o irá sobrar espaço. Isso porque
3 2
o todo está repartido em quantidades diferentes e, pela definição, somente
podemos somar e subtrair frações que possuem o mesmo denominador, ou seja,
que estejam repartidas em quantidades iguais.

Para podermos efetuar essa operação, devemos recorrer a frações


equivalentes. Frações equivalentes são frações que representam a mesma parte
do todo. Por exemplo:

Veja a representação gráfica:

39
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Acadêmico, observe que apesar do “todo” estar repartido em quantidades


diferentes, a parte pintada corresponde à metade da figura (todo) em todas as
frações. Por isso dizemos que elas são frações equivalentes.

Quando as frações não possuem o mesmo denominador, devemos reduzi-


las ao menor denominador comum (ou mínimo múltiplo comum) e, em seguida
somar ou subtrair as frações equivalentes às frações dadas.

Veja que agora o todo está repartido em partes iguais e assim podemos
realizar a adição.
1 1 3 2 5
   
2 3 6 6 6

Exemplo:

40
TÓPICO 2 | ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM

Frações equivalentes às frações dadas, com o mesmo denominador.

Veja o denominador da fração 13 , que era 3 e aumentou para 15, ou


seja, multiplicamos por 5. Para encontrarmos o numerador que vai manter
a equivalência precisamos realizar a mesma operação feita no denominador
(multiplicar por 5), assim, 1 x 5 = 5.

1 5
= Frações equivalentes
3 15

O mesmo ocorre para a fração 54 , que tinha o denominador 5 e devido


ao m.m.c., precisamos de uma fração equivalente com denominador 15, assim
multiplicamos por 3 o denominador 5, logo, precisamos fazer a mesma coisa no
denominador, 4 x 3 =12.

4 12
= Frações equivalentes
5 15

DICAS

É comum que ao ter aprendido este conceito, seu professor tenha ensinado
que depois que você encontrou o m.m.c., basta dividir pelo denominador e multiplicar pelo
numerador. Claro que na prática é a mesma coisa, mas cuidado para não interiorizar que
você pode realizar uma operação com o denominador e outra com o numerador. Então a
dica é pensar que você está sempre realizando a mesma operação (multiplicação ou divisão)
e que você faz para o denominador, precisa ser repetido para o numerador da fração.

Como obter o mínimo múltiplo comum (m.m.c.) de dois ou mais


denominadores?

Vamos achar os múltiplos comuns de 3 e 5:


Múltiplos de 3: 0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, ...
Múltiplos de 5: 0, 5, 10, 15, 20, 25, 30, 35, 40, ...
Múltiplos comuns de 3 e 5: 0, 15, 30, 45, 60, ...

Dentre estes múltiplos, diferentes de zero, 15 é o menor deles. Chamamos


o número 15 de mínimo múltiplo comum de 3 e 5.

41
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

E
IMPORTANT

O menor múltiplo comum de dois ou mais números, diferente de zero, é


chamado de mínimo múltiplo comum desses números. Usamos a abreviação m.m.c.

Relembraremos uma técnica chamada de “decomposição simultânea em


fatores primos”. Nesta técnica decompomos ao mesmo tempo cada denominador
em fatores primos. O produto de todos os fatores primos que aparece nessa
decomposição será o mínimo múltiplo comum.

Número primo é um número que possui apenas 2 divisores (o número 1 e


ele mesmo). São números primos: 2, 3, 5, 7, 11, 13, 17, 19, ...

Utilizando essa técnica, observe como determinar o m.m.c. de 12, 8 e 6.

Vejamos como utilizar esse conceito para determinar as frações equivalentes


e conseguir resolver a adição e subtração de frações com denominadores
diferentes, vamos a mais um exemplo:
3 1 5
 
10 2 6

Como os denominadores são diferentes, iniciamos determinando o m.m.c.

Sabemos que o novo denominador deve ser 30 para que possamos escrever
frações equivalentes, e assim obter frações de mesmo denominador para poder
efetuar a adição e subtração.
42
Multiplicação de Frações

Basta multiplicar numerador por numerador e denominador por


denominador.

Exemplos:

ATENCAO

Você não deve tirar o M.M.C., ou seja, não é necessário que as frações tenham
denominadores iguais.

Para ilustrar esse conceito de multiplicação, vamos recorrer à geometria,


acompanhe o procedimento.

Seja a multiplicação entre duas frações: 1 2



2 3

Iniciamos representando a primeira fração (se preferir é possível iniciar pela


segunda, visto que a ordem dos fatores não altera o produto).
43
Em seguida, subdividimos cada uma dessas partes em partes menores em
quantidades iguais ao denominador da segunda fração, que neste caso é 3.

Agora, para cada parte pintada, tomamos a quantidade de subdivisões iguais ao


numerador da segunda fração, que no caso é 2.

Desta forma, o círculo original foi dividido em duas partes e depois cada parte
subdividida em três, totalizando 6 subdivisões, destas 6, tomamos duas, ou seja: 2/6.

Assim, verificamos que: 1 2 2


 
2 3 3

FONTE: Adaptado de: <http://obaricentrodamente.blogspot.com.br/2012/07/aspectos-


geometricos-para-multiplicacao.html>. Acesso em: 18 jun. 2016.

Divisão de Frações

Mantenha a primeira fração e inverta a segunda passando a divisão para


multiplicação.

Exemplos:

44
Este é o processo prático, mas você sabe por que mantemos a primeira
fração e invertemos a segunda passando a divisão para multiplicação?

Na verdade, quando fazemos isso, estamos omitindo uma passagem.


O que se pretende ao multiplicar numerador e denominador pelo inverso do
denominador é obter um denominador igual a 1, para operar apenas com o
numerador, facilitando o cálculo. Observe:

Vejamos também a forma geométrica da divisão entre frações, para isso,


1 1
tomemos como exemplo a divisão ⋅
2 4

Iniciamos representando geometricamente ambas as frações.

1 1
Observe que a fração cabe duas vezes na fração , portanto, podemos
1 1 4 2
dizer que:  : = 2 .
2 4
1 1 1 4 4
Pelo artifício do algoritmo, :     2.
2 4 2 2 2

TUROS
ESTUDOS FU

A seguir, ampliaremos os conceitos aqui trabalhados, incluindo as porcentagens.

45
4 PORCENTAGENS
Acadêmico, tenha em mente que para compreender o conceito de
porcentagem devemos verificá-la como sendo uma razão (representada por
uma fração) cujo seu denominador é 100. Note como podemos representar, por
exemplo, o valor 75%:
75 3
75=
% = = 0, 75
100 4
Onde:

Neste estudo, você necessita entender muito bem como lidar com todos
estes tipos de representação de percentuais.

Por exemplo: Determine qual é o valor que representa 10% de 530.

Veja, que o processo pode ser feito da seguinte forma:


10 1
10%  530   530   530  0,1 530  53
100 10

Repare, que neste cálculo, utilizamos todas as suas formas de representação,


a qual podemos recair, na forma mais simples, que é 0,1 530  53 . A este valor
0,1, chamamos de fator de multiplicação percentual.

Em outras palavras, para conseguir resolver situações que envolvem


percentuais, basta descobrir qual é o fator de multiplicação percentual que
necessitamos utilizar para alcançar o resultado esperado. Segue uma lista de
situações em que podemos encontrá-los:

1) Situação: 25% do valor 1240.

Percentual: 25%
Fator de multiplicação: 0,25
Resultado: 0,25 x 1240 = 310

2) Situação: Acréscimo de 20% em R$ 3200.


Percentual: 100% + 20% = 120%
Fator de multiplicação: 1,2
Resultado: 1,2 x 3200 = 3840

46
3) Situação: Desconto de 15% em R$ 1800.
Percentual: 100% - 15% = 85%
Fator de multiplicação: 0,85
Resultado: 0,85 x 1800 = 1530

Note que os fatores de multiplicação são o resultado dos percentuais


divididos por 100. Outro ponto importante que podemos ressaltar é o fato de que
os acréscimos e descontos são sempre obtidos a partir de 100% (valor referência/
todo).

Agora, para ilustrar como este processo, do fator multiplicativo, é muito


eficaz nos problemas envolvendo percentuais, iremos realizar uma série de
exemplos em que o utilizamos como processo de resolução:

Exemplos:

1) No curso de Educação Física há 900 alunos, 42% são rapazes. Calcule o


número de rapazes.

Sabemos que 42% = 0,42, logo, basta realizar a multiplicação:


0,42 x 900 = 378 rapazes

2) Sobre um salário de R$ 2.380,00 são descontados 8% para o INSS. De


quanto é o total de desconto?

Podemos realizar este cálculo de duas formas:


I) 8% = 0,08
Logo, o desconto é de 0,08 x 2 380 = R$ 190,40.
II) O desconto de 8% é dado por: 100% - 8% = 92%
Como 92% = 0,92, temos: 0,92 x 2 380 = R$ 349,60. E ainda R$ 2.380 – R$
2.189,60 = R$ 190,40.

Outra situação importante é saber determinar o valor percentual a partir


dos valores envolvidos. Você com certeza já deve ter se deparado com alguma
situação em que pode se encontrar o valor percentual envolvido. Por exemplo:

a) Em uma turma, do total de 50 acadêmicos, 20 são do sexo feminino.


b) O dólar, que na semana passada era cotado em R$ 4,02, teve uma queda
para R$ 3,82.

Repare que nos casos acima, podemos desejar conhecer qual é o percentual
de funcionárias da empresa, ou qual foi a taxa de queda percentual do dólar na
última semana. Iremos demonstrar, a seguir, uma forma muito prática para esta
determinação, em dois casos:

47
Caso 1: Onde o valor é parte do todo.
Para este caso, basta dividir o valor conhecido pelo valor total, onde no
caso (a):

Obviamente, se a questão fosse a quantidade de funcionários do sexo


masculino, teríamos como resultado 100% - 40% = 60%.

Caso 2: Onde conhecemos o valor inicial e final de um processo.

Note que em (b) conhecemos o valor inicial e final do dólar, naquela


semana. Nestes casos, utilizaremos a seguinte fórmula:

Veja que para (b), temos:

Que representa em uma queda de 4,975%. Onde, se o valor fosse (+),


teríamos uma alta!

Para finalizar, vejamos mais alguns exemplos:

1) Numa turma de 30 acadêmicos faltaram 12 devido às fortes chuvas dos


últimos dias. Qual a taxa de acadêmicos presentes?

Sabemos que se faltaram 12 acadêmicos, é porque os outros 18 estavam


presentes. Logo:

2) Uma medicação custa R$ 40,00 e é vendida por R$ 52,00. Qual é a taxa


de lucro?

Conhecemos o valor inicial e final da medicação. Logo:

3) Comprei um par de óculos de sol por R$ 250,00 e vendi por R$ 200,00.


De quanto por cento foi o prejuízo?
Conhecemos o valor inicial e final dos óculos. Logo:

48
RESUMO DO TÓPICO 2
Neste tópico, vimos:

Quando for necessário o arredondamento de dados, deve-se proceder de


acordo com a resolução número 886/66, da Fundação IBGE (1993), que orienta:

I- Quando o primeiro algarismo a ser abandonado for 0, 1, 2,3 ou 4, fica


inalterado o último algarismo a permanecer (dígito remanescente).
II- Quando o primeiro algarismo a ser abandonado for 6, 7,8 ou 9, aumenta-
se de uma unidade o último algarismo a permanecer (dígito remanescente).
III- Quando o primeiro algarismo a ser abandonado for o 5, há duas
situações a considerar:

– Se ao 5 seguir em qualquer casa um algarismo diferente de zero,


aumenta-se uma unidade no algarismo a permanecer (dígito remanescente).
– Se o 5 for o último algarismo ou se ao 5 só seguirem zeros, o último
algarismo a ser conservado (dígito remanescente) só será aumentado de uma
unidade se for ímpar. No caso de ser par, fica inalterado o último algarismo a
permanecer (dígito remanescente).

A transformação de um número fracionário em um número decimal e


vice-versa. Na transformação de decimal para fracionário existem três situações,
fique atento!

As quatro operações básicas da matemática envolvendo frações. Vale


lembrar:

o Só podemos somar ou subtrair frações que possuam o mesmo


denominador. Para isso, basta manter o denominador e somar ou subtrair o
numerador. Quando os denominadores forem diferentes, precisamos buscar
frações equivalentes.
o Para multiplicar frações, basta multiplicar numerador por
numerador e denominador por denominador.
o Para dividir frações, mantenha a primeira fração e inverta a
segunda passando a divisão para multiplicação.

Por fim, o conceito de porcentagem, onde devemos sempre verificá-la


como sendo uma razão (representada por uma fração) cujo denominador é 100.

49
AUTOATIVIDADE

Prezado acadêmico, chegou a hora de você testar seus conhecimentos sobre


os conteúdos de arredondamento, frações e porcentagens. Lápis e borracha
em mãos e boa atividade!

1 Em uma pesquisa sobre o tempo, em minutos, gasto por acadêmicos para


resolver um teste psicológico observou-se os dados listados abaixo. Para
padronizar a quantidade de casas após a vírgula dos resultados, faça
o arredondamento de cada um dos números abaixo para o décimo mais
próximo:

• 23,40 =
• 234,7832 =
• 45,09 =
• 48,85002 =
• 120,4500 =

A resposta que apresenta os arredondamentos de forma correta é:


a) ( ) 23,4 – 234,8 – 45,1 – 48,9 – 120,4
b) ( ) 23,4 – 234,8 – 45,0 – 48,9 – 120,5
c) ( ) 23,4 – 234,8 – 45,1 – 48,8 – 120,5
d) ( ) 23,4 – 234,8 – 45,1 – 48,8 – 120,4

2 Um profissional de Educação Física tem uma jornada semanal de trabalho


de 30 horas. Devido ao acúmulo de atendimento personalizado na semana
passada, ele precisou fazer 12 horas extras. A fração que corresponde a
quanto ele trabalhou a mais do que o previsto é:

a) ( ) 1/4.
b) ( ) 1/5.
c) ( ) 2/5.
d) ( ) 2/3.

3 Uma academia realizou compras de novas máquinas para uma de suas filiais
no valor de R$ 35.000,00, efetuando pagamento à vista e recebendo por isso
um desconto de 7% no valor da nota fiscal. Qual o valor do desconto que
recebeu esta empresa?
a) ( ) R$ 2.450,00
b) ( ) R$ 3.150,00
c) ( ) R$ 3.169,00
d) ( ) R$ 4.150,00

50
UNIDADE 1
TÓPICO 3

AGRUPAMENTO DE DADOS

1 INTRODUÇÃO
Uma das fases do método estatístico refere-se ao agrupamento de dados,
que trata de como organizar os dados de uma certa pesquisa e como realizar
algumas considerações a partir desta organização. A organização dos dados
é uma das formas mais primitivas de se ter um resultado com relação a uma
pesquisa.

Todo fenômeno apresenta diversas variações que devem ser analisadas


sob diversos aspectos, de modo que possamos compreendê-lo e agir sobre ele.
Desta forma, antes de tratarmos das formas de agrupamento de dados, este
tópico também apresentará os tipos de variáveis com as quais nos deparamos ao
estudar qualquer fenômeno e qual o melhor tratamento a ser dado.

2 VARIÁVEIS ESTATÍSTICAS
Variável estatística é o conjunto de resultados possíveis de um fenômeno
quando são feitas sucessivas medidas. São as características que podem ser
observadas (ou medidas) em cada elemento da população. Por exemplo, um
estudo de análise biomecânica do movimento humano durante a realização de
lançamento de dardos será realizado por um pesquisador, e o problema básico
que se coloca nesta pesquisa é definir quais variáveis irão participar do estudo.
Nesse caso, podemos definir as variáveis como: idade, altura, peso, cor dos cabelos,
renda familiar, sexo etc. Notem a importância de definir bem as variáveis, pois
é claro que a “cor do cabelo” não tem importância para a pesquisa em questão.

Na maior parte das vezes, a escolha do método de análise ou descrição


dos dados depende do tipo de variável (dados) considerada. Alguns conjuntos
de dados (como alturas, pesos) consistem em números, enquanto outros são
não numéricos (como sexo, cor do cabelo). Para distinguir esses dois tipos de
dados aplicam-se, respectivamente, as expressões dados quantitativos e dados
qualitativos.

Vamos entender melhor estes dois conceitos.

51
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

2.1 VARIÁVEIS QUALITATIVAS


Como o próprio nome sugere, estes dados representam objetos de estudo
em que a informação se refere a alguma qualidade, categoria, não se associando
a números, mas, sim, à classificação, por exemplo, o sexo de um indivíduo, que
pode ser classificado como masculino ou feminino.

Os dados qualitativos ainda podem ser subdivididos em:

Nominais: As opções de caracterização do objeto de estudo não possuem


ordem definida para que possam ser entendidas. Exemplo: Sexo (masculino,
feminino), raça, cor de pele (parda, branca, negra), evolução (morte ou
sobrevivência), cor dos olhos (castanho, azul, verde) etc.

Ordinais: As opções de caracterização do objeto de estudo necessitam


de uma ordem para classificação. Exemplo: Escolaridade (analfabeto, educação
infantil, ensino fundamental, ensino médio, universitário); classificação em um
campeonato (1o lugar, 2o lugar, 3o lugar); desempenho em uma prova (baixo,
moderado e alto) etc.

2.2 VARIÁVEIS QUANTITATIVAS


As variáveis quantitativas representam características que são identificadas
através de valores numéricos, ou seja, são aqueles que resultam de uma contagem
ou de uma mensuração e podem nos revelar qual é a intensidade da situação. Os
dados quantitativos podem ser subdivididos em:

Discretos: As variáveis quantitativas discretas são aquelas resultantes de


contagens e constituem um conjunto enumerável de valores, ou seja, é uma variável
que só pode assumir valores pertencentes ao conjunto dos números naturais
(resultado de uma contagem). Exemplo: O número de filhos (0,1,2,3...); o número
de alunos na turma (1,2,3...); o número de alunos de uma escola (500, 800, 110...);
produção de peças; faltas dos funcionários; livros de uma biblioteca etc.
Contínuos: As variáveis quantitativas contínuas resultam de uma
mensuração e podem assumir qualquer valor (inteiro, fração etc.). Exemplo: o
tempo; a temperatura; a estatura ou a massa de um indivíduo etc.

Na ilustração a seguir, apresentamos um resumo sobre os tipos de variáveis:

52
TÓPICO 3 | AGRUPAMENTO DE DADOS

FIGURA 6 - TIPOS DE VARIÁVEIS

FONTE: A autora

Acadêmico, observe ainda que uma mesma população pode originar


vários tipos de dados.

QUADRO 1 - COMPARAÇÕES ENTRE OS TIPOS DE VARIÁVEIS

Variável Variável Variável Variável


População quantitativa quantitativa qualitativa qualitativa
contínua discreta nominal ordinal

grau de
número de sexo, cor
idade, peso, escolaridade,
Estudantes irmão, número da pele,
alturas. desempenho
de faltas. descendência.
escolar.

número de grau de
velocidade, defeitos, ano luxuosidade,
cores, marca,
Automóveis massa, de fabricação, grau de
modelo.
aceleração. unidades satisfação do
fabricadas. cliente.

qualidade
número do produto,
preço
de ofertas, cor, caro ou classificação
Eletrodomésticos (R$), peso,
quantidades barato, marca. no selo de
potência.
vendidas, economia
procel.

FONTE: A autora
53
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

Agora que já estudamos a estrutura do método de pesquisa estatístico


e conhecemos os tipos de variáveis possíveis chegou o momento de aprender a
organizar esses dados de tal forma que facilite sua leitura e descrição.

3 AGRUPAMENTO DE DADOS
Caro acadêmico, você já deve ter observado que existem formas diferentes
de apresentar os dados de uma pesquisa. Em alguns momentos, os dados podem
aparecer como uma simples “lista”, ou estarem em uma tabela que apresenta
ou não uma distribuição de frequência. A seguir, apresentaremos cada uma das
possíveis formas de se apresentar os dados coletados em uma pesquisa.

ATENCAO

Fique atento à nomenclatura de cada forma de apresentar os dados, isto


é, aprenda a relacionar o nome da organização dos dados com sua forma visual. Isto é
fundamental para que acompanhes a próxima unidade deste material, visto que iremos
realizar inferências (cálculos) nestes dados e para cada forma de apresentação, o cálculo a
ser realizado é diferente.

3.1 DADOS BRUTOS


Já vimos que toda pesquisa envolve coleta de dados, seja na forma
quantitativa ou qualitativa, que devem ser organizadas, analisadas, criando
conclusões sobre uma determinada pesquisa. Quando estes dados são coletados
sem que haja qualquer tipo de organização, dizemos que os dados se apresentam
na forma bruta.

A forma bruta de dados é o primeiro contato que um pesquisador se


depara após a união de todos os dados registrados. É em cima destes dados que
serão feitas possíveis conclusões e verificações.

Exemplo: Ao realizar uma pesquisa em julho de 2016, com uma turma de


50 acadêmicos do Curso de Educação Física da Faculdade X, sobre o tempo (em
segundos) que levaram para cumprir uma prova de resistência. Os dados a seguir
demonstram o resultado bruto obtido:

61 65 43 53 55 51 58 55 59 56
52 53 62 49 68 51 50 67 62 64

54
TÓPICO 3 | AGRUPAMENTO DE DADOS

53 56 48 50 61 44 64 53 54 55
48 54 57 41 54 71 57 53 46 48
55 46 57 54 48 63 49 55 52 51

Como podemos notar, fazer qualquer tipo de observação em dados


apresentados desta forma é algo demorado e cansativo. Por isso, é importante
que os dados apresentados em uma pesquisa sejam organizados, pois existem
análises estatísticas que só poderão ser realizadas se os dados estiverem realmente
organizados, dando uma clareza visual para os resultados obtidos.

3.2 ROL
A organização de dados em ROL é a simples tarefa de colocar os dados
quantitativos em ordem crescente ou decrescente, podendo ser por meio de uma
tabela ou simplesmente um ao lado do outro. Esta simples forma de ordenação
dos dados já aumenta a capacidade de informação do comportamento dos dados.

Exemplo: Utilizando os dados anteriores e ordenando-os em ROL, temos:

41 43 44 46 46 48 48 48 48 49
49 50 50 51 51 51 52 52 53 53
53 53 53 54 54 54 54 55 55 55
55 55 56 56 57 57 57 58 59 61
61 62 62 63 64 64 65 67 68 71

ATENCAO

Para organizar os dados em uma planilha eletrônica, deve-se digitar os dados


apenas em uma coluna. Selecionar os dados e clicar em DADOS – CLASSIFICAR – CRESCENTE
– OK. Ou, simplesmente no ícone crescente que aparece na Barra de Menus.

Note que, neste exemplo, os dados foram alinhados de forma crescente.


Poderiam também estar na forma decrescente, mas foram organizados um ao
lado do outro. No entanto, poderíamos tê-los apresentados um embaixo do outro,
criando colunas de organização.
Quando a quantidade de dados coletados não for muito grande, a
organização em ROL é bastante útil. Por outro lado, para dados em quantidades

55
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

grandes, esta forma de organizar pode ser compreendida como ineficaz, pois
analisar um grande número de dados em ordem numa tabela acaba confundindo
em muitos casos a veracidade dos dados apresentados.

TUROS
ESTUDOS FU

Veremos nos próximos itens como proceder com este volume de dados, através
de agrupamentos simples ou por agrupamentos por faixa de valor. Estes agrupamentos
também são conhecidos como distribuição de frequência.

3.3 AGRUPAMENTO SIMPLES OU DISTRIBUIÇÃO DE


FREQUÊNCIA SEM INTERVALOS DE CLASSE
A distribuição de frequência sem intervalos de classe ou agrupamento
simples consiste em juntar os dados que possuem valores iguais e transformar este
aglomero de dados em uma tabela organizada por colunas (mais comum) ou linhas.
Este agrupamento deve ser realizado após os dados estarem organizados em ROL,
pois facilita a contagem.

Exemplo: Para colocar os dados do exemplo trabalhado anteriormente em


uma distribuição de frequência sem intervalo de classes, é necessário registrar a
quantidade de vezes que determinado tempo apareceu. Por exemplo, o tempo 41s
apareceu uma vez, o tempo 43s apareceu também uma vez, o tempo 44s apareceu
uma vez, o tempo 46s apareceu duas vezes e assim por diante. Após realizar este
registro, colocamos estas informações em uma tabela, conforme mostramos a seguir:

TABELA 4 - TEMPO QUE OS ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA FACULDADE


X LEVARAM PARA CUMPRIR A PROVA DE RESISTÊNCIA - JULHO - 2016

Tempo (em segundos) Número de acadêmicos


41 1
43 1
44 1
46 2
48 4
49 2
50 2
51 3

56
TÓPICO 3 | AGRUPAMENTO DE DADOS

52 2
53 5
54 4
55 5
56 2
57 3
58 1
59 1
61 2
62 2
63 1
64 2
65 1
67 1
68 1
71 1
Total 50
FONTE: A autora

Acadêmico, perceba como os 50 dados anteriores, listados um a um, foram


reduzidos e organizados de forma que nenhum dado foi perdido ou ocultado.

ATENCAO

Observe que usamos a mesma relação de dados que estamos usando desde o
início deste tópico. Iniciamos com os dados brutos, fizemos o ROL e agora a distribuição de
frequência sem intervalo de classes.

Podemos resumir que a distribuição de frequência sem intervalos de


classe é a simples condensação dos dados conforme as repetições de seus valores.
Porém, note que para esta situação razoável, esta distribuição de frequência
é inconveniente, já que exige muito espaço. Assim, podemos realizar um
agrupamento com intervalos de classes.

57
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

3.4 AGRUPAMENTO POR FAIXA DE VALOR OU DISTRIBUIÇÃO


DE FREQUÊNCIA COM INTERVALOS DE CLASSE
Há casos em que a quantidade de dados diferentes, apresentados em uma
pesquisa, é grande. Não havendo com isso, a possibilidade de agrupar muitos
valores, deixando assim a tabela extensa em quantidade de linhas, o que dificulta
a visualização das informações.

Os agrupamentos em classes são intervalos de valores que podem


representar um grupo de valores em uma única linha, com a proposta de diminuir
a quantidade de linhas de uma tabela. Para tal, devemos realizar algumas
observações e seguir alguns passos, os quais veremos agora.

Método prático para a construção de uma distribuição de frequência com


intervalos de classe:

1º Passo - Organize os dados brutos em um ROL.


2º Passo - Calcule a amplitude total da amostra (AA).

Amplitude total da amostra: é a diferença entre o valor máximo e o valor


mínimo da amostra (ROL). Onde AA = Xmax - Xmin.

3º Passo - Calcule o número de classes através da “Regra de Sturges”.

Classe: são os intervalos de variação dos dados. É simbolizada por i e o


número total de classes simbolizada por k.

Regra de Sturges: i = 1 + 3,3.log n


Onde: i = o número de classes da distribuição de frequência.
Log n = logaritmo do número de elementos envolvidos.

E
IMPORTANT

Acadêmico, você precisará de uma calculadora científica para determinar o


logaritmo de um número. Na calculadora, deve-se primeiro descobrir o log n,
depois multiplicar por 3,3 e, por último, somar 1.

Caro acadêmico, é importante que você tenha em mente que qualquer


regra para determinação do número de classes da tabela não nos leva a uma
decisão final. O número de classes vai depender de um julgamento pessoal,
que deve estar ligado à natureza dos dados, como, por exemplo, quando se está
trabalhando com notas de alunos (de zero a dez), a regra perde o seu verdadeiro

58
TÓPICO 3 | AGRUPAMENTO DE DADOS

objetivo, mesmo porque normalmente trabalha-se com amostras superiores a 100


elementos. Neste caso, aplicando a regra de Sturges para uma amostra de 1200
elementos encontrar-se-ia 11 classes, o que se torna inviável.

4º Passo - Decidido o número de classes, calcule então a amplitude do


intervalo de classe (h).

A amplitude do intervalo de classe é sempre o número arredondado para


cima, resultante da divisão entre a amplitude total da amostra (AA) e o número
de classes (i) encontrada no cálculo da Regra de Sturges.

ATENCAO

AA
O símbolo > significa maior que, ou seja, a desigualdade h > i . Significa que h
é maior que a razão entre AA (amplitude total da amostra) e i (número de classes).

5º Passo: Montar a tabela com as classes. Colocamos inicialmente o menor


valor da amostra na parte inferior da primeira classe e na parte superior ela
aumentada pela amplitude da classe seguimos este raciocínio para as demais
classes.

6º Passo: Contar as aparições. Finalizaremos a tabela com a distribuição


da frequência absoluta para cada classe. Basta contar o número de aparições em
cada intervalo, não se esquecendo que o intervalo à direita é aberto, ou seja, os
valores que apresentarem este dado devem pertencer à próxima classe.

Exemplo: Vamos seguir estes passos para a construção de uma tabela de


distribuição de frequência de classes com os dados já usados anteriormente.

1º Passo - Organize os dados brutos em um ROL.

Já temos essa etapa pronta:

59
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

41 43 44 46 46 48 48 48 48 49
49 50 50 51 51 51 52 52 53 53
53 53 53 54 54 54 54 55 55 55
55 55 56 56 57 57 57 58 59 61
61 62 62 63 64 64 65 67 68 71

2º Passo - Calcule a amplitude total da amostra (AA).

Vamos lembrar que a amplitude total da amostra é a diferença entre o


valor máximo e o valor mínimo da amostra (ROL).
AA = Xmax - Xmin.
Para este exemplo, o valor máximo é 71 e o valor mínimo é 41. Logo:
AA = 71 – 41
AA = 30w
Registre isso! Amplitude total é 30!

3º Passo - Calcule o número de classes através da "Regra de Sturges".

Regra de Sturges: i = 1 + 3,3.log n

Para o nosso exemplo, i é o número de classes da distribuição de frequência


que queremos descobrir e n é o número de dados da nossa amostra, ou seja, n =
50. Portanto:
i = 1 + 3,3 ∙ log 50
Em uma calculadora científica, você consegue determinar que log 50 =
1,6990 (valor arredondado).
i = 1 + 3,3 ∙ 1,6990 Lembre-se que em uma expressão
i = 1 + 5,6067 numérica devemos resolver primeiramente
a multiplicação e depois a adição.
i = 6,6067

Registre mais esta informação!

4º Passo - Decidido o número de classes, calcule então a amplitude do


intervalo de classe (h).

AA
h>
i
Substituindo os valores já determinados nesta fórmula, temos:

30
h>
6, 6067
h > 4, 5408
h = 5s

60
TÓPICO 3 | AGRUPAMENTO DE DADOS

E
IMPORTANT

A amplitude do intervalo deve ser arredondado (sempre para cima), levando-se


em consideração o número de casas após a vírgula dos dados brutos.

5º Passo - Montar a tabela com as classes. Colocamos inicialmente o


menor valor da amostra na parte inferior da primeira classe e na parte superior
ela aumentada pela amplitude da classe e seguir este raciocínio para as demais
classes. Observe o exemplo:

TEMPO QUE OS ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA FACULDADE X,


LEVARAM PARA CUMPRIR A PROVA DE RESISTÊNCIA - JULHO DE 2016

Tempo (em segundos)


41 ├ 46
46 ├ 51
51 ├ 56
56 ├ 61
61├ 66
66 ├ 71
71 ├ 76
Total
FONTE: Dados fictícios

Acadêmico, preste atenção nas observações a seguir:

• Este símbolo ├ indica um intervalo, note que ele é fechado à esquerda,


ou seja, inclui o número e aberto à direita, ou seja, exclui o número.
• O intervalo representado por 41 ├ 46 compreende os tempos de 41
segundos até antes de chegar aos 46 segundos, ou seja, quem fez 46 segundos não
irá contar neste intervalo e sim no próximo.
• Na terceira linha, onde temos o intervalo 51 ├ 56, há 19 acadêmicos que
realizaram a prova em 51, 52, 53 e 54 segundos.
• Se todos os dados fossem contemplados até o intervalo 66 ├ 71, não
haveria necessidade de ter mais uma classe.

61
UNIDADE 1 | CONCEITOS BÁSICOS DA ESTATÍSTICA

6º Passo - Contar as aparições. Finalizaremos a tabela com a distribuição


da frequência absoluta para cada classe. Basta contar o número de aparições em
cada intervalo, não se esquecendo que o intervalo à direita é aberto, ou seja, os
valores que apresentarem este valor devem pertencer à próxima classe.

TEMPO QUE OS ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA FACULDADE X,


LEVARAM PARA CUMPRIR A PROVA DE RESISTÊNCIA - JULHO DE 2016

Tempo (em segundos) Número de acadêmicos


41 ├ 46 3
46 ├ 51 10
51 ├ 56 19
56 ├ 61 7
61├ 66 8
66 ├ 71 2
71 ├ 76 1
Total 50

FONTE: Dados fictícios

E assim, finalizamos o agrupamento de dados em uma distribuição de


frequência com intervalos de classe.

Desta tabela, ainda podemos destacar alguns termos:

• Amplitude de cada classe: note que cada classe segue um padrão de


valor acrescentado para cada linha. No caso do nosso exemplo, podemos ver que
a amplitude é de 5 segundos por classe. Exemplo: 46 – 5 = 41.
• Amplitude da tabela: refere-se à diferença entre o menor e o maior valor
apresentado nas classes que estão dispostas no primeiro valor da primeira classe
e no último valor da sétima classe. Exemplo: 76 – 41 = 35, ou seja, a amplitude da
tabela é de 35 segundos.
• Limites de cada classe: o limite de cada classe se refere aos extremos
inferior e superior de cada linha. Para a classe 41 46, o limite inferior (Li) é 41 e o
limite superior (Ls) é 46. O símbolo indica que à esquerda o intervalo é fechado
e à esquerda é aberto. Isso significa que o valor de 46 não pertence a essa classe e
sim à segunda classe 46 51.
Ponto médio da classe: é o ponto que divide o intervalo de classe em duas
partes iguais. No exemplo anterior, em 41 ├ 46 o ponto médio xi = ,
ou seja, xi= Li + Ls .
2
Acadêmico, estes termos serão muito utilizados na próxima unidade,
na qual desenvolveremos cálculos a partir das organizações de dados que
aprendemos aqui.
62
RESUMO DO TÓPICO 3
Neste tópico, vimos que:

Acadêmico, neste tópico você estudou que as variáveis estatísticas podem


ser classificadas em qualitativas e quantitativas. As qualitativas ainda podem ser
nominais ou ordinais e as quantitativas podem ser discretas ou contínuas.

Estudou ainda, que podemos organizar os dados brutos de três formas:

- ROL: é a ordenação dos dados de forma crescente ou decrescente.


- Distribuição de frequência sem intervalo de classe: trata-se do
agrupamento simples dos dados que possuem valores iguais, transformando
este aglomero de dados em uma tabela organizada por colunas (mais comum)
ou linhas.
- Distribuição de frequência com intervalo de classe: trata-se do
agrupamento em classes, em que os intervalos de valores possibilitam representar
um grupo de valores em uma única linha, com a proposta de diminuir a quantidade
de linhas de uma tabela. Para realizar esse tipo de agrupamento, deve-se seguir
os passos a seguir:

1º Passo - organize os dados brutos em um ROL.


2º Passo - calcule a amplitude total da amostra (AA).

Em que AA = Xmax - Xmin.

3º Passo - calcule o número de classes através da “Regra de Sturges”.


Regra de Sturges: i = 1 + 3,3.log n
Em que: i = o número de classes da distribuição de frequência;
Log n = logaritmo do número de elementos envolvidos.
4º Passo - decidido o número de classes, calcule, então, a amplitude do intervalo
de classe (h).

5º Passo - elabore a tabela com as classes. Colocamos inicialmente o menor valor da


amostra na parte inferior da primeira classe e na parte superior ela aumentada
pela amplitude da classe, seguindo este raciocínio para as demais classes.
6º Passo - conte as aparições.

63
AUTOATIVIDADE

1 Nas aulas de Bioestatística em Educação Física estudamos que em uma


pesquisa estatística temos dois grupos de dados: os dados quantitativos e
os dados qualitativos. Responda qual das alternativas a seguir representa
um dado qualitativo:

a) ( ) O volume em mililitros dos xampus produzidos pela Empresa A.


b) ( ) O comprimento em centímetros de placas de aço produzidas por uma
máquina.
c) ( ) A altura em centímetros dos alunos de uma academia.
d) ( ) Grupo sanguíneo disponíveis no banco de sangue do hospital “Doação”.

2 Nas aulas de Bioestatística em Educação Física estudamos que em uma


pesquisa estatística, temos dois grupos de dados: os dados quantitativos e
os dados qualitativos. Responda qual das alternativas a seguir representa
um dado quantitativo:

a) ( ) O volume, em mililitros de sucos fabricados pela empresa A.


b) ( ) Qualidade das peças fabricadas pela máquina B.
c) ( ) Sexo (feminino ou masculino) dos nascituros da maternidade X.
d) ( ) Cor dos cabelos das modelos da agência Belle.

3 Uma das formas mais simples de organizar dados brutos é ordená-los


em Rol. Com relação a essa classificação, qual das alternativas a seguir
apresenta uma organização em Rol.

a) ( ) 3, 5, 12, 22, 18, 27, 33


b) ( ) 81, 67, 63, 57, 34, 21, 12
c) ( ) 9, 7, 3, 1, -5, -3, -1
d) ( ) - 1, 2, - 4, 5, 7, 9,12

4 Os dados a seguir apresentam o número de acertos de arremessos, realizados


por 20 estudantes, durante um treino de basquetebol, sendo que cada
estudante teve direito a 6 arremessos. Observe os dados e responda qual
das alternativas apresenta a quantidade de linhas de dados que uma tabela
com agrupamento simples de dados deve conter:

64
UNIDADE 2

MEDIDAS DE POSIÇÃO

OBJETIVOS DE APRENDIZAGEM
Esta unidade tem por objetivos:

• descrever e interpretar informações do campo da Educação Física sob o


aspecto estatístico;

• compreender os procedimentos técnicos e de cálculos essenciais ao


trabalho estatístico quanto aos dados biológicos;

• utilizar a linguagem bioestatística como instrumento de apoio na execução


de atividades do cotidiano;

• analisar, descrever, organizar e interpretar informações sobre o aspecto


bioestatístico para a tomada de decisões;

• criar tabelas e gráficos que auxiliem na tomada de decisões, partindo de


uma situação problema da Educação Física.

PLANO DE ESTUDOS
Esta unidade está dividida em três tópicos e em cada um deles você
encontrará atividades visando à compreensão dos conteúdos apresentados.

TÓPICO 1 - MEDIDAS DE TENDÊNCIA CENTRAL

TÓPICO 2 - MEDIDAS DE DISPERSÃO

TÓPICO 3 - SÉRIES E GRÁFICOS ESTATÍSTICOS

65
66
UNIDADE 2
TÓPICO 1

MEDIDAS DE TENDÊNCIA CENTRAL

1 INTRODUÇÃO
Na unidade anterior vimos que o estudo de distribuição de frequência
permite descrever os grupos dos valores dos dados de uma pesquisa. Desta
forma, podem ser localizados onde ocorrem em maior concentração de valores,
ou seja, se a concentração se localiza no início, no meio ou no final da distribuição,
ou ainda, se há uma distribuição normal.

Para ressaltar as tendências características de cada distribuição é


necessário introduzir conceitos que se expressem através de números, que
permitam traduzir estas tendências. Estes conceitos são denominados elementos
típicos das medidas de posição, assunto desta unidade. As medidas de posição
representam uma série de dados, orientando quanto à posição da distribuição
com relação ao centro. Dentre as várias medidas de posição, descreveremos neste
tópico as Medidas de Tendência Central.

As Medidas de Tendência Central são números que indicam o valor médio


de uma distribuição de frequência procurando reduzir todos os valores num só,
e de preferência, tomam como mais representativo aquele que esteja no centro da
distribuição. São três as medidas de posição:

• Média: medida de uniformização


• Mediana: medida de posição
• Moda: medida de concentração

Acadêmico, é importante você notar que cada grupo de dados está


devidamente estabelecido na dependência do que está sendo verificado e que,
desta forma, há três maneiras diferentes de calcular essas medidas, que dependem
de como os dados se encontram: dados não estão agrupados, dados agrupados
em distribuição de frequência sem intervalo de classe e dados agrupados em
distribuição de frequência com intervalo de classe.

67
UNIDADE 2 | MEDIDAS DE POSIÇÃO

2 MÉDIA ARITMÉTICA
É o elemento representativo da série mais usado, procura uniformizar os
dados em torno de um valor médio, por isto é também chamado de medida de
uniformização. Há várias situações em que a média aritmética deve ser utilizada,
dando como resultado um único valor que represente um “ajuste” de todos os
outros valores. Operacionalmente, a média ( ) é o quociente entre a soma de
todos os valores (Σfi) pelo número total dos dados (n).

UNI

A letra grega Σ (sigma) é usada na matemática, como símbolo de um somatório.

2.1 MÉDIA ARITMÉTICA PARA DADOS NÃO AGRUPADOS


Essa média é calculada a partir da soma de todos os valores, dividindo-
os pela quantidade de valores que foram somados. Podemos representar
matematicamente a média aritmética pela seguinte expressão:

Onde:

Vejamos exemplos que demonstram em quais situações a média aritmética


pode ser utilizada.

Exemplo 1: O café é uma das bebidas favoritas da população brasileira e


pesquisas sobre seus benefícios e malefícios não param de surgir. Um treinador
de futebol quer analisar a relação entre o consumo de café e a energia concentrada
nos treinos de seus jogadores. Para isso, foram anotados o consumo de café de
quatro dos seus jogadores. O primeiro consumiu em um dia 8 xícaras de café, o
segundo 7, o terceiro 4 e o quarto 5 xícaras. Qual a média de café consumido por
esses jogadores?

68
TÓPICO 1 | MEDIDAS DE TENDÊNCIA CENTRAL

FIGURA 7 - CAFÉ

FONTE: Disponível em: <http://crisarcangeli.com/users/jayknights/desktop/cris_arcangeli/wp-


content/uploads/2015/10/office-coffee.jpg>. Acesso em: 15 ago. 2016.

Resposta:
Os valores registrados pelo consumo de café nestes jogadores foram: 8, 7,
4 e 5. Com isso, a média é representada por:

O que implica que cada um dos quatro jogadores poderia tomar seis cafés
que o consumo seria o mesmo. Dizemos então que a média de consumo diário é
de seis cafés por jogador, mesmo observando que nenhum dos quatro jogadores
analisados tomou esta quantia.

Exemplo 2: Um professor de Educação Física verificou que as notas da


prova teórica sobre atletismo dos seis meninos da turma foram: 8,5; 5,0; 9,0; 3,5;
7,5 e 8,5. Com o intuito de verificar como foi o desempenho geral destes meninos,
o professor decidiu encontrar a média aritmética. Qual valor encontrou?

Resposta:
Somando os valores das notas e dividindo pelas seis notas somadas:

A média aritmética destas notas é 7.

Exemplo 3: Na Universidade em que Maria estuda, os professores utilizam


a média aritmética para calcular a média final obtida pelas notas parciais. A média
69
UNIDADE 2 | MEDIDAS DE POSIÇÃO

mínima para que o aluno seja aprovado é 7,0. Maria já tirou as seguintes notas na
disciplina de Bioestatística em Educação Física: 7,0; 4,5 e 8,0. Como a professora
desta disciplina deseja fazer mais uma prova, qual deverá ser a nota mínima que
Maria pode tirar para permanecer na média para não reprovar?

Resposta: Como sabemos que a média mínima exigida pela escola é 7,


podemos desenvolver a questão da seguinte forma, adotando com x a nota ainda
a ser feita:

Concluímos que a nota mínima que Maria pode tirar é 8,5 para que sua
média fique dentro das expectativas da Universidade.

A seguir, trataremos do cálculo da média aritmética em dados agrupados


em uma distribuição de frequência sem intervalo de classe.

2.2 MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM


DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE CLASSE
Para determinar a média aritmética em dados agrupados em uma
distribuição de frequência sem intervalo de classe, multiplicamos a variável
(dados) pela frequência (fi), depois somamos todos os produtos e dividimos o
resultado pela quantidade de dados, simbolicamente:

Onde:

70
TÓPICO 1 | MEDIDAS DE TENDÊNCIA CENTRAL

Vejamos os exemplos a seguir:

Exemplo 1: Na distribuição a seguir estão relacionadas as notas de


35 acadêmicos do 7º semestre do curso de Educação Física na disciplina de
Bioestatística em Educação Física.

TABELA 5 - NOTAS DOS ACADÊMICOS DO 7O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA NA


DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA - UNIASSELVI - 2016

Notas (xi) Número de Acadêmicos (fi)


3 3
4 6
5 9
6 8
7 6
8 3
Total 35

FONTE: A autora

Para ter uma visão geral do desempenho destes acadêmicos nesta


avaliação, a professora calculou a média aritmética.

Resolução: Iniciamos calculando na própria tabela o produto e


calculando seu somatório.

TABELA 6 - NOTAS DOS ACADÊMICOS DO 7O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA


NA DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA - UNIASSELVI - 2016
Número de Acadêmicos
Notas (xi) xi ∙ fi
(fi)
3 3 3∙3=9
4 6 4 ∙ 6 = 24
5 9 5 ∙ 9 = 45
6 8 6 ∙ 8 = 48
7 6 7 ∙ 6 = 42
8 3 8 ∙ 3 = 24
Total 35 192

FONTE: A autora

71
UNIDADE 2 | MEDIDAS DE POSIÇÃO

Feito isso, basta substituir as informações necessárias na fórmula:

Assim, a média da turma nesta avaliação, em uma escala de 0 até 10, foi
de 5,49.

Exemplo 2: O basquetebol é um esporte disputado por duas equipes de


cinco jogadores, em que sai vencedora aquela que, no decorrer dos 40 minutos de
jogo, somar o maior número de pontos encestando uma bola. O jogo é altamente
conhecido e disputado nos Estados Unidos e a NBA (Associação Nacional de
Basquetebol) é considerada uma das mais importantes ligas de basquetebol em
nível mundial, sendo que os seus jogadores são os que recebem os mais elevados
salários. A média de altura dos jogadores da NBA é de 2,05 metros. No Brasil,
nós temos vários atletas de expressão que deixaram suas marcas e que são
mundialmente conhecidos, como é o caso de Hortência, Paula, Janeth e Oscar
Schmidt.

Em uma escola de Basquetebol, em São Paulo, o treinador busca manter


uma média de altura de seus atletas de 1,95m. Sabendo que, atualmente, treinam
nesta escola 30 atletas, os quais as alturas estão relacionadas na tabela a seguir,
responda se a média de altura pleiteada por este treinador está sendo mantida.

FIGURA 8 - BASQUETEBOL

FONTE: Disponível em: <http://s2.glbimg.com/rk-oAeOVJco-wAq0kHw02UmlSryIv51uWPaheI1


TYY5XxJLLu7PC3ucFPd86vm44/s.glbimg.com/es/ge/f/original/2013/03/02/gui_enterrada.jpg>.
Acesso em: 15 ago. 2016.

72
TÓPICO 1 | MEDIDAS DE TENDÊNCIA CENTRAL

TABELA 7 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO


– 2016

Alturas (xi) Número de Atletas (fi)


1,90 4
1,93 7
1,95 3
1,96 2
1,98 9
2,03 5
Total 30
FONTE: A autora

Resolução: Assim como no exemplo anterior, iniciamos calculando na


própria tabela o produto e calculando seu somatório.

TABELA 8 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL - SÃO PAULO


- 2016

Alturas (xi) Número de Atletas (fi) xi ∙ fi


1,90 4 1,90 · 4 = 7,6
1,93 7 1,93 · 7 = 13,51
1,95 3 1,95 · 3 = 5,85
1,96 2 1,96 · 2 = 3,92
1,98 9 1,98 · 9 = 17,82
2,03 5 2,03 · 5 = 10,15
Total 30 58,85
FONTE: A autora

Agora, basta substituir as informações necessárias na fórmula:

73
UNIDADE 2 | MEDIDAS DE POSIÇÃO

Assim, a média das alturas dos atletas desta escola é de 1,96 cm. Portanto, sim,
o treinador mantém e supera a meta de ter uma média das alturas em 1,95 cm.

Antes de calcularmos a média para dados distribuídos em frequência de classe,


vamos aprender a “preparar” a nossa tabela de classes para que consigamos calcular,
além da média, a moda, a mediana, os quartis e, futuramente, o desvio padrão.

Para isso, usaremos uma tabela de exemplo, com poucas classes, uma vez que,
se aprendermos a fazer numa linha, basta repetir para todas as outras. A partir das
colunas iniciais, construídas conforme explicado na Unidade 1, temos que construir
outras colunas. Explicaremos cada coluna detalhadamente.

ATENCAO

A frequência das aparições que utilizamos das distribuições são chamadas de


frequência absoluta. É com ela que verificamos por quantas vezes algum evento aconteceu.

Além da frequência absoluta, também temos a frequência absoluta


acumulada, este tipo de frequência tem como interesse mostrar o número de
aparições até um certo ponto de uma tabela de dados. Com ela podemos fazer
outras comparações e observações que até eram possíveis antes, mas que com
a inclusão de uma outra coluna ficam bem mais visíveis. Esta coluna é formada
pela soma da frequência até cada linha de dados.

EXEMPLO: Tomaremos como modelo a tabela resultante do exemplo 2


do assunto anterior para realizarmos a inclusão da coluna da frequência absoluta
acumulada.

TABELA 9 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO -


2016

Alturas (xi) Número de Atletas (fi) Frequência Absoluta Acumulada (fa)


1,9 4 4
1,93 7 4 + 7 = 11
1,95 3 4 + 7 + 3 = 14
1,96 2 4 + 7 + 3 + 2 = 16
1,98 9 4 + 7 + 3 + 2 + 9 = 25
2,03 5 4 + 7 + 3 + 2 + 9 + 5 = 30
Total 30 -

FONTE: A autora
74
TÓPICO 1 | MEDIDAS DE TENDÊNCIA CENTRAL

Note que a nova coluna apresentada é constituída pela soma dos


valores da frequência absoluta até cada linha, sempre somando todos os valores
anteriores. Com a inclusão desta nova coluna é possível responder rapidamente
a perguntas do tipo: Quantas atletas medem até 1,96 m.? Observando na tabela,
imediatamente verificamos que são 16 atletas.
Além da frequência acumulada, em estatística também é interessante
representar estes dados por meio de porcentagem, que permite realizar
comparações e análises de forma mais objetiva. Os dados apresentados em forma
de porcentagem são denominados de frequência relativa. E para determinar esta
frequência, basta dividir o valor de cada frequência absoluta pelo total da própria
frequência absoluta multiplicada por 100, ou seja:

EXEMPLO: Ainda tomando como modelo a tabela do exemplo anterior,


vamos inserir uma coluna para os valores da frequência relativa.

TABELA 10 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO


- 2016

Alturas (xi) Número de Atletas (fi) Frequência Relativa (fr)


1,9 4 4/30 ∙ 100 = 13,33 %
1,93 7 7/30 ∙ 100 = 23,33 %
1,95 3 3/30 ∙ 100 = 10,00 %
1,96 2 2/30 ∙ 100 = 6,67 %
1,98 9 9/30 ∙ 100 = 30,00 %
2,03 5 5/30 ∙ 100 = 16,67 %
Total 30 100,00%

FONTE: A autora

Perceba que basta pegar individualmente os valores da frequência


absoluta, dividir pela soma (total) da frequência absoluta e multiplicar por 100
para cada linha, deixando os valores na forma de porcentagem. Com essa nova
visão, a inferência se torna mais clara. Deixando a tabela somente com os valores
e observe as duas análises a seguir da tabela:

75
UNIDADE 2 | MEDIDAS DE POSIÇÃO

TABELA 11 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO


- 2016

Alturas (xi) Número de Atletas (fi) Frequência Relativa (fr)


1,9 4 13,33%
1,93 7 23,33%
1,95 3 10,00%
1,96 2 6,67%
1,98 9 30,00%
2,03 5 16,67%
Total 30 100,00%

FONTE: A autora

Sobre estes dados, podemos concluir:

• O menor grupo de atletas desta escola são os que medem 1,96 m com
6,67% dos atletas.
• O maior grupo de atletas desta escola são os que medem 1,98 m com
30% do total de atletas.
• O grupo de atletas que medem 2,03 metros representa 16,67% dos atletas
desta escola.

Assim como na frequência absoluta acumulada, podemos também


proceder com a frequência relativa e fazer suas acumulações de cima para baixo.
Fazendo isso, neste exemplo, temos:

TABELA 12 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO

Número Frequência
Alturas
de Atletas Relativa Frequência Relativa Acumulada (fra)
(xi)
(fi) (fr)

1,9 4 13,33% 13,33%


1,93 7 23,33% 13,33 + 23,33 = 36,66%
1,95 3 10,00% 13,33 + 23,33+ 10,00 = 46,66%
1,96 2 6,67% 13,33 + 23,33+ 10,00 + 6,67 = 53,33%
1,98 9 30,00% 13,33 + 23,33+ 10,00 + 6,67 + 30,00 = 83,33%
2,03 5 16,67% 13,33 + 23,33+ 10,00 + 6,67 + 30,00 + 16,67 = 100,00%
Total 30 100,00%  

FONTE: A autora
76
Nesta tabela temos os valores diferentes da pesquisa, frequência absoluta
(fi), a frequência relativa (fr) e a frequência relativa acumulada (fra). Com as
informações desta última coluna, podemos identificar dados como:

• 53,33% dos atletas medem no máximo 1,96 m.


• 83,33% dos atletas representam os atletas da escola que medem até 1,98 m.

A seguir, trataremos do cálculo da média aritmética em dados agrupados


em uma distribuição de frequência com intervalo de classe.

2.3 MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM


DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE
CLASSE
Para dados agrupados em intervalos de classes usamos a fórmula a seguir
para encontrar a média:

Onde:

Vejamos os exemplos a seguir:

Exemplo 1: Na tabela de distribuição de frequência com intervalos de


classe, a seguir, estão relacionadas as estaturas de 100 acadêmicos do curso de
Educação Física da UNIASSELVI no ano de 2016.

77
TABELA 13 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO
FÍSICA DA UNIASSELVI - 2016

Estatura (cm) Número de Acadêmicos (fi)


140 Ⱶ 150 5
150 Ⱶ 160 10
160 Ⱶ 170 30
170 Ⱶ 180 40
180 Ⱶ 190 10
190 Ⱶ 200 5
Total 100

FONTE: A autora

Para calcularmos a média para dados distribuídos em frequência de classe,


vamos aprender a “preparar” a nossa tabela de classes para que consigamos
calcular não apenas a média, mas também a moda, a mediana, os quartis e mais
adiante o desvio padrão.

Inicialmente, vamos calcular o ponto médio do intervalo de classe xi (já


aprendemos a calcular na Unidade 1 desde caderno de estudos). Para isso, em
cada linha devemos subtrair o limite inferior do limite superior e dividir por dois.

Vejamos na tabela:

TABELA 14 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO


FÍSICA DA UNIASSELVI - 2016

Estatura (cm) Número de Acadêmicos (f) xi


140 Ⱶ 150 5 145 150-140
2
0 Ⱶ 160 10 155
160 Ⱶ 170 30 165
170 Ⱶ 180 40 175 180-170
2
180 Ⱶ 190 10 185
190 Ⱶ 200 5 195
Total 100  

FONTE: A autora
78
Calculados os pontos médios (xi), devemos multiplicá-los pela frequência
absoluta (fi) de cada classe, conforme apresentamos na tabela a seguir:

TABELA 15 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO


FÍSICA DA UNIASSELVI – 2016

Estatura (cm) Número de Acadêmicos (fi) xi xi ∙ fi


140 Ⱶ 150 5 145 145 ∙ 5 = 725
150 Ⱶ 160 10 155 155 ∙ 10 = 1550
160 Ⱶ 170 30 165 165 ∙ 30 = 4950
170 Ⱶ 180 40 175 175 ∙ 40 = 7000
180 Ⱶ 190 10 185 185 ∙ 10 = 1850
190 Ⱶ 200 5 195 195 ∙ 5 = 975
Total 100   17 050 • Somatório de
todos os xi∙fi
FONTE: A autora

Com estas informações, é possível calcularmos a média das estaturas dos


100 acadêmicos do curso de Educação Física da Uniasselvi no ano de 2016.

Substituindo na fórmula,

Assim, a média dos acadêmicos do curso de Educação Física da


UNIASSELVI no ano de 2016 é de 170,5 centímetros.

79
ATENCAO

Acadêmico, veja algumas características da média quanto à importância,


vantagens e desvantagens:

• a média de um conjunto de números pode sempre ser calculada;


• para um dado conjunto de números a média é única;
• a média de uma constante sempre é uma constante;
• é descritiva de todos os dados de uma série e de fácil compreensão;
• é facilmente calculável;
• depende de cada valor da série e qualquer alteração de um deles altera seu valor;
• é influenciada por valores excepcionais, podendo em alguns casos não representar a série;
• é das medidas de tendência central de maior emprego;
• é usada para operações estatísticas mais avançadas, como testes para tomada de decisão.

3 MODA
É o elemento representativo da série que indica a concentração. É o valor
que ocorre com maior frequência, é o que mais aparece. Às vezes, num conjunto de
dados podemos ou não ter moda. Não existindo moda ele será amodal; havendo
mais de uma moda ele será multimodal – bimodal para duas modas; trimodal
para três modas.

Assim como no estudo da média, vamos separar o estudo do cálculo da


moda nas três apresentações dos dados vistos:

E
IMPORTANT

A moda é representada pelo símbolo Mo.

3.1 DADOS NÃO AGRUPADOS


Basta colocar os valores no ROL e depois verificar qual valor que ocorreu
com maior frequência. Esse valor será a moda da distribuição.
Ex.: a) 2, 4, 5, 5, 6, 7. Mo = 5
b) 5, 6, 7, 8, 9. Mo = Não existente. Classe amodal.
c) 3, 4, 4, 5, 5, 6, 7, 8, 9. Mo = 4 e 5. Classe bimodal.

80
3.2 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA
SEM INTERVALO DE CLASSES
A moda será o valor com maior frequência, ou seja, basta olhar a linha em
que o fi é maior, veja a tabela a seguir como exemplo.

TABELA 16 - NOTAS DOS ACADÊMICOS DO 7O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA


NA DISCIPLINA DE BIOESTATÍSTICA – UNIASSELVI - 2016

Notas Número de Acadêmicos (fi)


3 3
4 6
5 9
6 8
7 6
8 3
Total 35

FONTE: A autora

Como podemos observar, a terceira linha é portadora do maior fi, desta


forma, a nota modal nesta turma foi 5. Representamos por: Mo = 5.

3.3 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA


COM INTERVALO DE CLASSES
Quando os dados estiverem agrupados em uma distribuição de frequência
com intervalos de classe, devemos inicialmente encontrar a classe modal (classe
de maior fi) e depois calcular a moda pelo seguinte modelo matemático:

Onde:
d1 = diferença entre a frequência da classe modal e a anterior;
d 2 = diferença entre a frequência da classe modal e a posterior.
 i = limite inferior da classe modal.
hi = amplitude da classe modal. (ls – li)
81
Vejamos como calcular a moda para o exemplo já utilizado no cálculo da
média para esse mesmo tipo de dados.

Exemplo: Na tabela de distribuição de frequência com intervalos de classe,


a seguir, estão relacionadas as estaturas de 100 acadêmicos do curso de Educação
Física da UNIASSELVI no ano de 2016.

TABELA 17 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO


FÍSICA DA UNIASSELVI - 2016

Estatura (cm) Número de Acadêmicos (fi)


140 Ⱶ 150 5
150 Ⱶ 160 10
160 Ⱶ 170 30
170 Ⱶ 180 40
180 Ⱶ 190 10
190 Ⱶ 200 5
Total 100

FONTE: A autora

Para calcular a moda em um conjunto de dados agrupados em intervalos


de classes, devemos observar os seguintes passos:

1º Passo: Identificar a classe onde a Moda se encontra (Classe Modal), ou


seja, vamos destacar a linha onde temos o maior fi.

TABELA 18 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO


FÍSICA DA UNIASSELVI - 2016

Estatura (cm) Número de Acadêmicos (fi)


140 Ⱶ 150 5
150 Ⱶ 160 10
160 Ⱶ 170 30
170 Ⱶ 180 40
180 Ⱶ 190 10
190 Ⱶ 200 5
Total 100

FONTE: A autora

82
Neste exemplo, a classe modal é a quarta classe (i4) da distribuição, pois é
ali que se encontra a maior frequência, que é 40.

2º Passo: Definida a classe modal, vamos aplicar a fórmula para o cálculo


da moda:

Sendo: d1 = maior fi menos fi anterior; (f4 – f3 = 40 – 30 = 10)


d2 = maior fi menos fi posterior. (f4 – f5 = 40 – 10 = 30)

UNI

Não se esqueça do que significa li (limite inferior da classe) e hi (amplitude da


classe). Caso não lembre, retorne ao estudo nos tópicos anteriores.

Neste exemplo, li = 170 e hi = ls – li = 180 – 170 = 10. Substituindo na fórmula,


temos:

Desta forma, a altura modal para este grupo de acadêmicos é de 172,5


centímetros e representamos por, Mo = 172,5 cm.

E
IMPORTANT

Veja algumas observações sobre a moda:

• é a menos útil para problemas estatísticos, porque se presta à análise matemática;


• a utilidade da moda se acentua quando um ou dois valores ocorrem aproximadamente
com a mesma frequência;
• a moda nada acrescenta em termos de descrição dos dados.

83
4 MEDIANA
A mediana é o elemento de tendência central que, estando os dados em
ordem crescente, indica o valor médio ou a média dos valores centrais, por isto é
chamada de medida de posição. Divide a série em duas partes iguais.

Novamente, iremos apresentar como determinar essa medida, para os três


tipos de apresentação de dados.

4.1 DADOS NÃO AGRUPADOS


Quando todas as observações estão ordenadas em rol, a mediana é o valor
da observação central. A mediana não é calculada como a média, ao invés disso,
para determinar a mediana, calculamos a sua posição, o valor que estiver naquela
posição será a mediana.

Em dados não agrupados, determinamos a posição da mediana, através

do cálculo: , sendo n o número de dados da distribuição.

Vejamos alguns exemplos:

Exemplo 1: Qual a mediana dos dados a seguir?

4 7 8

Acadêmico, sabemos que a mediana é o termo que se encontra no centro da


distribuição e, nesse caso, podemos intuitivamente afirmar que a mediana é 7.

Ainda, podemos verificar o valor da mediana, usando a fórmula:


primeiramente calculamos a posição da mediana usando . Como temos três
dados, então n = 3. Assim A mediana é o dado da 2ª posição, logo Md = 7.

E
IMPORTANT

Quando o número de dados é par, a posição será um valor “quebrado”; com


isso, a mediana é a média dos dois dados centrais.

Exemplo 2: Qual a mediana dos dados a seguir?

3 5 9 16

84
Intuitivamente percebemos que não há um valor no centro da distribuição,
e sim dois valores (5 e 9). A mediana será, então, a média desses valores:

Usando a fórmula, temos quatro dados, então n = 4. Assim,


que representa a posição entre o 2º e o 3º dado, que não existe. Nesse caso,
calculamos a média entre o 2º (5) e o 3º (9), que é 7.

Exemplo 3: A seguir estão dispostos em ROL os salários, em reais, de 50


profissionais habilitados em Educação Física, referentes a uma carga horária de
20h, no mês de julho de 2016, no Estado de Santa Catarina.

578,90 885,85 1000,00 1234,32 1785,3


595,45 899,76 1000,76 1280,70 1798,24
671,45 900,00 1009,65 1290,12 1865,43
678,12 904,90 1010,43 1345,54 1900,00
683,92 908,99 1029,12 1383,90 1900,43
777,23 920,98 1055,90 1408,30 1920,01
786,43 965,00 1080,67 1600,00 2000,00
800,00 976,45 1100,00 1654,25 2043,89
850,80 980,12 1100,45 1670,98 2080,00
880,76 990,54 1100,99 1782,39 2109,88

Para determinar o salário mediano, devemos seguir os passos:

1º Passo: Calcular a posição da mediana:

2º Passo: Determinar o valor da mediana:

Como a posição 25,5 não existe, temos que pegar os valores da posição 25
e da posição 26, depois disso fazer a média entre os dois valores (sempre que o
número de dados n for par acontecerá isso).

Posição 25: Posição 26:

85
Mediana será a média dos dois valores encontrados, ou seja,
Portanto, o salário mediano é de R$ 1.042,51.

ATENCAO

Para determinar os valores das posições calculadas, colocamos os valores em


ROL, e contamos até a posição desejada. Volte na tabela acima e conte, na ordem em que os
dados crescem, até a posição 25 e 26 e perceba que são os valores 1029,12 e 1055,90.
Se o número de dados n for ímpar, o cálculo da posição dará um número inteiro, com isso
bastará encontrar o valor no ROL que está na posição calculada. Como teremos apenas um
valor, esse valor será a mediana.

4.2 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA


SEM INTERVALO DE CLASSES
Para dados agrupados em distribuição de frequência sem intervalo
de classes ou em frequência simples, também iremos determinar a mediana
calculando sua posição. Vejamos o exemplo, já trabalhado anteriormente:

Exemplo: Na distribuição a seguir estão relacionadas as notas de


35 acadêmicos do 7º semestre do curso de Educação Física na disciplina de
Bioestatística em Educação Física.

TABELA 19 - NOTAS DOS ACADÊMICOS DO 7O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA


NA DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA – UNIASSELVI – 2016

Notas (xi) Número de Acadêmicos (fi)


3 3
4 6
5 9
6 8
7 6
8 3
Total 35

FONTE: A autora

86
Para determinar a mediana, novamente devemos seguir os passos:

1º passo: Cálculo da posição:

Logo, queremos o valor da posição 18, ou, em outras palavras, o valor x18.

2º passo: Determinar o valor da mediana. Para isso, temos que olhar a


coluna da frequência acumulada (Fa), e encontrar a linha do primeiro valor igual
ou maior que a posição calculada, que no nosso caso é 18.

TABELA 20 - NOTAS DOS ACADÊMICOS DO 7O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA


NA DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA - UNIASSELVI

Notas (xi) Número de Acadêmicos (fi) Frequência Acumulada (Fa)

3 3 3
4 6 9
5 9 18
6 8 26
7 6 32
8 3 35

Total 35

FONTE: A autora

Na tabela, a terceira linha nos apresenta na coluna Fa o valor da posição


18. Logo, o valor da mediana é 5, porque é o xi da linha 3, ou seja, Md = 5.

ATENCAO

Se o número de dados n for par, acontecerá novamente uma posição


intermediária. Se essa posição ficar entre duas linhas, tira-se a média entre os dois valores das
respectivas linhas, caso contrário, a mediana será o valor da linha, como no caso de n ímpar
mostrado acima.

87
4.3 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA
COM INTERVALO DE CLASSES
Para calcular a mediana em dados agrupados em distribuição de frequência
com intervalo de classes, iremos retomar o exemplo já trabalhado anteriormente
e, assim como fizemos para as demais maneiras de apresentação de dados, vamos
seguir alguns passos.

Exemplo: Na tabela de distribuição de frequência com intervalos de classe


a seguir, estão relacionadas as estaturas de 100 acadêmicos do curso de Educação
Física da Uniasselvi no ano de 2016.

TABELA 21 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO


FÍSICA DA UNIASSELVI - 2016

Estatura (cm) Número de Acadêmicos (fi)


140 Ⱶ 150 5
150 Ⱶ 160 10
160 Ⱶ 170 30
170 Ⱶ 180 40
180 Ⱶ 190 10
190 Ⱶ 200 5
Total 100

FONTE: A autora

1º Passo: Continua sendo determinar a posição em que a mediana se


encontra, igual aos casos anteriores.

Posição:
2º Passo: Determinar a classe da mediana, que nada mais é que a linha em
que a posição calculada (no caso 50,5) se encontra. Novamente, para determinar
essa linha (classe), basta olhar a coluna da frequência acumulada (Fa). O primeiro
valor dessa coluna Fa igual ou maior que a posição calculada indicará a classe da
mediana. Assim, vamos preparar a tabela com os valores de xi e Fa.

88
TABELA 22 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO
FÍSICA DA UNIASSELVI - 2016

Número de
Estatura (cm) xi Fa
Acadêmicos (fi)

140 Ⱶ 150 5 145 5


150 Ⱶ 160 10 155 15
160 Ⱶ 170 30 165 45
170 Ⱶ 180 40 175 85 Classe da
180 Ⱶ 190 10 185 95 Mediana

Total 100    

FONTE: A autora

Neste exemplo, o primeiro valor igual ou maior que 50,5 é o 85, que está
na 4ª classe (linha 4), ou seja, a classe da mediana será 170 ├ 180.

3º Passo: Calcular a mediana usando a fórmula a seguir:

Onde:
= limite inferior da classe da mediana.
= frequência acumulada da classe anterior à da mediana.
= frequência da classe mediana.
= amplitude da classe modal.

Neste exemplo, temos:

89
Substituindo na fórmula, temos:

ATENCAO

Algumas observações sobre a Mediana:

• é menos sensível a valores extremos do que a média;


• é difícil de determinar para grande quantidade de dados;
• é mais adequada para distribuição muito assimétrica.

90
RESUMO DO TÓPICO 1
Neste tópico, você estudou as Medidas de Tendência Central, e vimos
que estes números indicam o valor médio de uma distribuição de frequência,
procurando reduzir todos os valores num só, e de preferência, tomam como mais
representativo aquele que esteja no centro da distribuição. São três as medidas de
posição:

• Média: medida de uniformização.


• Mediana: medida de posição.
• Moda: medida de concentração.

Já vimos também que os dados podem estar apresentados de três


formas: dados não agrupados, dados agrupados em distribuição de frequência
sem intervalo de classes e dados agrupados em distribuição de frequência com
intervalo de classes. E, para cada maneira de apresentar os dados de uma pesquisa,
existe uma maneira para se calcular a média, moda e mediana.

• Dados não agrupados

Média:

Moda: basta colocar os valores no ROL e depois verificar qual valor que
ocorreu com maior frequência.

Mediana: em dados não agrupados, determinamos a posição da mediana,


através do cálculo: , sendo n o número de dados da distribuição.

• Dados Agrupados em Distribuição de Frequência sem Intervalo de


Classe

Média:

Moda: basta olhar a linha em que o fi é maior, o xi correspondente será o


valor da moda.

Mediana: determinamos a posição da mediana através do cálculo:


, buscamos o valor encontrado na coluna da frequência acumulada
(Fa) e localizamos o respectivo xi, este será o valor da mediana.
• Dados Agrupados em Distribuição de Frequência com Intervalo de
Classe

91
Média:

Moda:

Mediana: após determinar a posição da mediana, aplicar a fórmula a


seguir:

92
AUTOATIVIDADE

Prezado acadêmico, chegou a hora de você testar seus conhecimentos sobre


as medidas de tendência central. Lápis e borracha em mãos e boa atividade!

1 A energia hidráulica ou energia hídrica é a energia obtida a partir da energia


potencial  de uma massa de  água. A forma na qual ela se manifesta na
natureza é nos fluxos de água, como rios e lagos, e pode ser aproveitada por
meio de um desnível ou queda d’água.  Considere os maiores consumidores
de energia hidráulica no quadro a seguir:

Maiores consumidores de energia hidráulica (em milhões de toneladas


de equivalentes de petróleo)

País Consumo em 2006


China 94,3
Canadá 79,3
Brasil 79,2
Estados Unidos 65,9
Rússia 39,6
Noruega 27,1
Índia 25,4
Japão 21,5
Outros 255,8
Total 688,1

FONTE: Disponível em: <http://bit.ly/2WPAuii>. Acesso em: 19 ago. 2016.

Observando estes dados, responda: qual a frequência relativa do consumo no


Brasil?

a) Aproximadamente 0,37.
b) Aproximadamente 0, 20.
c) Aproximadamente 0,40.
d) Aproximadamente 0,12.

93
2 Considere a seguinte distribuição das frequências absolutas dos salários
mensais, em R$, referentes a 200 trabalhadores de uma indústria de Santa
Catarina em julho de 2016.

Classes de salários (R$) Número de funcionários (fi)


400|— 500 50
500|— 600 70
600 |— 700 40
700 |— 800 30
800 |— 900 10

 fi 
Fonte: Dados fictícios

Sobre essa distribuição de salários, é correto afirmar que:

a) O salário mediano encontra-se na classe de R$ 600 até R$ 700.


b) O salário modal encontra-se na classe de R$ 600 até R$ 700.
c) O salário modal encontra-se na classe de R$ 700 até R$ 800.
d) O salário mediano encontra-se na classe de R$ 500 até R$ 600.

94
UNIDADE 2 TÓPICO 2

MEDIDAS DE DISPERSÃO

1 INTRODUÇÃO
No capítulo anterior vimos algumas medidas de localização do centro
de uma distribuição de dados, ou seja, as medidas de posição: média, moda e
mediana. Porém, estas medidas descrevem apenas uma das características dos
valores numéricos de um conjunto de observações, o da tendência central. O que,
às vezes, é insuficiente para representar fidedignamente os dados analisados.

Um exemplo disso é que grupos diferentes de dados observados podem


apresentar a mesma média, como no caso a seguir:

• Grupo 1: 5, 5, 5.
• Grupo 2: 4, 5, 6.
• Grupo 3: 0, 5, 10.
• Grupo 4: 3, 4, 8.

Acadêmico, observe que nos quatro grupos a média é a mesma (5), porém
no grupo 1 não há variação entre os dados, enquanto no grupo 2 a variação é
menor que no grupo 3 e no grupo 4.

Dessa forma, podemos observar que em qualquer grupo de dados os


valores numéricos não são semelhantes e apresentam desvios variáveis com
relação à tendência geral de média. Uma maneira mais completa de analisar os
dados é aplicar uma medida de dispersão, também conhecidas como medidas de
variabilidade, indicam se os valores estão relativamente próximos uns dos outros.
As principais medidas de dispersão são: amplitude, desvio padrão e variância.

Neste tópico, aprenderemos a determinar as medidas de dispersão e


interpretar seus resultados.

95
UNIDADE 2 | MEDIDAS DE POSIÇÃO

2 AMPLITUDE TOTAL
Já definimos este conceito na Unidade 1 deste caderno de estudos e é a
única medida de dispersão que não tem na média o ponto de referência. Vamos
recordar que a amplitude total representa a diferença entre o maior e o menor
valor de um conjunto de dados, ou seja, é a diferença entre o limite superior da
última classe e o limite inferior da primeira classe. Então:

AT = Li máximo – Li mínimo = Lmax – Lmin

Exemplo: Para os valores: 40, 45, 48, 62 e 70, a amplitude total será:

AT = 70 - 40 = 30

A amplitude total tem a característica de só levar em conta os dois valores


extremos da série, descuidando do conjunto de valores intermediários. Seu cálculo é
oportuno para identificar se os dados estão afastados ou não. Se a amplitude for um
número elevado, então os valores da série estão distribuídos afastados, e se a amplitude
for um número baixo, então, os valores na série estão próximos uns dos outros.

3 DESVIO PADRÃO
O desvio padrão é uma medida de dispersão que indica a regularidade
de um conjunto de dados em função da média aritmética, ou seja, nos informa
o quão “confiável” é esse valor. O desvio padrão é uma medida que só pode
assumir valores não negativos, e quanto maior for, maior será a dispersão e a
variabilidade dos dados.

Desta forma, quanto menor for o desvio padrão com relação à média,
maior a homogeneidade da distribuição, ou seja, mais agrupados os dados
estarão em torno da média. Se o desvio padrão for grande, indica que os dados
da distribuição estão muito dispersos, ou seja, estão longe da média.

Existem dois tipos de desvio padrão, o amostral e o populacional, os quais


trataremos a seguir.

3.1 DESVIO PADRÃO AMOSTRAL E DESVIO PADRÃO


POPULACIONAL
Na Unidade 1 deste caderno de estudos tratamos a diferença entre
população e amostra. E, na maioria das vezes, trabalhamos com amostras. Com
isso, é mais comum utilizarmos o desvio padrão amostral, que é representado por S.
No entanto, há também o desvio padrão populacional, representado por σ (sigma).

A seguir, veremos qual a diferença no cálculo de cada um deles.


96
TÓPICO 2 | MEDIDAS DE DISPERSÃO

3.2 CÁLCULO DO DESVIO PADRÃO


Assim como nos cálculos das medidas de tendência central, as quais
estudamos no tópico anterior, o desvio padrão também deve ser calculado
observando-se o tipo de dados que temos. Assim, trataremos cada um deles,
iniciando pelos dados não agrupados.

3.2.1 Dados não agrupados


Para calcular o desvio padrão em dados não agrupados, devemos observar
os seguintes passos:

1º passo: Calcular a média dos elementos.

2º passo: Calcular a diferença entre cada elemento e a média.

(x−x )

3º passo: Elevar essas diferenças à segunda potência.

x  x
2

4º passo: Somar todos os resultados obtidos no passo 3.

5º passo: Dividir a soma por n (se for populacional) ou dividir por n-1 (se
for amostral).

ATENCAO

A diferença no cálculo dos dois desvios padrões (populacional e amostral) é


o denominador (o divisor), enquanto que na populacional dividimos pelo número total de
elementos n, no amostral dividimos por n-1. A seguir, veremos exemplos de cálculos dos dois
tipos, para que não fiquem dúvidas.

6º passo: Calcular a raiz quadrada do resultado da divisão obtida no passo 5.

Acompanhe o exemplo:

Exemplo: Um professor de Educação Física verificou que as notas da


prova teórica sobre atletismo dos seis meninos da turma foram: 8,5; 5,0; 9,0; 3,5;
7,5 e 8,5. Com o intuito de verificar como foi o desempenho geral destes meninos,
o professor decidiu encontrar a média aritmética e seu respectivo desvio padrão.
97
UNIDADE 2 | MEDIDAS DE POSIÇÃO

1º passo: Média

2º passo: Fazer cada elemento menos a média ( )

Nota (x) Nota menos a média ( x − x )


8,5 8,5 – 7,0 = 1,5
5,0 5,0 – 7,0 = - 2,0
9,0 9,0 – 7,0 = 2,0
3,5 3,5 – 7,0 = - 3,5
7,5 7,5 – 7,0 = 0,5
8,5 8,5 – 7,0 = 1,5

3º passo: Elevar cada resultado acima à segunda potência.

x  x
2
Nota (x) (x−x )
8,5 8,5 – 7,0 = 1,5 (1,5)2 = 2,25
5,0 5,0 – 7,0 = - 2,0 (- 2,0)2 = 4,00
9,0 9,0 – 7,0 = 2,0 (2,0)2 = 4,00
3,5 3,5 – 7,0 = - 3,5 (- 3,5)2 = 12,25
7,5 7,5 – 7,0 = 0,5 (0,5)2 = 0,25
8,5 8,5 – 7,0 = 1,5 (1,5)2 = 2,25

4º passo: Somar os resultados do passo 3.

x  x
2
Nota (x) (x−x )
8,5 8,5 – 7,0 = 1,5 (1,5)2 = 2,25
5,0 5,0 – 7,0 = - 2,0 (- 2,0)2 = 4,00
9,0 9,0 – 7,0 = 2,0 (2,0)2 = 4,00
3,5 3,5 – 7,0 = - 3,5 (- 3,5)2 = 12,25
7,5 7,5 – 7,0 = 0,5 (0,5)2 = 0,25
8,5 8,5 – 7,0 = 1,5 (1,5)2 = 2,25
Total - 25

98
TÓPICO 2 | MEDIDAS DE DISPERSÃO

5º passo: Dividir o resultado da soma do passo 4 por n ou por n-1


(dependendo se é populacional ( σ )2 ou amostral (S).

E
IMPORTANT

Acadêmico! Nesse passo acabamos de calcular a variância amostral S² e a


populacional σ². Sobre a variância, é válido saber:

• num conjunto de dados, a variância é uma medida de dispersão que mostra o quão distante
cada valor desse conjunto está do valor central (médio);
• quanto menor é a variância, mais próximos os valores estão da média, No entanto, quanto
maior ela é, mais os valores estão distantes da média.

6º passo: Extrair a raiz quadrada dos resultados do passo 5.

Para este caso, o desvio padrão é o populacional, pois analisamos os dados


de todo o grupo selecionado (meninos da turma X). Note que a média foi 7,0 e o
desvio padrão ficou em 2,04, o que indica que há dados distantes desta média, e
voltando para os dados brutos, realmente confirmamos isso, visto que há menino
com nota 9,0 e menino com nota 3,5.

3.2.2 Dados agrupados em distribuição de frequência


sem intervalo de classes
Para este agrupamento de dados, iremos repetir os mesmos passos para
determinar o desvio padrão com frequência simples. Vamos retomar a tabela já
utilizada para outros cálculos.

99
UNIDADE 2 | MEDIDAS DE POSIÇÃO

TABELA 23 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL - SÃO PAULO


– 2016

Alturas (xi) Número de Atletas (fi)


1,90 4
1,93 7
1,95 3
1,96 2
1,98 9
2,03 5
Total 30

FONTE: A autora

Vamos calcular o desvio padrão amostral e populacional.

1º passo: Calcular a média.

TABELA 24 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO


- 2016

Alturas (xi) Número de Atletas (fi) xi ∙ fi


1,90 4 1,90 · 4 = 7,6
1,93 7 1,93 · 7 = 13,51
1,95 3 1,95 · 3 = 5,85
1,96 2 1,96 · 2 = 3,92
1,98 9 1,98 · 9 = 17,82
2,03 5 2,03 · 5 = 10,15
Total 30 58,85

FONTE: A autora

100
TÓPICO 2 | MEDIDAS DE DISPERSÃO

Assim, a média das alturas dos atletas desta escola é de 1,96 cm.

2º passo: Subtrair a média dos valores x  xi  x  .

TABELA 25 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO


- 2016

Alturas (xi) Número de Atletas (fi) xi ∙ fi  xi  x 


1,90 4 1,90 · 4 = 7,6 1,90 - 1,96 = - 0,06
1,93 7 1,93 · 7 = 13,51 1,93 - 1,96 = - 0,03
1,95 3 1,95 · 3 = 5,85 1,95 - 1,96 = - 0,01
1,96 2 1,96 · 2 = 3,92 1,96 - 1,96 = 0
1,98 9 1,98 · 9 = 17,82 1,98 - 1,96 = 0,02
2,03 5 2,03 · 5 = 10,15 2,03 - 1,96 = 0,07
Total 30 58,85  

FONTE: A autora

3º passo: Elevar os resultados de  xi  x  a segunda potência.

TABELA 26 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO


- 2016

Alturas (xi) Número de Atletas (fi) xi ∙ fi  xi  x   xi  x 


2

1,90 4 1,90 · 4 = 7,6 1,90 - 1,96 = - 0,06 (-0,06)2 = 0,0036

1,93 7 1,93 · 7 = 13,51 1,93 - 1,96 = - 0,03 (-0,03)2 = 0,0009

1,95 3 1,95 · 3 = 5,85 1,95 - 1,96 = - 0,01 (-0,01)2 = 0,0001

1,96 2 1,96 · 2 = 3,92 1,96 - 1,96 = 0 02 = 0

1,98 9 1,98 · 9 = 17,82 1,98 - 1,96 = 0,02 (0,02)2 = 0,0004

2,03 5 2,03 · 5 = 10,15 2,03 - 1,96 = 0,07 (0,07)2 = 0,0049

Total 30 58,85    

FONTE: A autora

4º passo: Multiplicar cada resultado do passo anterior pela frequência da


classe e somar os resultados.

101
UNIDADE 2 | MEDIDAS DE POSIÇÃO

TABELA 27 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO


- 2016
Alturas
(xi)
Número de
Atletas (fi)
xi ∙ fi  xi  x   xi  x 
2
 xi  x 
2
. fi
1,90 4 1,90 · 4 = 7,6 1,90 - 1,96 = - 0,06 (-0,06)2 = 0,0036 0,0036 · 4 = 0,0144

1,93 7 1,93 · 7 = 13,51 1,93 - 1,96 = - 0,03 (-0,03)2 = 0,0009 0,0009 · 7 = 0,0063

1,95 3 1,95 · 3 = 5,85 1,95 - 1,96 = - 0,01 (-0,01)2 = 0,0001 0,0001 · 3 = 0,0003

1,96 2 1,96 · 2 = 3,92 1,96 - 1,96 = 0 02 = 0 0·2=0

1,98 9 1,98 · 9 = 17,82 1,98 - 1,96 = 0,02 (0,02)2 = 0,0004 0,0004 · 0 = 0,0036

2,03 5 2,03 · 5 = 10,15 2,03 - 1,96 = 0,07 (0,07)2 = 0,0049 0,0049 · 5 = 0,0245

Total 30 58,85      0,0491

FONTE: A autora

5º passo: Dividir a soma 0,049 obtida no passo 4 por  fi  30 se for


populacional ou por 
fi  1  30  1  29 se for amostral.

6º passo: Extrair a raiz quadrada dos resultados do passo 5.

Note o quanto esse desvio padrão é wpequeno, isso indica que os dados
estão próximos da média.

3.2.3 Frequência de classes


Quando os dados estão agrupados em uma distribuição de frequência com
intervalo de classe, usaremos a seguinte fórmula para calcular o desvio padrão:

102
TÓPICO 2 | MEDIDAS DE DISPERSÃO

Essas fórmulas só resumem os passos que já fizemos anteriormente, veja


no exemplo das estaturas dos 100 acadêmicos do curso de Educação Física.

TABELA 28 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO


FÍSICA DA UNIASSELVI - 2016

Estatura (cm) Número de Acadêmicos (fi)


140 Ⱶ 150 5
150 Ⱶ 160 10
160 Ⱶ 170 30
170 Ⱶ 180 40
180 Ⱶ 190 10
190 Ⱶ 200 5
Total 100

FONTE: A autora

1º passo: Calcular a média.

Para isso, precisamos calcular a coluna xi (pontos médios das classes) e a


x  f 
coluna fi.xi para calcular a média: X  i f i .
i

TABELA 29 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE


EDUCAÇÃO FÍSICA DA UNIASSELVI – 2016

Estatura (cm) Número de Acadêmicos (fi) xi xi ∙ fi


140 Ⱶ 150 5 145 145 ∙ 5 = 725
150 Ⱶ 160 10 155 155 ∙ 10 = 1550
160 Ⱶ 170 30 165 165 ∙ 30 = 4950
170 Ⱶ 180 40 175 175 ∙ 40 = 7000
180 Ⱶ 190 10 185 185 ∙ 10 = 1850
190 Ⱶ 200 5 195 195 ∙ 5 = 975
Total 100   17 050

FONTE: A autora

103
UNIDADE 2 | MEDIDAS DE POSIÇÃO

Substituindo na fórmula,

Portanto, a média dos acadêmicos do curso de Educação Física da


UNIASSELVI no ano de 2016 é de 170,5 centímetros.

2º passo: Subtrair a média dos pontos médios xi, ou seja, fazer xi  x 

TABELA 30 - Distribuição das estaturas de 100 acadêmicos do curso de Educação Física da


Uniasselvi – 2016

Estatura (cm) Número de Acadêmicos (fi) xi xi ∙ fi  xi  x 


140 Ⱶ 150 5 145 725 145 - 170,5 = - 25,5
150 Ⱶ 160 10 155 1550 155 - 170,5 = - 15,5
160 Ⱶ 170 30 165 4950 165 - 170,5 = - 5,5
170 Ⱶ 180 40 175 7000 175 - 170,5 = 4,5
180 Ⱶ 190 10 185 1850 185 - 170,5 = 14,5
190 Ⱶ 200 5 195 975 195 - 170,5 = 24,5
Total 100   17 050  

FONTE: A autora

3º passo: Elevar os resultados de xi  x à segunda potência.

TABELA 31 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO


FÍSICA DA UNIASSELVI – 2016

Número de
Estatura (cm)
Acadêmicos (fi)
xi xi ∙ fi  xi  x   xi  x 
2

140 Ⱶ 150 5 145 725 145 - 170,5 = - 25,5 (- 25,5)2 = 650,25


150 Ⱶ 160 10 155 1550 155 - 170,5 = - 15,5 (- 15,5)2 = 240,25
160 Ⱶ 170 30 165 4950 165 - 170,5 = - 5,5 (- 5,5)2 = 30,25
170 Ⱶ 180 40 175 7000 175 - 170,5 = 4,5 (4,5)2 = 20,25
180 Ⱶ 190 10 185 1850 185 - 170,5 = 14,5 (14,5)2 = 210,25

104
TÓPICO 2 | MEDIDAS DE DISPERSÃO

190 Ⱶ 200 5 195 975 195 - 170,5 = 24,5 (24,5)2 = 600,25


Total 100   17 050    

FONTE: A autora

4º passo: Multiplicar os resultados de xi  x pela frequência da classe, ou


seja, faremos:  xi  x 2 . fi

TABELA 32 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO


FÍSICA DA UNIASSELVI – 2016

Número de
Estatura
(cm)
Acadêmicos Xi xi ∙ fi  xi  x   xi  x 
2
 xi  x 
2
. fi
(fi)

145 - 170,5 = - (- 25,5)2 = 650,25 · 5 =


140 Ⱶ 150 5 145 725
25,5 650,25 3251,25

155 - 170,5 = - (- 15,5)2 = 240,25 · 10 =


150 Ⱶ 160 10 155 1550
15,5 240,25 2402,5

165 - 170,5 = (- 5,5)2 =


160 Ⱶ 170 30 165 4950 30,25 · 30 = 907,5
- 5,5 30,25

175 - 170,5 = (4,5)2 =


170 Ⱶ 180 40 175 7000 20,25 · 40 = 810
4,5 20,25

185 - 170,5 = (14,5)2 = 210,25 · 10 =


180 Ⱶ 190 10 185 1850
14,5 210,25 2102,5

195 - 170,5 = (24,5)2 = 600,25 · 5 =


190 Ⱶ 200 5 195 975
24,5 600,25 3001,25

Total 100   17 050     12 475

FONTE: A autora

5º passo: Dividir a soma 12 475 obtida no passo 4 por  fi  100 se for


populacional ou por 
fi  1  99 se for amostral.

105
UNIDADE 2 | MEDIDAS DE POSIÇÃO

6º passo: Extrair a raiz quadrada dos resultados do passo 5.

Acadêmico, perceba que quanto maior é o desvio padrão, mais os dados


estão dispersos com relação à média.

4 COEFICIENTE DE VARIAÇÃO
Na Estatística utilizamos diversas medidas para descrever fenômenos.
Algumas são as de tendência central e outras as de dispersão. Dentre as medidas
de dispersão, já estudamos o desvio padrão. Porém, o desvio padrão por si só
tem algumas limitações, por exemplo, um desvio padrão de duas unidades pode
ser considerado pequeno para uma série de valores cujo valor médio é 200; no
entanto, se a média for igual a 20, o mesmo não pode ser dito.

Além disso, o fato de o desvio padrão ser expresso na mesma unidade


dos dados limita o seu emprego quando desejamos comparar duas ou mais séries
de valores, relativamente a sua dispersão ou variabilidade, quando expressas em
unidades diferentes. Entretanto, uma medida muito utilizada, principalmente
para se comparar medidas distintas, é o coeficiente de variabilidade ou apenas
coeficiente de variação (CV).

O coeficiente de variação é uma medida de variabilidade relativa, pois é a


relação entre o desvio padrão (S) e a média aritmética ( ), multiplicada por 100.
Portanto, o coeficiente de variação (CV) é uma medida de dispersão cujo objetivo
é apresentar a variabilidade da distribuição em termos percentuais (%).

A fórmula do   (o resultado neste caso é expresso em


percentual, entretanto pode ser expresso também através de um fator decimal,
desprezando assim o valor 100 da fórmula). Quando o desvio padrão calculado

for o populacional, usa-se:

ATENCAO

Interpretação do CV:
Até 15% variação pequena;
De 15% a 30% variação média;
30% ou mais variação grande.

106
TÓPICO 2 | MEDIDAS DE DISPERSÃO

Exemplo: Observe a tabela a seguir, com os resultados das estaturas e dos


pesos de um mesmo grupo de indivíduos.

TABELA 33 - COMPARAÇÃO ENTRE A MÉDIA E O DESVIO PADRÃO

Discriminação Média Desvio Padrão


Estaturas 170 cm 10 cm
Pesos 68 kg 7 kg

FONTE: A autora

Agora responda, qual das medidas (estatura ou peso) possui maior


homogeneidade?

Resposta: Teremos que calcular o coeficiente de variação da estatura e o


coeficiente de variação do peso, porque só o desvio padrão não informará qual a
distribuição é mais dispersa (como discutido acima), uma vez que os valores são
numericamente diferentes (enquanto a altura varia na casa das centenas, o peso
está na casa das dezenas). O resultado menor será o de maior homogeneidade
(menor dispersão ou variabilidade).

Para isso, basta substituir os dados na fórmula:

CV estatura = = 5,88%

CV peso = = 10,29%.

Assim, apesar de nesse grupo de indivíduos o desvio padrão ser menor


nos dados relativos aos pesos, as estaturas apresentam menor grau de dispersão
que os pesos, visto apresentarem um coeficiente de variação menor. 

107
RESUMO DO TÓPICO 2

Neste tópico, você viu que:

• O desvio padrão é a medida de dispersão mais empregada na Estatística.

• Para o cálculo do desvio padrão para dados amostrais é feito usando-se


a fórmula:

• Para dados populacionais, usamos a fórmula:

• O CV é usado para comparar a variabilidade entre duas grandezas com


unidades diferentes, uma vez que apresenta o resultado da variabilidade em
percentual.

• O coeficiente de variação populacional:

• O coeficiente de variação amostral:

108
AUTOATIVIDADE

Acadêmico, o processo de cálculos na Estatística pode parecer complicado


no começo. Porém, não desista! É normal escolhermos caminhos que não
nos levem à resposta esperada nas primeiras tentativas, mas o importante é
reconhecer que a escolha foi errada e recomeçar outra vez. Lápis, borracha e
mãos à obra!

1 (ENADE 2012). As ações das companhias AAA e ZZZ apresentaram a


seguinte série histórica de cotações em determinado mês, em reais.

DIAS AAA ZZZ


1 10,00 20,00
2 10,00 23,00
3 12,00 22,00
4 12,00 24,00
5 16,00 25,00
6 13,00 28,00
7 12,00 28,00
8 15,00 25,00
9 10,00 28,00
10 10,00 27,00

Dados estatísticos

AAA ZZZ
Média 12,00 25,00
Moda 10,00 28,00
Mediana 12,00 25,00
Variância 4,6667 7,7778
Desvio padrão 2,1602 2,7889

109
Com base nas estatísticas apresentadas acima, avalie as proposições que
seguem:

I. O desvio padrão das cotações das ações da empresa AAA mostra que houve
uma variação em torno da mediana de 2,1602 pontos para cima ou para
baixo.
II. A média da soma dos quadrados dos erros (variância) da cotação das ações
da empresa AAA é 4,6667.
III. A média das cotações das ações da empresa ZZZ mostra que R$ 25,00 é o
valor mais frequente na sua série histórica.
IV. A mediana da cotação das ações da empresa AAA corresponde à média
dos extremos de sua série histórica.
V. O valor mais frequente da cotação das ações da empresa ZZZ foi 28,00.

Assinale a alternativa CORRETA:

a) As sentenças I e V estão corretas.


b) As sentenças I, III e IV estão corretas.
c) As sentenças II e V estão corretas.
d) As sentenças III e IV estão corretas.

2 Uma pesquisa estatística que buscou verificar o perfil do estilo de vida


considerando cinco fatores (nutrição, atividade física, comportamento
preventivo, relacionamento social e controle do estresse) foi observada em
dois grupos (A e B) de empresas, apresentando os resultados seguintes:

A: Média 20 - Desvio padrão 4


B: Média 10 - Desvio padrão 3

Assinale a alternativa CORRETA:

a) No grupo B, os dados apresentam maior dispersão absoluta.


b) A dispersão absoluta de cada grupo é igual à dispersão relativa.
c) A dispersão relativa do grupo B é maior do que a dispersão relativa do
grupo A.
d) A dispersão relativa dos dados entre os grupos A e B é medida pelo
quociente da diferença de desvios padrão pela diferença de médias.

110
UNIDADE 2 TÓPICO 3

SÉRIES E GRÁFICOS ESTATÍSTICOS

1 INTRODUÇÃO
Caro acadêmico, tanto na Unidade 1 como nos tópicos anteriores,
trabalhamos com diversas tabelas, que têm por objetivo fornecer informações
rápidas e seguras a respeito das variáveis em estudo, para que assim se cumpra com
a função da estatística, que é analisar dados, compreendendo o comportamento
deles.

Em uma pesquisa estatística, além do tamanho da amostra e da


preocupação com os valores apresentados, visto que são provenientes de diversas
fontes e, por isso, suscetíveis a diferentes interpretações mediante a forma como
são apresentados, também é preciso ter atenção em como apresentamos esses
dados.

Por este motivo, existem critérios científicos, que vão além de calcular o
número de classes e a amplitude do intervalo, que são utilizados para melhor
organizar os dados coletados através da pesquisa estatística e reproduzir este
conjunto de informações de uma forma que apresentem significado claro e de
fácil compreensão.

Como você já observou, existem diversos tipos de tabelas e gráficos e cada


um deles deve ser utilizado para um fim específico. Desta forma, neste tópico
iremos estudar quais os elementos necessários para construir uma tabela e um
gráfico que representem os dados de forma fidedigna.

2 SÉRIE ESTATÍSTICA
Séries estatísticas são tabelas que apresentam o agrupamento de um
conjunto de dados estatísticos em função de uma época, local ou espécie. Assim,
podemos dizer que uma série estatística é um quadro que resume um conjunto de
dados dispostos segundo linhas e colunas de maneira sistemática. É também um
meio eficiente de apresentar os resultados estatísticos obtidos, por proporcionar
uma maior clareza, objetividade e compreensão do conjunto, oferecendo
vantagens para a análise matemática das variáveis relacionadas.
111
UNIDADE 2 | MEDIDAS DE POSIÇÃO

Porém, essa representação não deve ser realizada conforme o entendimento


de cada um. Você já se perguntou por que uma tabela tem título, ou já observou
que ela não é fechada nas laterais?

Nós respondemos: porque no Brasil a apresentação tabular (através de


tabelas) é regida pelas normas de apresentação tabelar do IBGE (1993) / NBR
14724 da ABNT. Nesta norma estão descritos alguns elementos principais para a
elaboração de uma série estatística. São eles:

a) Título: conjunto de informações sobre a tabela (O quê? Quando? Onde?)


localizado no topo da tabela.
b) Corpo: conjunto de linhas e colunas que contém os valores das variáveis em
estudo.
c) Casa ou célula: espaço destinado a uma só informação, encontro de uma linha
com uma coluna.
d) Cabeçalho: parte superior da tabela (1ª linha) que especifica o conteúdo das
colunas.
e) Linha: retas imaginárias no sentido horizontal que auxiliam na leitura das
informações.
f) Coluna indicadora: é a primeira coluna que indica o conteúdo das linhas.
g) Coluna numérica: parte da tabela que contém os dados apresentados.
h) Elementos complementares: colocados no espaço abaixo da tabela (rodapé):
• fonte: é a indicação da entidade responsável pelo fornecimento dos dados ou
sua elaboração;
• notas: são informações de natureza geral identificadas por algarismos romanos;
• chamadas: são informações de natureza específica identificadas por algarismos
arábicos, entre parênteses, escritos no corpo da tabela à esquerda das casas e à
direita da coluna indicadora.
FONTE: Adaptado de: <http://www.wservices.srv.br/UserFiles/File/A1%20Educar/epidemio/
TABELAS.pdf>. Acesso em: 21 ago. 2016.

112
TÓPICO 3 | SÉRIES E GRÁFICOS ESTATÍSTICOS

Exemplo: Observe a tabela abaixo:

Título. Obrigatoriamente deve responder


às perguntas: O que? Onde? Quando?

TABELA 34 - PAÍSES RECORDISTAS DE MEDALHAS DOS JOGOS


OLÍMPICOS DE VERÃO (DE 1896 A 2008)
Cabeçalho
País Número Total de Medalhas

Corpo da tabela/série
Estados Unidos 2296
União Soviética 1010
Alemanha 851
Grã-Bretanha 715
França 632
complementares

FONTE: Adaptado de: <http://veja.abril.com.br/esporte/brasil-e-37o-


Elementos

do-quadro-de-medalhas-geral-das-olimpiadas-eua-lideram/>. Acesso
em: 16 jul. 2016.
1. (chamada)
I. (nota)

É importante, acadêmico, que você perceba que nesta tabela podemos


observar todos os elementos essenciais e complementares apresentados até o
momento.

O título da Tabela é “Países recordistas de medalhas dos Jogos Olímpicos


de Verão (de 1896 a 2008)”. Pelo título é possível sabermos que as informações
contidas na série se referem aos países com o maior número de medalhas nos
Jogos Olímpicos de Verão no período de 1896 a 2008. No cabeçalho, observamos
que a tabela está dividida em País e Número Total de Medalhas. Na coluna
indicadora, temos os países recordistas de medalhas nos Jogos Olímpicos de
Verão. Na coluna numérica, a quantidade de medalhas conquistadas por cada
país. Abaixo da Tabela, temos o elemento complementar (fonte) indicando a
entidade responsável pelo fornecimento dos dados.

Além destes elementos essenciais, devemos seguir algumas regras para


apresentação da tabela/série:

• toda tabela/série deve ser clara, simples e completa, dispensando a consulta ao


texto;
• as tabelas/série não são fechadas nas laterais;
• as tabela/série são fechadas em cima e embaixo com traços horizontais mais
grossos;

113
UNIDADE 2 | MEDIDAS DE POSIÇÃO

• uma casa nunca deve ficar em branco;


• para englobar várias especificações usamos “outros”.
Algumas normas para o preenchimento das células:

• usar um traço horizontal (—) quando o valor é nulo quanto à natureza das
coisas ou resultado do inquérito.
• três pontos (...) quando não temos dados.
• um ponto de interrogação (?) quando temos dúvida quanto à exatidão do valor.
• zero (0; 0,0; 0,00) quando o valor é muito pequeno para ser expresso pela
grandeza utilizada.

Por fim, para a data de referência dos dados, devemos:

• indicar sempre a data do fenômeno estudado;


• não pontuar fim de data;
• os meses são observados pelas três primeiras letras, exceto maio, que se escreve
por extenso;
• série de anos consecutivos. Exemplo: 1890-990 (quando diferem os séculos),
1987-92 (quando for o mesmo século);
• série de anos não consecutivos. Exemplo: 1989-1998.
FONTE: Disponível em: <https://pt.scribd.com/doc/220950498/Estatistica-Descritiva-e-
Probabilidade>. Acesso em: 21 ago. 2016.

E
IMPORTANT

Todas estas normas têm por objetivo padronizar o tratamento dos dados estatísticos,
permitindo uma maior clareza, objetividade e melhor visão do conjunto.

Toda série é uma tabela, mas nem toda tabela é uma série, pois exige
homogeneidade, classificação, critério de modalidade: espécie, local ou época.
As séries estatísticas representam um conjunto de informações ou observações
através do tempo ou dentro de um determinado espaço ou, ainda, com relação a
um fenômeno.

Série é um conjunto de números associados a fenômenos dispostos em


correspondência com critério de modalidade, ou seja, apresenta a distribuição
de um conjunto de dados estatísticos em função da época, local ou espécie. Até o
momento estudamos os elementos que constituem uma série estatística. A partir
de agora, veremos que uma série estatística pode ser classificada segundo o tipo
de informação que representa.

114
TÓPICO 3 | SÉRIES E GRÁFICOS ESTATÍSTICOS

2.1 TIPOS DE SÉRIES


Como vimos, séries estatísticas consistem na apresentação dos dados
estatísticos em forma de tabelas com o objetivo de sintetizar as informações obtidas
em uma pesquisa estatística, tornando-as mais compreensíveis.

As séries estatísticas levam em consideração um fenômeno observado,


podendo se referir a uma época, a um espaço geográfico, a uma categoria ou, ainda,
podemos ter uma junção de dois tipos de séries. Portanto, na sequência veremos as
classificações das séries estatísticas e quais elementos que são comuns a elas.

2.1.1 Séries históricas, cronológicas ou temporais


São as séries que descrevem uma determinada informação da variável em
determinado local, apresentados em intervalos de tempo, ou seja, o tempo varia,
porém o lugar e o fato permanecem os mesmos.

Exemplo:

TABELA 35 - SEDENTARISMO POR GÊNERO NO BRASIL A CADA 100 HABITANTES – 1991/2000

Anos de referência Homens Mulheres


1991 62,6 69,8
1998 60,4 67,2
1999 55,6 62,3
2000 54,8 57,6
FONTE: A autora

Note, acadêmico, que o fenômeno (sedentarismo por gênero no Brasil a


cada 100 habitantes) e o local (Brasil) são elementos fixos. Enquanto que a época
(tempo de 1991 a 2000) é um elemento variável, ou seja, a cada ano observa-se
dados diferentes para o fato analisado.

2.1.2 Séries geográficas, espaciais, territoriais ou de


localização
São as séries em que os valores da variável são descritos em determinado
instante conforme a região. Desta forma, há a variação do local, porém a época e
a espécie permanecem fixas.

115
UNIDADE 2 | MEDIDAS DE POSIÇÃO

Exemplo 1: Um levantamento que representa uma série geográfica


foi realizado pelo Instituto Brasileiro de Geografia e Estatística (IBGE) para o
Ministério do Esporte, e o apresentamos a seguir:

TABELA 36 - ÍNDICE DE POPULAÇÃO SEDENTÁRIA POR PAÍS - 2013

País Sedentários (em %)


Itália 48
Espanha 35
França 22
Inglaterra 17
Portugal 53

FONTE: Adaptado de: <http://www.esporte.gov.br/diesporte/2.html>. Acesso em: 19 jul. 2016.

Observe que o fenômeno (índice de população sedentária por país) e a


época (2013) são elementos fixos. Enquanto que o local (países) é o elemento
variável, ou seja, para cada país citado têm-se dados diferentes para o fato
analisado.

Exemplo 2: Na sequência, apresentamos outro exemplo sobre séries


geográficas:
TABELA 37 - INDICADORES DE GASTO NACIONAL EM SAÚDE DE ALGUNS PAÍSES - 2007

Gasto geral do
Gasto total em Gasto geral
g o ve r n o c o m o Gasto total
saúde como do governo
País proporção do em saúde per
proporção do per capita
gasto total em capita (US$)
PIB (%) (US$)
saúde (%)
Argentina 10 50,8 1.322 671
Austrália 8,9 67,5 3.357 2.266
Brasil 8,4 41,6 837 348
Canadá 10,1 70 3.900 2.730
Chile 6,2 58,7 863 507
Dinamarca 9,8 84,5 3.513 2.968
Espanha 8,5 71,8 2.671 1.917
Reino Unido 8,4 81,7 2.992 2.446

FONTE: Ministério da Saúde

116
TÓPICO 3 | SÉRIES E GRÁFICOS ESTATÍSTICOS

Neste exemplo, o fenômeno são os indicadores de gasto nacional em saúde


de alguns países no ano de 2007, que são elementos fixos. O elemento variável é
o local onde estes indicadores foram analisados.

2.1.3 Séries específicas ou categóricas


Os valores da variável são escritos em um determinado tempo e local,
classificados conforme categorias. Sendo assim, varia a espécie, porém a época e
o local permanecem fixos.

Exemplo:

UNI

Acadêmico, veja um trecho da pesquisa realizada pelo IBGE (Instituto


Brasileiro de Geografia e Estatística) para o Ministério do Esporte em 2013 sobre a prática
do esporte no Brasil. Na fonte, você encontra a pesquisa completa.

FONTE: Disponível <http://www.esporte.gov.br/diesporte/2.html>. Acesso em: 19 jul.


2016.

TABELA 38 - CONDIÇÃO FÍSICA DE 8.902 PESSOAS NO BRASIL EM 2013

Condição Física Número de Pessoas


Sedentários 4.005,9
Praticantes de Atividade Física 2.537,07
Praticantes de Esportes 2.278,912

FONTE: IBGE

117
UNIDADE 2 | MEDIDAS DE POSIÇÃO

Acadêmico, perceba que a condição física de 8.902 pessoas é o elemento


variável desta série, uma vez que a condição física de uma pessoa nesta pesquisa
foi classificada em sedentária, praticante de atividade física ou praticante de
esportes. Por outro lado, a época (2013) e o local (Brasil) são os elementos fixos.

2.1.4 Séries conjugadas


São as tabelas de dupla entrada, também denominadas de mistas.
Constituem-se da conjugação de uma ou mais séries.

Exemplo: Podemos ter a conjugação de uma série geográfica com uma


série histórica.

TABELA 39 - TERMINAIS TELEFÔNICOS EM SERVIÇO NO BRASIL

Regiões 1991 1992


Norte 342.938 375.658
Sudeste 6.234.501 6.729.467
Sul 1.497.315 1.608.989

FONTE: Ministério das Comunicações

Exemplo: Podemos ter a conjugação de uma série geográfica com uma


série específica.

TABELA 40 - MATRÍCULAS NA INSTITUIÇÃO X - 2015

Curso Blumenau Indaial


Administração 32 45
Direito 28 51
Educação Física 24 41
Engenharia Civil 23 35

FONTE: A autora

Acadêmico, vistos os tipos de séries estatísticas, estudaremos agora sobre


a representação gráfica destas séries.

118
TÓPICO 3 | SÉRIES E GRÁFICOS ESTATÍSTICOS

3 GRÁFICO ESTATÍSTICO

O gráfico estatístico é uma forma de apresentação dos dados estatísticos,


cujo objetivo é o de produzir, no investigador ou no público em geral, uma
impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam
mais rápido à compreensão que as séries.
A representação gráfica de um fenômeno deve obedecer a certos requisitos
fundamentais:

a) simplicidade: o gráfico deve ser destituído de detalhes com importância


secundária, assim como de traços desnecessários que possam levar o observador
a uma análise morosa ou com erros;

b) clareza: o gráfico deve possibilitar uma correta interpretação dos valores


representativos do fenômeno em estudo;

c) veracidade: o gráfico deve expressar a verdade sobre o fenômeno em estudo.

Assim como para as tabelas, os gráficos possuem as seguintes normas de


construção:

• título e fonte: os mesmos da série;


• notas e chamadas: os mesmos da série;
• legendas: todas iguais colocadas abaixo ou ao lado direito do gráfico;
• leitura da esquerda para a direita;
• são incluídas no gráfico, apenas as coordenadas indispensáveis à leitura;
• as linhas dos gráficos devem ser destacadas das demais, usando cores ou
espessuras diferentes.

FONTE: Adaptado de: <https://books.google.com.br/books?isbn=8578938895>. Acesso em: 21


ago. 2016.

UNI

Acadêmico, note estes elementos nos gráficos que apresentaremos a seguir,


pois agora que aprendemos as normas de construção dos gráficos estatísticos,
dedicaremos nossos estudos aos tipos de gráficos mais utilizados para representar dados.

119
UNIDADE 2 | MEDIDAS DE POSIÇÃO

3.1 GRÁFICOS EM LINHA OU CURVA


Este tipo de gráfico é composto por dois eixos, um vertical e outro
horizontal, e por uma linha poligonal para representar a série estatística.

Exemplo:

TABELA 41 - ALUNOS NO CURSO DE NATAÇÃO DA ACADEMIA X

Ano Número de alunos


2010 47
2011 53
2012 32
2013 71
2014 63
2015 51

FONTE: A autora

Com os dados estatísticos apresentados na série temporal acima, podemos


elaborar um gráfico em linha que representa a evolução das matrículas no curso
de natação da academia X.

GRÁFICO 1 - ALUNOS NO CURSO DE NATAÇÃO DA ACADEMIA X

FONTE: A autora

120
TÓPICO 3 | SÉRIES E GRÁFICOS ESTATÍSTICOS

O gráfico de linha é mais utilizado nas séries cronológicas, em que a


variável tempo é representada no eixo horizontal e as quantidades respectivas,
no eixo vertical.

Acadêmico, note que os gráficos são representações visuais dos


dados estatísticos que correspondem às tabelas estatísticas, que devem trazer
simplicidade e veracidade para as informações apresentadas.

3.2 GRÁFICOS EM COLUNAS OU EM BARRAS


Este tipo de gráfico é composto por dois eixos, um vertical e outro
horizontal, em que os dados estatísticos são representados através de retângulos
dispostos verticalmente (colunas) ou horizontalmente (barras) de acordo com sua
intensidade.

Exemplo: Observe a seguinte situação:

A Copa do Mundo FIFA, mais conhecida tradicionalmente no Brasil pelo


antigo nome "Copa do Mundo", é uma competição internacional de futebol que
ocorre a cada quatro anos. O formato atual do Mundial é com 32 equipes nacionais
disputando por um período de cerca de um mês.

A Copa do Mundo FIFA é o evento esportivo mais assistido em todo


o mundo e, principalmente para o povo brasileiro, simboliza a união de uma
nação em prol do esporte. Apenas oito países foram campeões mundiais até hoje,
conforme podemos observar na tabela a seguir. O Brasil, a única seleção a ter
jogado em todas as competições, é o maior campeão, com cinco títulos.

TABELA 42 - PAÍSES CAMPEÕES DA COPA DO MUNDO, 1930 - 2014

País Número de Copas Ganhas

Argentina 2
Alemanha 4
Brasil 5
Espanha 1
França 1
Inglaterra 1
Itália 4
Uruguai 2

Total 20

FONTE: <http://bit.ly/2KWyJxD>. Acesso em: 19 jul. 2016.

121
UNIDADE 2 | MEDIDAS DE POSIÇÃO

A partir dos dados apresentados na tabela acima, é possível construir os


seguintes gráficos:

GRÁFICO 2 - NÚMERO DE TÍTULOS POR PAÍS EM COPAS DO MUNDO, 1930 - 2014

FONTE: A autora

GRÁFICO 3 - NÚMERO DE TÍTULOS POR PAÍS EM COPAS DO MUNDO,1930 - 2014

FONTE: A autora

122
TÓPICO 3 | SÉRIES E GRÁFICOS ESTATÍSTICOS

O primeiro gráfico apresentado trata-se de um gráfico de colunas, enquanto


que o segundo é um gráfico de barras. Observe que em ambos a representação
gráfica dos dados apresentados na série estatística foi feita de forma clara e concisa.

3.3 GRÁFICO EM SETORES


É a representação gráfica dos dados estatísticos em um círculo através de
setores. As áreas são diretamente proporcionais aos valores da série, que podem
ser expressos em números ou em porcentagens. Este gráfico é utilizado quando
queremos evidenciar tendências percentuais e não apenas os totais absolutos
pesquisados. Usado em séries geográficas e específicas.

GRÁFICO 4 - NÚMERO DE TÍTULOS POR PAÍS EM COPAS DO MUNDO, 1930 - 2014

FONTE: A autora.

E
IMPORTANT

Acadêmico, observe que neste gráfico os setores circulares devem ter cores
diferentes e devem ser colocadas legendas relativas aos setores, de modo a ser possível
interpretar o gráfico.

123
UNIDADE 2 | MEDIDAS DE POSIÇÃO

3.4 PICTOGRAMAS
A representação gráfica por pictogramas, como o próprio nome
sugere, utiliza figuras que remetem à ideia dos dados em questão. Este tipo de
representação tem como objetivo atrair a atenção do leitor.

Exemplo:

FIGURA 9 - NÚMEROS DO ESPORTE

FONTE: Disponível em: < https://www.flickr.com/photo.gne?short=2grCjBu >. Acesso em:


20 jul. 2016.

Estes gráficos são uma ilustração relacionada com o fenômeno em


estudo sem a preocupação de mostrar dados precisos. São muito utilizados em
propagandas (de jornais, revistas e televisão, entre outras formas).

Acadêmico, vimos nesta unidade que gráficos são instrumentos que


possibilitam transmitir o significado das séries estatísticas de uma forma mais
eficiente e clara. Lembre-se de que para criar um gráfico é preciso conhecer o tipo
de informação que se deseja transmitir, pois cada tipo de gráfico é adequado para
representar um determinado fenômeno.

124
RESUMO DO TÓPICO 3
Neste tópico, estudamos sobre os critérios que devem ser utilizados para
construir séries e gráficos estatísticos, bem como suas classificações. Sobre este
assunto, destacamos que:

• Tabela é um conjunto de dados estatísticos associados a um fenômeno,


dispostos numa ordem de classificação, numa organização racional e prática
de apresentação.
• Série é uma forma de organização mais completa e requer certas regras de
construção.
• Toda série é uma tabela, mas nem toda tabela é uma série, pois esta exige
homogeneidade, classificação, critério de modalidade, segundo espécie, local
ou época.
• O gráfico estatístico é uma forma de apresentação dos dados estatísticos cujo
objetivo é o de produzir uma impressão mais rápida e viva do fenômeno em
estudo.
• Os principais gráficos estatísticos são: gráfico de linhas, colunas, barras ou
setores.

125
AUTOATIVIDADE

Acadêmico, um dos princípios da UNIASSELVI é “Não basta saber, é preciso


saber fazer”. Agora, chegou a sua vez de colocar em prática os conceitos sobre
séries e gráficos estatísticos, estudados neste tópico.

1 Os gráficos são uma forma de representação dos dados estatísticos, que têm
o objetivo de produzir uma impressão rápida e viva de um determinado
fenômeno em estudo. Diante dos conceitos estudados neste tópico, assinale
a alternativa CORRETA:

( ) Um gráfico de barras ou colunas é aquele em que os retângulos que o


compõem estão dispostos horizontalmente.
( ) Um gráfico de barras ou colunas é aquele em que os retângulos que o
compõem estão dispostos verticalmente.
( ) Um gráfico de barras é aquele em que os retângulos que o compõem estão
dispostos verticalmente e um gráfico de colunas, horizontalmente.
( ) Um gráfico de barras é aquele em que os retângulos que o compõem estão
dispostos horizontalmente e um gráfico de colunas, verticalmente.

2 As séries estatísticas podem ser classificadas de acordo com o critério de


modalidade em espécie, local ou época. Pelo exposto, quando uma série
estatística é denominada Temporal?

( ) Quando o elemento variável é o tempo.


( ) Quando o elemento variável é o local.
( ) Quando o elemento variável é a espécie.
( ) Quando é o resultado da combinação de séries estatísticas de tipos
diferentes.
( ) Quando os dados são agrupados em subintervalos do intervalo observado.

126
UNIDADE 3

INTRODUÇÃO AOS TESTES


ESTATÍSTICOS

OBJETIVOS DE APRENDIZAGEM
Esta unidade tem por objetivos:

• utilizar os conceitos e as definições de variáveis aleatórias nas distribui-


ções de probabilidade;

• realizar testes de hipótese;

• relacionar linearmente duas variáveis quantitativas;

• planejar, estruturar e realizar trabalhos de pesquisa voltados à Educação


Física, obedecendo aos tópicos ensinados sob os aspectos bioestatísticos;

• discutir e relatar os resultados obtidos a partir de pesquisas.

PLANO DE ESTUDOS
Esta unidade está dividida em três tópicos e em cada um deles você encontrará
atividades que o ajudarão a aplicar os conhecimentos apresentados.

TÓPICO 1 - INTRODUÇÃO À PROBABILIDADE

TÓPICO 2 - TESTES DE HIPÓTESES

TÓPICO 3 - REGRESSÕES E CORRELAÇÕES

127
128
UNIDADE 3
TÓPICO 1

INTRODUÇÃO À PROBABILIDADE

1 INTRODUÇÃO
Já destacamos que a bioestatística é um esforço de aplicar regras
matemáticas a uma ciência experimental. E, para utilizar essa ferramenta, além da
estatística paramétrica, precisamos nos basear em suposições, que constituem no
pilar de todo o procedimento, e estas serão estudadas com os detalhes necessários
para que você, acadêmico, saiba tomar decisões.

Para isso, adentraremos ao mundo das probabilidades, em que


aprenderemos sobre distribuição de probabilidades e, ao final, será possível
calcular as probabilidades de aceitar ou rejeitar os dados de uma amostra.

2 DISTRIBUIÇÃO NORMAL
A distribuição de probabilidade normal trabalha com variáveis aleatórias
contínuas, e é de longe a mais comum, pois é a que ocorre com mais frequência
na natureza. A distribuição normal é definida pelos parâmetros e σ (média e
desvio padrão), e a sua função densidade de probabilidade é definida por:

Como é possível observar a seguir, a curva Normal tem o aspecto de sino.

129
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

FIGURA 10 - GRÁFICO DA CURVA DE DISTRIBUIÇÃO NORMAL

FONTE: A autora

Quando tivermos = 0 e σ = 1, chamamos essa curva de distribuição


Normal Padrão e sua função densidade de probabilidade se reduz a:

É possível transformar qualquer distribuição Normal para uma


distribuição Normal Padrão, inclusive já existe uma tabela Z (Apêndice A) que
contém todas as soluções de que você precisará, portanto não terá que usar as
funções anteriores para determinar os resultados das probabilidades. O que se faz
é transformar uma distribuição Normal qualquer para uma distribuição Normal
Padrão e, a partir daí, chegar à probabilidade procurada por meio da tabela Z.

2.1 TABELA Z
Existem vários tipos de tabelas que apresentam as probabilidades sob
a curva Normal Padrão. A que será utilizada apresenta a probabilidade de a
variável aleatória Z ser menor que z. (Apêndice A).

130
TÓPICO 1 | INTRODUÇÃO À PROBABILIDADE

Como a área sob a curva de densidade é 1, a probabilidade de a variável


aleatória Z ser maior que z é obtida fazendo:

• P (Z > z), se z > 0.

• P (Z > z), se z < 0.

Ainda podemos ter a probabilidade de a variável aleatória Z estar entre


0 e z.

• P (Z < z) – 0,5, se z > 0

131
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

• 0,5 – P(Z < z), se z < 0

Para saber a probabilidade de Z estar entre z1 e z2, com z2 < z1, precisamos
fazer:

• P(Z < z2 ) – P(Z <z2)

E
IMPORTANT

Na tabela Z, o número padronizado z é formado por três dígitos: a (parte inteira),


b (parte decimal) e c (parte centesimal), z = a,bc.
A parte inteira e a decimal (a,b) aparecem na primeira coluna da tabela z, e a parte centesimal
você procura na primeira linha da tabela Z.

Vejamos, agora, alguns exemplos:

Exemplo 1: Utilize a tabela Z (Apêndice A) para calcular a probabilidade


de Z ser maior que 1,75. Em símbolos: P(Z > 1,75).
132
TÓPICO 1 | INTRODUÇÃO À PROBABILIDADE

Solução: Em z = 1,75 deve-se procurar 1,7 na 1ª coluna e 0,05 na 1ª linha, o


cruzamento dessas duas coordenadas é a P(Z < 1,75) = 0,9599. Como você precisa
encontrar P(Z > 1,75), deverá fazer 1 - P(Z < 1,75), então:

P(Z > 1,75) = 1 – 0,9599 = 0,0401.

Exemplo 2: Utilize a tabela Z (Apêndice A) para calcular a probabilidade


de Z ser menor que – 1,6. Em símbolos: P(Z < -1,6).

Solução: Como a curva é simétrica em relação à média 0, a P(Z < -1,6) é


igual a P(Z > 1,6). Assim, P(Z < -1,6) = P(Z > 1,6) = 1 – P(Z > 1,6). Procurando z =
1,6 na tabela Z (1,6 parte inteira e a decimal, e 0,00 parte centesimal), temos que
P(Z > 1,6) = 0,9452, então:

P(Z < -1,6) = P(Z > 1,6) = 1 – P(Z > 1,6) = 1 – 0,9452 = 0,0548.

Exemplo 3: Utilize a tabela Z (Apêndice A) para calcular a probabilidade


de Z ser maior que 0 e menor que 2,65. Em símbolos: P(0 < Z < 2,65).

Solução: Acadêmico, note que P(0 < Z < 2,65) = P(Z < 2,65) – 0,5. Procurando
z = 2,65 na tabela Z (2,6 parte inteira e a decimal, e 0,05 parte centesimal), temos
que P(Z < 2,65) = 0,9960, então:

P(0 < Z < 2,65) = 0,9960 – 0,5 = 0,4960.

Além desses tipos de exemplos, nos testes de hipóteses é comum querer


saber que valor de z produz uma determinada área sob a curva Normal Padrão,
de –z até z; ou seja, realizar o processo inverso que fizemos.

Vejamos um exemplo disso. Responda: para que valor de z temos uma


área sob a curva normal padrão de 0,90, de –z até z?

A figura a seguir ilustra essa pergunta:

Acadêmico, lembre-se de que a curva normal padrão é simétrica e sua área


total sob a curva é 1, logo, se a parte pintada tem área 0,90, falta 0,10 para fechar a
área 1. Observe que a área branca sob a curva vale 0,05 (0,10/2). Assim, podemos
substituir a pergunta para: qual valor de z deixa uma área menor que 0,95?
133
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

Para solucionarmos, basta localizar 0,95 no corpo da tabela Z (Apêndice


A) para encontrar o valor de z.

Verifica-se que na tabela o valor 0,95 está entre 0,9495 e 0,9505, então
podemos dizer que z está entre 1,64 e 1,65. Calculando a média [(1,64 + 1,65)/2]
entre esses dois valores, z = 1,645.

Agora que você já sabe como usar a tabela Z, acompanhe a resolução do


exemplo a seguir, que pode ser resolvido através de uma distribuição normal.

Exemplo 4: As alturas de uma população têm média 1,70 m e desvio


padrão de 0,2 m. Um pesquisador, ao tomar uma pessoa desta população, pretende
determinar qual é a probabilidade de:

i) encontrar alguém com altura superior a 1,80 m;


ii) encontrar alguém com altura entre 1,40 m e 1,65 m;
iii) encontrar alguém com altura inferior a 1,60 m.

Solução:

Note que = 1,70 e σ = 0,2, ou seja, tem-se um caso de distribuição normal,


mas ainda não se tem uma distribuição normal padrão, ou seja, não se pode usar

134
TÓPICO 1 | INTRODUÇÃO À PROBABILIDADE

a tabela Z. É preciso transformar essa distribuição normal em distribuição normal


padrão usando:

i) Queremos calcular a probabilidade de encontrar alguém acima de 1,80


m, ou seja, P(X > 1,80). Transformando x = 1,80 em z padrão, temos:

O problema agora consiste em encontrar P(Z > 0,5). Como P(Z > 0,5) =
1 – P(Z < 0,5), temos que P(Z > 0,5) = 1 – 0,6915 = 0,3085. Portanto, a P(X > 1,80) =
P(Z > 0,5) = 0,3085. Assim, o valor 0,3085 representa a probabilidade de encontrar
alguém com mais de 1,80 m de altura.

ii) Devemos encontrar P(1,40 < X < 1,65), para isso precisamos transformar
os valores x1 = 1,40 m e x2 = 1,65 m em z1 e z2 respectivamente.

Agora, o problema consiste em encontrar P(-1,5 < Z < -0,25) usando a


tabela Z.

Como P(-1,5 < Z < -0,25) = P(Z < -0,25) – P(Z < -1,5) e P(Z < -1,5) = P (Z > 1,5)
= 1 – P(Z < 1,5) = 1 – 0,9332 = 0,0668

P(Z < -0,25) = P (Z > 0,25) = 1 – P(Z < 0,25) = 1 – 0,5987 = 0,4013, temos:
P(-1,5 < Z < -0,25) = 0,4013 – 0,0668 = 0,3345.

Portanto, a P(1,40 < X < 1,65) = P(-1,5 < Z < -0,25) = 0,3345.

iii) Queremos determinar a P(X < 1,60). Transformando o valor x = 1,60 em


z padrão, obtemos:

Note que agora o problema consiste em encontrar a P(Z < -0,5) na tabela
Z. Como a P(Z < -0,5) = P(Z > 0,5) e P(Z > 0,5) = 1 – P(Z < 0,5), temos que:

P(Z < -0,5) = 1 – 0,6915 = 0,3085. Portanto, a P(X < 1,60) = P(Z < -0,5) = 0,3085.

135
RESUMO DO TÓPICO 1
Neste tópico, você viu que:

• Se uma variável aleatória X tem distribuição normal de média μ e


variância σ 2 , podemos transformá-la numa variável aleatória Z de distribuição
normal padrão de média 0 e variância 1, através da fórmula:

• A curva Normal Padrão é simétrica em relação à média 0 e a área sob


essa curva é 1.

• A tabela Normal Padrão (Apêndice A) apresenta a probabilidade de a


variável aleatória Z ser menor que z.

136
AUTOATIVIDADE

Acadêmico, agora é a sua vez de exercitar o que aprendeu até aqui! Lembre-
se de que você tem à disposição materiais complementares em seu Ambiente
Virtual de Aprendizagem. Consulte-os sempre que necessário. Conte também
com a tutoria interna, que está disponível por meio do 0800, contato e
atendimento on-line. Bons estudos!

1 É possível transformar qualquer distribuição Normal para uma distribuição


Normal Padrão, inclusive já existe uma tabela Z que contém todas as
soluções. Utilize a tabela Z para calcular a probabilidade de Z ser menor
que 3,75.

a) ( ) P = 0,0001.
b) ( ) P = 0,5000.
c) ( ) P = 0,1000.
d) ( ) P = 0,9999.

2 Em estatística, um intervalo de confiança é o intervalo estimado em que a


média de um parâmetro de uma amostra tem uma dada probabilidade de
ocorrer. Quando, num teste, é dito que o nível de significância é de 3%,
então o nível de confiança será:

a) ( ) de 97%.
b) ( ) de 0,03%.
c) ( ) de 0,97%.
d) ( ) de 3%.

137
138
UNIDADE 3
TÓPICO 2

TESTES DE HIPÓTESES

1 INTRODUÇÃO
Até este momento já aprendemos muitos conceitos importantes para
interpretar as características de uma determinada população ou amostra, como:
média, variância, desvio padrão e proporção, bem como apresentá-los em séries e
tabelas estatísticas. E nesta terceira unidade daremos continuidade a esse estudo,
aprendendo como testar nossas suposições e a elaborar uma hipótese estatística,
relacionadas à estatística não paramétrica e aos estudos de correlação e regressão.

Testes como estes são necessários porque em alguns casos não é possível
reunir todos os dados de uma população para aferir o parâmetro desejado. Assim,
os testes de hipóteses se baseiam na amostra, ou seja, em uma parte da população.

Para obter um resultado confiável em qualquer teste estatístico, o


pesquisador deve se preocupar com a coleta de dados da amostra, pois se você
cometer um “vício” na coleta da amostra, certamente comprometerá o resultado
do teste, tornando-o tendencioso. Para evitar essa possível influência externa,
existem metodologias de amostragem abordadas detalhadamente na Unidade 1
deste caderno de estudos. Se preciso, retorne àquelas orientações.

Assim, neste tópico, serão apresentados os testes de hipóteses.

2 TESTES CLÁSSICOS
Em estatística, uma hipótese é uma alegação, ou afirmação, sobre uma
característica de uma população, levando-se em consideração a observação de
uma amostra. Por exemplo: “Pesquisadores médicos afirmam que a temperatura
média do corpo humano não é igual a 37 °C”.

A dificuldade nestas pesquisas é que a característica de interesse varia em


cada amostra, visto que a temperatura média do corpo humano varia de pessoa
para pessoa, por esse motivo existe a necessidade de métodos estatísticos.

Desta forma, os testes de hipóteses servem para verificar se a diferença


entre um parâmetro populacional e uma estimativa é atribuída à aleatoriedade da
amostra ou a diferença é tão grande a ponto de haver desconfiança na integridade
139
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

da amostra, ou seja, a intenção é analisar uma amostra para distinguir entre


resultados que podem ocorrer facilmente e os que dificilmente ocorrem.

Para realizar um teste de hipóteses você deve formular duas hipóteses a


respeito da afirmação, denominadas de H0 e H1.

E
IMPORTANT

Saiba que a hipótese H0 é chamada de hipótese nula, ou seja, é a hipótese que “anula”
o teste. Enquanto a hipótese H1 ou hipótese alternativa é a que o teste quer provar.

Acompanhe os exemplos a seguir para compreender estes conceitos.

Exemplo 1: Numa pesquisa para comparar a eficácia de emagrecimento


em pessoas adultas entre duas enzimas, tem-se as seguintes hipóteses:

Considerando que podemos comparar a eficácia de emagrecimento por


meio das médias de emagrecimento das duas enzimas (enzima 1 e 2), temos que
1
e 2 são as médias populacionais de emagrecimento de pessoas adultas tratadas
pelas enzimas 1 e 2, respectivamente.

FONTE: Disponível em: <http://www.gifs-animados.net/profissao/profissao132.gif>. Acesso em:


20 jul. 2016.

Assim:

H0: 1 = 2 (média de emagrecimento da enzima 1 é igual à média de


emagrecimento da enzima 2).
H1: 1 ≠ 2 (média de emagrecimento da enzima 1 é diferente da média de
emagrecimento da enzima 2).

140
TÓPICO 2 | TESTES DE HIPÓTESES

ATENCAO

Acadêmico, é importante lembrar que: H0 hipótese nula, ou seja, a hipótese que


“anula” o teste. H1 hipótese alternativa, a que o teste quer provar.

Exemplo 2: Numa pesquisa de qualidade, o INMETRO quer verificar se a


resistência da cama elástica para Jump de uma determinada marca é menor que o
valor K anunciado na embalagem.

FONTE: < http://cdn1.mundodastribos.com/wp-admin/uploads/2010/12/cama-elastica-para-


ginastica-pre%C3%A7os-onde-comprar.jpg> Acesso em: 20 jul. 2016.

Nesse caso:

H0: = K (média de resistência da cama elástica para Jump é igual ao valor


anunciado K).
H1: < K (média de resistência da cama elástica para Jump é menor que o
valor anunciado X).

Exemplo 3: Numa pesquisa para verificar se a média de idade de uma


população é diferente de 30 anos, temos as seguintes hipóteses:

H0: = 30 (média populacional é igual a 30 anos)


H1: ≠ 30 (média populacional é diferente de 30 anos)

Acadêmico, é válido destacar que quando você efetua um teste de hipótese


sempre obterá a resposta tendo como referência H0, ou seja, se após o teste você
verificar que a hipótese certa é a hipótese nula pode aceitar H0, mas se verificar
que a hipótese certa é a hipótese alternativa deve rejeitar H0, ao invés de citar H1.
141
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

UNI

Claro que você já aprendeu, mas caso tenha esquecido, recorde agora!
Igualdade (=). Exemplo: 7 = 3 + 4 (sete é igual a três mais quatro).
Diferença (≠). Exemplo: 7 ≠ 3 + 3 (sete é diferente de três mais três).
Maior que (>). Exemplo: 7 > 3 + 3 (sete é maior que três mais três).
Menor que (<). Exemplo: 7 < 3 + 5 (sete é menor que três mais cinco).

3 ERROS DO TIPO I E II
Por mais cuidado que se tenha ao coletar os dados de uma pesquisa,
a estimação dos dados jamais estará livre de erros. E, ao realizar um teste de
hipóteses, existem dois tipos de erros que podem ser cometidos:

Erro do tipo I (a)


Erro do tipo II (β)

A seguir, estudaremos o que cada um representa.

UNI

Você já deve ter percebido, em sua trajetória escolar, que a utilização das letras gregas
é bem comum na matemática. Aqui iremos utilizar as letras gregas Alfa (a) e Beta (β).

3.1 ERRO DO TIPO I (α)


O erro do tipo I (Α) significa rejeitar a hipótese nula (H0), sendo que na verdade
deveria ter aceitado. É importante que essa probabilidade de cometer o erro do tipo I
seja pequena, pois assim a chance de rejeitar uma hipótese verdadeira também será
pequena.

A essa probabilidade dá-se o nome de nível de significância do teste, que é


representado por α. O valor 1 – α representa a probabilidade de aceitar uma hipótese
verdadeira quando ela é verdadeira, e a esse valor damos o nome de nível de confiança.

Cometer um erro do tipo I, no exemplo 1 visto anteriormente, seria ter dito que
as médias são diferentes quando na verdade elas são iguais.

142
TÓPICO 2 | TESTES DE HIPÓTESES

E
IMPORTANT

O nível de significância do teste a é definido no início do teste.

3.2 ERRO DO TIPO II (β)


O erro do tipo II (Β) significa aceitar a hipótese nula (H0) sendo que na
verdade você deveria ter rejeitado. Para este tipo de erro também se deseja que
a probabilidade de cometê-lo seja pequena, para que a chance de aceitar uma
hipótese falsa seja, igualmente, pequena.

Essa probabilidade é representada pela letra β e a diferença 1 – β representa


a probabilidade de rejeitar uma hipótese falsa quando ela é falsa, e este valor (1 –
β) é chamado de poder do teste.

Cometer um erro do tipo II, no exemplo 1 visto anteriormente, seria ter


dito que as médias são iguais quando na verdade elas são diferentes.

O quadro a seguir resume esses dois erros, veja:

REALIDADE
DECISÃO
H0 verdadeira H0 falsa
Rejeitar H0 Erro do tipo I (α) Sem erro
Aceitar H0 Sem erro Erro do tipo II (β)

ATENCAO

O risco do erro do tipo I é dado por a.


a é a probabilidade de rejeitarmos H0, quando H0 é verdadeira.
1 - a é a probabilidade (contrária) de aceitar H0, quando ela é verdadeira. E, neste caso, não
cometemos erro, ou seja, a decisão é correta.

O risco do erro do tipo II é dado por β.


β é a probabilidade de aceitarmos H0, quando H0 é falsa.
1 - β é a probabilidade (contrária) de rejeitar H0, quando ela é falsa. E, neste caso, não
cometemos erro, ou seja, a decisão é correta.

143
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

A seguir veremos alguns exemplos sobre testes de hipóteses.

4 EXEMPLOS DE TESTES DE HIPÓTESES


Este item é destinado às resoluções de alguns casos de testes de hipóteses,
os conceitos que serão utilizados serão explicados passo a passo e os exemplos
trabalhados em ordem crescente de dificuldade.

Acadêmico, os testes de hipóteses podem ser de três tipos diferentes, onde


o que muda é a hipótese alternativa (H1). Vejamos cada um deles a seguir:

a) teste bicaudal ou bilateral


H0: = 150
H1: ≠ 150

UNI

No caso do teste bicaudal, o valor α fica dividido para as duas regiões


amarelas com área a 2.

b) teste unicaudal à direita ou unilateral à direita


H0: = 150
H1: > 150

144
TÓPICO 2 | TESTES DE HIPÓTESES

c) teste unicaudal à esquerda ou unilateral à esquerda


H0: = 150
H1: < 150

A área das regiões amarelas sob as caudas da curva normal corresponde


à probabilidade de cometer o erro do tipo I (α). Essas regiões são limitadas pelo
valor crítico α que divide a área sob a curva normal em duas regiões: Região de
aceitação de H0 e Região de rejeição de H0.

Acadêmico, não se preocupe com como e quando usar cada um dos tipos
anteriores, bem como a compreensão do que significa e como definir a(s) área(s)
de rejeição de H0 e a área de aceitação de H0 nos testes de hipóteses. Isso será
explicado nas resoluções dos próximos exemplos para desvio padrão conhecido
e desvio padrão desconhecido, acompanhe!

4.1 TESTE DE HIPÓTESES PARA A MÉDIA QUANDO O


DESVIO PADRÃO DA POPULAÇÃO É CONHECIDO
O INMETRO fará uma inspeção numa fábrica de aparelhos para
ginástica que afirma que o diâmetro das suas camas elásticas de Jump segue uma
distribuição normal com a média = 94 cm e desvio padrão populacional σ = 2
cm. Para a verificação, o inspetor recolheu uma amostra com 10 unidades em
que obteve as seguintes medidas (em cm): 92, 97, 94, 95, 96, 97, 96, 95, 95, 94. O
INMETRO admite um erro estatístico de 5% (nível de significância 5%), ou seja,
nível de confiança 95%, em outras palavras α = 0,05.

Solução: Fazendo a estimativa da média dos diâmetros das camas elásticas


de Jump , temos:

Um pesquisador que não entende de estatística falaria que a média dos


diâmetros das camas elásticas de Jump é maior que o informado pela fábrica,
contudo nós sabemos que estamos lidando com uma amostra e por isso temos
que tomar cuidado nas conclusões, por isso que o teste de hipóteses é essencial.
145
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

É esse teste que indicará se a diferença entre a média populacional (


= 94 cm) informada pela empresa e a estimativa   95,1 cm obtida através da
amostra recolhida pelo pesquisador é significante ou apenas casual devido à
aleatoriedade da amostra.

Como o objetivo do INMETRO é inspecionar se a média dos diâmetros


das camas elásticas de Jump é diferente de 94 cm, devemos confrontar as seguintes
hipóteses:

H0: = 94 cm
H1: ≠ 94 cm

A distribuição da média amostral θ , convenientemente padronizada, se
comporta segundo um modelo Normal com = 0 e σ2 = 1. Essa padronização é
feita por meio da fórmula:

Agora, para resolver o teste, calcule o valor z padronizado e o compare


com os valores críticos tabelados ztab. O valor ztab é obtido entrando na tabela Z
(Apêndice A) com o valor 1 – α/2 = 1 – 0,05/2 = 1 – 0,025 = 0,975. Localizando este
valor na tabela Z:

Para obter ztab devemos somar o valor inicial da linha com o valor inicial
da coluna. Assim ztab = 1,9 + 0,06 = 1,96.

Calculando z:
146
TÓPICO 2 | TESTES DE HIPÓTESES

O valor 95,1 cm na curva normal é equivalente a 1,74 na curva normal


padrão, veja o esquema:

E
IMPORTANT

O Teorema Central do Limite garante que essa padronização,


para n grande, segue um modelo normal, com média 0 e desvio padrão 1.

Se a média amostral padronizada estiver na área de rejeição, ou seja, no


exemplo for maior que o valor crítico 1,96 ou menor que o valor crítico -1,96, nós
devemos rejeitar H0, do contrário devemos aceitá-la. Neste caso, a média amostral
(já padronizada) é 1,74, então temos:

-1,96 < 1,74 < 1,96

O que indica que 1,74 está na região de aceitação de H0.

Assim, podemos concluir que as médias amostrais e populacionais são


iguais a um nível de significância de 5% (ou dizemos: a um nível de confiança de
95%).

Em outras palavras, a diferença obtida através da amostra não é


significativa, então não se pode afirmar que as especificações da empresa estão

147
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

incorretas. Tem-se 5% de chance de você estar errado nessa conclusão (nível de


significância).

Agora, acadêmico, caso o INMETRO desejasse inspecionar se a média dos


diâmetros das camas elásticas de Jump é menor que 94 cm ou maior que 94 cm,
você estaria diante de um teste unilateral. Com isso, seria necessário adequar a
hipótese alternativa para cada tipo de teste, H1: < 94 cm (unilateral à esquerda)
e H1: > 94 cm (unilateral à direita).

Como a média amostral é maior que a média populacional, não é preciso


testar a hipótese H1: < 94 cm, pois o valor z (padronizado) ficará sempre na região
de aceitação de H0, considerando α pequeno. Assim, teste apenas a hipótese H1:
>94 cm!

Unilateral à direita

Solução:
H0: = 94 cm
H1: > 94 cm

A padronização da estimativa da média populacional permanece a mesma

O que muda é o valor crítico (ztab), pois o nível de significância corresponde


somente à área sob a cauda direita. O valor ztab é obtido entrando na tabela Z
(Apêndice A) com o valor 1 – = 1 – 0,05 = 0,950.

148
TÓPICO 2 | TESTES DE HIPÓTESES

Observe que o valor 0,950 não aparece na tabela, mas está entre os valores
0,9495 e 0,9505. Assim, fazemos a média aritmética dos valores encontrados na
coluna e somamos com o valor da linha. Logo, ztab = (0,04 + 0,05)/2 + 1,6 = 1,645.
Veja o esquema a seguir:

Observe que o fato de o teste ser unilateral aumenta a área sob a cauda
direita da curva, diminuindo o valor crítico (ztab). Nesse caso, rejeita-se H0 a um
nível de significância de 5% porque o valor z padronizado (1,74) está na região de
rejeição de H0 (1,645 < 1,74). Assim, a média populacional é maior que 94 cm a um
nível de confiança de 95%.

4.1.2 Teste de hipóteses para a média quando o desvio


padrão da população é desconhecido
Suponha que você precisa testar a hipótese de que a média da estatura dos
jogadores brasileiros de basquetebol adultos de sexo masculino seja 1,95 m contra
a hipótese de que é diferente, a um nível de significância de 5%.

Na amostra feita são obtidas as seguintes alturas:

ALTURA, EM METROS, DOS JOGADORES DE BASQUETEBOL - BRASIL – 2016

Alturas (xi) Número de Atletas (fi)


1,90 4
1,93 7
1,95 3
1,96 2
1,98 9
2,03 5
Total 30

FONTE: A autora

149
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

Solução: Observe que não há o desvio padrão populacional, e na maioria


dos problemas práticos não haverá mesmo! Porém, na resolução, o que muda
apenas é a tabela a ser utilizada.

A amostra dá as seguintes estimativas:


n = 30, (número de elementos, média e desvio
padrão).

Agora, temos as seguintes hipóteses:

H0: = 1,95m
H1: ≠ 1,95m

Como a variância populacional é desconhecida, a padronização da


estimativa da média amostral deve ser feita com a estimativa da variância amostral
s2, o que torna a função densidade dessa padronização diferente da normal. Essa
nova densidade é denominada t-Student e essa padronização é calculada através

da fórmula: t    x .
calc
s n
Para resolver o teste é preciso comparar o valor do t calculado (tcalc) com o
valor crítico t tabelado (ttab). O valor ttab é encontrado na tabela t-Student (Apêndice
C) na intersecção da linha 29 (“n – 1”) com a coluna 2,5% ( a 2 ) = 2,5/100 = 0,025.
Com isso, temos ttab = 2,0452.

Obtendo o valor tcalc:

150
TÓPICO 2 | TESTES DE HIPÓTESES

Conclusão: Rejeitamos H0.

A média populacional é diferente a 1,95 m a um nível de significância de


5%. Você pode afirmar isso, pois o valor 32,2190 está fora dos valores críticos, ou
seja, está na região de rejeição de H0.

4.2 TESTE DE HIPÓTESES PARA A VARIÂNCIA


POPULACIONAL σ2
A Patinação Artística é um esporte de inverno e foi incluso nos Jogos
Olímpicos no ano de 1908 em Londres, na Inglaterra. Além de esporte, é um
espetáculo e atletas já aposentados continuam fazendo shows e apresentações de
gala. Nas competições existem categorias individuais e em duplas e há inúmeros
elementos, como tipos de piruetas e saltos, que constituem a apresentação e
somam pontos para a avaliação.

Agora, vamos supor que desejamos testar a hipótese de que a variância


das médias dos patinadores homens na categoria individual, no Campeonato
Mundial de Patinação Artística de 2015, tenha sido 5,3 contra a hipótese de que é
diferente, a um nível de significância de 10%.

Para realizar o teste foi coletada uma amostra com as seguintes notas:

5,9 6,5 8,0 9,6 4,0 3,4 8,0 6,0 6,5 8,4
4,0 8,5 9,3 8,5 8,2 6,0 5,1 3,5 6,0 5,2
6,2 7,0 5,5 7,0 7,9 6,4 4,6 4,0 7,0 7,0

A amostra nos dá as seguintes estimativas: n = 30,   6, 44 e s 2  2, 97


(número de elementos, média e variância).

Assim, temos as seguintes hipóteses:

H0: 2 = 5,3
H1: σ2 ≠ 5,3

 n  1 s 2
Em uma distribuição normalmente distribuída, a razão  2 segue uma
distribuição qui-quadrado. Assim, o cálculo usado para o teste de hipóteses para

a variância populacional é:
 calc
2

 n  1 s 2 .
2

151
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

Para resolver o teste é necessário comparar os valores de χ2tab (χ2A e χ2B,


pois o teste é bicaudal) com o valor crítico χ2calc. O valor χ2A é encontrado na tabela
qui-quadrado (Apêndice B) na intersecção da linha 29 (n – 1) com a coluna 0,05
(α/2),χ2A = 42,5569, e o valor χ2B na intersecção da linha 29 com a coluna 0,95 (1-
α/2), χ2B = 17,7084.

Obtendo o valor χ2calc:

Conclusão: Rejeitamos H0.

A variância populacional é diferente a 5,3 a um nível de significância de


10%. Você pode afirmar isso, pois o valor 16,25 é menor que o valor crítico 17,7084,
ou seja, está na região de rejeição de H0.

4.3 TESTE DE HIPÓTESES PARA A PROPORÇÃO


POPULACIONAL P
O futebol é o esporte dos brasileiros e o sonho de se tornar um grande
jogador já nasce na infância. A Escola de Futebol Oficial do Time XX promove
testes e avaliações para encontrar novos craques em todo o Brasil. Os jogadores
são selecionados por observadores oficiais do Time XX. E os jogadores que são
selecionados passam um período de experiência na escola do Time XX. Os alunos
são observados diariamente em seus treinamentos. Aqueles que se destacam são
indicados para participar das equipes das categorias de Base do Time XX.

Segundo o treinador de futebol do Time XX, existe uma taxa de 15% de


reprovação entre seus candidatos já na primeira etapa. Para verificar se a taxa de
152
TÓPICO 2 | TESTES DE HIPÓTESES

reprovação é diferente, com α = 2%, selecionou-se aleatoriamente uma amostra


de 300 candidatos e verificou-se que 36 reprovaram.

Solução: O treinador afirma que a proporção de reprovados p = 15% =

0,15. Da amostra selecionada, estimamos uma proporção . Assim,


temos as seguintes hipóteses:
H0: p = 0,15
H1: p ≠ 0,15

Considerando que a distribuição da proporção amostral pode ser


aproximada por um modelo Normal, resolve-se o problema comparando o valor
de z padronizado com os valores críticos tabelados (ztab). O valor ztab é obtido
entrando na tabela Z (Apêndice A) com o valor 1 – α/2 = 1 – 0,02/2 = 1 – 0,01 = 0,99,
assim ztab = 2,33.

O valor z padronizado para proporção é obtido pela fórmula:


.
Calculando z:

153
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

ATENCAO

Acadêmico, estes testes podem parecer difíceis, mas com concentração,


dedicação e persistência você conseguirá compreender estes conceitos.

154
RESUMO DO TÓPICO 2
Neste tópico, estudamos os testes de hipóteses e destacamos:

• Roteiro para realizar um teste de hipóteses:


1º: estabelecer as hipóteses H0 e H1;
2º: com base na H1 e no nível de significância (α) estabelecer as regiões de aceitação
e rejeição de H0 e o valor crítico;
3º: calcular o valor da variável do teste;
4º: aceitar ou rejeitar H0 pela comparação do valor calculado no 3º passo com a
região de aceitação ou rejeição.

• Nos testes de hipótese para a média, quando o desvio padrão populacional


é conhecido, a estimativa amostral da média é padronizada pela fórmula:

• Nos testes de hipótese para a média, quando o desvio padrão populacional é


desconhecido, a estimativa amostral da média é padronizada pela fórmula:

 x
tcalc  .
s n
• Nos testes de hipótese para a variância populacional, o cálculo usado é

 calc 
 n  1 s 2
.
2

2
• Nos testes de hipótese para a proporção populacional, a estimativa amostral da

proporção é padronizada pela fórmula: .

155
AUTOATIVIDADE

Prezado acadêmico! Agora chegou a sua vez de colocar em prática seu


conhecimento sobre os testes de hipóteses.

1 Um teste de hipótese é um método de inferência estatística muito útil em


casos em que não é possível reunir todos os dados de uma população
para aferir o parâmetro desejado. Assim, os testes de hipóteses se baseiam
na amostra, ou seja, em uma parte da população. Portanto, em diversas
pesquisas estatísticas são utilizados os testes de hipóteses para avaliar a
veracidade dos dados observados.

Sobre o teste de hipótese, assinale a alternativa CORRETA:

a) ( ) A hipótese H0 será chamada de hipótese nula, enquanto a hipótese H1


ou hipótese alternativa é a que o teste quer provar. O erro do tipo I (Α)
significa rejeitar H0 sendo que na verdade deveria ter aceitado, enquanto
o erro do tipo II (Β) significa aceitar H0 sendo que na verdade você deveria
ter rejeitado.
b) ( ) A hipótese H0 será chamada de hipótese fiel, enquanto a hipótese H1 ou
hipótese infiel é a que o teste quer provar. E, em um teste estatístico, em que
o “poder do teste” é de 0,84, o erro do tipo II será 0,16.
c) ( ) A hipótese H0 será chamada de hipótese certa, enquanto a hipótese H1
ou hipótese errada é a que o teste quer provar. E, em um teste estatístico,
em que o “poder do teste” é de 0,84, o erro do tipo I será 0,16.
d) ( ) A hipótese H0 será chamada de hipótese nula, enquanto a hipótese H1
ou hipótese alternativa é a que o teste quer provar. O erro do tipo I (Α)
significa aceitar H0 sendo que na verdade deveria ter rejeitado, enquanto o
erro do tipo II (Β) significa rejeitar H0 sendo que na verdade você deveria
ter aceitado.

2 Uma equipe de corrida de bicicletas está testando a durabilidade de duas


marcas de freios. Para isso, testou cinco freios de cada marca e constatou,
para a marca A, uma durabilidade média de 5.000 km e variância 2.500 km2;
para a marca B uma durabilidade média de 4.910 km e variância 2.300 km2.
Sabendo-se que as variâncias populacionais são desconhecidas e iguais,
teste a hipótese de que a durabilidade dos freios da marca A é maior que
da marca B, em nível de significância de 5%. Nessas condições, analise as
seguintes sentenças:

156
Assinale a alternativa CORRETA:

a) ( ) O item II está correto.


b) ( ) O item I está correto.
c) ( ) O item III está correto.
d) ( ) O item IV está correto.

157
158
UNIDADE 3
TÓPICO 3

REGRESSÕES E CORRELAÇÕES

1 INTRODUÇÃO
Uma parte importante da estatística é a análise da regressão entre uma
variável dependente e uma variável independente de um modelo matemático,
com o objetivo de determinar o nível de interação entre elas. A determinação
dessa relação auxilia na simulação da previsão do comportamento de um
fenômeno, possibilitando a análise das tendências e as relações de causa e efeito
de um determinado evento.

Neste tópico temos por objetivo o estudo da regressão entre duas variáveis
e a verificação da existência de uma correlação entre elas. Para tornarmos a
compreensão deste conteúdo mais simples, abordaremos algumas situações que
fazem parte do cotidiano do profissional da Educação Física.

2 DIAGRAMA DE DISPERSÃO
Diagramas de dispersão são gráficos que permitem a identificação entre
causas e efeitos, com o propósito de avaliar o tipo de relação entre as variáveis
estudadas.

De uma maneira mais simples, é a representação gráfica de valores de


duas variáveis relacionadas a um mesmo fenômeno, mostrando o quanto uma
variável é afetada por outra, ajudando desta forma a visualizar se existe, ou não,
alguma relação entre elas.

Neste gráfico, cada ponto plotado representa um par observado de


valores para as variáveis estudadas (x, y), num sistema de eixos cartesianos,
formando uma “nuvem” de pontos, que definirá qual o tipo de correlação está
sendo analisada.

159
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

A seguir, apresentamos alguns exemplos de diagramas de dispersão.

Observe, acadêmico, que cada combinação de dados indica um eixo e


uma direção que caracteriza a relação entre as variáveis x e y. A relação entre as
variáveis é direta quando os valores de y aumentam em decorrência do aumento
dos valores de x. A relação é considerada inversa quando os valores de y variam
inversamente em relação aos de x. E não há relação quando os valores de y não
variam com o aumento dos valores de x.

Exemplo: Acadêmico, vamos verificar a relação entre os valores informados


na tabela de peso e altura para crianças, construindo um gráfico de dispersão:

TABELA 43 - VARIAÇÃO DO PESO E DA ALTURA PARA CRIANÇAS BRASILEIRAS ENTRE 1 E 12 ANOS

Idade Altura (cm) Peso (Kg)


1 ano 74 9,8
2 anos 85 12,3
3 anos 96 14,7
4 anos 101 16,5
5 anos 108 18,6
6 anos 112 20,5

160
TÓPICO 3 | REGRESSÕES E CORRELAÇÕES

7 anos 117 23,1


8 anos 125 25,4
9 anos 132 28,7
10 anos 137 32,4
11 anos 143 35,3
12 anos 149 40,7

FONTE: A autora

Representando os dados em um gráfico de dispersão que relaciona as


variáveis x e y:

GRÁFICO 5 - VARIAÇÃO DO PESO E DA ALTURA PARA CRIANÇAS BRASILEIRAS ENTRE 1 E 12 ANOS.

FONTE: A autora

Note que o gráfico de dispersão que relaciona a altura e o peso conforme a


idade das crianças brasileiras sugere que as variáveis possuem uma relação linear
direta. Veremos no próximo tópico que podemos quantificar a força dessa relação
através da determinação do coeficiente de correlação de Pearson.

161
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

3 CORRELAÇÃO DE PEARSON
O coeficiente de correlação de Pearson é uma medida do grau da relação
linear entre duas variáveis quantitativas. É um índice adimensional que estabelece
o quanto uma linha reta se ajusta em uma de nuvem de pontos (diagrama de
dispersão).

O coeficiente de correlação costuma ser representado pela letra R quando


se trata de uma amostra ou por ρ quando o estudo refere-se a uma população.
Possui valores situados entre -1,0 e 1,0, sendo que:

Usualmente, multiplicamos o valor do coeficiente por 100 para termos o


seu valor em porcentagem. A partir dos valores de R ou ρ, podemos verificar o
tipo da correlação existente entre as variáveis estudadas:

• 0 < r < 0,3: a correlação é muito fraca e não é possível estabelecer relação efetiva
entre as variáveis;
• 0,3 r < 0,6: a correlação é fraca, mas pode-se considerar a existência de uma
relação entre as variáveis;
• 0,6 ≤ r < 1: a correlação é média para forte e a relação entre as variáveis é
significativa, havendo uma forte relação entre as variáveis.

Acadêmico, note que no estudo estatístico as correlações resumem o grau


de relacionamento entre duas variáveis, e as regressões têm como finalidade a
obtenção de uma equação matemática que descreve o relacionamento entre estas
variáveis.

Exemplo 1: A busca por uma vida saudável, que alie alimentação


equilibrada a exercícios físicos, vem crescendo entre todos os grupos da
população. Diante disso, uma empresa buscou fazer uma pesquisa para verificar
se há correlação significativa do gasto mensal com suplementos dos praticantes
regulares de atividade física com a renda de cada um deles.

A partir dos dados coletados foi possível elaborar a seguinte tabela:

162
TÓPICO 3 | REGRESSÕES E CORRELAÇÕES

TABELA 44 - RELAÇÃO ENTRE GASTO MENSAL COM SUPLEMENTO E RENDA INDIVIDUAL POR
ALUNOS DA ACADEMIA XX NA CIDADE DE BLUMENAU - 2016

Atividade Praticada Renda Individual (R$) Gasto com Suplemento (R$)

Musculação 2470,98 61,53


Ginástica localizada 2357,89 58,48
Corrida 2233,18 56,79
Funcional 2128,47 54,91
Esportes coletivos 2002,95 47,38
Natação 1926,56 44,98
Step 1818,27 39,25
Zumba 1801,32 37,5
Pilates 1789,56 33,15

FONTE: A autora.

Para podermos visualizar a relação entre as variáveis, construímos o


gráfico de dispersão com os dados do gasto com suplemento em relação à renda
individual, conforme apresentado a seguir:

GRÁFICO 6 - GASTO MENSAL COM SUPLEMENTO E RENDA INDIVIDUAL POR ALUNOS DA


ACADEMIA XX NA CIDADE DE BLUMENAU - 2016.

FONTE: A autora

Acadêmico, note que os gráficos de dispersão exibem quão bem os dados


se adaptam a um certo ajuste (linha de tendência)

Depois de observarmos a dispersão dos dados estatísticos no gráfico,


vimos que se trata de uma relação linear direta. Agora, devemos organizar as
163
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

informações necessárias para calcularmos o coeficiente de correlação de Pearson.


Para facilitar a compreensão dos cálculos realizados, elaboramos a tabela a seguir:

TABELA 45 - CÁLCULO DO COEFICIENTE DE PEARSON PARA O GASTO MENSAL COM


SUPLEMENTO E RENDA INDIVIDUAL POR ALUNOS DA ACADEMIA XX NA CIDADE DE
BLUMENAU - 2016

Renda Gasto com


Atividade
Individual Suplemento x iy i x2i y2i
Praticada
(xi) (yi)

Musculação 2470,98 61,53 152039,40 6105742,16 3785,94


Ginástica
2357,89 58,48 137889,41 5559645,25 3419,91
localizada
Corrida 2233,18 56,79 126822,29 4987092,91 3225,10
Funcional 2128,47 54,91 116874,29 4530384,54 3015,11
Esportes coletivos 2002,95 47,38 94899,77 4011808,70 2244,86
Natação 1926,56 44,98 86656,67 3711633,43 2023,20
Step 1818,27 39,25 71367,10 3306105,79 1540,56
Zumba 1801,32 37,50 67549,50 3244753,74 1406,25
Pilates 1789,56 33,15 59323,91 3202524,99 1098,92
TOTAL 18529,18 433,97 913422,34 38659691,53 21759,86

FONTE: A autora

A partir destas informações, podemos calcular o coeficiente de correlação


de Pearson:

164
TÓPICO 3 | REGRESSÕES E CORRELAÇÕES

Com base no resultado encontrado para o coeficiente de Pearson,


podemos dizer que a relação entre a renda mensal e o gasto com suplementos é
uma correlação forte e tem significância.

Acadêmico, após compreendermos que uma correlação é a relação entre


duas variáveis, partiremos para um novo desafio: encontrar uma equação que
represente a variação da variável independente em relação à variável dependente
em um determinado fenômeno, ou seja, nosso próximo objetivo é estudar a
regressão linear.

4 REGRESSÃO LINEAR SIMPLES


O coeficiente de correlação de Pearson é uma medida do grau da relação
linear entre duas variáveis quantitativas. É um índice adimensional que estabelece
o quanto uma linha reta se ajusta em uma de nuvem de pontos (diagrama de
dispersão).

O coeficiente de correlação costuma ser representado pela letra R quando


se trata de uma amostra ou por ρ quando o estudo refere-se a uma população.
Possui valores situados entre -1,0 e 1,0, sendo que:

• R = 1: significa que as variáveis são diretamente proporcionais, e os pontos da


reta caem exatamente sobre uma linha crescente;
• R = -1: significa que as variáveis são inversamente proporcionais, e os pontos da
reta caem exatamente sobre uma linha decrescente;
• R = 0: Significa que não existe correlação entre as duas variáveis.

O coeficiente de correlação é dado por:

Na maioria das vezes, ao visualizarmos o diagrama de dispersão


conseguimos supor que exista uma relação de causa-efeito entre as duas variáveis
quantitativas. A partir dessa observação, surgiu o desafio de como expressar
matematicamente essa relação.

Neste tópico abordaremos a análise de regressão como uma técnica


estatística que tem por objetivo investigar e modelar a relação entre duas variáveis.
Regressão linear significa determinar uma equação da reta que melhor se ajuste
ao padrão seguido pelos dados, para ser possível determinar um modelo que
permita prever uma estimativa linear entre duas variáveis aleatórias.

Existem diversas situações em que devemos utilizar a regressão linear na


estatística. Podemos estimar os valores de uma variável, com base em valores
165
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

conhecidos da outra, ou em situações em que seja necessário confirmar uma


relação de causa e efeito entre variáveis.

No estudo da regressão, iniciamos denominando a variável dependente


(ou variável resposta) de y e a independente (fator) de x. Acadêmico, note que as
expressões a seguir possuem o mesmo significado:

• y depende de x (linguagem coloquial);


• y é função de x (linguagem matemática);
• existe regressão de y sobre x (linguagem estatística).

O estudo da regressão linear deve iniciar pela elaboração de um gráfico


de dispersão dos pontos. Esse passo é fundamental, pois a partir dele podemos
determinar a existência ou não da regressão, assim como evita com que a técnica
seja aplicada em um conjunto de dados que não são adequados. O segundo passo
é determinarmos a equação da reta, como veremos na sequência.

4.1 EQUAÇÃO LINEAR


Para aplicar regressão, os dados estatísticos precisam atender às seguintes
condições conjuntas:

• Ser significativo; para isso, é necessário realizar um teste de hipóteses;


• Existir homocedasticidade, verificando os resíduos;
• A variável y apresentar distribuição normal.

Acadêmico, é importante lembrarmos que:

• Para um valor xi podem existir um ou mais valores de yi amostrados;


• Porém, para esse mesmo valor xi apenas um valor será projetado;
• Sempre teremos observações que não são pontos da reta, ou seja, pontos
fora do padrão dos dados.
FONTE: Disponível em: < http://docslide.com.br/documents/analise-de-regressao-
55bd18966ba31.html>. Acesso em: 20 ago. 2016.

Sabemos que a equação de uma reta é representada por y = ax + b. Para


determinarmos qual a equação que melhor se ajusta a um conjunto de dados,
precisamos calcular os valores dos parâmetros a e b, conforme as seguintes
fórmulas:

166
TÓPICO 3 | REGRESSÕES E CORRELAÇÕES

Onde:
• n é o número de dados a serem analisados;
• e y são as médias dos valores de xi e yi, respectivamente. Podemos
determinar as médias através das equações:

É importante ressaltarmos que quando aplicamos estas fórmulas a um


conjunto de dados, estamos fazendo uma estimativa da verdadeira equação de
regressão. Deste modo, devemos escrever , onde é o y estimado.

Exemplo 1: Uma academia de ginástica decidiu realizar uma pesquisa


de como a prática de exercícios pode afetar na perda de peso. Para isto, foram
selecionados 12 alunos iniciantes na academia que realizavam os exercícios com
o objetivo de emagrecer. No entanto, na fase inicial da pesquisa, estes alunos não
poderiam diminuir a quantidade de calorias ingeridas diariamente, para que os
dados referentes à perda de peso fossem somente influenciados pelos exercícios
físicos realizados. Foi solicitado aos alunos que registrassem no decorrer de duas
semanas o número de minutos de exercícios que praticaram, com a perda de peso
após o período de duas semanas.

TABELA 46 - PERDA DE PESO COM RELAÇÃO À PRÁTICA DE EXERCÍCIOS FÍSICOS

Indivíduo Exercícios xi (min) Perda de Peso yi (Kg)


1 237 1,71
2 235 1,49
3 228 1,49
4 193 1,26
5 190 1,17
6 186 1,17
7 185 1,13

167
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

8 176 0,9
9 171 0,73
10 148 0,63
11 109 0,5
12 100 0,27

FONTE: A autora

A partir da tabela acima, construímos um gráfico de dispersão para


avaliar se existe relação entre a variável dependente perda de peso (yi) e a variável
independente tempo de atividade física praticada (xi):

GRÁFICO 7 - PERDA DE PESO COM RELAÇÃO AO TEMPO REALIZADO DE ATIVIDADE FÍSICA.

FONTE: A autora

Observe que os pontos que formam o gráfico de dispersão representam


uma correlação que se assemelha a uma reta ascendente, sendo, portanto, uma
correlação linear positiva.

TABELA 56 - CÁLCULOS AUXILIARES PARA DETERMINAÇÃO DA EQUAÇÃO DA RETA PARA A


DETERMINAÇÃO DA PERDA DE PESO EM RELAÇÃO À PRÁTICA DE ATIVIDADE FÍSICA

Exercícios xi
Indivíduo Perda de Peso yi (Kg) x iy i x2i y2i
(min)
1 237 1,71 405,27 56169 2,9241
2 235 1,49 350,15 55225 2,2201
3 228 1,49 339,72 51984 2,2201

168
TÓPICO 3 | REGRESSÕES E CORRELAÇÕES

4 193 1,26 243,18 37249 1,5876


5 190 1,17 222,3 36100 1,3689
6 186 1,17 217,62 34596 1,3689
7 185 1,13 209,05 34225 1,2769
8 176 0,9 158,4 30976 0,81
9 171 0,73 124,83 29241 0,5329
10 148 0,63 93,24 21904 0,3969
11 109 0,5 54,5 11881 0,25
12 100 0,27 27 10000 0,0729
TOTAL 2158 12,45 2445,26 409550 15,0293

FONTE: A autora

Com base nas informações da tabela acima, podemos calcular os


parâmetros a e b:

169
UNIDADE 3 | INTRODUÇÃO AOS TESTES ESTATÍSTICOS

Substituindo os valores encontrados para os parâmetros a e b na fórmula


genérica que representa a equação da reta, chegaremos à seguinte função de
regressão linear: y = 0,009611x – 0,69088. Com esta função, poderemos estimar a
perda de peso de um indivíduo que passa a praticar exercícios físicos regularmente.

E
IMPORTANT

Acadêmico, você pode utilizar o programa Microsoft Excel para auxiliá-lo na


obtenção da linha de tendência dos pontos num gráfico de dispersão e para a
determinação da equação da reta que representa estes pontos.

Na barra de ícones principal do programa você pode inserir um gráfico


de dispersão. Após selecionar os dados da série, basta clicar com o botão direito
do mouse sobre os pontos do gráfico e adicionar uma linha de tendência. Abrirá
uma janela que lhe permite configurar a linha de tendência. Para obter a equação
da reta que melhor se ajusta aos pontos do gráfico, selecionar “Exibir equação no
gráfico”.

Observe o gráfico a seguir, baseado no exemplo anterior:

GRÁFICO 8 - LINHA DE PERDA DE PESO COM RELAÇÃO AO TEMPO REALIZADO DE


ATIVIDADE FÍSICA.

FONTE: A autora

170
RESUMO DO TÓPICO 3
Neste tópico, você viu que:

• Coeficiente de correlação de Pearson é uma medida do grau da relação


linear entre duas variáveis quantitativas, sendo representado pela equação:

• Regressão linear tem por objetivo determinar uma equação da reta


que melhor se ajuste a um conjunto de dados estatísticos. O resultado de uma
regressão linear segue a equação da reta: y = ax + b.

• A fórmula para o cálculo dos parâmetros a e b é:

a= ; b=

171
AUTOATIVIDADE

1 A correlação e a regressão linear simples são métodos estudados pela


estatística que compreendem a análise de dados amostrais para saber se, e
como, duas ou mais variáveis estão relacionadas entre si numa população.
Sobre estes métodos, assinale a alternativa CORRETA:

a) ( ) A regressão e a correlação são técnicas qualitativas utilizadas para


estimar a qualidade de uma relação entre uma população e uma variável;
b) ( ) A correlação mede a intensidade da força de relacionamento entre duas
variáveis e a regressão fornece a equação que descreve o relacionamento
em termos matemáticos.
c) ( ) Os dados para análise de regressão e correlação são obtidos através de
informações aleatórias; sendo assim, as variáveis não precisam tratar de uma
mesma população.
d) ( ) Na regressão pressupõe-se que não haja uma relação de causa e efeito
entre duas variáveis.

2 Selecione a alternativa que possui a regressão linear que melhor representa


os dados da tabela a seguir:

RELAÇÃO ENTRE O PREÇO E A QUANTIDADE DE PRODUTOS VENDIDOS

Produto Quantidade Preço


P1 71 40,7
P2 84 37,3
P3 96 35,9
P4 102 32,7
P5 108 31,8
P6 112 28,1
P7 119 27,5
P8 127 26,4
P9 132 25,6
P10 139 24,7
P11 147 24,3
P12 156 23,8

FONTE: A autora

172
a) ( ) y = -0,2141x + 54,753
b) ( ) y = 0,2141x - 54,753
c) ( ) y = -4,3526x + 246,23
d) ( ) y = 4,3526x - 246,23

173
APÊNDICE A

Tabela Z (Normal Padrão)

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952

174
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

175
APÊNDICE B
Distribuição Qui-Quadrado
P(χ2(n-1) ≥ χ2tab) = α

gl 0,990 0,950 0,900 0,500 0,100 0,050 0,025 0,010 0,005


1 0,0002 0,0039 0,0158 0,4549 2,7055 3,8415 5,0239 6,6349 7,8794
2 0,0201 0,1026 0,2107 1,3863 4,6052 5,9915 7,3778 9,2103 10,5966
3 0,1148 0,3518 0,5844 2,3660 6,2514 7,8147 9,3484 11,3449 12,8382
4 0,2971 0,7107 1,0636 3,3567 7,7794 9,4877 11,1433 13,2767 14,8603
5 0,5543 1,1455 1,6103 4,3515 9,2364 11,0705 12,8325 15,0863 16,7496
6 0,8721 1,6354 2,2041 5,3481 10,6446 12,5916 14,4494 16,8119 18,5476
7 1,2390 2,1673 2,8331 6,3458 12,0170 14,0671 16,0128 18,4753 20,2777
8 1,6465 2,7326 3,4895 7,3441 13,3616 15,5073 17,5345 20,0902 21,9550
9 2,0879 3,3251 4,1682 8,3428 14,6837 16,9190 19,0228 21,6660 23,5894
10 2,5582 3,9403 4,8652 9,3418 15,9872 18,3070 20,4832 23,2093 25,1882
11 3,0535 4,5748 5,5778 10,3410 17,2750 19,6751 21,9200 24,7250 26,7568
12 3,5706 5,2260 6,3038 11,3403 18,5493 21,0261 23,3367 26,2170 28,2995
13 4,1069 5,8919 7,0415 12,3398 19,8119 22,3620 24,7356 27,6882 29,8195
14 4,6604 6,5706 7,7895 13,3393 21,0641 23,6848 26,1189 29,1412 31,3193
15 5,2293 7,2609 8,5468 14,3389 22,3071 24,9958 27,4884 30,5779 32,8013
16 5,8122 7,9616 9,3122 15,3385 23,5418 26,2962 28,8454 31,9999 34,2672
17 6,4078 8,6718 10,0852 16,3382 24,7690 27,5871 30,1910 33,4087 35,7185
18 7,0149 9,3905 10,8649 17,3379 25,9894 28,8693 31,5264 34,8053 37,1565
19 7,6327 10,1170 11,6509 18,3377 27,2036 30,1435 32,8523 36,1909 38,5823
20 8,2604 10,8508 12,4426 19,3374 28,4120 31,4104 34,1696 37,5662 39,9968
21 8,8972 11,5913 13,2396 20,3372 29,6151 32,6706 35,4789 38,9322 41,4011
22 9,5425 12,3380 14,0415 21,3370 30,8133 33,9244 36,7807 40,2894 42,7957
23 10,1957 13,0905 14,8480 22,3369 32,0069 35,1725 38,0756 41,6384 44,1813
24 10,8564 13,8484 15,6587 23,3367 33,1962 36,4150 39,3641 42,9798 45,5585
25 11,5240 14,6114 16,4734 24,3366 34,3816 37,6525 40,6465 44,3141 46,9279
26 12,1981 15,3792 17,2919 25,3365 35,5632 38,8851 41,9232 45,6417 48,2899
27 12,8785 16,1514 18,1139 26,3363 36,7412 40,1133 43,1945 46,9629 49,6449
28 13,5647 16,9279 18,9392 27,3362 37,9159 41,3371 44,4608 48,2782 50,9934
29 14,2565 17,7084 19,7677 28,3361 39,0875 42,5570 45,7223 49,5879 52,3356
30 14,9535 18,4927 20,5992 29,3360 40,2560 43,7730 46,9792 50,8922 53,6720
31 15,6555 19,2806 21,4336 30,3359 41,4217 44,9853 48,2319 52,1914 55,0027
32 16,3622 20,0719 22,2706 31,3359 42,5847 46,1943 49,4804 53,4858 56,3281
33 17,0735 20,8665 23,1102 32,3358 43,7452 47,3999 50,7251 54,7755 57,6484
34 17,7891 21,6643 23,9523 33,3357 44,9032 48,6024 51,9660 56,0609 58,9639
35 18,5089 22,4650 24,7967 34,3356 46,0588 49,8018 53,2033 57,3421 60,2748

176
36 19,2327 23,2686 25,6433 35,3356 47,2122 50,9985 54,4373 58,6192 61,5812
37 19,9602 24,0749 26,4921 36,3355 48,3634 52,1923 55,6680 59,8925 62,8833
38 20,6914 24,8839 27,3430 37,3355 49,5126 53,3835 56,8955 61,1621 64,1814
39 21,4262 25,6954 28,1958 38,3354 50,6598 54,5722 58,1201 62,4281 65,4756
40 22,1643 26,5093 29,0505 39,3353 51,8051 55,7585 59,3417 63,6907 66,7660
41 22,9056 27,3256 29,9071 40,3353 52,9485 56,9424 60,5606 64,9501 68,0527
42 23,6501 28,1440 30,7654 41,3352 54,0902 58,1240 61,7768 66,2062 69,3360
43 24,3976 28,9647 31,6255 42,3352 55,2302 59,3035 62,9904 67,4593 70,6159
44 25,1480 29,7875 32,4871 43,3352 56,3685 60,4809 64,2015 68,7095 71,8926
45 25,9013 30,6123 33,3504 44,3351 57,5053 61,6562 65,4102 69,9568 73,1661
50 29,7067 34,7643 37,6886 49,3349 63,1671 67,5048 71,4202 76,1539 79,4900

177
APÊNDICE C
Distribuição t-Student
P(t(n-1) ≥ ttab) = α

gl 0,25 0,10 0,05 0,025 0,01 0,005


1 1,0000 3,0777 6,3137 12,7062 31,8210 63,6559
2 0,8165 1,8856 2,9200 4,3027 6,9645 9,9250
3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8408
4 0,7407 1,5332 2,1318 2,7765 3,7469 4,6041
5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0321
6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074
7 0,7111 1,4149 1,8946 2,3646 2,9979 3,4995
8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554
9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498
10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693
11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058
12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545
13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123
14 0,6924 1,3450 1,7613 2,1448 2,6245 2,9768
15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467
16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208
17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982
18 0,6884 1,3304 1,7341 2,1009 2,5524 2,8784
19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609
20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453
21 0,6864 1,3232 1,7207 2,0796 2,5176 2,8314
22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188
23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073
24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7970
25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874
26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787
27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707
28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633
29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564
30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500
40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045
50 0,6794 1,2987 1,6759 2,0086 2,4033 2,6778
60 0,6786 1,2958 1,6706 2,0003 2,3901 2,6603
120 0,6765 1,2886 1,6576 1,9799 2,3578 2,6174
∞ 0,6745 1,2816 1,6449 1,9600 2,3264 2,5758

178
REFERÊNCIAS

BRASIL. Ministério do Esporte. Disponível em: <http://www.esporte.gov.br/


diesporte/2.html>. Acesso em: 20 ago. 2016.

BRASIL. Rede Interagencial de Informação para a Saúde. Indicadores básicos


para a saúde no Brasil: conceitos e aplicações. 2. ed. Brasília: Organização
Pan-Americana da Saúde, 2008. Disponível em: <http://tabnet.datasus.gov.br/
tabdata/livroidb/2ed/indicadores.pdf>. Acesso em: 20 ago. 2016.

CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. 5. ed.


Curitiba: Ibpex, 2010.

CRESPO, Antônio A. Estatística fácil. São Paulo: Saraiva, 2005.

FARBER, Larson. Estatística Aplicada. 4º São Paulo: Pearson Education, 2010.

MORRETTIN, Luiz Gonzaga. Estatística Básica. Probabilidade e Inferência. São


Paulo. Pearson: 2010.

TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São


Paulo: Atlas, 2009.

WALPOLE, Ronald E. Probabilidade e estatística para engenharia e ciências.


São Paulo: Pearson Prentice Hall, 2009.

179
ANOTAÇÕES

____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________

180
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
181

Você também pode gostar