Módulo 3 - Visão Sistêmica Sobre A Análise de Dados
Módulo 3 - Visão Sistêmica Sobre A Análise de Dados
Módulo 3 - Visão Sistêmica Sobre A Análise de Dados
3
Módulo
Conteudista/s
Ricardo Alexandre Amaral (conteudista, 2022);
Diretoria de Desenvolvimento Profissional.
Enap, 2022
Fundação Escola Nacional de Administração Pública
Diretoria de Desenvolvimento Profissional
SAIS - Área 2-A - 70610-900 — Brasília, DF
Sumário
Unidade 1: Elementos de Tratamento Numérico e Computacional
de Dados.................................................................................................5
Referências . ...................................................................................................................... 10
Referências . ...................................................................................................................... 17
Referências . ...................................................................................................................... 22
Apresentação e Boas-vindas
Seja bem-vindo e bem-vinda ao curso Análise de Dados: uma Leitura Crítica das
Informações.
A estatística é entendida como a ciência dos dados, visto que tem ligação direta com o
tratamento desses dados em vários campos do saber. Especialmente neste curso, você
poderá analisar o alinhamento da estatística com o desenvolvimento da sociedade,
via produção de pesquisa social e por meio de indicadores que permitem mensurar
desde características regionais de um país, até suas demandas de desenvolvimento
socioeconômico.
O propósito é que este curso sirva para aprimorar um olhar crítico sobre o tema análise
de dados e sobre outras áreas de atuação adjacentes ao tema como, por exemplo:
gestão, mercado, políticas públicas e a cultura do cidadão pleno. Dessa forma, uma
vez que o indivíduo estabeleça vínculo com as mídias informativas espera-se que ele
esteja apto à leitura e interpretação de dados.
A ideia aqui é mostrar como obter a análise de dados e como fazer esses fits, que
vão sendo internalizados e contribuem para o desenvolvimento da sua percepção e
criticidade. Logo, o olhar clínico do examinador é imprescindível, uma vez que é ele
que faz as escolhas quanto aos ajustes, do mais simples para o mais complexo: reta,
quadrático etc. Sites como o Planet Calc fazem regressões lineares, quadráticas e cúbicas
de modo simples, direto e sem a necessidade de instalação de nenhum programa.
Para saber mais sobre o Planet Calc clique aqui e acesse o site
Para seguir com o conteúdo será usada novamente a análise da curva de imunização
parcial contra coronavírus no Brasil e seus ajustes. É importante relembrar que o fit
em vermelho é linear e não passa por todos os pontos, assim tendo uma correlação
menor que a dos demais ajustes, representados em verde claro e roxo, que são
ajustes de graus 2 e 3 respectivamente.
Idealmente R² = 1 = 100%, seria uma reta perfeita, porém não existe para dados
reais, uma vez que dados tem uma incerteza intrínseca, portanto quanto mais baixo
Você chegou ao fim desta unidade. Caso surjam dúvidas, faça uma releitura dos tópicos
de interesse. Bons estudos!
HURWITZ, Judith et al. Big Data para leigos. Rio de Janeiro, Alta Books Editora, 2016.
INSTITUTO BRASILEIRO DE GEOGRAFIA (IBGE). O que é o PIB. Rio de Janeiro, IBGE, 2021.
Disponível em: https://www.ibge.gov.br/explica/pib.php. Acesso em: 12 nov. 2021.
PROVOST, Foster; FAWCETT, Tom. Data Science for Business: What you need to know
about data mining and data-analytic thinking. Sebastopol (USA) O'Reilly Media, Inc., 2013.
SOUZA, Emanuel Fernando Maia de; PETERNELLI, Luiz Alexandre; MELLO, Márcio
Pupin de. Software Livre R: aplicação estatística. 2014. Universidade Federal da Paraíba.
Ao final desta unidade você será capaz de reconhecer a análise de dados e o pensamento
estratégico, assim atrelando as fits e seus modelos ao olhar crítico, o qual deve fundamentar
o discurso e exame dos dados.
Ocorre que a ideia por trás de um ajuste é obter uma função que modela os dados,
que os recria, e deste modo que permite fazer inferências, mesmo que tímidas,
sobre a evolução de um sistema, ou seja, um futuro caracterizado com base na
tendência determinada por um rol de dados.
Motivado pelo ajuste linear de boa qualidade (ótima correlação), é possível avançar
na busca de extrair resultados sobre os dados da curva de imunização parcial
contra coronavírus no Brasil. Logo a ideia é listar os passos para a construção de
informações a partir dos dados e a interpretação do contexto.
É interessante tratar um pouco mais tais dados sobre a imunização, uma vez que
é possível determinar o eixo temporal em dias, calculando a diferença entre datas.
Um exemplo pode ser visto no período de tempo entre 14/02 e 01/04 de 2021, que
pode ser reescrito, buscando uma padronização quanto ao tempo. A tabela a seguir
mostra tal raciocínio e resultados.
A figura a seguir, via análise do gráfico e da reta de ajuste, permite prever que se
chegará a 100% da população por volta de 340 dias, ou seja, tratar dados e promover
argumentação com base nos mesmos.
y = (0,319389909358684)x + (-5,4151309052754)
B = -5,415
A = 0,319
------------------
R^2 = 0,96
Note ainda que a função de ajuste, escrita de modo simplificado como: y = (0,319)
x + (-5,415) se comporta como uma regra, mas não é a regra, pois é possível, por
exemplo, que se admita percentuais negativos.
Você chegou ao fim desta unidade. Parabéns! Caso exista dúvida sobre o tema,
reveja o conteúdo para fixar seus estudos.
ALVES, Isabel Fraga. Data Science, Big Data e um novo olhar sobre a Estatística.
Boletim SPE: O Tema Central da Estatística - um novo olhar, Lisboa, v. 12, n. 2, p.
29-31, 2017. Semestral.
HURWITZ, Judith et al. Big Data para leigos. Rio de Janeiro, Alta Books Editora, 2016.
INSTITUTO BRASILEIRO DE GEOGRAFIA (IBGE). O que é o PIB. Rio de Janeiro, IBGE, 2021.
Disponível em: https://www.ibge.gov.br/explica/pib.php. Acesso em: 12 nov. 2021.
PROVOST, Foster; FAWCETT, Tom. Data Science for Business: What you need to
know about data mining and data-analytic thinking. Sebastopol (USA) O'Reilly Media,
Inc., 2013.
SOUZA, Emanuel Fernando Maia de; PETERNELLI, Luiz Alexandre; MELLO, Márcio Pupin
de. Software Livre R: aplicação estatística. 2014. Universidade Federal da Paraíba.
VITALI, Marieli Mezari. Estatística sem matemática para psicologia. Revista Brasileira
de Psicodrama, São Paulo, v. 27, n. 1, p. 139-144, 2019.
Ao final desta unidade você será capaz de reconhecer a emergência da análise de dados
para uma leitura crítica de informações.
Note que as discussões que derivam da Lei de Hubble recriam um histórico de como
são tecidos pareceres científicos a partir de um ajuste linear de dados, ou, em outras
palavras, como uma metodologia baseada na análise de dados se aplica a um certo
nicho específico de conhecimento humano, nesse caso a física e a cosmologia.
A figura a seguir mostra um gráfico de ações em tempo real, retirado do site Investing.
com. Nesta figura está relacionado o volume de ações da Petrobrás, empresa cuja
atuação influencia nos custos de vida de todo brasileiro. O investidor usa sua intuição,
principalmente para perceber se o gráfico não descreve um sistema muito latente.
O fato é que a análise de dados é uma área altamente interdisciplinar que se compõe
com a estatística, matemática, programação, resolução de problemas acadêmicos
e científicos, desenvolvimento de técnicas numéricas etc. Dado que vários estudos,
mesmo com o uso de computadores são muito demorados,simplificações são muito
bem-vindas.Um exemplo disso é utilizar um fit de menor grau, quando a correlação
é suficientemente satisfatória, comumente acima de 0,9.
Ao chegar até aqui você finalizou o estudo desta unidade! Acesse a atividade avaliativa
no ambiente virtual de aprendizagem para refletir sobre o que foi apresentado até aqui.
ALVES, Isabel Fraga. Data Science, Big Data e um novo olhar sobre a Estatística.
Boletim SPE: O Tema Central da Estatística - um novo olhar, Lisboa, v. 12, n. 2, p.
29-31, 2017. Semestral.
HURWITZ, Judith et al. Big Data para leigos. Rio de Janeiro, Alta Books Editora, 2016.
INSTITUTO BRASILEIRO DE GEOGRAFIA (IBGE). O que é o PIB. Rio de Janeiro, IBGE, 2021.
Disponível em: https://www.ibge.gov.br/explica/pib.php. Acesso em: 12 nov. 2021.
PROVOST, Foster; FAWCETT, Tom. Data Science for Business: What you need to
know about data mining and data-analytic thinking. Sebastopol (USA) O'Reilly Media,
Inc., 2013.
SOUZA, Emanuel Fernando Maia de; PETERNELLI, Luiz Alexandre; MELLO, Márcio Pupin
de. Software Livre R: aplicação estatística. 2014. Universidade Federal da Paraíba.