Data Science Big 2022

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 60

Jéssica Laisa Dias da Silva e

Alan de Oliveira Santana


Big Data e
Ciência de
Dados
Diretor Executivo
DAVID LIRA STEPHEN BARROS
Diretora Editorial
CRISTIANE SILVEIRA CESAR DE OLIVEIRA
Projeto Gráfico
TIAGO DA ROCHA
Autores
JÉSSICA LAISA DIAS DA SILVA E
ALAN DE OLIVEIRA SANTANA
OS AUTORES
Jéssica Laisa Dias da Silva
Eu, Jéssica, possuo graduação em Sistema da Informação pela
Unifacisa – Universidade de Ciências Sociais Aplicadas. Sou mestre em
Sistema e Computação pela UFRN-Universidade Federal de Rio Grande
do Norte. Atualmente sou doutoranda em Sistema e Computação
pela UFRN-Universidade Federal de Rio Grande do Norte e professora
conteudista elaborando cadernos.

Alan de Oliveira Santana


Olá. Sou Alan de Oliveira Santana, possuo graduação em Ciência da
Computação – Universidade do Estado do Rio Grande do Norte – e Mestre
em Sistemas da Computação – Universidade Federal do Rio Grande do
Norte. Atualmente sou professor conteudista, elaborador de cadernos
de questões e doutorando em Ciências da Computação. Como cientista,
atuo no desenvolvimento e avaliação de técnicas de desenvolvimento de
sistemas com ênfase na educação.

Desse modo, fomos convidados pela Editora Telesapiens a integrar


seu elenco de autores independentes. Estou muito satisfeito com o
convite e a possibilidade de auxiliar em seu desenvolvimento intelectual
e profissional. Bons estudos!
ICONOGRÁFICOS
Olá. Esses ícones irão aparecer em sua trilha de aprendizagem toda
vez que:

INTRODUÇÃO: DEFINIÇÃO:
para o início do houver necessidade
desenvolvimento de se apresentar um
de uma nova com- novo conceito;
petência;

NOTA: IMPORTANTE:
quando forem as observações
necessários obser- escritas tiveram que
vações ou comple- ser priorizadas para
mentações para o você;
seu conhecimento;
EXPLICANDO VOCÊ SABIA?
MELHOR: curiosidades e
algo precisa ser indagações lúdicas
melhor explicado ou sobre o tema em
detalhado; estudo, se forem
necessárias;
SAIBA MAIS: REFLITA:
textos, referências se houver a neces-
bibliográficas e links sidade de chamar a
para aprofundamen- atenção sobre algo
to do seu conheci- a ser refletido ou
mento; discutido sobre;
ACESSE: RESUMINDO:
se for preciso aces- quando for preciso
sar um ou mais sites se fazer um resumo
para fazer download, acumulativo das
assistir vídeos, ler últimas abordagens;
textos, ouvir podcast;
ATIVIDADES: TESTANDO:
quando alguma quando o desen-
atividade de au- volvimento de uma
toaprendizagem for competência for
aplicada; concluído e questões
forem explicadas;
SUMÁRIO
Conceitos, história e evolução do Big Data......................................10
Histórico: Big Data ........................................................................................................................ 13

Big Data ................................................................................................................................................ 14

Os 5Vs do Big Data........................................................................................................................ 17

Fundamentos do ambiente favorável à aplicação de tecnologias


do Big Data.....................................................................................................21
A diferença entre Big Data e os sistemas tradicionais........................................ 21

Impacto do Big Data ................................................................................................................... 22

O ambiente favorável a aplicação do Big Data: tecnologias ........................ 28

Técnicas de Visualização de dados......................................................31


Visualização de dados: Conceito........................................................................................ 31

Modelos do processo de Visualização.......................................................................... 34

Técnicas de visualização ......................................................................................................... 37

Onde aplicar Big Data................................................................................42


Importância de utilizar Big Data......................................................................................... 42

Big Data onde é aplicado......................................................................................................... 43

Big Data na educação............................................................................................. 43

Big Data aplicando aplicado a negócios .................................................. 46

Big Data Aplicado na Saúde............................................................................... 48

Big Data aplicado na Área Eleitoral .............................................................. 49


Big Data e Ciência de Dados 7

01
UNIDADE

LIVRO DIDÁTICO DIGITAL


8 Big Data e Ciência de Dados

INTRODUÇÃO
Percebemos que a cada dia as tecnologias avançam se tornando
cada vez mais acessíveis, não parando de produzir grandes massas de
dados. Temos o avanço inciando com internet e crescendo ao longo do
tempo, com os sistemas de informação, aplicações pessoais e comercias.
Como também, temos as redes socias, portais, emails, sensores e
aplicações gerando dados a cada instante.

Com isto, surge a necessidade de desenvolvimento de técnicas e


recursos tecnológicos que ajudam a lidar com todos esses dados. Uma
destas tecnologias que surgiram é a solução computacional Big Data,
que será abordada ao longo da unidade. Dessa forma, iremos descrever
desde da definição dos autores como os 5Vs que a carcterizam: volume,
veracidade, valor e variedade.

Veremos também, a diferença entre Big Data e os sistemas


tradicionais, tendo em vista o objetivo, bem como o tipo de plataforma e
infraestrutura usadas para trabalhar com Big Data.

Entederemos ainda, como a visualização de dados é importante na


utilização do Big Data, tendo em vista que a partir da análises dos dados é
necessário disponibiliza-lá a informação para as organizações realizarem
suas tomadas de decisão.

Por fim, da unidade estudaremos ambientes onde aplicar o Big data


e as contribuições trazidas com essa solução computacional.
Big Data e Ciência de Dados 9

OBJETIVOS
Olá. Seja muito bem-vindo à Unidade 1. Nosso objetivo é auxiliar
você no desenvolvimento das seguintes competências profissionais até o
término desta etapa de estudos:

1. Introduzir o conceito do Big Data;

2. Conhecer o ambiente favorável à aplicação de tecnologias do


Big Data;

3. Conhecer a visualização de dados;

4. Estudar onde aplicar Big Data.

Então? Preparado para uma viagem sem volta rumo ao


conhecimento? Ao trabalho!
10 Big Data e Ciência de Dados

Conceitos, história e evolução do Big


Data

INTRODUÇÃO:

Neste capítulo, conceituaremos sobre a solução


computacional Big Data, tratando da sua definição e seu
surgimento, apresentando ainda sua importância na
atualidade.

Com o surgimento da internet acompanhou uma nova era de


compartilhamento de informações em um volume e velocidade nunca
vistos antes. Segundo Sodré (2016), aproximadamente 2,5 quintilhões de
bytes de dados são criados diariamente por meio de postagens em redes
sociais, upload de fotos e vídeos, registros de transações comerciais,
sinais de GPS, rastros de navegação e sensores dos mais diversos tipos. E
esse volume só tende a crescer.

Além do que, as novas tecnologias têm surgido nos últimos anos para
endereçar as limitações técnicas das ferramentas clássicas no tratamento
das demandas de processamento mais sofisticados, tempos de resposta
cada vez menores e crescentes volumes de dados (LETOUZÉ, 2012;
GOLDMAN et al., 2012). Tecnologias como ferramentas de colaboração,
sensores, diversidade de sistemas, aplicações desenvolvidas tanto para
empresas como para uso pessoal contribuem para a grande produção
dos dados diariamente.

Assim temos, um grande volume de dados é produzido diariamente


pelas mais variadas aplicações existentes, surgindo, nesse contexto, a
necessidade de tratamento desses dados e extração das informações.

Observemos primeiramente os conceitos primordiais envolvidos


neste cenário, conforme o exposto na Figura 1.
Big Data e Ciência de Dados 11

Figura 1 - Conceitos primordiais do Big Data

Fonte: Adaptado de Coelho (2009), Sober (2008) e Orna (2008)

Dessa maneira, podemos entender que tendo os dados e usando


técnicas de análise, obtém-se informações, sendo possível gerar
conhecimento.

EXEMPLO: Para compreender melhor as definições temos, o dado


como o ponto de inicial para a informação. A informação é determinada
por um dado com significado para o indivíduo que tenha interesse, e esta
informação pode ser transformada em conhecimento.

Portanto, percebe-se que a todo momento temos que lidar com


grande volume de dados que estão sendo produzidos por meio de
inúmeras aplicações existentes. Em termos práticos, segundo o autor
PETRY (2013), em um ano, por volta de 2 zettabytes de dados são
acumulados. Isto é, em escala, 3 exabytes era toda a capacidade de
armazenamento anual que a humanidade podia sustentar em 1986. Em
contrapartida, atualmente produzimos duas vezes esse valor por dia.

•• Grande parte do aumento no volume de dados, deve-se


aos seguintes motivos (LOH, 2014):
12 Big Data e Ciência de Dados

•• Armazenamento de dados a cada vez mais baratos e


disponíveis;

•• Maior utilização de aplicações e tecnologias por pessoas,


devido a familiaridade com as tecnologias.

•• Maior disponibilidade de serviços e aplicações diversas


que são utilizados para propagar informações, como
redes sociais, e-mail, redes globais, conexões sem fio,
entre outros.
Figura 2: Volume de dados

Fonte: Pixabay

A partir do grande volume de dados existentes, motivou-se o


surgimento da área de análise de dados, denominada por Big Data,
utilizada para caracterizar os dados que extrapolam a capacidade de
processamento em sistemas de banco de dados convencionais.

DEFINIÇÃO:

O autor Schneider (2012) afirma que Big Data representa


um grande volume de dados, se movendo rapidamente, e
que não se adapta as restrições do modelo arquitetural de
banco de dados.
Big Data e Ciência de Dados 13

Outros autores definem o Big Data como um processo de extração


da informação com qualidade por meio de um grande volume de
informação (MAYER-SCHONBERG; CUKIER, 2013).

A seguir, vamos conhecer um breve histórico sobre Big Data, como


também, trazer mais conceitos de autores sobre essa tecnologia e abordar
sua composição.

Histórico: Big Data


Antes de começarmos a explorar a história do Big Data (BD),
é importante esclarecer que não se sabe ao certo o período de seu
surgimento, uma vez que não há um consenso sobre a época exata de
seu surgimento pela comunidade acadêmica.

A exemplo disto, os autores Phelan (2012) e Arrigoni (2013) afirmam


que o Big Data surgiu para determinar um grande volume de dados que
foram gerados a partir dos anos 2000, porém, não haviam hardwares para
armazená-los ou manipulá-los.

Todavia, conforme Arrigoni (2013), o surgimento deste termo se deu


na década de 1990, na NASA, com o intuito de delinear grandes conjuntos
de dados complexos que apresentavam um enorme desafio aos limites
computacionais tradicionais de capturar, processar, analisar e armazenar
informação.

Corroborando com a disparidade de datas apresentadas


anteriormente, no ano de 2010 por meio de uma reportagem na revista
The Economist, o termo Big Data foi usado para se dirigir à terceira era
da informação, o qual, está ligado à terceira Revolução Industrial que
ocorreu em meados do século XX e obteve como principais impactos a
globalização, a utilização da informática e o desenvolvimento de novas
tecnologias (NESELLO; FACHINELLI, 2014).

No entanto, a consolidação do Big Data no âmbito acadêmico se


deu em meados dos anos 2000, com o relatório de Laney (2001), em que
foram apresentados os resultados de estudos sobre os desafios que o
incremento do e-commerce trouxe para o mercado de gestão de dados.
14 Big Data e Ciência de Dados

Diante desta notoriedade, o mercado aderiu massivamente ao uso


do Big Data e de seus modelos evolutivos de análise de dados, visto que
tais modelos atenderam às novas demandas de análises rápidas dos
dados oriundos de várias fontes e em maior quantidade (NOVO; NEVES,
2013).

SAIBA MAIS:

Saiba mais nesta entrevista, que traz uma linha do tempo


da história de como os dados se tornaram importantes,
com informações que precederam o surgimento do Big
Data como área da Tecnologia da Informação (TI). O artigo
está disponível em: <https://bit.ly/2Dk7L1l>. Acesso em 24
de abril de 2020.

Na próxima seção, detalharemos o conceito que os autores trazem


sobre Big Data.

Big Data
Não há um consenso sobre o conceito do Big Data, alguns autores
apresentam este termo como correspondendo ao alto volume de dados
virtuais que são complexos, variados, heterogêneos e que derivam
de múltiplas e autônomas fontes, com controles distribuídos e não
centralizados (MCAFEE; BRYNJOLFSSON, 2012).

Já Goldman et al. (2012), refere-se o Big Data como um


acontecimento do processamento de grandes volumes de dados, com as
quais ferramentas tradicionais não possuem capacidades para trabalhar
na velocidade necessária.
Big Data e Ciência de Dados 15

Figura 3: Big Data

Fonte: Freepik

Segundo Schonberguer (2012), o Big Data representa trabalhos em


ampla escala de dados para extrair novas ideias e criar novos modos de
valor, a fim de alterar os mercados e as organizações.

Como já citamos, o Big Data tomou uma proporção maior na


atualidade devido ao grande volume de dados que é gerado a cada dia.
Podemos destacar um ponto que contribui para isso, como o quesito das
novas fontes de dados.

Neste sentido, temos as redes sociais como um exemplo de


fonte de dados mais utilizados ao longo dos anos, fato motivado pela
grande quantidade de dados gerados pelos usuários, como por exemplo
através de: mensagens de texto, tweets, posts sensores, entre outros
(SCHNEIDER,2012).

Podemos perceber o quanto as rede socias produz dados, basta


você perceber o quanto ficamos usando desses recursos. Além das redes
socias, também temos os portais das principais redes de rádio e TV, jornais
e revistas tradicionais permitindo a rápida disseminação de informações.
16 Big Data e Ciência de Dados

Outro autor, que destacou o crescimento dos dados das redes


sociais foi Gantz (2011), citando outras fontes responsáveis por produzir
dados, como sites de entretenimento, aplicações de saúde e segurança
(como os vídeos de vigilâncias).

Ainda conforme o aludido autor, o Big Data é como um corte


horizontal do mundo digital, podendo conter dados transacionais,
armazenados, metadados e entre outros que habitam em arquivos
volumosos.

Existe diversas conceituações na literatura, porém, podemos inferir


que todas elas têm concordância com a definição de Davenport (2014, p.
152), que afirma:

Big Data é um termo genérico para dados que não podem ser
contidos nos repositórios usuais; refere-se a dados volumosos
demais para caber em um único servidor; não estruturados
demais para se adequar a um banco de dados organizados em
linhas e colunas; ou fluídos demais para serem armazenados
em um data warehouse estático.

Segundo Schonberguer e Cukier (2013), o Big Data é responsável por


modificar a natureza dos negócios, dos mercados e da sociedade, uma
vez que sua aplicação altera e se expande em relação aos importantes
dados corporativos, tornando-se um recurso econômico primordial para
a macroeconomia, servindo como fundamento para o surgimento de
novos modelos de negócios.

NOTA:

O autor Moraes (2012) revela como a aplicação do Big


Data pode ser importante para o direcionamento dos
melhores modos de angariar fundos e distinguir quem
poderia ser convencido para apoiar a reeleição do
candidato Barack Obama para presidência dos Estados
Unidos da América.
Big Data e Ciência de Dados 17

Neste cenário, a aplicação do Big Data possibilitou prever com 15


dias de antecedência que a atuação de Obama no primeiro debate não
seria satisfatória, oportunizando que a equipe elaborasse uma ação on-
line que foi ao ar uma hora depois do programa de debates (MORAES,
2012).

Outro meio aplicado, segundo a análise do The Guardian (2012), foi


a campanha de Obama que utilizou a capacidade do Facebook para guiar
os eleitores, ou seja, manipulando a rede social como meio de detectar o
perfil de potenciais eleitores.

Os 5Vs do Big Data


Taurion (2013) determina cinco características que compõem o Big
Data, sendo elas: volume, variedade, velocidade, veracidade e valor.

A representação do Big Data feita por meio dos 5Vs relaciona as


diversas alterações no universo da informação.

EXEMPLO: Por exemplo, o aumento no volume de dados


disponíveis e a necessidade de velocidade para que as informações sejam
recuperados e processados, ligados a característica de sua variedade,
auxiliam para que os dados possam gerar valor e que estes possam ter
garantia de veracidade. Abaixo temos o detalhamento de cada um desses
pontos:

•• Volume: Constitui a grande capacidade de aquisição de


dados disponíveis em registro, explicando o universo de
informações disponíveis por meio das diversas aplicações
existentes, redes sociais pesquisas no Google, upload,
entre outros. Esse crescimento de dados pode ser
originado por várias fontes, como por exemplo: celulares,
computadores, sensores, equipamentos médicos,
variados aplicativos existentes, entre outros que agrupam
grandes quantidades de informação (SCHNEIDER, 2012).

•• Velocidade: Esta característica refere-se ao dinamismo


de crescimento e o processamento dos dados. Vale
ressaltar que o Big Data tem um andamento consecutivo
18 Big Data e Ciência de Dados

de informações que não param de ser geradas, por isto, é


de suma importância que as análises sejam realizadas em
tempo real e que se atualizem de modo constante, ou seja,
que ocorram com velocidade. Diferentemente de análises
de modo tradicional, o Big Data necessita satisfazer um
fluxo contínuo de dados (DAVENPORT, 2014).

•• Variedade: Refere-se às diversas origens, configurações


e formatos dos dados, podendo apresentar os dados
estruturados ou não, compreendendo os não estruturados
como os oriundos de redes sociais, e-mails, pesquisas na
internet, dentre outros meios. Esta variedade é de grande
importância devido às fontes em geral não estarem
relacionadas. Porém quando combinados os dados de
diversas fontes, esses podem resultar em informações
marcantes para os gestores adotarem em suas decisões,
bem como, realizarem predições mais hábeis (TAURION,
2013).

•• Veracidade: Refere-se à autenticidade, a fonte originada


e a confiabilidade dos dados. Segundo White (2012), se
porventura os dados não constituírem uma qualidade
satisfatória na ocasião em que forem integrados com
outros dados, as informações podem acarretar em uma
falsa correlação, podendo, assim, resultar em uma análise
incorreta de alguma oportunidade de negócios de uma
organização, ou seja, implicando de modo direto no
resultado das análises.

•• Valor: Refere-se ao conjunto de resultados entre as ações


de coletar, armazenar, processar e analisar o Big Data, ou
seja, a junção de todos os outros Vs apresentados acima.
Este ponto está intrinsecamente relacionado com quanto
maior for a qualidade dos dados, maior valor ela tem para
o negócio (KAISLER et al., 2013). Vale ressaltar que o valor
e a velocidade estão inversamente relacionados, de modo
que quanto menor for a velocidade para gerar informações
Big Data e Ciência de Dados 19

consistentes, maior poderá ser o valor gerado para o


negócio, os quais irão contribuir valor para as organizações
ajudando no processo de tomada de decisão deixando
mais eficiente e rápida.

SAIBA MAIS:

Saiba mais sobre o tema neste artigo do Canaltech que tem


como título: “Big Data: os cinco Vs que todo mundo deveria
saber”. Este artigo traz um resumo e explicação de cada
um dos Vs que compõem o Big Data: volume, veracidade,
velocidade, valor e variedade.

Disponível em: <https://bit.ly/2BXkgPX> (Acesso em:


28/04/2020).

Por fim, temos que o desempenho das organizações no mercado


será compreendido por meio do modo que irão trabalhar com esse
volume e essa veracidade e com a velocidade que elas surgem e se
disseminam. Portanto, os líderes terão que determinar o que fazer com
tantos dados a fim de agregar valor ao negócio, esse é um dos principais
objetivos do Big Data (COMPUTERWORLD, 2012).

RESUMINDO:

Estudamos neste capítulo a respeito do Big Data, abordando


pontos importantes como histórico, conceituação e
característica ligadas aos dados. Durante o capítulo,
percorremos sobre diversas aplicações como: redes sociais,
internet, sensores, entre outros, os quais são responsáveis
por produzir grandes quantidades de dados. Vimos como,
ao longo dos avanços tecnológicos, as diversas fonte
dados marcaram o surgimento do termo Big Data, no qual
entendemos sua ligação com grandes volumes de dados
que necessitam ser analisados em tempo real para gerarem
informações para um determinado escopo solicitado.
20 Big Data e Ciência de Dados

RESUMINDO (CONTINUANDO):

Podemos observar ainda uma breve história do termo


Big Data e os conceitos dados por diferentes autores.
Finalizamos estudando e descrevendo os 5Vs que
compõem o Big Data: volume, veracidade, variedade,
velocidade e valor.
Big Data e Ciência de Dados 21

Fundamentos do ambiente favorável à


aplicação de tecnologias do Big Data

INTRODUÇÃO:

Seguindo os estudos sobre Big Data, neste capítulo iremos


abordar um pouco mais sobre este universo ao tratar
das características do ambiente de trabalho com esta
tecnologia. Iremos abordar ainda a diferença entre Big Data
e os sistemas tradicionais, tendo em vista o seu objetivo,
bem como discorreremos sobre o tipo de plataforma e
infraestrutura usadas para trabalhar com Big Data. Prontos?
Vamos lá!!

A diferença entre Big Data e os sistemas


tradicionais
Precisamos compreender primeiramente que a gestão do
conhecimento no assunto do Big Data, no geral, não é compatível com
as clássicas linguagens de consulta em bancos de dados e sistemas
de informação, devido os sistemas tradicionais serem habitualmente
projetados para lidarem com fluxos menores e mais previsíveis de dados
estruturados, fator que pode acarretar em desempenho indesejado caso
haja um aumento na quantidade desses dados (SANTOS, 2016).

Outra diferença que merece ser destacada, é referente ao


processamento de dados de modelos tradicionais (SQL) entre os modelos
do Big Data, em que a escalabilidade vertical e horizontal utilizada nos
sistemas SQL para obter uma melhor capacidade de processamento,
um investimento em hardware e tecnologias mais avançadas, devem ser
aplicadas, gerando um alto custo para se obter o aperfeiçoamento do
processamento dos dados (COELHO, 2004).
22 Big Data e Ciência de Dados

Por outro lado, a escalabilidade horizontal é utilizada nos modelos


do Big Data a computação paralela, de modo que as máquinas de nível
intermediário, commodities, trabalham em conjuntos para processar
volumes de dados que antes não possuíam essa capacidade, permitindo,
assim, uma redução de custo e tempo (COELHO, 2004).

Figura 4: Processamento de Dados

Fonte: Freepik

Conforme uma analogia feita pelo autor Taurion (2013), o qual,


relata que as ferramentas do Big Data representam para as organizações
e para a sociedade uma importância semelhante ao que o microscópio
representou para a medicina, por serem ferramentas de análise,
possibilitando recursos para extrair informações, predizer incidentes
permitindo e evitando problemas futuros.

Impacto do Big Data


Percebe-se que os recursos do Big Data, como visto anteriormente,
possibilitam descobrir padrões e sentidos em um enorme e variado
volume de dados gerados por sistemas transacionais, redes sociais,
sensores, entre outros.
Big Data e Ciência de Dados 23

Deste modo, o Big Data permite agregar valor para as empresas,


pois possibilita buscar padrões e relação entre dados que antes estavam
perdidos (TAURION, 2013).

Conforme a Mckinsey e Company (2012) existem cinco modos


para se obter o valor transformacional por meio dos grandes dados:
Elaborar transparência; Apresentar a variabilidade que possibiliam
a experimentação; Segmentar populações para personalizar ações;
Substituir e apoiar a tomada de decisão humana com algoritmos
automáticos; e Inovar novos modelos de negócios, produtos e serviços.

Continuando, temos como impacto positivo obtido pela aplicação


do Big Data nas empresas, o fato da possibilidade do grande potencial
de proporcionar uma melhor tomada de decisão, visto que quando uma
organização adota o desenvolvimento de tecnologias que trabalhem como
Big Data, obtém-se um ganho por meio de análises eficientes e corretas
dos dados extraídos, como ainda a capacidade de decisão, ganhando,
assim, um importante diferencial frente a concorrência (MAZZEGA, 2016).

Outra implicação positiva no âmbito do Big Data, são duas


características importantes: um volume relacionado as grandes
quantidades de dados dos bancos de dados e a velocidade referente a
manipulação e o tratamento analítico ligado a realização de modo rápido
em algumas situações em tempo real (TAURION, 2013).

Em contrapartida, temos um impacto crítico em relação a exigência


de escolher mão de obra qualificada para se trabalhar com Big Data e
realizar a sua implantação devido a exigência de conhecimento robusto
e específico para trabalhar com essa tecnologia. Por outro lado, esta
necessidade de profissionais qualificados permitiu surgir oportunidades
de trabalho para aqueles que se qualificam.
24 Big Data e Ciência de Dados

NOTA:

Alguns anos atrás, Anderson e Raine (2012) realizaram


um estudo com diversos pesquisadores e especialistas,
apresentando os impactos positivos e negativos que o Big
Data poderia causar às empresas, indivíduos e sociedade
ao longo dos anos. Neste estudo, demonstrou-se que os
53% dos indivíduos entrevistados tinha um posicionamento
positivo ligado o Big Data, enquanto 39% tinha um
posicionamento negativo.

Foi demonstrado nesta pesquisa citada acima, um contexto


promissor de novas oportunidades de empregos e foi destacado a
necessidade de um novo tipo de profissional chamado de Data Scientist
ou cientista de dados, um profissional com formação em Ciências da
Computação e Matemática.

Uma matéria no ano de 2017 reportada pelo jornal Extra com


tema “Profissionais do Big Data estão entre os cinco mais contratados
no Brasil”, comprava o que os pesquisadores já previram, ou seja, que
as oportunidades na área em Big Data iriam oferecer oportunidades a
profissionais qualificados. Nesta reportagem, também pode ser destacado
um levantamento de uma empresa de recrutamento, Michael Page,
demonstrando que o cargo estava entre os cinco mais solicitados pelo
mercado brasileiro no ano 2017 (ZUAZZO, 2017).

De acordo com Isaca (2013), o Big Data pode afetar a empresa em


diversos pontos, como pode afetar a governança e gerenciamento do
planejamento, utilização, garantia e privacidade apresentados abaixo:

•• Governança: A governança é responsável por garantir que


as requisições e necessidades dos envolvidos possam
ser analisadas para estabelecer metas que devam
ser atendidas pelas empresas. Este fato implica que o
Big Data e Ciência de Dados 25

processo de governança apropriado aos projetos do Big


Data pode levar a uma sequência de outros problemas,
inclusive de dados errôneos e imprevistos nos custos.
Dessa forma, temos um desafio expressivo no processo
de governança do Big Data que é atenção em categorizar,
modelar e mapear os dados ao modo que são capturados
e armazenados.

•• Planejamento: Referente ao processo de coleta e


estruturação dos resultados gerados pela análise dos
dados.

•• Utilização: É referente ao tipo de uso do Big Data que


pode mudar conforme a necessidade de cada empresa.
Exemplificando, dependendo da estrutura que compõem
a empresa, pode ocorrer maior tempo para implementar o
Big Data, principalmente se for uma empresa menor que
necessite se adequar para oferecer suporte e caso seja
necessário desenvolver infraestrutura para suportar os
novos processos ligados a BD. Também é percebido, ao
longo do tempo, que empresas grandes como a IBM, HP,
Amazon, Google e Netflix, realizaram aquisições precisas
e implementações usando recursos oferecidos pelo Big
Data para suas tomadas de decisões e planejamentos
estratégicos nas suas organizações.

•• Garantia: Representa um ponto crítico e preocupante


para empresa ligado a garantia da qualidade dos dados,
pois uma informação só é eficaz quando satisfaz às
necessidades do beneficiário das informações, bem como,
quanto melhor a qualidade do dado melhora as decisões
fundamentadas nos dados.

•• Privacidade: Refere-se às leis que resguardam a


privacidade dos sujeitos e todas as informações adquiridas
sobre eles, mesmo que haja o compartilhamento de
informações confidenciais de modo inadequado pelas
26 Big Data e Ciência de Dados

pessoas. Até mesmo com toda as informações de fácil


acesso nas redes sociais, deve-se garantir a autenticidade
da informação coletada devido esta necessitar ser
protegida de usuários perigosos e fraudulentos, bem
como, até de governos controladores.

IMPORTANTE:

È importante destacar que a Lei 13.709, conhecida como


Lei Geral de Proteção de Dados Pessoais (LGPD), foi
sancionada por Michel Temer em agosto de 2018 e entra
em vigor em agosto de 2020. O objetivo é regulamentar o
tratamento de dados pessoais de clientes e usuários por
parte de empresas públicas e privadas (PlANALTO, 2018).

Figura 5: Segurança e Privacidade dos dados

Fonte: Pixabay

Com isto, todas as partes envolvidas no trabalho com Big Data


precisam estar informadas das implicações de armazenamento e análises
realizando cruzamentos de grandes volumes de dados confidenciais.
Big Data e Ciência de Dados 27

IMPORTANTE:

Vale ressaltar que os dados se tornaram um elemento


de extremo valor nas empresas, gerando assim uma
dependência, pois a partir do tratamento e das análises dos
dados as organizações obtêm precisas tomadas decisões.
Por isso, todo cuidado é preciso para que não sejam
gerados dados imprecisos, incompletos ou manipulados
de maneira fraudulenta, para que assim não seja gerado
prejuízos aos tomadores de decisões (FEIJÓ, 2013).

Outro ponto de extrema importância é a segurança e privacidade


que cumprem uma função destacada em Big Data, até porque não se
pode trabalhar com dados e não promover a segurança e privacidade
deles, tendo em vista que, após serem tratados, possuem valor para a
organização.

Com isto, todas as partes envolvidas no trabalho com Big Data


precisam estar informados das implicações de armazenamento e análises
realizadas, as quais ocorrem através do cruzamento de grandes volumes
de dados confidenciais.

SAIBA MAIS:

Para saber mais, veja o artigo com título: “O fenômeno Big


Data e seu impacto nos negócios”, disponível em: <https://
bit.ly/3kf7Cx8> (Acesso em: 04 de maio de 2020).

Na próxima seção, abordaremos sobre o ambiente e a estrutura


para trabalhar com aplicação de Big Data.
28 Big Data e Ciência de Dados

O ambiente favorável a aplicação do Big


Data: tecnologias
Podemos compreender que proporcionar o trabalho com Big
Data é definido pelo desenvolvimento de tecnologias que possibilitem
aperfeiçoar a complexidade de se gerenciar grandes volume de dados.
Com isso, surgiram ferramentas com intuito de proporcionar o tratamento
dos dados e contribuir no desenvolvimento de soluções voltadas ao Big
Data.

Figura 6: Tecnologias Big Data

Fonte: Pixabay

Assim, as tecnologias do Big Data podem ser analisadas sob duas


óticas (KERNOCHAN, 2011), sendo elas:

•• Relacionadas com analytics ou analítica, tendo Hadoop e


MapReduce como destaques.

•• As tecnologias de infra estrutura, que são responsáveis


por armazenar e processar os dados. Neste caso, destaca-
se o NoSQL.

Abaixo temos o detalhe de cada uma dessas tecnologias:


Big Data e Ciência de Dados 29

•• Haddop

O Hadoop Distributed File System (HDFS) é um software em Java


desenvolvido para ser usado em dispositivos que são interconectados
para disponibilizar um poder de processamento maior. HDFS tem
características distintas, como: ter alta tolerância a falhas e é idealizado
para ser implementado em hardware de baixo custo. Além do exposto,
é dirigido para aplicações que possuam grande volume de dados
(BORTHAKUR, 2007).

Esta ferramenta, HDFS, é um sistema de arquivos distribuídos com


o componente de armazenamento de dados do projeto sendo código
aberto, intitulado Apache Hadoop, aperfeiçoado para qualquer tipo de
dados não estruturados, estruturados e semiestruturados, elaborado para
trabalhar com hardware de baixo custo e escalável de modo rápido com
milhares de máquinas (HADOOP, 2020).

•• MapReduce

Inicialmente, esta ferramenta foi idealizada pelo Google, sendo


uma inovação na técnica para tirar proveito da grande quantidade de
volume de dados produzidos em larga escala. Está ferramenta tem
uma característica de subdividir problemas em atividades controláveis e
logo após, realizar a distribuição das atividades para alguns servidores,
trabalhando assim um conjunto de servidores em paralelo para alcançar o
resultado. Exemplos de empresas que utilizam a MapReduce é o próprio
Google e a Fundação Apache Software, utilizado para formar a base de
implementação para tratar grandes dados (SCHNEIDER, 2012).

•• NoSQL

Esta foi outra tecnologia que surgiu para o ambiente de Banco de


Dados, fazendo parte de uma nova categoria denominada NoSQL (Not
Only SQL), em que teve intuito de ser idealizado para atender aos requisitos
de gerenciamento de grandes massas de dados que precisavam de alta
disponibilidade e escalabilidade. Outro motivo para o surgimento desta
30 Big Data e Ciência de Dados

tecnologia foi a falta de eficiência dos bancos de dados relacionais, ligado


a grandes massas e diferentes tipos de dados. (LÓSCIO, 2011).

O Big Data está nos mais diversos setores, como: saúde, educação,
empresas e nos setores econômicos, motivando as empresas a investirem
em inovação e em fornecer tecnologias que utilizem o Big Data, como
por exemplo a IBM (2012), Linkedin, Amazon, entre outros que vêm
desenvolvendo tecnologias e métodos de utilização do Big Data para as
mais variadas áreas.

Após a infraestrutura, a decisão de tecnologia adotadas para usar o


Big Data é de vital importância, sendo preciso atenção aos componentes
de analytics, pois este transforma os dados em algo de valor para o
negócio. O Big Data Analytics não significa eliminar os sistemas tradicionais
que existem hoje, mas ambos devem coexistir (TAURION, 2013).

RESUMINDO:

Estudamos neste capítulo conceitos mais detalhados sobreo


Big Data e ambiente favorável para trabalhar com esta
tecnologia. Podemos estudar ainda a diferença entre o Big
Data e os sistemas tradicionais, como também, discorremos
sobre os impactos positivos e negativos quando se trabalha
como o Big Data. Também vimos que o impacto positivo
está relacionado às contribuições permitidas nos diversos
setores econômicos, colaborando na tomada de decisão
das organizações devido ao valor que os dados tem após
ser analisados. Ainda podemos apresentar os impactos
negativos ligados a questão de as empresas terem atenção
na tecnologia adequada para implementar o Big Data,
bem como, no quesito de segurança e privacidade dos
dados, entre outros pontos. Por fim, conhecemos algumas
tecnologias que oferecem infraestrutura para trabalhar com
o Big Data. No próximo capítulo continuaremos a detalhar
mais sobre as tecnologias associadas ao Big Data e suas
contribuições.
Big Data e Ciência de Dados 31

Técnicas de Visualização de dados


INTRODUÇÃO:

Neste capítulo estudaremos como a visualização de dados


é importante na utilização do Big Data, uma vez que a
partir da análises dos dados é necessário disponibilizar a
visualização das informação para as organizações. Nesse
sentido, como estudamos, o Big Data possibilita o uso de
todos os dados de um acontecimento, realizando um filtro
das informações necessárias e visualizando dados que
antes não eram possíveis por meio de outras tecnologias.

Assim, estudaremos neste capítulo os conceitos de visualização


de dados que apresentam as informações após terem sido realizados os
tratamentos e análises. Também veremos os modelos de representação
de dados, como também, como se dá o trabalho com esses dados no
contexto da tecnologia o Big Data, sendo apresentando as técnicas
adequada de visualização de dados.

Vamos dar continuidade aos nossos estudos!!

Visualização de dados: Conceito


Para iniciar, precisamos entender do que se trata a visualização
de informação, segundo Chen (2010), esta visualização corresponde
às representações gráficas interativas de informação criadas por um
computador consistindo em uma área que tem integração com técnicas
de computação gráfica que contribuem no processo de análise e
interpretação de conjuntos de dados por meio de representações gráficas
possíveis de se manipular (CARD; MACKINLAY, 1997).

Neste sentido, entende-se a visualização de dados como a


apresentação de informações em formato imagético ou gráfico. Por
meio dela, é possível os organizadores poderem realizar as tomadas
de decisões observando os resultados das análises visualmente, assim,
32 Big Data e Ciência de Dados

com a visualização é possível obter ainda um maior entendimento dos


conceitos difíceis através da identificação de novos padrões (SAS, 2020).

De acordo com Yau (2000), a visualização de dados é o modo de


proporcionar e expor informações de maneira a estimular a compreensão,
seleção e associação, possibilitando o reconhecimento de padrões.

Figura 7: Visualização dos dados

Fonte:Freepik

Assim entendemos a visualização dos dados como a representação


gráfica dos dados, onde possibilita que estes possam ser analisados,
através de alguma técnica computacional com a finalidade de obter
informação. Todavia não são apenas estruturas computacionais que são
usadas para análise de dados, mas também as habilidades humanas para
interpretar essas representações (MATTHEW et. al. 2010).

No contexto do uso da tecnologia, as representações visuais


apresentam e combinam os elementos fortes de apresentação de
dados em que temos o indivíduo e o computador colaborando com os
Big Data e Ciência de Dados 33

referentes aptidões para obter os resultados mais eficazes para atender


uma determinada necessidade.

IMPORTANTE:

É importante entender que a visualização de dados não


visa somente representar os dados, mas trata de trazer a
compreensão e padrões existentes em grupos de dados.
Com relação ao analista, este deve proporcionar, detectar,
avaliar e comparar os processos através de técnicas que
resultem em informação de diferentes formas e visões
(PARSAYE e CHIGNELL, 1993). Por isso, é importante
entender do que se trata a visualização, para assim
compreender a importância desta em Big Data.

Sabe-se que o Big Data trabalha com grande volume de dados que
passam pelo processo de coleta, armazenamento e análises. Tendo em
vista essa grande quantidade de dados disponibilizados que não param
de crescer nas empresas, a visualização torna-se ainda mais importante,
pois possibilita que as empresas vejam e tenham entendimento dos seus
dados, criando estratégias e tomando decisões (ACCENTURE, 2014).

SAIBA MAIS:

Saiba mais assistindo dois vídeos do TED que abordam


visualização de dados de modo inovador, trazendo uma
visão ampla: “A Beleza da visualização de dados”. Disponível
em: https://bit.ly/3fub0jO. Acesso em 03 de maio 2020.

Já na próxima seção será apresentado os modelos de processo de


Visualização.
34 Big Data e Ciência de Dados

Modelos do processo de Visualização


Temos que os modelos do processo de visualização correspondem
a apresentação de um conjunto de atividades que necessitam ajudar a
elaboração de uma representação visual.

Desse modo, inicialmente os dados grosseiros são coletados


dos sistemas operacionais, banco de dados ou alguma aplicação e
são transformados em tabelas de dados por meio de processos de
transformação de dados e em seguida, as tabelas de dados devem ser
alteradas para formatos visuais por meio de processos de mapeamento
visual com o intuito de alcançar a visualização concreta.

Conforme os autores Card e Mackinlay (1999), o modelo de


visualização de dados foi idealizado para selecionar os componentes
primordiais no processo de transformação dos dados em uma
representação visual diante o uso de uma técnica.

Dessa forma, no processo de visualização identifica-se três etapas


básicas (CARD; MACKINLAY, 1999):

1. Pré-processamento: esta etapa trata da transformação


dos dados realizando as alterações dos dados brutos em
relações lógicas, mas, estruturadas para a compreensão
humana.

2. Mapeamento visual: esta etapa trata de relação entre os


dados e as representações gráficas, ou seja, os formatos
visuais são formados por: substrato espacial, marcas e
propriedades gráficas.

3. Representação: esta etapa trata de disponibilizar a


imagem ou gráfico.

Dado o exposto, este modelo de processo pode ser alterado,


incluso outras etapas de acordo com o intuito de utilizá-lo, por exemplo,
na utilização da tecnologia Big Data, podemos incluir filtragem e interação,
implicando que a filtragem corresponde a selecionar o conjunto de dados
que se almeja visualizar e esta pode ser empregada em qualquer parte do
andamento do processo de visualização de dados (PEREIRA, 2015).
Big Data e Ciência de Dados 35

Já a interação é referente a um mecanismo que pode ser usado ao


longo do processo de visualização em que se pode adicionar um novo
conjunto de dados para um novo pré-processamento, caso o conjunto de
dados processados não seja absoluto (PEREIRA, 2015).

Por outro lado, segundo Ware (2013), o processo de visualização


é formado por quatro etapas: coleta e armazenamento de dados; pré-
processamento para manipular os dados deixando apenas as informações
que são pertinentes; a transformação dos dados após a coleta e
manipulação, realizando apresentação visual através, geralmente, da
computação gráfica. E por fim, a parte referente à percepção da informação
pelo usuário por meio do seu sistema cognitivo.

Podemos exemplificar os tipos comuns de visualização de dados


que são: Gráficos, Tabelas, Diagramas, Mapas, Infográficos, Painéis. E
outros exemplos mais característicos de processos de visualização de
dados: gráfico de área, gráfico de barras, gráfico de caixa, nuvem de
bolhas, gráfico de marcador, cartogramas, exibição de círculos, mapa
de distribuição de pontos, mapa de variações, histograma, matriz, árvore
radial, gráfico de dispersão (2D ou 3D), gráfico de fluxo, tabelas de texto,
linha do tempo, mapa de árvore, gráfico de segmentos e nuvem de
palavras (TABLEAU, 2020).

Figura 8: Tipos de Visualização de Dados

Fonte: Freepik
36 Big Data e Ciência de Dados

Referente ainda a grande quantidade de dados trabalhadas no


Big Data, temos outras dificuldades como em relação a visualização.
Primeiro a questão de deixar todos esses dados escaláveis para serem
visualizados, como também a dificuldade de processamento. Segundo
Agrawal et al, (2015), mesmo com a redução dos dados, ocorre um custo
com relação ao tempo para serem geradas as visualizações dos dados,
ocasionando travamentos.

IMPORTANTE:

É importante ressaltar alguns problemas atribuídos pela


visualização de dados referente a utilização do Big Data.
Um desses se trata do quesito escalabilidade. Por causa
da dificuldade de percepção, às informações em tempo
real e a necessidade de ocorrer interação. Além do
exposto, a questão de coletar informações referentes a
grandes massas de dados, tornar difícil deixar escaláveis as
visualizações de dados.

Outra limitação que temos é a da tela para demonstrar todos


os dados visualmente, diante disso, tem-se a necessidade de buscar
técnicas com a abstração para apresentar os dados visualmente. Ainda
merece destaque o cuidado na visualização, devido o fator dos dados
serem gerados em tempo real, dificultarem a criação da visualização para
esse tipo de informação (AGRAWAL et al, 2015).

SAIBA MAIS:

Saiba mais sobre visualização de dados neste artigo


<https://accntu.re/2Xog9nh> (Acesso em: 09/05/2020).
Big Data e Ciência de Dados 37

Podemos constatar que a visualização facilita o processo de tomada


decisão, pois acaba por trazer as informações geradas de modo mais
compreensivo e interpretável para os gestores trabalharem.

Técnicas de visualização
A visualização das informações contribui para apresentar as
informações para que os envolvidos possam consumi-las e extrair valor
delas, sendo fundamental para o Big Data. Como já vimos, por meio
das visualizações e análises, é possível realizar a tomada de decisões e
estratégias.

Ao longo do tempo, as técnicas de visualização vêm avançando


muito conforme se aumenta as demandas de análises de dados (TAURION,
2013).

NOTA:

No mercado existem diferentes ferramentas de visualização


de dados que trabalham com a plataforma Hadoop, o
qual, contém módulos que analisam muito bem a grande
quantidade de dados, mas são ineficientes na criação da
visualização dos dados (WANG et al, 2015).

Vimos que a abordagem da visualização de dados se relaciona com


às técnicas usadas para criar representações gráficas, seja elas tabelas,
imagens, diagramas, entre outros modos de exibição intuitivos para
promover a interpretação dos dados e gerar o conhecimento por eles
apresentados (CHEN; ZHANG, 2014).

Diante das dificuldades de visualização de dados quando se trabalha


com Big Data, como estudamos anteriormente, surgiram pesquisas para
desenvolver tecnologias para enfrentar os desafios existentes. Abaixo
segue dois exemplos que surgiram como alternativa: Data Cube e
Nanocube; e imMens.
38 Big Data e Ciência de Dados

Data Cube e Nanocube: Data cubes corresponde a estruturas


que conseguem agregar-se em todas as possibilidades nas dimensões
de uma tabela em um banco de dados, permitindo uma abordagem
de modo rápido aos dados (LINS, KLOSOVSKI, 2013). Pesquisadores
tiveram iniciativas ao longo dos últimos anos, desenvolvendo algoritmos
fundamentados a esta tecnologia com o intuito de transmitir a visualização
de dados para Big Data, principalmente com relação a escalabilidade
do tempo real que esse tipo de iniciativa disponibiliza para explorar
visualizações multidimensionais e espaço-temporais, de modo muito
veloz. Um desses exemplos é o Nanocube.

imMens: O imMens é referente a uma plataforma online que oferece


interações em tempo real com sínteses visuais escaláveis do Big Data
(LIU et al, 2013). Com isso, para viabilizar que as visualizações se tornem
escaláveis e interativas, o sistema deve usar táticas para reduzir os dados
denominado data binning, resultando em pontos mapeados unidos por
variáveis, como: numérico, ordinal, temporal e variáveis geográficas.

Dentro do universo do Big Data, uma prática muito adotada


para possibilitar análise dos dados é realizar o trabalho de limpeza,
transformação e modelagem dos dados. Neste sentido, a data mining
(Mineração de Dados) possibilita a extração de informações importantes
por meio de dados desorganizados através de algoritmos (KEIM, et.al.,
2008).

A Data mining realiza processos de encontrar padrões e


relacionamentos em grandes massas de dados. Esse tipo de técnica
usa da análise para fazer a combinação de ferramentas de estatística e
inteligência artificial que, através do gerenciamento de banco de dados,
realizam análises de grandes volumes de dados (ENCYCLOPÆDIA
BRITANNICA, 2018).

A ferramenta Oracle Data Mining é uma ferramenta que aplica


técnicas da Data Mining. Esta ferramenta permite o uso de robustos
algoritmos de mineração de dados que possibilitam aos analistas
Big Data e Ciência de Dados 39

alcançar insights, fazer previsões e tomar decisão de investimentos. Com


o ODM, é possível também realizar criações e aplicações de modelos
preditivos, além de fornecer projeções sobre o comportamento do
cliente, desenvolver perfis, identificar oportunidades de vendas e detectar
possíveis anomalias e fraudes.

IMPORTANTE:

É importante ressaltar que a visualização faz parte de


um processo maior, podendo ser a análise dos dados,
descoberta de conhecimento, a exposição de resultados
de técnicas ou análise visual. Tanto a visualização quanto a
análise, tem seus andamentos conjuntos, com o intuito de
promover a construção de um modelo que representa os
dados. Isso se deve a visualização promover a exploração
dos dados e ser utilizada para disponibilizar as informações,
descobertas de novos conhecimentos a identificação de
estruturas, padrões, entre outros (MATTHEW et.al., 2010).

Podemos citar no contexto de promover a visualização de dados


em Big Data, existem outras ferramentas disponíveis no mercado, como
as citadas abaixo:

Tableau: Esta ferramenta possibilita visualizar as informações


com nitidez, visto que, essa função é básica para quem deseja investir
em análises do Big Data. Abordagem deste software possibilita a criação
de mapas, gráficos diversos, tabelas e outros elementos gráficos para
contribuir ao entendimento das informações. Vale ressaltar que esta
ferramenta trabalha criando tudo de modo rápido e atualizado em
tempo real. O Tableau está disponível em versões gratuitas e pagas.
(TABLEAU,2020)

Pentaho: Tratasse de uma ferramenta que possibilita realizar a


integração das informações de diferentes plataformas e softwares usados
enquanto ocorre a análise do Big Data. O Pentaho permite-se conectar
40 Big Data e Ciência de Dados

com o Tableau e também se conectar com as redes sociais da empresa


envolvida, permitindo, assim, que por meio desta conexão o trabalho
possa ser mais eficiente no uso dessas informações (PENTAHO, 2020).

Chartio: O Chartio se trata de uma ferramenta que possibilita


juntar os distintos dados coletados e criar relatórios de modo direto pelo
navegador web, proporcionando que os arquivos possam ser convertidos
em formato PDF (CHARTIO, 2020).

SAIBA MAIS:

Saiba mais sobre o assunto nesse artigo com o seguinte título:”


Guia prático da visualização de dados: definição, exemplos
e recursos de aprendizado”. Disponível em:<https://tabsoft.
co/2DvkK0b>. (Acesso em: 05/05/2020.

Conforme destaca Taurion (2013), outras tecnologias que merecem


destaque em Big Data é o conceito de stream processing, que é
responsável por analisar os dados em movimento e permite análises
por meio de técnicas paralelas no momento em que estes são gerados,
passando por regras de negócio de forma que contribuem nas análises,
definindo assim, ações imediatas em resposta. Além do exposto, o
paradigma stream computing realiza o tratamento dos dados estáticos
em tempo real.

RESUMINDO:

Estudamos neste capítulo a importância da visualização


de dados no contexto do Big Data. Estudamos como ela
promove a representação dos dados, porém, também trata
de por meio do visual, promover a compreensão de padrões,
tendências, análises dos dados e as relações existentes
entre o conjunto dos dados. Vimos que o processo de
visualização contribui para selecionar os componentes
primordiais no processo de transformação dos dados em
uma representação visual diante do uso de uma técnica.
Também foi destacado problemas que podem ocorrer
Big Data e Ciência de Dados 41

RESUMINDO (CONTINUAÇÃO):

na visualização dos dados em Big Data, devido ao grande


volume de dados trabalhados por essa tecnologia,
permitindo, assim, o tratamento e interatividade para
produzir a informação em tempo real. Por fim, foi
apresentado técnicas de visualização e como estas estão
relacionadas com análises de dados, mostrando algumas
tecnologias desenvolvidas para promover uma visualização
de qualidade, tentando sanar os pontos críticos para uma
boa visualização dos dados em aplicações que utilizam Big
Data.
42 Big Data e Ciência de Dados

Onde aplicar Big Data

INTRODUÇÃO:

Continuando nossos estudos, vamos ver nesse capítulo


onde podemos aplicar Big Data, citando sua importância
no contexto geral do mercado. Logo após, apresentaremos
as diversas áreas que ele está sendo explorando. Vamos lá!!

Importância de utilizar Big Data


Para iniciar, vamos entender que a grande importância do Big Data
não é voltada apenas em torno do volume de dados disponíveis, mas sim
por conta do que se pode fazer com todos esses dados. Desse modo, os
dados oriundos de qualquer que seja a fonte, podem ser analisados para
descobrir conhecimento e buscar respostas.

Por meio da utilização do Big Data é possível reduzir custos,


antecipar ações, elaborar estratégias, criar novos produtos e realizar
ofertas melhoradas.

Vale ressaltar que as empresas utilizam cada vez mais a tecnologia


como meio e não como fim, usando os recursos do Big Data para ser
um diferencial e uma vantagem no mercado, deixando-as à frente dos
concorrentes.

SAIBA MAIS:

Saiba mais sobre a importância do Big Data no artigo


com tema:” A importância do Big Data e como gerar
valor por meio da tecnologia”. Disponível em: <https://bit.
ly/33oR5QX>. Acesso em: 08 de maio de 2020.
Big Data e Ciência de Dados 43

Ao longo das seções seguintes, será exposto áreas onde se pode


aplicar Big Data e suas contribuições.

Big Data onde é aplicado


Podemos ver que as empresas hoje buscam não só satisfazer seus
clientes, como também seus colaboradores e visam sempre ter recursos
para vencer seus concorrentes. Observamos ainda que os políticos,
de forma geral, buscam entender quem são os leitores, bem como, a
satisfação ou insatisfação deles.

Na educação, vemos que a cada dia, busca-se respostas para


promover aprendizado aos alunos e entender suas reais necessidades,
como também atender aos professores.

Na saúde, hoje percebemos uma mudança onde os médicos eram


antes a principal fonte de informação, hoje a saúde é sobre entender o
paciente e não mais sobre a doença (GAFFIELD, 2013).

IMPORTANTE:

Diante de todo esse contexto das necessidades, de cada


um desses setores e o advindo da era da informação, as
aplicações do Big Data tem se tomado um grande aliado
para trabalhar com estes grandes volume de dados e
é adotada para analisar os dados para fazer previsões,
provendo auxílio em tomadas de decisões ou para
compreender um problema.

Ademais, existem diversas áreas como: empresarial, eleitoral,


educação e saúde, que acabam adotando o Big Data para produzir e
prever problemas para suas áreas de atuação.

Big Data na educação


Uma boa área para se aplicar o Big Data é a educação e um bom
exemplo é o Programa Internacional de Avaliação de Alunos (Programm
44 Big Data e Ciência de Dados

for International Student Assessment - PISA), que é organizado pela


Organização para a Cooperação e Desenvolvimento Econômico, o qual
tem buscado realizar análises das habilidades dos estudantes no campo
de Matemática, Ciências e Leitura/interpretação, de modo que se possa
permitir fazer comparação entre as capacidades que os jovens estão
aprendendo em diversos países (SCHLEICHER, 2013).

O Pisa possibilitou a criação de grandes massas de dados, onde


se pode utilizar o Big Data sobre a propriedade dos resultados da escola.
Este uso também contribui ao direcionar as políticas públicas na área
da educação mais claras e mais eficientes, disponibilizando as escolas
por meio desses dados tomarem decisão para o seu país observado os
dados dos outros. Assim, permitindo que os governos possam analisar
melhorias na oferta de conteúdos de diversas áreas da educação em seus
respectivos países (SCHLEICHER, 2013).

Outra contribuição que a utilização do Big Data pode fornecer, é


a fundamentação para o desenvolvimento de algoritmos e aplicações
que permitam criar deduções sobre o conhecimento que os estudantes
possuem, prevendo problemas, interesses, como também a idealização
de modelos apropriados de previsão de comportamentos e interesses
futuros (MANYIKA et al, 2011).

Figura 9: Big Data na educação

Fonte: Freepik
Big Data e Ciência de Dados 45

Autores como Arnold e Pistilli (2012), descreveram que no ano de


2007 a 2010, a universidade de Purdue, dirigiu um trabalho denominado
Course Signal, que usava o Big Data para agrupar conhecimento sobre seus
estudantes por meio de várias fontes, com o objetivo de gerar influências
pedagógicas e fazer a identificação de alunos em circunstâncias de riscos.

Conforme está descrito no site (Santo Digital,2018), descreve


algumas vantagens em adotar o big data na educação que são
apresentadas abaixo:

1. Identificação dos padrões para melhorar notas:


Querendo entender o problema de desempenho de
alunos em diferentes contextos, como por exemplo: tentar
entender “Por que o Brasil é tão mal avaliado no Programa
Internacional de Avaliação de Estudantes, o Pisa?”,o
Big Data pode ajudar sendo uma ótima alternativa para
encontrar essas respostas, entre outras.

2. Criação de plataformas de aprendizado personalizadas:


Em que a utilização do Big Data, pode contribuir no
desenvolvimento de programas personalizadas para os
alunos de acordo com o perfil de cada um.

3. Integração ao contexto dos alunos: Promover a


integração no desenvolvimento de plataformas de
aprendizagens mais interessantes são direcionados para
cada aluno por meio da utilização do Big Data.

4. Possibilidade de avaliação inteligente: Por meio da


utilização do Big Data, promover atividades personalizadas
para cada aluno.

5. Diminuição da evasão: Como atualmente o problema


de evasão é forte na área de educação, principalmente
nos cursos de exatas, as aplicações de Big Data são um
grande recurso para realizar previsões, identificar padrões
no desempenho do aluno e indicar a probabilidade de
evasão, contribuindo com soluções para evitar evasão.
46 Big Data e Ciência de Dados

Big Data aplicando aplicado a negócios


A aplicação do Big Data para os negócios de empresas de diversos
segmentos, é cada vez mais utilizado. Neste sentido, a International Data
Corporation (IDC) (2013) teve uma iniciativa de listar algumas oportunidades
interessantes de negócios, a qual estão descritas abaixo:

•• Serviços financeiros: Este setor trata de promover por


meio da utilização do Big Data, recursos para prever
e detectar fraudes bancárias e de seguros. Através de
análise preditiva, impedir estragos nas indústrias de
seguros, análises no segmento de reclamações em
seguros, observar padrões, prever riscos de transações e
integrar dados a fim de entender aspectos de consumo.

•• Telecomunicações: No segmento de telecomunicações,


o Big Data pode contribuir otimizando as redes, prevendo
fraudes e evasões de clientes, melhorar o processo de
vendas e a identificação de padrões como por exemplo: a
alocação de largura de banda.

•• Meios de comunicação: A utilização do Big Data no


segmento de comunicação contribui classificando os
clientes, e viabilizando o crescimento de audiência.

•• Transporte: No segmento de transporte,o Big Data


pode promover aperfeiçoamento de logística, como
análises geográficas referentes a localização usadas
através dos dados de GPS. Outro exemplo, é o uso
de sensores espalhados em dispositivos móveis, que
possibilitam veículos fornecerem informações em tempo
real, permitindo que seja analisado o tráfego. Por meio
destas informações, alinhando com alguns elementos
independentes em alguns veículos, é possível que os
condutores dirijam de forma mais segura e com menos
engarrafamentos (TECHAMERICA, 2012).
Big Data e Ciência de Dados 47

•• Serviços profissionais: Neste segmento o Big Data


pode promover aos profissionais, maior facilidade no
gerenciamento e direcionamento de campanhas e
programas a fim de atrair e manter clientes. Além do
exposto, é possível buscar por clientes que se identifique
com produtos específicos. Ainda na área de segurança, o
Big Data pode ser utilizada para prevenir crimes e detectar
serviços de segurança.

•• Varejo e atacado: Neste segmento o Big Data pode


promover aperfeiçoamento da redes de fornecedores,
análise de comportamento observando as preferências
dos consumidores, fomentando o cruzamento de venda
e a inferência de vendas em locais, viabilizar descontos
baseados nos padrões de consumo dos clientes,
análise de cesta baseada na demografia, otimização
de merchandising, prevenção e detecção de fraudes e
detecção de fraudes no comércio eletrônico.

IMPORTANTE:

Podemos perceber que o Big Data pode ser aplicado em


diversos setores e geram importantes recursos, como
também pode ser uma tecnologia que contribuem e atua
na prevenção de problemas do dia a dia.

Assim, o Big Data pode ser usada em aplicações para entender


problemas e identificar padrões. A BD cada dia vem crescendo e
sendo aplicado trazendo importantes mudanças. Nisto percebemos
que a mudança que lidamos é de certa forma, superior as geradas por
inovações importantes de modo drástico, expandindo o escopo e a escala
das informações na sociedade (Mayer et.al , 2013).
48 Big Data e Ciência de Dados

Big Data Aplicado na Saúde


Neste segmento, a utilização do Big Data vem crescendo bastante,
pois atualmente existem diversos recursos que disponibilizam os dados
serem tratados através de meios eletrônicos, como dispositivos móveis
que registram e monitoram algumas ações dos pacientes, dados em
tempo real, armazenamento de dados do paciente e exames, entre outros.

Por meio das análises de dados, o Big Data possibilita contribuições,


ligadas ao uso de sistema de análise para poder gerar alertas
personalizados a cada pessoa e o como o médico corresponderá ao
paciente. Com esses sistemas, os recursos de sensores nos hospitais ou
em residências, podem monitorar frequente os principais com marcadores
bioquímicos, permitindo que seja realizado análises em tempo real dos
dados, bem como, prever eventos que poderão acontecer ao paciente
(TECHAMERICA, 2012).

Continuando, podemos citar outras melhorias que podem ser


destacadas na utilização de aplicações do Big Data. Voltando para saúde,
com o aperfeiçoamento na qualidade do serviço de cuidados, tem-se
aperfeiçoado o processo de diagnóstico de doenças ainda no período
inicial, permitindo tratamentos personalizados.

Assim, o Big Data é de vital importância para a saúde, uma vez que
permite aplicações de tomada de decisão mais fundamentadas, bem
como, realizações de previsões (CALDEIRA,2016).

Figura 10: Big Data aplicado na saúde

Fonte: Freepik
Big Data e Ciência de Dados 49

Outro exemplo foi a pesquisa idealizada com análise de mais de


60 mil usuários nos Estados Unidos em um período de quatro anos, onde
houve observações ligadas à como os usuários descreviam nas redes
sociais sobre seu peso inicial e sustentavam um maior influência mútua
com outros durante todo o período de regime, o qual falavam ainda
sobre suas queixas, desafios e vitórias, conseguindo atingir a meta final
(CALDEIRA, 2016).

Alguns exemplos interessantes podem ser citados, como a pesquisa


do Big Data realizada na UFMG em colaboração com pesquisadores do
Catar e da Alemanha, finalizada no ano 2016, o qual conseguiu-se analisar
padrões de comportamento de indivíduos em grupos que buscavam
perda de peso em redes sociais.

SAIBA MAIS:

Saiba mais no artigo com tema “Big Data na Medicina: veja


como essa tecnologia está transformando a área da saúde”.
Disponível em <https://bit.ly/33hF5Ro>. Acesso em: 09 de
maio de 2020. Nesse artigo detalha mais alguns exemplos
de pesquisas que utilizaram o Big Data na saúde.

Continuado apresentar as áreas que trabalham com Big Data, segue


as seções abaixo.

Big Data aplicado na Área Eleitoral


Uma aplicação que merece destaque é uso do Big Data na política,
ajudando em processos de eleição para os candidatos entenderem
melhor seus cidadãos e como realizar estudos que possam permitir
entender melhor os problemas de determinadas regiões, pavimentando a
construção de planos de governo.

Assim, utilizando dos recursos de Cruzamento de dados geográficos


ou demográficos através de captura de dados de redes sociais e de
pesquisas por formulário on-line, as campanhas podem agregar valor às
suas estratégias de campanha, obtendo assim, informações sólidas para
tomadas decisões.
50 Big Data e Ciência de Dados

Figura 11: Big Data aplicado na área eleitoral

Fonte: Freepik

Um grande exemplo do Big Data utilizado em áreas eleitorais,


ocorreu em campanhas presidenciais americanas de 2008 e 2012, em
que foram feitas análises por meio de um sistema de coleta de notícias
automatizados.

Conforme relata Prati (2014, p. 47):

o estudo descreve ampla pesquisa com 2,5 milhões de


notícias coletadas a partir de 498 diferentes provedores de
98 países e que publicaram textos na língua inglesa por um
período de 10 meses. Com isto, as notícias foram classificadas
automaticamente e foram aplicados sobre elas, técnicas de
aprendizado de máquina em 15 categorias variadas. O intuito
era descobrir padrões e semelhanças, como por exemplo,
estilos de escrita entre diferentes provedores, distinção de
gênero no tema abordado nas notícias e no relacionamento
com a popularidade dos artigos.
Big Data e Ciência de Dados 51

SAIBA MAIS:

Saiba mais neste artigo com tema:” Big Data na política:


entenda como ela interfere nas eleições”. Disponível em:<
https://bit.ly/3grswqg>. Acesso em 09 de maio de 2020.

Assim, percebemos que o campo eleitoral pode obter um bom


aproveito das técnicas de Big Data que proporcionam análises em tempo
real, de padrão como de predição entre outras.

RESUMINDO:

Estudamos ao longo deste capítulo onde podemos


aplicar o Big Data, abordando diversas áreas que podem
ser aplicadas suas técnicas, bem como, contribuir como
importante recurso de tomada de decisão. Assim podemos
ver nas explanações as contribuições oferecidas por esta
tecnologia, entendendo melhor como ela pode ser aplicada
nos diversos segmentos, desde a saúde, ao mercado
financeiro, passando também pela educação e tantos
outros ramos do conhecimento e comércio. Podemos
ainda avaliar a importância desta tecnologia e como ela
tem um grande potencial de viabilizar um diferencial aos
setores que adotar.
52 Big Data e Ciência de Dados

REFERÊNCIAS
AGRAWAL, R et al. Challenges and Opportunities with Big Data
Visualization. Proceedings of the 7th International Conference on
Management of computational and collective intElligence in Digital
EcoSystems, p. 169-173, 2015.

ACCENTURE. Disponível em:<https://www.accenture.com/_


acnmedia/pdf-45/accenture-entendedo-de-dados.pdf>. Acesso em: 02
de maio de 2020.

ARTHUR, Charles (29 de junho de 2011). «What’s a zettabyte? By


2015, the internet will know, says Cisco». the Guardian (em inglês). Acesso
em: 02 de maio de 2020.

ARRIGONI, Rodrigo. Uma entrevista didática sobreo Big Data.


EXAME. Postado em 25/07/2013. Disponível em:< https://exame.abril.
com.br/tecnologia/uma-entrevista-didatica-sobre-big-data/> Acesso
em: 28 de Abril 2020.

BIESDORF, S., COURT, D., & WILLMOTT, P. (2013). Big data: What`s
your Plan? Mckinsey Quarterly, 2(1) 40 – 41.

CARD, S. K., & Mackinlay, J. (1997). The Structure of the Information


Visualization Design Space. Xerox PARC, 92–99.

CHARTIO. Disponível em:<https://chartio.com/> Acesso em: 08 de


maio de 2020.

CHEN, C. Information visualization. John Wi Ley & Sons, Inc, 2, 387–


403. http://doi.org/10.1002/wics.89.

COELHO, Willianny. Dados, informação, conhecimento e


competência. Webarti-gos.com. 2009. Disponível em: <http://
www.webartigos.com/articles/26653/1/DADOS-INFORMACAO-
CONHECIMENTO-E-COMPETENCIA/pagina1.html>. Acesso em: 02 de
maio de 2020.
Big Data e Ciência de Dados 53

CALDEIRA Helvio.O Big Data e o seu uso na saúde. Disponível em


:<https://cmtecnologia.com.br/blog/big-data-saúde/>. Acesso em: 09
de maio de 2020.

CANALTECH. Big Data: os cinco vs que todo mundo deveria saber.


Disponível em:<http://corporate.canaltech.com.br/dica/big-data/big-
data-os-cinco-vs-que-todo-mundo-deveria-saber/ >. Acesso em: 28 de
Abril de 2020.

COELHO, O. P. Arquitetura: Princípios para alcançar Desempenho


e escalabilidade em Aplicações. Disponível em: <https://msdn.microsoft.
com/pt-br/library/cc518051.aspx>. Acesso em: 28 de Abril de 2020.

COMPUTERWORLD.Disponível em: <https://computerworld.com.


br/2012/05/25/big-data-volume-de-dados-no-mundo-crescera-60-
em-2012/>. Acesso em: 02 de maio de 2020.

CHEN, Min; MAO, Shiwen; LIU, Yunhao. Big Data: A survey. Mobile
networks and applications, v. 19, n. 2, p. 171-209, 2014.

DAVENPORT, Thomas H. Big Data no trabalho: derrubando mitos e


descobrindo oportunidades. 1. ed. Rio de Janeiro: Elsevier, 2014.

Encyclopædia Britannica, Inc. Data Mining. 2018. Disponível em:

< h t t p s : / / a c a d e m i c .
eb.com/?target=%2Flevels%2Fcollegiate%2Farticle%2F437561>. Acesso
em: 05 de maio de 2020.

FEIJÓ, Bruno Vieira. A Revolução dos Dados. Revista Exame PME –


Pequenas.

FREEPIK. Big Data. Disponível em:<https://br.freepik.com/


ve to re s - g r a t i s / f u n d o - d e - g r a n d e -vo l u m e - d e - d a d o s - d e - m a o -
desenhada_3531252.htm#page=1&query=big%20data&position=475>.
Acesso em: 22 de Abril de 2020.

FREEPIK. Volume de dados. Disponível em:<https://br.freepik.


com/vetores-gratis/fundo-de-grande-volume-de-dados-de-mao-
desenhada_3531252.htm#page=1&query=big%20data&position=475>
Acesso em: 22 de Abril de 2020.
54 Big Data e Ciência de Dados

FREEPIK. Processamento de Dados. Disponível em: < https://b


r.freepik.com/vetores-gratis/computador-tecnologia-isometric-icone-
servidor-sala-digital-dispositivo-jogo-elemento-para-desenho-pc-
laptop_4103157.htm#page=1&query=banco%20de%20dados&position=28>
Acesso em: 04 de maio de 2020.

FREEPIK. Tecnologias Big Data. Disponível em: <https://pixabay.


com/pt/illustrations/dados-big-data-internet-on-line-4132580/>. Acesso
em: 02 de maio 2020.

PIXABAY. Segurança e Privacidade. Disponível em: <https://


p i x a b ay. c o m /p t /p h o to s /re g u l a % C 3 % A7 % C 3 % A 3 o - p i b r- d a d o s -
protec%C3%A7%C3%A3o-3246979/>. Acesso em: 02 de Maio de 2020.

FREEPIK. Big Data na educação. Disponível em <https://br.freepik.


com/fotos-gratis/conceito-de-diagrama-criativo-de-ideias-de-
lampada_4413599.htm#page=1&query=educacao&position=26>.

Acesso em: 08 de maio 2020.

FREEPIK. Tipos de Visualização de Dados. Disponível em:<https://


br.freepik.com/vetores-premium/vetores-planos-de-graficos-
de-barras_6701421.htm#query=representa%C3%A7%C3%A3o%20
grafica&position=44> Acesso em: 08 de maio de 2020.

FREEPIK. Visualização dos dados. Disponível em::https://br.freepik.


com/vetores-gratis/ilustracao-do-conceito-de-estatisticas-do
site_7140739.htm#query=analise%20de%20dados&position=0. Acesso em:
03 de maio de 2020.

FREEPIK. Tecnologias Big Data. Disponível em:<https://pixabay.


com/pt/illustrations/dados-big-data-internet-on-line-4132580/>. Acesso
em: 02 de maio 2020.

FREEPIK. Urna. Disponível em:<https://br.freepik.com/


vetores-gratis/eleitores-inserindo-formularios-nas urnas_6976405.
htm#page=1&query=urna&position=23>. Acesso em: 09 de maio de 2020.

GANTZ, John e REINSEL David. THE DIGITAL UNIVERSE IN 2020: Big


Data. Disponível em:<https://www.emc.com/collateral/analyst-reports/
idc-the-digital- universe-in-2020.pdf>. Acesso em: 09 de maio de 2020.
Big Data e Ciência de Dados 55

GLIKAS, Alexandre. A importância do Big Data e como gerar valor


por meio da tecnologia. Disponível em:<https://computerworld.com.
br/2018/02/09/importancia-do-big-data-e-como-gerar-valor-por-
meio-da-tecnologia/>. Acesso em: 08 de maio. 2020.

GOLDMAN, A., et al. Apache hadoop: conceitos teóricos e práticos,


evolução e novas possibilidades. In: XXXI Jornadas De Atualizações Em
Informática, 2012.

GUIMARÃES, Leandro. Big Data na política: entenda como ela


interfere nas eleições. Disponível em:<https://www.knowsolution.com.br/
big-data-politica-eleicoes/#close> Acesso em: 09 de maio. 2020.

HADOOP. Disponível em:<https://hadoop.apache.org/>. Acesso em:


05 de maio de 2020.

ISACA. Big Data – Impactos e Benefícios. 2013. Disponível em:


<http://www.isaca.org/Knowledge-Center/Research/Documents/
BigData_whp_Por_0413.pdf.> Acesso em: 20 Maio. 2017.

ICLINIC, blog. Big Data na Medicina: veja como essa tecnologia está
transformando a área da saúde. Disponível em:< https://blog.iclinic.com.
br/big-data-na-medicina/>. Acesso em: 09 de maio de 2020.

IBM. Saiba o que é o Big Data e os desafios que as empresas


enfrentam. IBM, 2012. Disponível em: <http://www.ibm.com/midmarket/
br/pt/infografico_bigdata.html>. Acesso em 04 de maio de 2020.

LANEY, D. 3D Data Management: Controlling Data Volume, Velocity,


and Variety, Meta Group. Disponível em:< https://blogs.gartner.com/
douglaney/files/2012/01/ad949-3D-Data-Management-Controlling-
Data-Volume-Velocityand-Variety.pdf >. Acesso em 04 de maio de 2020.

LETOUZÉ, E. Big Data for development: challenges & opportunities.


UN Global Pulse, 2012.

LINS, L, KLOSOWSKI, J T., SCHEIDEGGER, C. Nanocubes for Real-


Time Exploration of Spatiotemporal Datasets. Visualization and Computer
Graphics, IEEE Transactions on 19, no. 12, 2456-2465, 2013.
56 Big Data e Ciência de Dados

LOH, Stanley. BI na era do Big Data para cientistas de dados - indo


além de cubos e dashboards na busca pelos porquês, explicações e
padrões. Porto Alegre, 2014.

KAISLER, Stephen et al. Big Data: Issues and Challenges Moving


Forward. In: XLVI HAWAII INTERNATIONAL CONFERENCE ON SYSTEM
SCIENCES, 46., Maui, 2013.

MATTHEW O. W.; GRINSTEIN, G.; KEIM, D. Interactive Data


Visualization Foundations Techniques and Applications. 2nd Edition, CRC
Press, 2010.

McAFEE, A.; BRYNJOLFSSON, E. Big Data: The management


revolution. Harvard Business Review, v. 90, n. 10, p. 60, 2012.

MAZZEGA C. L. Big Data: Oportunidades e Desafios Para Os


Negócios. Universidade Estadual De Campinas Faculdade De Ciências
Aplicadas. 2016.

MAYER SCHÖNBERGER, Viktor; CUKIER, Kenneth. Big Data. Como


Extrair Volume, Variedade, Velocidade e Valor da Avalanche de Informação
Quotidiana. Rio de Janeiro. Campus. 2013.

MANYIKA, James, CHUI Michael, Brown Brad, BUGHIN Jacques,


DOBBS Richard, ROXBURGH Charles, BYERS Angela Hung; Big Data;
McKinsey Global Institute. USA. 2011.

MCCANDLESS, David. A Beleza da visualização de dados. TED,


2010. Disponível em:<http://www.ted.com/talks/david_mccandless_the_
beauty_of_data_visualization.html>. Acesso em: 03 de maio 2020.

MORAES, M. Big Brother Obama. InfoExame, edição de dezembro


de 2012.
Big Data e Ciência de Dados 57

NESELLO, Priscila; FACHINELLI, Ana Cristina. Big Data: o novo


desafio para gestão. Revista Inteligência Competitiva, São Paulo, v. 4, n. 1, p.
18-38, jan. 2014. Disponível em:<cin.ufpe.br/~processos/TAES3/Livro/00-
LIVRO/04-MDA-v8_CORRIGIDO.pdf>. Acesso em: 28 de Abril 2020.

NOVO Rafael; NEVES S. M. José. Inovação na inteligência analítica


por meio do Big Data: características de diferenciação da abordagem
tradicional.2013.

SANTOS Ijon A. B.. Condicionantes do Uso Efetivo do Big Data


e Business Analytics em Organizações Privadas: Atitudes, Aptidão
e Resultados. Programa de Pós-Graduação em Administração –
PROPAD,UFPE.2016

SANTO DIGITAL. 2018. Disponível em: <https://www.santodigital.


com.br/big-data-na-educacao-conheca-5-vantagens/>. Acesso em: 05
de maio 2020.

SAS. Disponível em:<https://www.sas.com/pt_br/insights/big-


data/data-visualization.html>. Acesso em: 05 de maio 2020.

SCHLEICHER, A. Big Data and PISA. Disponível em:<http://www.


huffingtonpost.com/andreas-schleicher/big-data-andpisa_

b_3633558.html> Acesso em: 05 de maio 2020.

SCHNEIDER, R. D. Hadoop For Dummies, Special Edition.


Mississauga, CAN: John Wiley & Sons Canada, 2012. 41 p.

SCHONBERGER-MAYER, Viktor; CUKIER Kenneth. Tradução Paulo


Palzonoff Junior. Big Data: como extrair volume, variedade, velocidade e
valor da avalanche de informação cotidiana. Rio de Janeiro: Elsevier, 2013.

SOBER, Elliott. O que é o conhecimento? Tradução de Paula Mateus.


Crítica: Re-vista de Filosofia, 2008. Retirado do livro Core Questions in
58 Big Data e Ciência de Dados

Philosophy, de Elliott Sober. Disponível em: <http://criticanarede.com/


fil_conhecimento.html>. Acesso em: 04 de Maio 2020.

SODRÉ, L. Big Data Estratégico: Um Framework para Gestão


Sistêmica do Ecossistema Big Data. 125 f. Dissertação (Mestrado) -
Programa de Pós-graduação em Engenharia de Produção, COPPE,
Universidade Federal do Rio de Janeiro, abr. 2016.

ORNA. E. Information policies: Yesterday, today, tomorrow. Journal of


information Science, Otawa, v. 34, n. 4, p. 547-565, jun. 2008.

PARSAYE, K.; CHIGNELL, M. Intelligent Database Tools & Applications:


Hyperinformation access, data quality, visualization, automatic Discovery.
John Wiley & Sons Inc. 541p.1993.

PEREIRA A. F. Patricia. Big Data e Data Analysis:Visualização de


Informação. Universidade do Minho Escola de Engenharia. 2015.

PETRY, A. Vida Digital: O Berço do Big Data. Revista Veja, São Paulo,
Maio. p.71-81, 2013.

TAURION, Cezar. Big Data. Rio de Janeiro: Brasport, 2013

TABLEAU. Disponível em:<https://www.tableau.com/pt-br/learn/


articles/data-visualization> Acesso em: 05 de maio de 2020.

YAU, N. Visualize This: The FlowingData Guide to Design,


Visualization, and Statistics. Ed. Willey. 384p. 2011.

VIANNA, W. B.; DUTRA, M. L. Big Data e gestão da informação:


Modelagem do Contexto Decisional Apoiado pela Sistemografia. Revista
Informação e Informação, Londrina, v. 21, n. 1, p. 185 – 212, jan./abr. 2016.

WARE, Colin. Information Visualization: Perception for design. 3. ed,


Nova Iorque, NY, EUA: Morgan Kaufmann Publishers, 2013.
Big Data e Ciência de Dados 59
Jéssica Laisa Dias da Silva e
Alan de Oliveira Santana

Big Data e
Ciência de
Dados

Você também pode gostar