Complementariedade Conceitual No Processo de Tomada de Decisão
Complementariedade Conceitual No Processo de Tomada de Decisão
Complementariedade Conceitual No Processo de Tomada de Decisão
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
57
nho é fator impeditivo de captura, armazenamento, • Volume. Grandes volumes de dados são gerados
gerenciamento e análise por parte de ferramentas com- mediante o uso de recursos computacionais abun-
putacionais tradicionais (Manyika et al., 2011). Ou dantes. Com a evolução das mídias sociais e outros
seja, o Big Data requer formas inovadoras de proces- recursos e serviços da Internet, as pessoas produ-
samento de grandes volumes de dados heterogêneos, zem mais e mais conteúdo, vídeos, fotos, tweets,
amparando o Processo de Tomada de Decisão guiado entre outros tipos de dados.
por Dados (Gartner, 2018a; Provost e Fawcett, 2013).
• Velocidade. Os dados são gerados em grande velo-
Por isso, atualmente, enfrenta-se desafios tecnológicos
cidade, à medida que os recursos computacionais
para coletar, guardar e disponibilizar volumosos con-
têm sua capacidade de produção, captura e proces-
juntos de dados e produzir informação relevante.
samento de dados aumentada.
Neste sentido, o Big Data também requer que seus
• Variedade. Os dados advêm de variadas fontes
profissionais detenham competências diversas na orga-
(sistemas legados, e-mails, posts em mídias sociais,
nização, representação de dados para, em um segundo
arquivos de vídeo/áudio, gráficos, dispositivos ou
momento, desenvolver ações de recuperação e visuali-
sensores), as quais implementam tecnologias distin-
zação de informação nos processos decisórios. Por isso,
tas para representação e armazenamento de recursos
pressupõe-se que salvaguardar volumosas coleções de
digitais.
dados (Big Data) distingue-se da produção de informa-
ção a partir dessas coleções. Ao considerar o atual estágio da utilização de Tecnolo-
gias de Comunicação e Informação, outros Vs são
Essa distinção conceitual para com o Big Data, com-
adicionados aos 3Vs originais, conforme a visão de
plementarmente, enseja a Ciência de Dados. Em suma,
especialistas ou o domínio de aplicação. Neste sentido,
a Ciência de Dados é devotada à extração de informa-
Akhtar (2018) pontua a existência de 6Vs (Figura 2),
ção útil a partir de imensas, complexas e dinâmicas
incrementando as características com:
bases de dados (Bugnion, Manivannan e Nicolas,
2017). Entende-se que a Ciência de Dados é um con-
ceito conexo à camada dos métodos, na qual os softwa-
res são empregados para transformar dados em infor-
mação, resultando no apoio à tomada de decisão.
Ao considerar a evolução dados → informação →
conhecimento, disserta-se sobre os conceitos Big Data
e Ciência de Dados, apresentando o locus interdiscipli-
nar de competências das Ciências da Informação e da
Computação.
Figura 2. Representação dos 6Vs do Big Data
Para fomentar a discussão, além desta seção introdutó- (Akhtar, 2018) [tradução dos autores]
ria, este artigo aborda: i) o conceito Big Data, estabele-
cendo seu relacionamento com a Curadoria Digital; ii) • Veracidade. Refere-se à integridade e à precisão
a Ciência de Dados como método de transformação de dos dados, contrapondo o fenômeno GIGO (garba-
dados em informação; iii) o Processo de Tomada de ge-in, garbage-out – lixo entra, lixo sai) na recupe-
Decisão, amparando-se nas Tarefas Intensivas em Co- ração da informação. Neste sentido, deve-se evitar
nhecimento; iv) a discussão da complementariedade do ruídos e incertezas no armazenamento dos dados de
Big Data e Ciência de Dados em processos decisórios; modo a não interferir, consequentemente, na análise
e v) as considerações finais. da informação e no Processo de Tomada de Deci-
são.
2 Big Data: a camada dos materiais e da
• Variabilidade. Relaciona-se à compreensão e ao
Curadoria Digital
tratamento dos fenômenos subliminares e tempora-
O Big Data é um termo derivado dos avanços recentes riamente presentes nos dados. Por exemplo, sazo-
relativos à massificação da utilização de recursos tec- nalmente, alguns eventos específicos (virais nas
nológicos e da farta produção de dados. Em suma, é mídias sociais, como a estreia de um filme a muito
um conceito que caracteriza volumosos conjuntos de aguardado ou o acontecimento de um fato midiáti-
dados heterogêneos, os quais não são passíveis de pro- co) podem refletir em padrões de comportamento
cessamento por soluções computacionais tradicionais, que não se sustentam ao longo do tempo.
considerando seu dinamismo e sua complexidade. • Valor. É característica mais importante em termos
Originalmente, o Big Data preconizava três caracterís- dos dados, independente das demais dimensões (vo-
ticas essenciais dos dados, denominadas por Laney lume, velocidade, variedade, variabilidade e veraci-
(2001) como 3Vs: dade). O valor em Big Data é, principalmente, per-
cebido mediante a análise com dados precisos e,
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
58
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
59
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
60
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
61
padrões apresentados ao usuário para avaliação, desco- adequado em uma refeição. Dadas as características
berta de novos conhecimentos e suporte à Tomada de do prato principal, o sommelier recomenda o vinho
Decisão (conhecimento em ação). ideal a ser consumido. Neste caso, em um ecossis-
tema de Big Data, as regras de associação entre vi-
4 Processo de Tomada de Decisão: a camada nhos e pratos principais podem ser abstraídas de ba-
das Tarefas Intensivas em Conhecimento ses de dados das vinícolas e das opiniões de experi-
Considerando que o Big Data aporta grande volume de ências dos consumidores, mediante os processos de
dados estruturados ou desestruturados para o processo Mineração de Dados.
decisório, a curadoria desse aporte deve permitir às • Avaliação. O objetivo principal em tarefas de ava-
organizações as condições para realizar análises, in- liação é caracterizar um caso em conformidade às
sights e/ou julgamentos baseados em dados precisos. opções de decisão. Para exemplificar uma Tarefa
Neste sentido, conforme a Figura 6, a Ciência de Dados Intensiva em Conhecimento, considere um sistema
configura-se como um suporte metodológico ao Pro- de avaliação de crédito. Baseando-se nos históricos
cesso de Tomada de Decisão, facilitando: a obtenção de empréstimos realizados e armazenados no ecos-
de informação contextualizada; a explicitação de fenô- sistema de Big Data, para determinado caso, um
menos subliminares contidos nos dados; ou a refuta- gestor pode melhor discernir sobre sua decisão ao
ção/confirmação de hipóteses previamente estabeleci- compará-lo com casos anteriores. Neste tocante, a
das. Esse processo é denominado por Provost e Fawcett decisão a ser tomada pode ser: conceder o crédito;
(2013) como Tomada de Decisão Guiada por Dados. recusar o crédito; sugerir uma contraproposta, ou
requisitar mais informações do contratante.
• Diagnóstico. Dado um conjunto de atributos, resu-
me-se na tarefa de inferir o estado de um objeto
(caso em investigação) em contraste ao conheci-
mento que rege um domínio. Neste sentido, dispõe-
se de uma heurística (geralmente expressa por re-
gras) que caracteriza a compatibilidade ou a discre-
pância de um caso em análise em relação ao com-
portamento esperado. Em um ecossistema de Big
Data, o conhecimento do domínio (as regras) pode
ser abstraído dos dados, mediante o uso de soluções
computacionais de Ciência de Dados.
• Monitoramento. Em suma, é um processo de diag-
nóstico iterativo, no qual o estado de um objeto é
aferido ciclicamente ao longo do tempo. Ou seja,
periodicamente, dados sensitivos são capturados e
criticados por regras que definem a dinâmica da
Figura 6. Evolução Dados → Informação → Conhecimento
normalidade do objeto em monitoramento. Nas si-
na utilização do Big Data como base no Processo de Tomada
de Decisão (adaptado de Provost e Fawcett, 2013) [tradução tuações em que anormalidades são detectadas, aler-
dos autores] tas podem ser disparados para a execução de ativi-
dades de correção. Assim como na Tarefa Intensiva
Em face disso, tecnologicamente, a Tomada de Decisão em Conhecimento de Diagnóstico, em um ecossis-
Guiada por Dados auxilia os gestores em suas ativida- tema de Big Data, as regras podem ser abstraídas a
des cognitivas. E, por conseguinte, contribui à qualida- partir dos dados com o uso de soluções computaci-
de das decisões deliberadas e à produtividade laboral. onais de Ciência de Dados.
Neste enredo, as soluções computacionais de Ciência
de Dados auxiliam os gestores em suas Tarefas Inten- • Predição. Considerando um conjunto de dados de
sivas em Conhecimento (Schreiber et al., 2000). Dentre históricos e os dados correntes, na Tarefa Intensiva
as referidas tarefas, são listadas: em Conhecimento de Predição, estima-se o(s) even-
to(s) vindouro(s) para algum ponto futuro no tem-
• Associação. Tarefa em que o conhecimento de um po. Exemplos de aplicações voltadas à Predição são
mapeamento entre dois conjuntos de objetos é utili- a estimativa de vendas, a previsão de safras de
zado. Por exemplo, considere as tarefas em que a commodities, dentre outros.
relação entre causa e efeito é evidente. Por exem-
plo, pode-se citar a falta de óleo em um motor leva Em suma, em ecossistemas de Big Data, quando as
ao desgaste prematuro das peças mecânicas, com- Tarefas Intensivas em Conhecimento são tecnologica-
prometendo a vida útil). Outro exemplo do cotidia- mente suportadas, estas permeiam os processos de
no de tarefa de Associação é sugestão de um vinho transformação dos dados primários em informação,
apoiando o discernimento dos tomadores de decisão.
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
62
Em relação à Ciência de Dados, esta é considerada a • obtenção de dados de fontes primárias heterogêneas
segunda camada de suporte (camada dos métodos) em internas à organização ou distribuídas na web;
ambientes computacionais voltados à tomada de deci- • definição dos procedimentos de ingestão de dados
são. Caracterizada como uma camada de transformação no ecossistema de Big Data;
dados → informação, a Ciência de Dados visa agregar
valor aos dados armazenados na camada de Big Data. • pré-processamento, estruturação e formalização dos
Para tanto, as organizações que queiram extrair infor- dados e seus metadados para o uso;
mações a partir do Big Data necessitam combinar habi- • modelagem dos processos de transformação de
lidades diversas, geralmente, atendidas por equipes dados e seus metadados de modo a gerar informa-
multidisciplinares (Gartner, 2018b). Neste sentido, ções relevantes;
Manyika et al. (2011) identifica três oportunidades de
atuação: • utilização de métodos computacionais ou estatísti-
cos de Aprendizado de Máquina para automatizar
• Suporte tecnológico. Oportunidade reservada aos os processos de sumarização e visualização de in-
profissionais com competência em computação que formações a partir dos dados disponíveis; e
desenvolvem, configuram e mantém, por exemplo:
os programas para a aquisição de dados a partir do • instrumentalização dos meios de exploração da
Big Data; as interfaces para realização de análise de informação com intuito de subsidiar os entendimen-
dados; a implementação de algoritmos de Aprendi- tos dos tomadores de decisão no desempenho das
zado de Máquina; dentre outros. Atividades Intensivas em Conhecimento.
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
63
Notadamente, o desenvolvimento de instrumentos Akhtat, Syed Muhammad Fahad (2018). Big Data Architect’s Hand-
book. Birmingham: Pack Publishing, 2018.
voltados à extração automatizada de informação a
partir do Big Data têm despertado atenção das organi- Blum, Avrim; Hopcroft, John; Kannan, Ravi (2018). Foundations of
zações. Principalmente, para subsidiar os gestores na Data Science (2018). https://www.cs.cornell.edu/jeh/book.pdf
(2018-07-26).
execução das Tarefas Intensivas em Conhecimento,
facilitando o Processo de Tomada de Decisão guiada Bugnion, Pascal; Manivannan, Arun; Nicolas, Patrick R. (2017).
por Dados. Scala: Guide for Data Science Professionals. Birmingham: Packt
Publishing, 2017.
Neste contexto, a evolução dados → informação → Conamay, Drew (2010). The data science venn diagram (2010).
conhecimento em ecossistemas de Big Data requer a http://drewconway.com/zia/2013/3/26/the-data-science-venn-
sinergia de competências de profissionais (cientistas da diagram (2018-07-27).
informação, cientistas da computação, estatísticos, Digital Curation Centre (2018). The DCC Curation Lifecycle Model
gestores, dentre outros). (2018).
http://www.dcc.ac.uk/sites/default/files/documents/publications/
Considerando a interdisciplinaridade supracitada, neste DCCLifecycle.pdf (2018-07-25).
trabalho dissertou-se sobre a diferença tecnológica e a Economist, The (2017). The world’s most valuable resource is no
complementariedade dos conceitos Big Data e Ciência longer oil, but data (2017).
de Dados. https://www.economist.com/leaders/2017/05/06/the-worlds-
most-valuable-resource-is-no-longer-oil-but-data (2018-07-28).
Como resultado, aponta-se que o Big Data é um termo
Eiica (2019). X Encontro Internacional de Informação, Conhecimen-
intrinsecamente ligado à infraestrutura do hardware e to e Ação. Marília, 2018.
de serviços de computação na nuvem, necessários para http://enancib.marilia.unesp.br/index.php/EIICA/XEIICA.
o armazenamento, o processamento e a distribuição de (2019-02-27).
recursos. Em outras palavras, considerando a evolução Gartner (2018a). What is Big Data? – Gartner IT Glossary – Big
dados → informação → conhecimento, o conceito Big Data (2018a). http://www.gartner.com/it-glossary/big-data
Data é relacionado à camada basilar de materiais, pri- (2018-07-28).
vilegiando os 6Vs atribuídos aos dados (Velocidade, Gartner (2018b). Data Scientist – Gartner IT Glossary (2018c).
Variedade, Variabilidade, Veracidade, Volume e Va- https://www.gartner.com/it-glossary/data-scientist (2018-07-28).
lor). Neste sentido, advoga-se que a Ciência da Infor- Grady, Nancy; Chang, Wo (2015). NIST Big Data Interoperability
mação tem papel fundamental na consolidação dos Framework: Volume 1, Definitions (2015).
ecossistemas de Big Data. Principalmente, no tocante https://nvlpubs.nist.gov/nistpubs/SpecialPublications/NIST.SP.1
às competências de organização/representação de da- 500-1.pdf (2018-07-28).
dos e metadados e da Curadoria Digital dos recursos Laney, Doug (2001). 3D Data Management: Controlling Data Vol-
mantidos nesses ecossistemas. ume, Velocity, and Variety (2001).
https://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-
Em relação à Ciência de Dados, entende-se que este Data-Management-Controlling-Data-Volume-Velocity-and-
conceito é conexo à camada dos softwares, a qual me- Variety.pdf (2018-07-25).
todologicamente transforma os dados em informação Manyika, James; Chui, Michael; Brown, Brad; Bughin, Jacques;
para o Apoio à Tomada de Decisão. Neste sentido, as Dobbs, Richard; Roxburgh, Charles Byers, Angela Hung (2011).
competências dos cientistas da computação e da infor- Big data: The next frontier for innovation, competition, and
productivity (2011).
mação são necessárias na concepção de modelos de https://bigdatawg.nist.gov/pdf/MGI_big_data_full_report.pdf
representação, interfaces de comunicação e informa- (2018-07-28).
ções relevantes. Em ecossistemas de Big Data, tais Mishra, Sanjay; Chang, Wo (2015). NIST Big Data Interoperability
competências são úteis para customizar o ferramental Framework: Volume 5, Security and Privacy (2015).
utilizado pelo gestor na Tomada de Decisão guiada por https://nvlpubs.nist.gov/nistpubs/SpecialPublications/NIST.SP.1
Dados. 500-5.pdf (2018-07-28).
Munakata, Toshinori (2008). Fundamentals of the New Artificial
Notas Intelligence: Neural, Evolutionary, Fuzzy and More. Heidelberg:
Springer, 2008.
Os autores agradecem à Fundação Araucária pelas
bolsas de Iniciação Científica concedida (PIBIC- National Science Foundation (2005). Long-Lived Digital Data Col-
lections: Enabling Research and Education in the 21st Century
2018/UNICENTO - Programa Institucional de Inicia- (2005). https://www.nsf.gov/pubs/2005/nsb0540/nsb0540.pdf
ção Científica) e de Produtividade (FA - Convênio (2018-07-28).
046/2019).
Provost, Foster; Fawcett, Tom (2013). Data Science and its Relation-
Referências ship to Big Data and Data-Driven Decision Making. // Big Data,
1:1 (March 2013) 51-59.
Abraham, Ajith; Guo, He; Liu, Hongbo (2006). Swarm Intelligence:
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do (2018). Big
Foundations, Perspectives and Applications. // Nedjah, Nadia,
Data e Ciência de Dados: Complementariedade Conceitual no
Mourelle, Luiza de M. (eds). Swarm Intelligent Systems. Hei-
Processo de Tomada de Decisão. // Encontro Internacional de In-
delberg: Springer, 2006. 3-25.
formação, Conhecimento e Ação, Marilia. Caderno de Resumos.
Marilia: Unesp, 10, 1, 2018, p. 219-221.
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
64
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
65
Apêndice
Figura 1.
Figura 1. A Internet de Eventos baseada em Conteúdo, Pessoas, Coisas e Localizações (van der Aalst, 2014) [tradução dos autores]
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
66
Figura 3.
Figura 3. Ciclo de Vida da Curadoria Digital (Digital Curation Centre, 2018) [tradução dos autores]
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.
67
Figura 7.
Figura 7. Representação do Alinhamento de Big Data e Ciência de Dados no Processo de Tomada de Decisão
Rautenberg, Sandro; Carmo, Paulo Ricardo Viviurka do. Big Data e Ciência de Dados: complementariedade conceitual no processo de tomada de
decisão. // Brazilian Journal of Information Studies: Research Trends. 13:1 (2019) p.56-p.67. ISSN 1981-1640.