A1 - Ciencia de Dados
A1 - Ciencia de Dados
A1 - Ciencia de Dados
e Classificação
Introdução à Análise Preditiva
Revisão Textual:
Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro
Introdução à Análise Preditiva
OBJETIVOS DE APRENDIZADO
• Descrever o processo de modelagem preditiva;
• Revisar tópicos de aprendizagem de máquina para análise preditiva;
• Compreender o processo de classificação de dados;
• Estudar aplicações preditivas.
UNIDADE Introdução à Análise Preditiva
Inicialmente, vamos admitir que os dados são fatos conhecidos e registrados, ten-
do eles um significado implícito. Por exemplo, se João tem 40 anos, o valor numéri-
co 40 indica o dado, e “40 anos” informa o significado desse dado, o qual conhece-
mos como informação. A partir desse conjunto de informações, um conhecimento
pode ser extraído. A Figura 1 ilustra esse exemplo e apresenta a relação entre dado,
informação e conhecimento. A diferença entre esses conceitos é importante para
que você possa compreender mais à frente como as aplicações de Analytics desen-
volvem o conhecimento a partir da granularidade dos dados.
Assim, um banco de dados (ou base de dados) é uma coleção de dados que pos-
suem alguma relação entre si (ELMASRI; NAVATHE, 2019). Retomando o exemplo
anterior, vamos admtir que João, com 40 anos, trabalha na empresa XPTO, que está
localizada na cidade de Santo André, em São Paulo. A relação entre duas entidades
distintas – o profissional e a empresa – nos mostra que pode existir uma coleção de
dados em que João faz parte. Essa coleção poderia constituir um banco de dados.
8
Quando falamos de habilidades de negócio, queremos dizer que as habilidades ne-
cessárias para atuar no mercado financeiro são diferentes daquelas exigidas no setor
da saúde, por exemplo. Isso acontece com todo segmento de negócio, fazendo com
que o especialista em Analytics também seja conhecedor do seu segmento de atuação.
Mas será que você precisará conhecer todos os segmentos de negócio para pra-
ticar Analytics? Será que você precisará conhecer um segmento de negócio a fundo
para trabalhar na área?
Sistemas e tecnologias de Big Data têm sido desenvolvidos com apoio daquelas
disciplinas para permitir que os tomadores de decisão se concentrem na extração
de insights de negócio. Do ponto de vista desses tomadores de decisão, Analytics
é uma ferramenta que deve ser empregada para melhorar a capacidade de trabalho
das organizações.
Big Data: indica, no mundo corporativo, os sistemas que geram dados em três dimensões:
volume, velocidade e variedade.
9
9
UNIDADE Introdução à Análise Preditiva
Interpretação/
Avaliação
Mineração de
Dados
Transformação Conhecimento
Pré-processamento
Padrões
Seleção
Dados
transformados
Dados
pré-processados
Conjunto de
dados Dados-alvo
10
Você Sabia?
Em 1950, o cientista da computação Alan Turing publicou o artigo Computing Machinery
and Intelligence. Nesse artigo, o cientista articulou uma visão completa sobre IA, apre-
sentando o conhecido teste de Turing e uma ideia para aprendizagem de máquina,
aprendizagem por reforço e algoritmos genéticos. Todas essas ideias foram sendo es-
tudadas ao longo das últimas décadas por diversos pesquisadores ao redor do mundo
e consolidaram-se como áreas de estudo independentes da IA, ainda que relacionadas
a ela. O artigo de Turing tornou-se a base fundamental para o esforço inicial de vários
cientistas em encontrar caminhos que permitam a compreensão da inteligência das
máquinas e também humana.
Mais à frente, você vai conhecer as aplicações que podem ser trabalhadas com
mineração de dados e análise preditiva. No momento, é importante saber que a mi-
neração de dados trabalha de maneira interdisciplinar com outras áreas, como banco
de dados e estatística.
11
11
UNIDADE Introdução à Análise Preditiva
A Análise Preditiva possui uma ligação próxima com Machine Learning e, nos
tempos atuais, é altamente dependente dessa área. Ainda que a análise e a modelagem
dependam da interpretação e do conhecimento do especialista – no caso, você –, é im-
portante estudar os métodos principais de aprendizagem de máquina para saber como
o problema deverá ser resolvido conforme as abordagens e paradigmas existentes.
12
Aplicações
Ao estudar Analytics, você irá encontrar um conjunto de disciplinas relacionadas
que também precisarão da sua atenção. A primeira delas corresponde ao uso, mo-
delagem e manipulação de bancos de dados.
Os bancos de dados são muito importantes para Analytics, pois é a partir deles
que você irá desenvolver soluções para os problemas de negócio da sua empresa.
Os dados são importantes também para a IA, que depende de informações muito
bem organizadas. Sem os bancos de dados, Analytics e IA tornam-se mais fracas,
pois enfraquecem o poder do tomador de decisão ou o processo de construção de
sistemas inteligentes.
Para Analytics, os dados são insumos fornecidos para o entendimento dos fenô-
menos que estão acontecendo, considerando a ótica de uma determinada organiza-
ção. O propósito das tarefas analíticas é compreender a situação atual do negócio,
permitindo que o tomador de decisão construa conhecimento a respeito das infor-
mações que se tornam disponíveis a ele.
Para bem utilizar uma técnica ou aplicação analítica, você também trabalhará
com ferramentas da computação, da matemática e da estatística. Ainda que essa sé-
rie de disciplinas distintas coloque medo nos profissionais em início de carreira, não
existem motivos para preocupações sérias. Com o avanço recente de Analytics e IA,
você não terá dificuldades em encontrar suporte para as ferramentas mais utilizadas
pelos profissionais de mercado.
A única preocupação que você, como profissional de Analytics, deve ter a partir
de agora é em conhecer os detalhes das principais soluções analíticas e suas aplica-
ções. Apesar de os problemas de negócio serem diversos, existem poucas tarefas que
resolvem problemas analíticos. Na maior parte das situações, você poderá utilizar
uma dessas tarefas para solucionar um problema de negócio usando Analytics.
13
13
UNIDADE Introdução à Análise Preditiva
Figura 3
Fonte: Getty Images
14
Independentemente da tarefa que você selecionar, tenha em mente que uma boa
compreensão do domínio do negócio é essencial para a formulação do problema.
Lembre-se também de que ter as informações em mãos é importante para que o
problema de negócio seja solucionado por uma tarefa analítica.
No caso da tarefa de mineração de itens frequentes, você percebe que pode ex-
plorar a base de dados das transações financeiras dos clientes. Com ela, você irá
verificar as associações entre os produtos comprados, podendo, assim, identificar o
perfil do cliente que comprará o novo produto.
Trocando Ideias...
Imagine a seguinte situação: você faz parte de uma equipe de profissionais de Analytics
e foi convidado para atuar em um projeto junto ao departamento de marketing. Os ana-
listas de marketing desse departamento desejam adotar novas formas de atrair clientes
e optaram em utilizar as mídias sociais como canal principal para essa missão. Sabendo
que eles desconhecem os conceitos de Analytics, como você abordaria o problema de
negócio e explicaria à equipe de marketing o funcionamento das tarefas analíticas?
15
15
UNIDADE Introdução à Análise Preditiva
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Livros
Planejamento e inteligência de marketing
FARIA, P. S.; BORGES, L. G. N. L. Planejamento e inteligência de marketing.
Londrina: Editora e Distribuidora Educacional S.A., 2016. Unidade 3, p. 97-154.
Fundamentos de banco de dados
SILVA, N. dos S.; SANTANA, G. A. Conceitos e terminologias de um banco de
dados. In: SILVA, N. dos S.; SANTANA, G. A. Fundamentos de banco de dados.
Londrina: Editora e Distribuidora Educacional S.A., 2018. Unidade 1, Seção 1, p. 11-20.
Vídeos
Etapas da Mineracao de Dados
https://youtu.be/j1yjamuaOKY
Leitura
Mineração de Dados – O que é e qual sua importância?
https://bit.ly/35q1ag4
16
Referências
DE CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: concei-
tos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016.
17
17