Preditiva Book Abr2019

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 18

Especialista em Analytics

Quem
nós somos?
Olá, muito obrigado por baixar nosso book. Somos a Preditiva Analytics,
a escola especializada em Ciência de Dados. Nosso propósito é demo-
cratizar o ensino de Ciência de Dados para os mais diversos públicos,
contribuindo assim para a preparação das pessoas para a Economia
4.0 - nova revolução causada pela Digitalização e Inteligência Artificial.

Nos últimos anos o processamento de grandes volumes de informação,


o chamado "Big Data", cresceu em níveis nunca antes vistos. Com este
cenário, inúmeras foram as aplicações de Ciência de Dados que chega-
ram ao mercado. Aplicações como reconhecimento facial, previsão de
demanda, segmentação de clientes, recomendação de produtos, IoT e
dispositivos inteligentes fazem parte do nosso dia a dia. Desta forma, as
empresas estão se digitalizando e tornando-se cada vez mais
Data Driven, ou seja, baseando suas decisões estratégicas não mais no
feeling, mas sim no uso intensivo de dados.

Essa mudança abre uma grande necessidade de profissionais com


habilidades em Analytics e capacidade de uso das aplicações de
Ciência de Dados. Além disso, muitas são as pesquisas que concluem
que muitos trabalhos podem ser extintos nos próximos anos devido à
automação. Segundo pesquisa* da Universidade de Brasília, cerca de
54% dos empregos formais estão ameaçados pelas máquinas.

Um profissional fluente em Analytics é aquele que além de extrair,


preparar e entender um grande conjunto de dados, consegue apresen-
tar insights relevantes para o negócio. Nós da Preditiva acreditamos que
essa habilidade é algo que todos nós podemos aprender, assim como
o aprendizado de um idioma. Veja nossa língua portuguesa por
exemplo. Não precisamos ser professores para saber falar o idioma no
dia a dia.

Também acreditamos que Ciência de Dados possa ser entendida e


utilizada por qualquer um, sem a necessidade de conhecer profunda-
mente como funciona. O uso correto de aplicações de Ciência de Dados
pode ser alcançado com um conhecimento mínimo em matemática,
estatística e computação. Da mesma forma que podemos dirigir um
carro sem saber como construí-lo, podemos usar as técnicas mais
atuais sem saber a complexidade envolvida.

Com essa visão, formamos uma escola totalmente dedicada em


desenvolver esta habilidade importantíssima para os profissionais do
presente (e do futuro). Mesclando professores com grande experiência
de mercado e metodologia de ensino preparada para entregar valor a
cada aula, a Preditiva fornece uma trilha completa de cursos para que
você se prepare para os desafios que essa nova economia demanda.

Embarque conosco nesta jornada!

02
*https://epocanegocios.globo.com/Tecnologia/noticia/2019/02/54-dos-empregos-formais-no-brasil-estao-ameacados-por-maquinas.html
Por que aprender
Ciência de Dados?
O futuro é da Automação
Segundo Klaus Schwab, presidente do Fórum
Econômico Mundial, entramos na Era da
Quarta Revolução Industrial. O surgimento
de novas formas de fazer as coisas, com
grande automação de atividades repetitivas
ou que não trazem valor, criarão novos
papéis, liberando pessoas para
preenchê-los. O Fórum Econômico Mundial
sugere que a automação irá eliminar 75
milhões de postos de trabalhos, enquanto
que criarão 133 milhões de novos empregos.
A Mckinsey fala em algo entre 400 a 800
milhões de empregos em risco. As predições
para o futuro, apesar de não trazerem os
mesmos números, concordam que esses
avanços transformarão nossas vidas pes-
soais e profissionais.

Big Data tomou conta do mundo


O que você faz quando acorda de manhã?
Provavelmente faz o login em sua rede social
preferida. Só aí você já gerou uma linha de
informação em um banco de dados. Agora
pense nos dados gerados por todos os apli-
cativos de smartphones que usa, páginas de
Internet disponíveis, dispositivos inteligentes
conectados e multiplique por bilhões de
usuários ao redor do mundo. Muita coisa
não? Como organizar, ler e entender toda
essa informação? Ciência de Dados é a
resposta.

03
Por que aprender
Ciência de Dados?
"Dado$" é a nova moeda
Já parou pra pensar por que o Facebook é
muito mais valioso que sua própria receita
gerada anualmente? Empresas como a Nike,
avaliadas em torno de U$ 30 Bi, possuem
receitas próximas a isso. Segundo a Forbes, o
Facebook terminou o ano de 2018 avaliado
em U$ 94 Bi, com "somente" U$ 35 Bi de
receita. Qual a razão dessa diferença?
Adivinhou quem falou "Dados". O potencial
que os dados do Facebook têm é extraor-
dinário, ou melhor, BILIONÁRIO! No entanto,
somente aplicando Ciência de Dados nesse
conjunto de dados que podemos trans-
formá-los em informação relevante para o
negócio.

A Preditiva é especializada nisso!

Profissão mais desejada do século


Um cientista de dados de sucesso deve ter
habilidade com dados, perfil analítico, boa
comunicação interpessoal e conseguir a
confiança da alta direção. Essa combinação
é rara e extremamente poderosa. O principal
motivo de diversas empresas não conse-
guirem se tornar Data Driven é a escassez de
profissionais capazes de dizer, a partir dos
dados, quais as melhores decisões a serem
tomadas. Apesar disso as empresas já enten-
deram que ser Data Driven é uma questão de
sobrevivência, criando assim excelentes
oportunidades de carreira.

04
Os nossos
diferenciais
Foco em Analytics
Somos 100% dedicados ao ensino de análise de dados. Aqui a
aprendizagem de programação e utilização das diversas ferramen-
tas são apenas um meio para extrair as valiosas informações conti-
das nos dados. Por esse motivo, damos preferência às ferramentas
que facilitam esse trabalho de análise, e permitam que a maior
parte do esforço seja investido na análise dos dados. Dessa forma,
focamos em, por exemplo, identificar oportunidades, avaliar investi-
mentos e tomar as melhores decisões.

Entrega de valor a cada aula


Atualmente o mindset de desenvolvimento de produtos e projetos
envolve metodologias ágeis. Essas metodologias prezam pela
entrega de valor a cada etapa, em vez de entregar valor apenas no
final do projeto. Trouxemos esse mindset ágil para a educação. Nossa
metodologia de ensino foi cuidadosamente planejada de forma que
você já consiga resolver problemas em Analytics a cada aula. Não
precisar aguardar o término do curso para aplicar o que aprendeu. É
sair e já aplicar as técnicas no dia seguinte em sua empresa.

Metodologia de ensino 3.0


No Brasil o EAD teve um boom dos anos pra cá. É uma alternativa pra
quem tem pouquíssimo tempo livre ou mora longe. No entanto,
somente um curso EAD não fornece o ferramental necessário para
absorver todo o conhecimento disponível. Nós da Preditiva acredita-
mos em um mix entre aulas presenciais e a distância. Aqui os con-
ceitos fundamentais são ensinados presencialmente e somente o
homework e aulas opcionais são oferecidos a distância em nosso
Portal do Aluno. Está tudo organizadinho e pensado para que você
tenha a melhor experiência de aprendizado possível.

06
Analytics que vale a pena
Apesar de sermos apaixonados por matemática e estatística,
temos plena consciência de que nem tudo é necessário dominar
para entregar um bom trabalho de Ciência de Dados. Portanto,
aqui na Preditiva estamos interessados nas técnicas que real-
mente são relevantes para resolver problemas reais e que agre-
gam valor à sua carreira.

Professores com experiência e formação técnica


Nossos professores possuem uma sólida formação acadêmica e
vasta experiência em diversos segmentos do mercado. Dessa forma,
entendem o que é necessário para resolver os problemas encontra-
dos nas empresas, sejam eles mais comuns ou mais específicos. Além
disso, possuem também experiência no ensino de conteúdo técnico
de forma didática, acessível e orientada a resolução de problemas.
Assim você conseguirá extrair o máximo de conhecimento e
colocá-los em prática a cada aula.

Comunidade colaborativa
Acreditamos que o conhecimento é coletivo e colaborativo. Assim é
feita a ciência, em que os trabalhos são apresentados em comuni-
dade, possibilitando sua validação e ajuste. Trazemos um clube
formado por quem entende do assunto e tem paixão por aprendizado.

Além disso, organizamos workshops para a troca de idéias, apresen-


tação de cases e fornecemos as ferramentas para a gestão deste
conhecimento gerado pela comunidade, facilitando assim sua docu-
mentação e compartilhamento.

07
Conheça
nossos cursos
FOUNDATIONS
Primeira formação em Analytics

O que você será capaz de fazer depois deste curso?

a) Analisar criticamente os dados levantados, tirar conclusões e discutir a validade da extrapolação


desses insights para momentos diferentes ou em outras situações

b) Preparar uma apresentação clara e objetiva das suas análises

Pré Requisitos

Não há. O conhecimento básico necessário será fornecido no material do curso.

Conteúdo Programático

1) Overview sobre Microsoft Excel


• Introdução a Planilhas Eletrônicas
• Como inserir fórmulas
• Principais funções do Excel: Funções matemáticas, de texto, de datas e de busca
• Gerando gráficos
• Tabelas dinâmicas

2) Estatística descritiva
• Diferenças entre varíaveis discretas, contínuas e categóricas
• Quantificando os eventos: Frequências absolutas e relativas
• Visualizando seu conjunto de dados: Gráfico de Barra, Pizza, Linha, Pareto, Histograma
• Quais medidas são usadas para entender um conjunto de dados?
Medidas resumo: Média, Moda, Mediana e Quartis (com visualização em Box-Plot)
Medidas de posição: Variância e Desvio Padrão

3) Probabilidades
• Noções de probabilidade: Como prever a ocorrência de um evento ?
• Distribuições de probabilidade: Distribuição Uniforme, Poisson, Normal e t-Student.
• Funções de densidade: Para que servem?
• Frequências conjuntas: Analisando uma tabela de "dupla entrada"
• Mais visualização de dados: Gráficos de Dispersão
• Análise de correlação e associação entre variáveis
• Tire as conclusões corretas: Diferença entre correlação e causalidade

4) Noções de inferência
• Noções sobre o método científico e amostragem de dados
• Conceitos fundamentais: População, Amostra, Parâmetros e Estimadores
• Estimação pontual e por intervalo
• O importante “Teorema do Limite Central” e suas consequências
• Conceito de Intervalo de Confiança e Margens de Erro
• Como calcular o tamanho de uma amostra?

5) Como estruturar os seus resultados de forma executiva


• Conceitos de KPI's (Indicadores de Negócio)
• Venda sua análise: Tópicos de apresentação de resultados em Analytics

Carga horária e Valor de Investimento

72h (48h Presenciais e 24h Online) - R$ 2.850 à vista, ou 6x de R$ 529 09


INTERMEDIATE 1
Formação para trabalhar com fluxos de dados

O que você será capaz de fazer depois deste curso?

a) Extrair e manipular informações usando o SQL

b) Criar fluxos de dados que contenham etapas de extração, transformação e carga de dados
usando o Knime Analytics

c) Desenvolver dashboards claros, objetivos e com noções de Storytelling usando o Tableau

Pré Requisitos

Curso Foundations ou conhecimentos equivalentes

Conteúdo Programático

1) Fundamentos de Business Intelligence (BI):


• Diferenças entre planilhas eletrônicas e bancos de dados
• O que é Data Integration e ETL ?
• Diferenças entre Data Warehouses, Data Marts e Data Lakes
• Metadados

2) Extração de Dados
• O que é SQL?
• Introdução ao SQL: Comandos CREATE, SELECT, INSERT, UPDATE, FROM, WHERE, GROUP BY,
HAVING e outros comandos essenciais
• Subqueries SQL
• Tudo sobre JOIN de tabelas: LEFT, RIGHT, INNER e OUTER JOINs.

3) Transformação de Dados
• Técnicas de Preparação de Dados (Data Prep):
Tratamento de Missing Values
Remoção de espaços
Correção de tipos de dados
Dados duplicados
Normalização de Case Sensitive
Lidando com Outliers
• Outros tipos de transformação: Funções Matemáticas, de Texto ou de Data

4) Fluxos de dados com o Knime Analytics


• Overview do Knime e sua interface "Point and Click"
• Principais ferramentas de extração e transformação de dados
• Como exportar os resultados do fluxo de dados?

5) Visualização de Dados
• Introdução ao Tableau
• Conectando seu fluxo de dados no Tableau
• Tipos de gráfico:
Barras, Linhas, Pizza, Dispersão, Área, Bolhas, Mapas Geográficos entre outros.
• Filtros, Parâmetros e Campos Calculados
• Criação de Dashboards

Carga horária e Valor de Investimento

72h (48h Presenciais e 24h Online) - R$ 3.400 à vista, ou 6x de R$ 629 10


INTERMEDIATE 2
Formação do profissional de dados para mundo Lean Analytics

O que você será capaz de fazer depois deste curso?

a) Entender os tipos de perguntas que um estudo consegue responder

b) Planejar testes A/B para cada situação em seu negócio

c) Avaliar corretamente o resultado de um teste e entender as técnicas para aumentar seu poder

Pré Requisitos

Curso Intermediate 1 ou conhecimentos equivalentes

Conteúdo Programático

1) Como montar corretamente seu teste usando o método científico


• Ecossistema do Método Científico e Amostragem
• Tipos de estudos e perguntas que podem ser respondidas:
Retrospectivos, transversais, prospectivos
• Noções de Planejamento de Experimentos:
Unidade experimental, fator fixo e aleatório, aleatorização, réplicas, etc
• Tipos de controle: controle ativo, pareamento, balanceamento
• Cálculo do tamanho de uma amostra:
Para estudos exploratórios
Para estudos de comparação de dois grupos

2) Como tirar conclusões e insights dos seus dados


• Distribuições amostrais mais utilizadas
• Estimação pontual e por Intervalos de Confiança
• Testes de hipóteses:
Tipos de erro que você pode cometer
Testes para médias e proporções
Entendendo significância estatística
Valor P de um teste
• O que fazer quando temos muitos grupos a serem testados:
Partição de Qui-quadrado e a correção geral de Bonferroni
• Tópicos Avançados: correções para desvios das suposições e testes não paramétricos

Carga horária e Valor de Investimento

48h (32h Presenciais e 16h Online) - R$ 1.899 à vista, ou 6x de R$ 349

11
MASTER 1
Formação do profissional de Modelagem Preditiva

O que você será capaz de fazer depois deste curso?

a) Utilizar os principais pacotes de Ciência de Dados das linguagens de programação R e Python e


da plataforma Knime Analytics

b) Resolver problemas de clusterização, regressão e classificação realizando o devido diagnóstico


dos modelos, avaliando assim a sua qualidade e capacidade Preditiva

Pré Requisitos

Curso Intermediate 2 ou conhecimentos equivalentes

Conteúdo Programático

1) Introdução à modelagem
• O que são modelos e para que servem?
• Diferenças entre modelos descritivos e preditivos
• Cursos rápidos: R e Python para Ciência de Dados
• O Processo de Aprendizado de Máquina:
Minimização da Função de Custos usando o método Gradient Descent

2) Aprendizado Supervisionado
• Regressão Linear Simples e Múltipla
• Árvores de Decisão
• Regressão Logística
• KNN
• Introdução às Redes Neurais

3) Diagnóstico de Modelos Supervisionados


• Métricas de performance:
R Quadrado e R Quadrado Ajustado
Matriz de Confusão, Acurácia, Precision e Recall, F1 Score, KS, Curva ROC
• Validação Cruzada (Conjuntos de Treinamento, Validação e Teste):
Holdout e K-Fold
• Problemas comuns em modelos: Overfitting e Underfitting
• Técnicas de Regularização
• Trade Off em Ciência de Dados: Acurácia, Interpretabilidade e Performance
• Desafios em amostras altamente desbalanceadas (eventos raros)

3) Aprendizado Não Supervisionado


• Clusterização: k-Means e Gaussian Mixtured Models (GNN)

4) Framework de Desenvolvimento de Modelos


• Overview das principais metodologias (Ex: CRISP-DM)

5) Introdução a análise de dados não estruturados


• Feature Engineering: Extraindo características dos dados
• Overview sobre dados não estruturados em NLP e Computer Vision

Carga horária e Valor de Investimento

112h (64h Presenciais e 48h Online) - R$ 4.999 à vista, ou 6x de R$ 925. 12


MASTER 2
Formação de Data Scientist

O que você será capaz de fazer depois deste curso?

a) Identificar a técnica mais adequada para a solução de cada problema e selecionar aquela com
melhor trade-off entre Acurácia, Interpretabilidade e Performance

b) Realizar análises descritivas e desenvolver modelos de classificação usando dados não estru-
turados de Texto, Imagens e Vídeos

c) Preparar pipeline para implantação do modelo em produção

Pré Requisitos

Curso Master 1 ou conhecimentos equivalentes

Conteúdo Programático

1) Técnicas avançadas em Machine Learning e Deep Learning


• Aprendizado Supervisionado
Redes Neurais Artificiais
Support Vector Machines (SVM)
Ensemble de modelos: Random Forest e Modelos Boosting
• Redução de dimensionalidade:
Análise de Componentes Principais (PCA)
Autoencoder
t-SNE
• Detecção de Anomalias: Autoencoder e Isolation Forest
• Tuning de Hiperparâmetros: Grid Search e Algoritmos Genéticos

2) Dados não estruturados em Natural Language Processing (NLP)


• Análise descritiva em NLP: Tokenização, Contagem de Palavras e Word Clouds.
• Técnicas de pré-processamento: Lematização/Stemming, Stop Words e Normalização
• Representação de textos: One Hot, TF-IDF, Word Embeddings (Word2Vec e GloVe)
• Modelagem de Classificação usando Textos (Ex: Análise de Sentimentos)
• Modelagem de Tópicos: Latent Dirichlet Allocation (LDA)
• Algoritmos de sumarização de textos

3) Dados não estruturados em Computer Vision


• Redes Neurais Convolucionais (CNN)
• Detecção de objetos com CNN
• Reconhecimento Facial com CNN

4) Deploy de modelos e versionamento de códigos


• Versionando seu código: Overview sobre o Git e Github
• Preparando os modelos para produção
• Análise de ambientes disponíveis

Carga horária e Valor de Investimento

72h (48h Presenciais e 24h Online) - R$ 4.399 à vista, ou 6x de R$ 815

13
Perguntas
mais
frequentes
Qualquer um pode se inscrever no curso?

01
Sim, não há pré-requisitos formais. Contudo, existe um questionário de
avaliação para nivelamento e também existe um processo de entrevista
para criarmos turmas com expectativas semelhantes de aprendizado.
Isso é necessário para termos um curso 100% aplicável no seu dia a dia.

02
Como é o questionário de avaliação de nível?
É uma espécie de prova eletrônica, que pode ser preenchida online, e
que verifica quanto você conhece dos conceitos necessários para o
acompanhamento do curso.

03
Como é o processo de entrevista?
Na entrevista conversaremos sobre suas necessidades e interesses no
aprendizado de Analytics e Ciência de Dados. Em conjunto com o ques-
tionário de avaliação do nível de conhecimento conseguiremos
recomendar o curso mais adequado para você.

O conteúdo do curso é prático?

04
Sim, além de aprender os conceitos fundamentais para um profissional
da área de Analytics, você realizará exercícios com dados reais, trocará
experiências com os demais alunos e participará de discussões que
ampliarão ainda mais seus conhecimentos.

Preciso saber estatística / matemática?

05
Os conhecimentos básicos de estatística e matemática são impor-
tantes para entender como funcionam as diversas técnicas utilizadas
ao longo dos cursos e principalmente identificar as limitações de cada
método. Para ajudá-lo nessa etapa disponibilizaremos conteúdo online
sobre matemática e estatística, assim você poderá aprender os con-
ceitos necessários para melhor aproveitamento dos cursos.

Preciso saber linguagens de programação?

06
A partir do curso Master I são introduzidas as linguagens R e Python para
Ciência de Dados, sendo necessário um conhecimento de pro-
gramação para melhor aproveitamento do curso. Por esse motivo, faze-
mos a curadoria de conteúdos que permitem você revisar ou mesmo
aprender esse conceitos antes de iniciar seu curso conosco.

15
07
Onde serão as aulas?
As aulas são ministradas em locais de fácil acesso, normalmente próxi-
mos à estações de metrô ou centros comerciais. Cada curso terá o local
divulgado no momento de abertura das turmas.

08
Sou de fora de São Paulo, consigo participar?
Sim, você pode aprender o conteúdo online de qualquer lugar. Pode vir
para São Paulo para participar das aulas presenciais ou aguardar
cursos ministrados na sua região.

09
Preciso levar meu notebook? Qual configuração mínima?
Sim, traga seu notebook pois ele será sua principal ferramenta de
trabalho. Sugerimos como configuração mínima um processador i5 ou
similar com pelo menos 4 núcleos e 8GB de memória RAM.

Qual é a diferença entre Analytics e Ciência de Dados?


Analytics é o conjunto de conhecimentos envolvidos na identificação de

10
padrões e obtenção de conclusões a partir de um conjunto de dados
para a tomada de decisão fundamentada no método científico. Ciência
de Dados é um termo que tem sido usado de forma ampla para desig-
nar atividades que envolvem a obtenção de conhecimento e a apli-
cação desses na tomada de decisão de forma automática. Dessa
forma, Analytics é utilizada em Ciência de Dados, porém também existe
fora dela. Enquanto que Ciência de Dados envolve uma gama mais
ampla de conhecimentos, muito deles necessários ao trabalho com
grande volume, variedade de dados e a velocidade necessária para uso
das informações na tomada de decisões de forma automática.

11
Recebo algum certificado após a conclusão do curso?
Ao concluir cada curso você recebe um certificado digital para compar-
tilhar nas redes sociais como LinkedIn, Facebook e outros.

16
Comece agora sua
jornada em Analytics
Entre em nossa lista de interesse e seja um dos
primeiros a receber as datas das próximos turmas

Entrar na lista

Siga-nos nas redes sociais

Fale conosco
[email protected]

Rua Florida, 1703, cj. 62 - Berrini


São Paulo/SP
https://preditiva.ai

Você também pode gostar