Preditiva Book Abr2019
Preditiva Book Abr2019
Preditiva Book Abr2019
Quem
nós somos?
Olá, muito obrigado por baixar nosso book. Somos a Preditiva Analytics,
a escola especializada em Ciência de Dados. Nosso propósito é demo-
cratizar o ensino de Ciência de Dados para os mais diversos públicos,
contribuindo assim para a preparação das pessoas para a Economia
4.0 - nova revolução causada pela Digitalização e Inteligência Artificial.
02
*https://epocanegocios.globo.com/Tecnologia/noticia/2019/02/54-dos-empregos-formais-no-brasil-estao-ameacados-por-maquinas.html
Por que aprender
Ciência de Dados?
O futuro é da Automação
Segundo Klaus Schwab, presidente do Fórum
Econômico Mundial, entramos na Era da
Quarta Revolução Industrial. O surgimento
de novas formas de fazer as coisas, com
grande automação de atividades repetitivas
ou que não trazem valor, criarão novos
papéis, liberando pessoas para
preenchê-los. O Fórum Econômico Mundial
sugere que a automação irá eliminar 75
milhões de postos de trabalhos, enquanto
que criarão 133 milhões de novos empregos.
A Mckinsey fala em algo entre 400 a 800
milhões de empregos em risco. As predições
para o futuro, apesar de não trazerem os
mesmos números, concordam que esses
avanços transformarão nossas vidas pes-
soais e profissionais.
03
Por que aprender
Ciência de Dados?
"Dado$" é a nova moeda
Já parou pra pensar por que o Facebook é
muito mais valioso que sua própria receita
gerada anualmente? Empresas como a Nike,
avaliadas em torno de U$ 30 Bi, possuem
receitas próximas a isso. Segundo a Forbes, o
Facebook terminou o ano de 2018 avaliado
em U$ 94 Bi, com "somente" U$ 35 Bi de
receita. Qual a razão dessa diferença?
Adivinhou quem falou "Dados". O potencial
que os dados do Facebook têm é extraor-
dinário, ou melhor, BILIONÁRIO! No entanto,
somente aplicando Ciência de Dados nesse
conjunto de dados que podemos trans-
formá-los em informação relevante para o
negócio.
04
Os nossos
diferenciais
Foco em Analytics
Somos 100% dedicados ao ensino de análise de dados. Aqui a
aprendizagem de programação e utilização das diversas ferramen-
tas são apenas um meio para extrair as valiosas informações conti-
das nos dados. Por esse motivo, damos preferência às ferramentas
que facilitam esse trabalho de análise, e permitam que a maior
parte do esforço seja investido na análise dos dados. Dessa forma,
focamos em, por exemplo, identificar oportunidades, avaliar investi-
mentos e tomar as melhores decisões.
06
Analytics que vale a pena
Apesar de sermos apaixonados por matemática e estatística,
temos plena consciência de que nem tudo é necessário dominar
para entregar um bom trabalho de Ciência de Dados. Portanto,
aqui na Preditiva estamos interessados nas técnicas que real-
mente são relevantes para resolver problemas reais e que agre-
gam valor à sua carreira.
Comunidade colaborativa
Acreditamos que o conhecimento é coletivo e colaborativo. Assim é
feita a ciência, em que os trabalhos são apresentados em comuni-
dade, possibilitando sua validação e ajuste. Trazemos um clube
formado por quem entende do assunto e tem paixão por aprendizado.
07
Conheça
nossos cursos
FOUNDATIONS
Primeira formação em Analytics
Pré Requisitos
Conteúdo Programático
2) Estatística descritiva
• Diferenças entre varíaveis discretas, contínuas e categóricas
• Quantificando os eventos: Frequências absolutas e relativas
• Visualizando seu conjunto de dados: Gráfico de Barra, Pizza, Linha, Pareto, Histograma
• Quais medidas são usadas para entender um conjunto de dados?
Medidas resumo: Média, Moda, Mediana e Quartis (com visualização em Box-Plot)
Medidas de posição: Variância e Desvio Padrão
3) Probabilidades
• Noções de probabilidade: Como prever a ocorrência de um evento ?
• Distribuições de probabilidade: Distribuição Uniforme, Poisson, Normal e t-Student.
• Funções de densidade: Para que servem?
• Frequências conjuntas: Analisando uma tabela de "dupla entrada"
• Mais visualização de dados: Gráficos de Dispersão
• Análise de correlação e associação entre variáveis
• Tire as conclusões corretas: Diferença entre correlação e causalidade
4) Noções de inferência
• Noções sobre o método científico e amostragem de dados
• Conceitos fundamentais: População, Amostra, Parâmetros e Estimadores
• Estimação pontual e por intervalo
• O importante “Teorema do Limite Central” e suas consequências
• Conceito de Intervalo de Confiança e Margens de Erro
• Como calcular o tamanho de uma amostra?
b) Criar fluxos de dados que contenham etapas de extração, transformação e carga de dados
usando o Knime Analytics
Pré Requisitos
Conteúdo Programático
2) Extração de Dados
• O que é SQL?
• Introdução ao SQL: Comandos CREATE, SELECT, INSERT, UPDATE, FROM, WHERE, GROUP BY,
HAVING e outros comandos essenciais
• Subqueries SQL
• Tudo sobre JOIN de tabelas: LEFT, RIGHT, INNER e OUTER JOINs.
3) Transformação de Dados
• Técnicas de Preparação de Dados (Data Prep):
Tratamento de Missing Values
Remoção de espaços
Correção de tipos de dados
Dados duplicados
Normalização de Case Sensitive
Lidando com Outliers
• Outros tipos de transformação: Funções Matemáticas, de Texto ou de Data
5) Visualização de Dados
• Introdução ao Tableau
• Conectando seu fluxo de dados no Tableau
• Tipos de gráfico:
Barras, Linhas, Pizza, Dispersão, Área, Bolhas, Mapas Geográficos entre outros.
• Filtros, Parâmetros e Campos Calculados
• Criação de Dashboards
c) Avaliar corretamente o resultado de um teste e entender as técnicas para aumentar seu poder
Pré Requisitos
Conteúdo Programático
11
MASTER 1
Formação do profissional de Modelagem Preditiva
Pré Requisitos
Conteúdo Programático
1) Introdução à modelagem
• O que são modelos e para que servem?
• Diferenças entre modelos descritivos e preditivos
• Cursos rápidos: R e Python para Ciência de Dados
• O Processo de Aprendizado de Máquina:
Minimização da Função de Custos usando o método Gradient Descent
2) Aprendizado Supervisionado
• Regressão Linear Simples e Múltipla
• Árvores de Decisão
• Regressão Logística
• KNN
• Introdução às Redes Neurais
a) Identificar a técnica mais adequada para a solução de cada problema e selecionar aquela com
melhor trade-off entre Acurácia, Interpretabilidade e Performance
b) Realizar análises descritivas e desenvolver modelos de classificação usando dados não estru-
turados de Texto, Imagens e Vídeos
Pré Requisitos
Conteúdo Programático
13
Perguntas
mais
frequentes
Qualquer um pode se inscrever no curso?
01
Sim, não há pré-requisitos formais. Contudo, existe um questionário de
avaliação para nivelamento e também existe um processo de entrevista
para criarmos turmas com expectativas semelhantes de aprendizado.
Isso é necessário para termos um curso 100% aplicável no seu dia a dia.
02
Como é o questionário de avaliação de nível?
É uma espécie de prova eletrônica, que pode ser preenchida online, e
que verifica quanto você conhece dos conceitos necessários para o
acompanhamento do curso.
03
Como é o processo de entrevista?
Na entrevista conversaremos sobre suas necessidades e interesses no
aprendizado de Analytics e Ciência de Dados. Em conjunto com o ques-
tionário de avaliação do nível de conhecimento conseguiremos
recomendar o curso mais adequado para você.
04
Sim, além de aprender os conceitos fundamentais para um profissional
da área de Analytics, você realizará exercícios com dados reais, trocará
experiências com os demais alunos e participará de discussões que
ampliarão ainda mais seus conhecimentos.
05
Os conhecimentos básicos de estatística e matemática são impor-
tantes para entender como funcionam as diversas técnicas utilizadas
ao longo dos cursos e principalmente identificar as limitações de cada
método. Para ajudá-lo nessa etapa disponibilizaremos conteúdo online
sobre matemática e estatística, assim você poderá aprender os con-
ceitos necessários para melhor aproveitamento dos cursos.
06
A partir do curso Master I são introduzidas as linguagens R e Python para
Ciência de Dados, sendo necessário um conhecimento de pro-
gramação para melhor aproveitamento do curso. Por esse motivo, faze-
mos a curadoria de conteúdos que permitem você revisar ou mesmo
aprender esse conceitos antes de iniciar seu curso conosco.
15
07
Onde serão as aulas?
As aulas são ministradas em locais de fácil acesso, normalmente próxi-
mos à estações de metrô ou centros comerciais. Cada curso terá o local
divulgado no momento de abertura das turmas.
08
Sou de fora de São Paulo, consigo participar?
Sim, você pode aprender o conteúdo online de qualquer lugar. Pode vir
para São Paulo para participar das aulas presenciais ou aguardar
cursos ministrados na sua região.
09
Preciso levar meu notebook? Qual configuração mínima?
Sim, traga seu notebook pois ele será sua principal ferramenta de
trabalho. Sugerimos como configuração mínima um processador i5 ou
similar com pelo menos 4 núcleos e 8GB de memória RAM.
10
padrões e obtenção de conclusões a partir de um conjunto de dados
para a tomada de decisão fundamentada no método científico. Ciência
de Dados é um termo que tem sido usado de forma ampla para desig-
nar atividades que envolvem a obtenção de conhecimento e a apli-
cação desses na tomada de decisão de forma automática. Dessa
forma, Analytics é utilizada em Ciência de Dados, porém também existe
fora dela. Enquanto que Ciência de Dados envolve uma gama mais
ampla de conhecimentos, muito deles necessários ao trabalho com
grande volume, variedade de dados e a velocidade necessária para uso
das informações na tomada de decisões de forma automática.
11
Recebo algum certificado após a conclusão do curso?
Ao concluir cada curso você recebe um certificado digital para compar-
tilhar nas redes sociais como LinkedIn, Facebook e outros.
16
Comece agora sua
jornada em Analytics
Entre em nossa lista de interesse e seja um dos
primeiros a receber as datas das próximos turmas
Entrar na lista
Fale conosco
[email protected]