0% acharam este documento útil (0 voto)
11 visualizações6 páginas

01 Python Machine Learning

Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
11 visualizações6 páginas

01 Python Machine Learning

Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 6

ML Python

Capítulo 1: Dando ao computador a habilidade de aprender a partir dos dados


Construindo máquinas inteligentes para transformar dados em conhecimento

Os três diferentes tipos de aprendizado de máquina


Fazendo predições sobre o futuro com aprendizado supervisionado
Classificação para predizer labels de classes
Regressão para prever resultado das classes
Resolvendo problemas interativos com aprendizado por reforço
Descobrindo estruturas ocultas com aprendizado não-supervisionado
Encontrando subgrupos com clustering
Redução de dimensionalidade para compressão de dados
Introdução a terminologia básica e anotações
Um roteiro para construir sistemas ML
Preprocessamento – dando forma aos dados
Treinando e selecionando um modelo preditivo
Avaliação de modelos e previsão de instancias de dados não vistos
Usando Python para ML
Instalando Python e pacotes do Python Package Index
Usando distribuição do Anaconda Python e Package Manager
Pacotes para computação científica, data science, and machine learning

Resumo
Dando ao computador a habilidade de aprender a partir dos dados

Na minha opinião, machine learning, a aplicação e a ciência dos algoritmos que dão sentido
aos dados, é o domínio mais excitante de todas as ciências computacionais!
Estamos vivendo uma era em que os dados são abundantes; utilizando algoritmos de auto-
aprendizagem do domínio da aprendizagem automática , podemos transformar esses dados em
conhecimento. Graças às muitas bibliotecas poderosas de código aberto que foram desenvolvidas
nos últimos anos, provavelmente nunca houve um momento melhor para entrar no campo do
aprendizado de máquina e aprender como utilizar algoritmos poderosos para identificar padrões em
dados e fazer previsões sobre eventos futuros.
Neste capítulo, você vai aprender os principais conceitos e os diferentes tipos de
aprendizado de máquina. Juntamente com uma introdução básica à terminologia relevante,
estabeleceremos as bases para o uso bem-sucedido de técnicas de aprendizado de máquina para
resolução prática de problemas.
Neste capítulo, agente vai cobrir os seguintes tópicos:

* Conceitos gerais de aprendizado de máquina


* Os 3 tipos de aprendizado e a terminologia básica
* Os blocos de construção para projetar com sucesso sistemas de aprendizado de máquina
* Instalar e configurar Python para análise de dados e aprendizado de máquina

Construindo máquinas inteligentes para transformar dados em conhecimento

Nesta era de tecnologia moderna, há um recurso que temos em abundância: uma grande quantidade
de dados estruturados e não estruturados. Na segunda metade do século XX, o aprendizado de
máquina evoluiu como um subcampo da Inteligência Artificial que envolviam algoritmos de
autoaprendizagem que derivavam conhecimento de dados para fazer previsões. Em vez de exigir
que humanos derivem regras manualmente e criem modelos a partir da análise de grandes
quantidades de dados, o aprendizado de máquina oferece uma alternativa mais eficiente para
capturar o conhecimento em dados para melhorar gradualmente o desempenho de modelos
preditivos e tomar decisões baseadas em dados. O aprendizado de máquina não só está se tornando
cada vez mais importante na pesquisa em ciência da computação, mas também desempenha um
papel cada vez maior em nossa vida cotidiana. Graças ao aprendizado de máquina, desfrutamos de
filtros de spam de e-mail robustos, software prático de reconhecimento de texto e voz, mecanismos
de busca na web confiáveis, programas desafiadores de xadrez e, esperamos que em breve, carros
autônomos seguros e eficientes.

Os três tipos diferentes de aprendizado de máquina

Nesta seção, daremos uma olhada nos três tipos de aprendizado de máquina: aprendizado
supervisionado, aprendizado não supervisionado e aprendizado por reforço. Aprenderemos sobre as
diferenças fundamentais entre os três diferentes tipos de aprendizagem e, usando exemplos
conceituais, desenvolveremos uma intuição para os domínios de problemas práticos onde eles
podem ser aplicados:
Fazendo predições sobre o futuro com aprendizado supervisionado

O principal objetivo no aprendizado supervisionado é aprender um modelo a partir de dados


de treinamento rotulados que nos permitem fazer previsões sobre dados não vistos ou futuros. Aqui,
o termo supervisionado se refere a um conjunto de amostras onde os sinais de saída desejados
(rótulos) já são conhecidos.
Considerando o exemplo da filtragem de spam de e-mail, podemos treinar um modelo
usando um algoritmo de aprendizado de máquina supervisionado em um corpus de e-mails
rotulados, e-mails que são marcados corretamente como spam ou não spam, para prever se um novo
e-mail pertence a uma das duas categorias. Uma tarefa de aprendizado supervisionado com rótulos
de classe discretos, como no exemplo anterior de filtragem de spam de e-mail, também é chamada
de tarefa de classificação. Outra subcategoria de aprendizado supervisionado é a regressão, onde o
sinal de resultado é um valor contínuo:

Classificação para prever rótulos de classe


Classificação é uma subcategoria do aprendizado supervisionado onde a meta é predizer os
rótulos de classe categórica de novas instâncias, com base em observações anteriores. Esses rótulos
de classe são discretos, valores desordenados que podem ser entendidos como as associações de
grupo das instâncias. O exemplo mencionado anteriormente de detecção de spam de e-mail
representa um exemplo típico de uma tarefa de classificação binária, onde o algoritmo de
aprendizado de máquina aprende um conjunto de regras para distinguir entre duas classes possíveis:
e-mails de spam e não spam. No entanto, o conjunto de rótulos de classe não precisa ser de natureza
binária. O modelo preditivo aprendido por um algoritmo de aprendizado supervisionado pode
atribuir qualquer rótulo de classe que foi apresentado no conjunto de dados de treinamento a uma
nova instância não rotulada. Um exemplo típico de tarefa de classificação multiclasse é o
reconhecimento de caracteres manuscritos. Aqui, poderíamos coletar um conjunto de dados de
treinamento que consiste em vários exemplos manuscritos de cada letra do alfabeto. Agora, se um
usuário fornecer um novo caractere manuscrito por meio de um dispositivo de entrada, nosso
modelo preditivo será capaz de prever a letra correta do alfabeto com certa precisão. No entanto,
nosso sistema de aprendizado de máquina não seria capaz de reconhecer corretamente nenhum dos
dígitos de zero a nove, por exemplo, se eles não fizessem parte do nosso conjunto de dados de
treinamento. A figura a seguir ilustra o conceito de uma tarefa de classificação binária, dadas 30
amostras de treinamento; 15 amostras de treinamento são rotuladas como classe negativa (sinais de
menos) e 15 amostras de treinamento são rotuladas como classe positiva (sinais de mais). Neste
cenário, nosso conjunto de dados é bidimensional, o que significa que cada amostra tem dois
valores associados a ela: x1 e x2. Agora, podemos usar um algoritmo de aprendizado de máquina
supervisionado para aprender uma regra - o limite de decisão representado como uma linha
tracejada - que pode separar essas duas classes e classificar novos dados em cada uma dessas duas
categorias, dados seus valores x1 e x2:
Regressão para prever resultado das classes

Aprendemos na seção anterior que a tarefa de classificação é atribuir rótulos categóricos e


não ordenados a instâncias. Um segundo tipo de aprendizado supervisionado é a previsão de
resultados contínuos, que também é chamada de análise de regressão. Na análise de regressão,
recebemos uma série de variáveis preditoras (exploratórias) e uma variável de resposta contínua
(resultado ou alvo), e tentamos encontrar uma relação entre essas variáveis que nos permita prever
um resultado.
Por exemplo, vamos supor que estamos interessados em prever as notas do SAT de
matemática dos nossos alunos. Se houver uma relação entre o tempo gasto estudando para o teste e
as notas finais, poderíamos usá-lo como dados de treinamento para aprender um modelo que usa o
tempo de estudo para prever as notas do teste de futuros alunos que estão planejando fazer esse
teste.

Nota
[ O termo regressão foi criado por Francis Galton em seu artigo Regression toward Mediocracy in
Hereditary Stature em 1886. Galton descreveu o fenômeno biológico de que a variância de altura
em uma população não aumenta ao longo do tempo. Ele observou que a altura dos pais não é
passada para os filhos, mas, em vez disso, a altura das crianças está regredindo em direção à média
populacional. ]
A figura a seguir ilustra o conceito de regressão linear. Dada uma variável preditora x e uma
variável de resposta y, ajustamos uma linha reta a esses dados que minimiza a distância - mais
comumente a distância quadrada média - entre os pontos da amostra e a linha ajustada. Agora
podemos usar o intercepto e a inclinação aprendidos dos dados tris para prever a variável de
resultado de novos dados:

Resolvendo problemas interativos com aprendizado por reforço

Você também pode gostar