Documento Sem Título

UNIVERSIDADE FEDERAL DO PIAUÍ – UFPI
CURSO TECNOLOGIA EM GESTÃO DE DADOS
DISCIPLINA: APRENDIZAGEM DE MÁQUINA I
PROFESSOR: MARTONY DEMES DA SILVA
Aluno:Mariana Borges Machado de Andrade
Lista de Exercício II
1. Qual das seguintes técnicas é usada para reduzir a dimensionalidade de um

conjunto de dados?
a) KNN
b) PCA (Análise de Componentes Principais)
c) Regressão Linear
d) SVM
R: B
2. Em aprendizagem de máquina, o que é um "hyperparameter"?
a) Um parâmetro que é aprendido pelo modelo a partir dos dados.
b) Um parâmetro ajustado antes do processo de treinamento.
c) Um valor que determina o número de camadas em uma rede neural.
d) Um valor que sempre é igual a zero.
R:B
3. Qual das alternativas abaixo é uma técnica de aprendizagem não

supervisionada?
a) Regressão Logística
b) K-Means
c) Regressão Linear
d) Redes Neurais
R:B
4. Qual das seguintes técnicas pode ser usada para avaliar a performance de um
modelo de classificação?
a) MSE (Mean Squared Error)
b) Accuracy
c) R-squared
d) Ajuste de Curva
R:B
5. O que é aprendizagem supervisionada?
(A) Aprendizagem com rótulos
(B) Aprendizagem sem rótulos
(C) Aprendizagem por reforço
(D) Nenhuma das anteriores
R:A
6. Qual das alternativas abaixo é um exemplo de algoritmo de regressão?
(A) K-Means
(B) Árvore de decisão
(C) Regressão logística
(D) Regressão linear
R:C, D
7. Na aprendizagem supervisionada, qual é o principal objetivo do modelo?
(A) Reduzir o erro de predição
(B) Maximizar a variabilidade dos dados
(C) Encontrar padrões nos dados não rotulados
(D) Gerar novos dados
R:A
8. Qual é a principal diferença entre a regressão linear e a regressão logística?
(A) A regressão linear prevê valores contínuos, enquanto a logística prevê

categorias.
(B) A regressão logística é usada para dados sequenciais, enquanto a linear é para
dados independentes.
(C) A regressão linear é usada para classificação, enquanto a logística é para

regressão.
(D) Ambas são usadas para prever valores contínuos.
R:A
9. Qual técnica de pré-processamento é aplicada para escalonar dados de

entrada entre 0 e 1?
(A) Padronização
(B) Normalização
(C) One-hot encoding
(D) Redução de dimensionalidade
R:D
10. O algoritmo K-Nearest Neighbors (KNN) é um exemplo de:
(A) Algoritmo não supervisionado
(B) Algoritmo supervisionado
(C) Aprendizagem por reforço
(D) Modelo generativo
R:B
11. O que é overfitting em um modelo de machine learning?
(A) O modelo performa bem tanto no treinamento quanto no teste
(B) O modelo performa bem no treinamento, mas mal no teste
(C) O modelo performa mal no treinamento, mas bem no teste
(D) O modelo tem alta generalização

R: B
12. Qual das técnicas abaixo pode ser utilizada para combater o overfitting?
(A) Aumentar o tamanho do conjunto de dados
(B) Aplicar regularização L2
(C) Usar validação cruzada
(D) Todas as anteriores
R:D
13. O que significa uma matriz de confusão?
(A) Uma matriz que organiza os dados de entrada para o modelo
(B) Uma matriz que compara as predições feitas pelo modelo com os valores reais
(C) Uma matriz usada para realizar multiplicação de matrizes em redes neurais
(D) Nenhuma das anteriores
R:D
14. Explique a diferença entre aprendizagem supervisionada e não

supervisionada.
Aprendizagem supervisionada: programa a máquina com base em uma série de

rótulos que mapeiam as entradas e saídas desejadas.
Aprendizagem não supervisionada: não se utiliza de rótulos para gerar o resultado

desejado, pois ele é ensinado a descobrir padrões
15. O que é validação cruzada (cross-validation) e como ela pode melhorar a

performance do modelo?
Na validação cruzada, o dataset é dividido aleatoriamente em

“K” grupos. Quando definimos um número para “k”, usamos o
número no lugar de “k” para fazer referência ao teste
16. Descreva o que é uma árvore de decisão e como ela realiza a tarefa de
classificação ou regressão..
Dividir os dados em subconjuntos baseados em condições de decisão;
Forma uma estrutura similar a uma árvore;

Cada nó interno representa uma "pergunta” sobre um atributo;
Cada folha representa uma decisão ou uma previsão.
17. Como funciona o algoritmo Naive Bayes e quais são suas principais hipóteses?
Podemos dizer que sua categorização só é realizada porque trata-se de um

problema supervisionado, que demanda a intervenção e acompanhamento
de um profissional que vai ajudar na construção do modelo a ser identificado.
18. O que são redes neurais convolucionais (CNNs) e para quais tipos de problemas
elas são mais eficazes?
São um subconjunto do aprendizado de máquina utilizadas com mais

frequência para tarefas de classificação e visão computacional. As redes neurais
convolucionais oferecem uma abordagem mais dimensionável para tarefas de
classificação de imagens e reconhecimento de objetos. Cada nó conecta-se a outro
tem peso e um limite associados. Se a saída de qualquer nó individual estiver acima
do valor de limiar especificado, esse nó será ativado, enviando dados para a
próxima camada da rede. Caso contrário, nenhum dado será passado para a
próxima camada da rede.
19. Diferencie aprendizagem por reforço de outras formas de aprendizagem.
Na aprendizagem por reforço, a interação com o ambiente é feita através de

feedback constante
20. Explique o conceito de learning rate e como ele afeta o desempenho de um

modelo.
Learning Rate é um valor numérico que determina o tamanho dos ajustes

feitos aos pesos do modelo durante o treinamento. Em outras palavras, a
Learning Rate controla a rapidez com que o modelo aprende com os dados
de treinamento. Se a Learning Rate for muito alta, o modelo pode não
convergir para uma solução ótima, resultando em instabilidade e baixo
desempenho. Por outro lado, se a Learning Rate for muito baixa, o
treinamento pode ser lento e o modelo pode ficar preso em mínimos locais.
21. Como você avaliaria a performance de um modelo de classificação? Quais

métricas são comumente utilizadas?
Categorizar um determinado conjunto de dados
em classes
■ Algoritmos mais famosos:
● KNN
● Naive Bayes
● Logistic Regression
● Support Vector Machines
● Decision Trees
22. O que são métodos de clusterização? Cite um exemplo e explique como ele
funciona.
Agrupar dados não rotulados com base em suas
semelhanças ou diferenças.
• Esses algoritmos de agrupamento ainda podem ser
subdivididos em agrupamentos:
• Exclusivos, sobrepostos, hierárquicos e probabilísticos.
• Exemplos de algoritmos: K-means, Mean-Shift, DBSCAN, Single Linkage e

Complete Linkage.
23. O que é o método Random Forest e quais são suas principais vantagens?
Combina várias árvores de decisão treinadas em diferentes subconjuntos dos dados

para reduzir a variância e aumentar a precisão.
24. Qual é o papel do pré-processamento de dados e por que ele é essencial?
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
25. Descreva o processo de construção e avaliação de um modelo de machine learning

desde a coleta de dados até a análise final.
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
Fim do exercício

Documento Sem Título

Enviado por

Direitos autorais:

Formatos disponíveis

Documento Sem Título

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Documento Sem Título

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE FEDERAL DO PIAUÍ – UFPI

CURSO TECNOLOGIA EM GESTÃO DE DADOS

DISCIPLINA: APRENDIZAGEM DE MÁQUINA I

PROFESSOR: MARTONY DEMES DA SILVA

Aluno:Mariana Borges Machado de Andrade

1. Qual das seguintes técnicas é usada para reduzir a dimensionalidade de um

b) PCA (Análise de Componentes Principais)

2. Em aprendizagem de máquina, o que é um "hyperparameter"?

a) Um parâmetro que é aprendido pelo modelo a partir dos dados.

b) Um parâmetro ajustado antes do processo de treinamento.

c) Um valor que determina o número de camadas em uma rede neural.

d) Um valor que sempre é igual a zero.

3. Qual das alternativas abaixo é uma técnica de aprendizagem não

a) MSE (Mean Squared Error)

5. O que é aprendizagem supervisionada?

(A) Aprendizagem com rótulos

(B) Aprendizagem sem rótulos

(C) Aprendizagem por reforço

(D) Nenhuma das anteriores

6. Qual das alternativas abaixo é um exemplo de algoritmo de regressão?

(B) Árvore de decisão

(C) Regressão logística

(D) Regressão linear

7. Na aprendizagem supervisionada, qual é o principal objetivo do modelo?

(A) Reduzir o erro de predição

(B) Maximizar a variabilidade dos dados

(C) Encontrar padrões nos dados não rotulados

(D) Gerar novos dados

(A) A regressão linear prevê valores contínuos, enquanto a logística prevê

(C) A regressão linear é usada para classificação, enquanto a logística é para

(D) Ambas são usadas para prever valores contínuos.

9. Qual técnica de pré-processamento é aplicada para escalonar dados de

(C) One-hot encoding

(D) Redução de dimensionalidade

10. O algoritmo K-Nearest Neighbors (KNN) é um exemplo de:

(A) Algoritmo não supervisionado

(B) Algoritmo supervisionado

(C) Aprendizagem por reforço

(D) Modelo generativo

11. O que é overfitting em um modelo de machine learning?

(A) O modelo performa bem tanto no treinamento quanto no teste

(B) O modelo performa bem no treinamento, mas mal no teste

(C) O modelo performa mal no treinamento, mas bem no teste

(D) O modelo tem alta generalização

(A) Aumentar o tamanho do conjunto de dados

(B) Aplicar regularização L2

(C) Usar validação cruzada

(D) Todas as anteriores

13. O que significa uma matriz de confusão?

(A) Uma matriz que organiza os dados de entrada para o modelo

(D) Nenhuma das anteriores

14. Explique a diferença entre aprendizagem supervisionada e não

Aprendizagem supervisionada: programa a máquina com base em uma série de

Aprendizagem não supervisionada: não se utiliza de rótulos para gerar o resultado

15. O que é validação cruzada (cross-validation) e como ela pode melhorar a

Na validação cruzada, o dataset é dividido aleatoriamente em

Dividir os dados em subconjuntos baseados em condições de decisão;

Forma uma estrutura similar a uma árvore;

Cada folha representa uma decisão ou uma previsão.