Documento Sem Título

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 7

UNIVERSIDADE FEDERAL DO PIAUÍ – UFPI

CURSO TECNOLOGIA EM GESTÃO DE DADOS

DISCIPLINA: APRENDIZAGEM DE MÁQUINA I

PROFESSOR: MARTONY DEMES DA SILVA

Aluno:Mariana Borges Machado de Andrade

Lista de Exercício II

1. Qual das seguintes técnicas é usada para reduzir a dimensionalidade de um


conjunto de dados?

a) KNN

b) PCA (Análise de Componentes Principais)

c) Regressão Linear

d) SVM

R: B

2. Em aprendizagem de máquina, o que é um "hyperparameter"?

a) Um parâmetro que é aprendido pelo modelo a partir dos dados.

b) Um parâmetro ajustado antes do processo de treinamento.

c) Um valor que determina o número de camadas em uma rede neural.

d) Um valor que sempre é igual a zero.

R:B

3. Qual das alternativas abaixo é uma técnica de aprendizagem não


supervisionada?

a) Regressão Logística

b) K-Means

c) Regressão Linear

d) Redes Neurais
R:B

4. Qual das seguintes técnicas pode ser usada para avaliar a performance de um
modelo de classificação?

a) MSE (Mean Squared Error)

b) Accuracy

c) R-squared

d) Ajuste de Curva

R:B

5. O que é aprendizagem supervisionada?

(A) Aprendizagem com rótulos

(B) Aprendizagem sem rótulos

(C) Aprendizagem por reforço

(D) Nenhuma das anteriores

R:A

6. Qual das alternativas abaixo é um exemplo de algoritmo de regressão?

(A) K-Means

(B) Árvore de decisão

(C) Regressão logística

(D) Regressão linear

R:C, D

7. Na aprendizagem supervisionada, qual é o principal objetivo do modelo?

(A) Reduzir o erro de predição

(B) Maximizar a variabilidade dos dados

(C) Encontrar padrões nos dados não rotulados

(D) Gerar novos dados

R:A
8. Qual é a principal diferença entre a regressão linear e a regressão logística?

(A) A regressão linear prevê valores contínuos, enquanto a logística prevê


categorias.

(B) A regressão logística é usada para dados sequenciais, enquanto a linear é para
dados independentes.

(C) A regressão linear é usada para classificação, enquanto a logística é para


regressão.

(D) Ambas são usadas para prever valores contínuos.

R:A

9. Qual técnica de pré-processamento é aplicada para escalonar dados de


entrada entre 0 e 1?

(A) Padronização

(B) Normalização

(C) One-hot encoding

(D) Redução de dimensionalidade

R:D

10. O algoritmo K-Nearest Neighbors (KNN) é um exemplo de:

(A) Algoritmo não supervisionado

(B) Algoritmo supervisionado

(C) Aprendizagem por reforço

(D) Modelo generativo

R:B

11. O que é overfitting em um modelo de machine learning?

(A) O modelo performa bem tanto no treinamento quanto no teste

(B) O modelo performa bem no treinamento, mas mal no teste

(C) O modelo performa mal no treinamento, mas bem no teste

(D) O modelo tem alta generalização


R: B

12. Qual das técnicas abaixo pode ser utilizada para combater o overfitting?

(A) Aumentar o tamanho do conjunto de dados

(B) Aplicar regularização L2

(C) Usar validação cruzada

(D) Todas as anteriores

R:D

13. O que significa uma matriz de confusão?

(A) Uma matriz que organiza os dados de entrada para o modelo

(B) Uma matriz que compara as predições feitas pelo modelo com os valores reais

(C) Uma matriz usada para realizar multiplicação de matrizes em redes neurais

(D) Nenhuma das anteriores

R:D

14. Explique a diferença entre aprendizagem supervisionada e não


supervisionada.

Aprendizagem supervisionada: programa a máquina com base em uma série de


rótulos que mapeiam as entradas e saídas desejadas.

Aprendizagem não supervisionada: não se utiliza de rótulos para gerar o resultado


desejado, pois ele é ensinado a descobrir padrões

15. O que é validação cruzada (cross-validation) e como ela pode melhorar a


performance do modelo?

Na validação cruzada, o dataset é dividido aleatoriamente em


“K” grupos. Quando definimos um número para “k”, usamos o
número no lugar de “k” para fazer referência ao teste
16. Descreva o que é uma árvore de decisão e como ela realiza a tarefa de
classificação ou regressão..

Dividir os dados em subconjuntos baseados em condições de decisão;

Forma uma estrutura similar a uma árvore;


Cada nó interno representa uma "pergunta” sobre um atributo;

Cada folha representa uma decisão ou uma previsão.

17. Como funciona o algoritmo Naive Bayes e quais são suas principais hipóteses?

Podemos dizer que sua categorização só é realizada porque trata-se de um


problema supervisionado, que demanda a intervenção e acompanhamento
de um profissional que vai ajudar na construção do modelo a ser identificado.

18. O que são redes neurais convolucionais (CNNs) e para quais tipos de problemas
elas são mais eficazes?

São um subconjunto do aprendizado de máquina utilizadas com mais


frequência para tarefas de classificação e visão computacional. As redes neurais
convolucionais oferecem uma abordagem mais dimensionável para tarefas de
classificação de imagens e reconhecimento de objetos. Cada nó conecta-se a outro
tem peso e um limite associados. Se a saída de qualquer nó individual estiver acima
do valor de limiar especificado, esse nó será ativado, enviando dados para a
próxima camada da rede. Caso contrário, nenhum dado será passado para a
próxima camada da rede.

19. Diferencie aprendizagem por reforço de outras formas de aprendizagem.

Na aprendizagem por reforço, a interação com o ambiente é feita através de


feedback constante

20. Explique o conceito de learning rate e como ele afeta o desempenho de um


modelo.

Learning Rate é um valor numérico que determina o tamanho dos ajustes


feitos aos pesos do modelo durante o treinamento. Em outras palavras, a
Learning Rate controla a rapidez com que o modelo aprende com os dados
de treinamento. Se a Learning Rate for muito alta, o modelo pode não
convergir para uma solução ótima, resultando em instabilidade e baixo
desempenho. Por outro lado, se a Learning Rate for muito baixa, o
treinamento pode ser lento e o modelo pode ficar preso em mínimos locais.

21. Como você avaliaria a performance de um modelo de classificação? Quais


métricas são comumente utilizadas?

Categorizar um determinado conjunto de dados

em classes

■ Algoritmos mais famosos:

● KNN

● Naive Bayes

● Logistic Regression

● Support Vector Machines

● Decision Trees

22. O que são métodos de clusterização? Cite um exemplo e explique como ele
funciona.

Agrupar dados não rotulados com base em suas

semelhanças ou diferenças.

• Esses algoritmos de agrupamento ainda podem ser

subdivididos em agrupamentos:

• Exclusivos, sobrepostos, hierárquicos e probabilísticos.

• Exemplos de algoritmos: K-means, Mean-Shift, DBSCAN, Single Linkage e


Complete Linkage.

23. O que é o método Random Forest e quais são suas principais vantagens?

Combina várias árvores de decisão treinadas em diferentes subconjuntos dos dados


para reduzir a variância e aumentar a precisão.
24. Qual é o papel do pré-processamento de dados e por que ele é essencial?

___________________________________________________________________

___________________________________________________________________

___________________________________________________________________

___________________________________________________________________

___________________________________________________________________

25. Descreva o processo de construção e avaliação de um modelo de machine learning


desde a coleta de dados até a análise final.

___________________________________________________________________

___________________________________________________________________

___________________________________________________________________

___________________________________________________________________

___________________________________________________________________

Fim do exercício

Você também pode gostar