0% found this document useful (0 votes)

5 views3 pages

Machine Learning Questions and Answers: Decision Tree

The document outlines key concepts in machine learning, including performance measures for classification models, feature selection methods for decision trees, and differences between various classifiers like Random Forest and Decision Trees. It also discusses clustering techniques, dimensionality reduction methods, and the distinctions between generative and discriminative classifiers. Additionally, it covers practical applications and challenges associated with different machine learning approaches.

Uploaded by

venkat Mohan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views3 pages

Machine Learning Questions and Answers: Decision Tree

Uploaded by

venkat Mohan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Machine Learning Questions and Answers

1. Performance measures associated with a classification model

- Error Rate: (FP + FN)/N
- Accuracy: (TP + TN)/N = 1 - Error Rate
- True Positive Rate (TPR) / Recall / Sensitivity: TP/P
- False Positive Rate (FPR): FP/N
- Precision: TP/P'
- Specificity: TN/N = 1 - FPR
- Receiver Operating Characteristic (ROC) Curve: Graphical representation of TPR vs. FPR.
- Area Under Curve (AUC): Measure of classifier performance based on ROC.

2. Measures used to select features for root and internal nodes in a decision tree
- Entropy: Measures impurity in a dataset.
- Gini Index: Measures the probability of misclassification.
- Information Gain: Reduction in entropy when a feature is used.
- Gain Ratio: Adjusted version of information gain to account for attribute splits.

3. Multivariate Classifier
- Considers multiple features simultaneously.
- Examples: Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA),
Multivariate Decision Trees.

4. Differences between Random Forest and Decision Tree

Decision Tree:
- Simple, interpretable model.
- Can overfit to training data.

Random Forest:
- Collection of multiple decision trees.
- Uses bagging to reduce overfitting.
- More accurate but less interpretable.

5. Challenges in Linear Support Vector Machines (SVM)

- Sensitivity to noise and outliers.
- Difficulty handling non-linearly separable data.
- High computational complexity for large datasets.
- Feature scaling required for optimal results.
6. K-Nearest Neighbors (KNN) Classifier
- Lazy learner (stores training data and classifies new instances based on nearest neighbors).
- Distance-based approach (uses Euclidean, Manhattan, Minkowski distances).
- Sensitive to choice of K (odd K values prevent ties in binary classification).

7. Kernel Function & High Dimensionality Handling

- Kernel Function: Transforms data into higher dimensions (e.g., polynomial, Gaussian, radial
basis function).
- Handling High Dimensionality: Use PCA, feature selection, and dimensionality reduction
methods.

8. Distance Metrics
- Euclidean Distance: d(x,y) = sqrt(sum (x_i - y_i)^2)
- Manhattan Distance: d(x,y) = sum |x_i - y_i|
- Minkowski Distance: d(x,y) = (sum |x_i - y_i|^p)^(1/p).

9. Difference between Regression and Classification

- Regression: Predicts continuous values.
- Classification: Predicts discrete labels/classes.

10. Difference between Probabilistic Generative and Discriminative Classifiers

- Generative Classifiers (e.g., Naïve Bayes, Gaussian Mixture Model): Model joint probability
P(X, Y).
- Discriminative Classifiers (e.g., Logistic Regression, SVM): Model conditional probability P(Y
| X).

11. Applications of Clustering

- Image segmentation
- Customer segmentation
- Anomaly detection
- Document clustering
- Bioinformatics.

12. Approaches to Finding K in K-Means Clustering

- Elbow Method
- Silhouette Score
- Gap Statistic.

13. Properties of Clustering

- Homogeneity: Items in a cluster should be similar.
- Separation: Clusters should be distinct.
- Scalability: Should handle large datasets.
- Robustness: Should handle noise and outliers.
14. Types of Clustering
- Hard Clustering (e.g., K-Means)
- Soft Clustering (e.g., Gaussian Mixture Model)
- Hierarchical Clustering
- Density-Based Clustering (e.g., DBSCAN).

15. Feature Selection vs. Feature Extraction

- Feature Selection: Choosing the most relevant features.
- Feature Extraction: Transforming features into a new space (e.g., PCA, LDA).

16. Curse of Dimensionality Solutions

- Feature selection to reduce dimensions.
- Principal Component Analysis (PCA).
- Manifold Learning (e.g., t-SNE, LLE).
- Regularization techniques.

17. Spectral Clustering

- Uses eigenvalues of similarity matrices to perform clustering.
- Effective for non-convex clusters.

18. LVM (Latent Variable Model)

- Used for dimensionality reduction.
- Examples: Principal Component Analysis (PCA), Hidden Markov Models (HMMs).

19. Difference between Gaussian Mixture Model (GMM) and Dirichlet Mixture Model (DMM)
- GMM: Assumes Gaussian distributions with known priors.
- DMM: Uses Dirichlet Process as a prior, allowing a variable number of clusters.

20. Applications of Topic Mixture Models

- Text Classification
- Document Clustering
- Sentiment Analysis
- Recommender Systems.

21. Difference between Soft and Hard Clustering

- Hard Clustering: Data point belongs to only one cluster (e.g., K-Means).
- Soft Clustering: Data point has probabilities for multiple clusters (e.g., Gaussian Mixture
Models).

22. Why is K Odd in KNN?

- Prevents ties in classification.
- Ensures a majority vote in binary classification.

SImple and Compound Interest Notes Lyst6475
No ratings yet
SImple and Compound Interest Notes Lyst6475
11 pages
Machine Learning Bangalore City University 2024
No ratings yet
Machine Learning Bangalore City University 2024
5 pages
At2150b Series
0% (1)
At2150b Series
3 pages
Grade Estimation Using Surpac
No ratings yet
Grade Estimation Using Surpac
58 pages
Varela 1979
No ratings yet
Varela 1979
14 pages
Chapter 2
No ratings yet
Chapter 2
23 pages
Scientech 2400GN
No ratings yet
Scientech 2400GN
178 pages
Corrosion Protection of Rock Bolts by Epoxy Coating and Its Effec PDF
No ratings yet
Corrosion Protection of Rock Bolts by Epoxy Coating and Its Effec PDF
9 pages
Chapter 12 Biology 11
No ratings yet
Chapter 12 Biology 11
52 pages
2.RGP Corneal Lens
No ratings yet
2.RGP Corneal Lens
13 pages
Lect 6
No ratings yet
Lect 6
8 pages
The Definite Integrals
No ratings yet
The Definite Integrals
25 pages
MLE1101 - Tutorial 2 - Suggested Solutions
No ratings yet
MLE1101 - Tutorial 2 - Suggested Solutions
8 pages
Discussion Forum Unit 5
No ratings yet
Discussion Forum Unit 5
2 pages
Data Classification - Algorithms and Applications-Chapman and Hall - CRC (2014) - (Chapman & Hall - CRC Data Mining and Knowledge Discovery Series) Charu C. Aggarwal PDF
100% (1)
Data Classification - Algorithms and Applications-Chapman and Hall - CRC (2014) - (Chapman & Hall - CRC Data Mining and Knowledge Discovery Series) Charu C. Aggarwal PDF
704 pages
كلية الهندسة
No ratings yet
كلية الهندسة
73 pages
Laboratory Work #4: Measurement of The Horizontal Component of The Earth Magnetic Induction
No ratings yet
Laboratory Work #4: Measurement of The Horizontal Component of The Earth Magnetic Induction
9 pages
Radiator - Wikipedia
No ratings yet
Radiator - Wikipedia
8 pages
Marantz SR 4500 Brochure
No ratings yet
Marantz SR 4500 Brochure
4 pages
Gutter Flow
No ratings yet
Gutter Flow
2 pages
Cbds 2103
No ratings yet
Cbds 2103
11 pages
M.L. 3,5,6 Unit 3
No ratings yet
M.L. 3,5,6 Unit 3
6 pages
Multi Class Logistic Regression Training and Testing
No ratings yet
Multi Class Logistic Regression Training and Testing
9 pages
ML Concepts: 1. Parametric Vs Non-Parametric Models:: Examples: Linear, Logistic, SVM
No ratings yet
ML Concepts: 1. Parametric Vs Non-Parametric Models:: Examples: Linear, Logistic, SVM
34 pages
Intro To Sampling Theory
No ratings yet
Intro To Sampling Theory
11 pages
Accelerated Data Science Introduction To Machine Learning Algorithms
No ratings yet
Accelerated Data Science Introduction To Machine Learning Algorithms
37 pages
Thesis Topics On Image Processing
100% (3)
Thesis Topics On Image Processing
6 pages
Pattern Summary Final
No ratings yet
Pattern Summary Final
28 pages
Intro S4HANA Using Global Bike Exercises PP Fiori en v4.2
No ratings yet
Intro S4HANA Using Global Bike Exercises PP Fiori en v4.2
16 pages
Preface To The Second Edition V 1 1
No ratings yet
Preface To The Second Edition V 1 1
9 pages
CE Board Nov 2020 - Hydraulics - Set 19
No ratings yet
CE Board Nov 2020 - Hydraulics - Set 19
1 page
ML - Machine Learning PDF
No ratings yet
ML - Machine Learning PDF
13 pages
2024 Ceed Mathematics - Paper I
No ratings yet
2024 Ceed Mathematics - Paper I
14 pages
Unit 4 DWDM
No ratings yet
Unit 4 DWDM
8 pages
ML Topics
No ratings yet
ML Topics
18 pages
CC Unit IV
No ratings yet
CC Unit IV
30 pages
Xchapter 1
No ratings yet
Xchapter 1
31 pages
SEM MLOps
No ratings yet
SEM MLOps
58 pages
NEET JH Sir Liquid Solution DPP
No ratings yet
NEET JH Sir Liquid Solution DPP
11 pages
Sem Rpa
No ratings yet
Sem Rpa
61 pages
Unit 2
No ratings yet
Unit 2
57 pages
Kavin
No ratings yet
Kavin
15 pages
100-Machine-Learning-Interview-Questions-and-Answers (Downloaded From Internet)
No ratings yet
100-Machine-Learning-Interview-Questions-and-Answers (Downloaded From Internet)
24 pages
PRCV Viva Notes
No ratings yet
PRCV Viva Notes
32 pages
Chapter 2 Machine Learning Draft-85-172
No ratings yet
Chapter 2 Machine Learning Draft-85-172
88 pages
Pattern Recognition Unit 2
No ratings yet
Pattern Recognition Unit 2
24 pages
Dimensioning and Tolerances
No ratings yet
Dimensioning and Tolerances
51 pages
ML Unit 3
No ratings yet
ML Unit 3
10 pages
ML - Interview Prep
No ratings yet
ML - Interview Prep
9 pages
Fam Question Bank CT
No ratings yet
Fam Question Bank CT
14 pages
JavaScript Cheat Sheet & Quick Reference
No ratings yet
JavaScript Cheat Sheet & Quick Reference
23 pages
Chatgpt Unit - 3
No ratings yet
Chatgpt Unit - 3
4 pages
Answer 2022-23
No ratings yet
Answer 2022-23
22 pages
Here Are Some Possible Questions and Answers Based On The Uploaded Documents
No ratings yet
Here Are Some Possible Questions and Answers Based On The Uploaded Documents
8 pages
APEC 2015 Intro Small Signal Modeling Seminar
No ratings yet
APEC 2015 Intro Small Signal Modeling Seminar
171 pages
Unit 4 Introduction To Algorithm
No ratings yet
Unit 4 Introduction To Algorithm
10 pages
ML ModuleUntitled 2
No ratings yet
ML ModuleUntitled 2
8 pages
ML Unit4
No ratings yet
ML Unit4
10 pages
ChatPDF IMG 20250313 WA0000
No ratings yet
ChatPDF IMG 20250313 WA0000
2 pages
ChatPDF IMG 20250313 WA0000
No ratings yet
ChatPDF IMG 20250313 WA0000
2 pages
DM Assignment 2
No ratings yet
DM Assignment 2
23 pages
ML 2m Cie2
No ratings yet
ML 2m Cie2
4 pages
Asynch Exercise 2 WACC APV
No ratings yet
Asynch Exercise 2 WACC APV
2 pages
ML Questions Answers
No ratings yet
ML Questions Answers
4 pages
ML QB With Answer
No ratings yet
ML QB With Answer
20 pages
Supervised Learning Final With Diagrams Cleaned
No ratings yet
Supervised Learning Final With Diagrams Cleaned
7 pages
1.write The Formula For Sigmoid, Hyperbolic Tangen...
No ratings yet
1.write The Formula For Sigmoid, Hyperbolic Tangen...
3 pages
Artificial Intelligence
No ratings yet
Artificial Intelligence
24 pages
Dsbda Ut5
No ratings yet
Dsbda Ut5
7 pages
Classification in Data Mining
No ratings yet
Classification in Data Mining
60 pages
Spam Not Spam
No ratings yet
Spam Not Spam
7 pages
ML Notes
No ratings yet
ML Notes
12 pages
Nit ML Sugg
No ratings yet
Nit ML Sugg
5 pages
Unit Pattern
No ratings yet
Unit Pattern
6 pages
Aiml Nts
No ratings yet
Aiml Nts
33 pages
Machine Learning One Mark Answers
No ratings yet
Machine Learning One Mark Answers
4 pages
6th - SEM Machine Learning Notes PDF
100% (1)
6th - SEM Machine Learning Notes PDF
36 pages
Eligible Candidates 2025-2026
0% (1)
Eligible Candidates 2025-2026
24 pages
Jman - Cse
No ratings yet
Jman - Cse
49 pages
Practice MCQ AI
No ratings yet
Practice MCQ AI
4 pages
2 Marks
No ratings yet
2 Marks
14 pages
Sona HWI Final Registration
No ratings yet
Sona HWI Final Registration
30 pages
CHP 1,2
No ratings yet
CHP 1,2
18 pages
CTS 3
No ratings yet
CTS 3
16 pages
Zentropy Addon
No ratings yet
Zentropy Addon
4 pages
ML - ML in Nutshell
No ratings yet
ML - ML in Nutshell
7 pages
Machine Learning
No ratings yet
Machine Learning
2 pages
(CS434) Questions You Can Be Asked
No ratings yet
(CS434) Questions You Can Be Asked
9 pages
Vacation Training Cse - Iqmath (Paid and Attendee List)
No ratings yet
Vacation Training Cse - Iqmath (Paid and Attendee List)
4 pages
DevRev Customer Support Engineering Intern
No ratings yet
DevRev Customer Support Engineering Intern
3 pages
Supervised Learning
No ratings yet
Supervised Learning
30 pages
CSE-Batch 3 List
No ratings yet
CSE-Batch 3 List
1 page
Current Affairs - MAY 2025
No ratings yet
Current Affairs - MAY 2025
127 pages
Programming in Java
No ratings yet
Programming in Java
1 page
Programming in Java 250525 093638
No ratings yet
Programming in Java 250525 093638
1 page
Prospectus Pharm D
No ratings yet
Prospectus Pharm D
18 pages
JMAN - CSE New List
No ratings yet
JMAN - CSE New List
28 pages
Cognizant DN Java FSE Progress Report
No ratings yet
Cognizant DN Java FSE Progress Report
4 pages
Machine Lar Arii
No ratings yet
Machine Lar Arii
9 pages
Machinelearning GateNotes
No ratings yet
Machinelearning GateNotes
105 pages
JD Software Engineer JMAN 2025
No ratings yet
JD Software Engineer JMAN 2025
1 page
Associate Data Scientist
No ratings yet
Associate Data Scientist
2 pages
Associate Software Engineer
No ratings yet
Associate Software Engineer
2 pages
ML
No ratings yet
ML
18 pages
Machine Learning Theory Updated
No ratings yet
Machine Learning Theory Updated
8 pages
SONA Round1 Shortlisted Candidates
No ratings yet
SONA Round1 Shortlisted Candidates
2 pages
Cognizant Communication Assessment Questions
100% (1)
Cognizant Communication Assessment Questions
4 pages
Sona L1 Assessment
No ratings yet
Sona L1 Assessment
2 pages
Sona College of Technology, Salem
No ratings yet
Sona College of Technology, Salem
6 pages
Sona College-Interview Reschedule
No ratings yet
Sona College-Interview Reschedule
5 pages
SONA Institute of Technology - Second Round Shortlisted Candidates
No ratings yet
SONA Institute of Technology - Second Round Shortlisted Candidates
6 pages
Sona Hwi Interview Shortlist
No ratings yet
Sona Hwi Interview Shortlist
2 pages
Data corp
No ratings yet
Data corp
16 pages
Data corp
No ratings yet
Data corp
16 pages
Data corp
No ratings yet
Data corp
16 pages
Data corp
No ratings yet
Data corp
16 pages
Wipro Milestone1 Result
No ratings yet
Wipro Milestone1 Result
12 pages
Endava 2026 Batch JD
No ratings yet
Endava 2026 Batch JD
3 pages

Machine Learning Questions and Answers: Decision Tree

Uploaded by

Machine Learning Questions and Answers: Decision Tree

Uploaded by

Machine Learning Questions and Answers

1. Performance measures associated with a classification model

4. Differences between Random Forest and Decision Tree

5. Challenges in Linear Support Vector Machines (SVM)

7. Kernel Function & High Dimensionality Handling

9. Difference between Regression and Classification

10. Difference between Probabilistic Generative and Discriminative Classifiers

11. Applications of Clustering

12. Approaches to Finding K in K-Means Clustering

13. Properties of Clustering

15. Feature Selection vs. Feature Extraction

16. Curse of Dimensionality Solutions

17. Spectral Clustering

18. LVM (Latent Variable Model)

20. Applications of Topic Mixture Models

21. Difference between Soft and Hard Clustering

22. Why is K Odd in KNN?

You might also like