Kabir ML Assignment

The document outlines an ML assignment consisting of theoretical questions and practical coding tasks. It covers topics such as neural network limitations, performance metrics for classifiers, frequent itemset mining using the Apriori algorithm, decision trees, K-Means clustering, and a GitHub API community clustering project. The assignment requires analysis, calculations, and the development of a Python script for data collection and clustering visualization.

Uploaded by

shahharshil686

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views3 pages

Kabir ML Assignment

Uploaded by

shahharshil686

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

ML Assignment

Theory and Numericals

1. Analyze the limitations of traditional neural networks.

2. A classifier achieves the following confusion matrix on a test dataset:

Predicted Predicted
Positive Negative
Actual Positive 40 10
Actual Negative 20 30
Calculate precision, recall, F1 score, and
accuracy.

Derive the mathematical formula for the F1 score and explain its relationship with
precision and recall.

3. A dataset contains the following transactions:

o T1: {A, B, C}
o T2: {A, C}
o T3: {A, B}
o T4: {A, B, C, D}
o T5: {B, C, D} Find all frequent itemsets using the Apriori algorithm with a
minimum support of 0.6.
o Extend the above example to generate association rules with a minimum
confidence of 0.8.
4. Decision Trees
5. Open ended

• Why is it not always ideal to achieve zero training error in a machine learning model?
Explain with examples.
• If adding more data does not improve the performance of a machine learning model, what
could be the reasons? Propose solutions.
• Can a classifier with 100% accuracy always be considered the best? Discuss scenarios
where this may not hold true.
• How does feature scaling impact the performance of algorithms like K-Nearest
Neighbors and Support Vector Machines? Provide insights.

6. K-Means Clustering Process:

Using the given data: [2,4,10,12,3,20,30,11,25] [2, 4, 10, 12, 3, 20, 30, 11, 25],

perform K-Means clustering with K=2

Tasks:

1. Perform two iterations of the K-Means algorithm and report the cluster
assignments after each iteration.
2. Calculate the final centroids of the clusters.
3. Explain why the clusters remain stable or change during each iteration.
Coding Assignment

Github API Community Clustering

Write a Python script to:

1. Data Collection:
o Use the GitHub API to fetch user profile data for a list of users.
o Collect information about each user's repositories, programming languages, and
followers.
2. Data Processing:
o Create a dataset where each user is represented by the programming languages
they most frequently use.
o Encode the programming languages as features.
3. Clustering:
o Apply K-Means clustering to group users based on their programming language
preferences.
o Visualize the clusters using a 2D scatter plot (if dimensionality reduction is
needed, use PCA).
4. Community Insights:
o Identify the main programming languages in each cluster.
o Provide a brief analysis of how the clusters represent communities of users who
code in similar languages.

Deliverables:

• Python script (.py file) with clear comments and modular code.
• A README file explaining how to run the script and interpret the results.
• A visualization of the clusters and summary insights.

REFERENCES

Adobe Acrobat
Document

Beginners Guide To Making Money Online
100% (8)
Beginners Guide To Making Money Online
129 pages
Combo .Com - MX Targets 97k @fxntycraker
No ratings yet
Combo .Com - MX Targets 97k @fxntycraker
1,637 pages
DATA SCIENCE Internship Tasks
No ratings yet
DATA SCIENCE Internship Tasks
12 pages
AI&ML Lab Report
No ratings yet
AI&ML Lab Report
19 pages
ABB Bailey Infi90
No ratings yet
ABB Bailey Infi90
29 pages
Artificial Intellegence Lab Practical
No ratings yet
Artificial Intellegence Lab Practical
48 pages
Ai Possible Qns
No ratings yet
Ai Possible Qns
15 pages
PDS - October 26, 1 - 32 AM
No ratings yet
PDS - October 26, 1 - 32 AM
29 pages
E1213 PRNN: Assignment 1 - Basic Models: Prof. Prathosh A. P. Submission Deadline: 1st March 2022
No ratings yet
E1213 PRNN: Assignment 1 - Basic Models: Prof. Prathosh A. P. Submission Deadline: 1st March 2022
3 pages
Question Bank Python For Data Science
0% (1)
Question Bank Python For Data Science
3 pages
Aman 61
No ratings yet
Aman 61
24 pages
Assignment-1 ML Solution by Loknath Regmi
No ratings yet
Assignment-1 ML Solution by Loknath Regmi
41 pages
MNC Companies HR Email Ids To Forward Resumes
No ratings yet
MNC Companies HR Email Ids To Forward Resumes
11 pages
Irs 122010304057 PDF
No ratings yet
Irs 122010304057 PDF
23 pages
ML Lab Manual
No ratings yet
ML Lab Manual
90 pages
Group B: Machine Learning
No ratings yet
Group B: Machine Learning
25 pages
Heart Merged
No ratings yet
Heart Merged
8 pages
IQBAL Fresher 19
No ratings yet
IQBAL Fresher 19
3 pages
Papaer Sizes
No ratings yet
Papaer Sizes
25 pages
Solutions To Applied Data Science AI
No ratings yet
Solutions To Applied Data Science AI
9 pages
Programming Questions
No ratings yet
Programming Questions
5 pages
Imkpğ
No ratings yet
Imkpğ
3 pages
ML Unit-5
No ratings yet
ML Unit-5
8 pages
OSPF Config
No ratings yet
OSPF Config
264 pages
Rithvik Bhuvkar AI Assignment Final
No ratings yet
Rithvik Bhuvkar AI Assignment Final
24 pages
Machine L-Lab-Manual
No ratings yet
Machine L-Lab-Manual
90 pages
AI Lab 3 11102024 011846pm
No ratings yet
AI Lab 3 11102024 011846pm
5 pages
Gradient Ascent
No ratings yet
Gradient Ascent
27 pages
Bil570 hw3 Summer2020
No ratings yet
Bil570 hw3 Summer2020
3 pages
Ai ML
No ratings yet
Ai ML
12 pages
Datascience
No ratings yet
Datascience
8 pages
Question Bank Data Science & Its Applications
No ratings yet
Question Bank Data Science & Its Applications
3 pages
CSE Sem7 N 8
No ratings yet
CSE Sem7 N 8
51 pages
(1122) AI Assignment2
No ratings yet
(1122) AI Assignment2
2 pages
Tamizhalagan Internship Document
No ratings yet
Tamizhalagan Internship Document
25 pages
Assignment 3 FML July Nov 2024
No ratings yet
Assignment 3 FML July Nov 2024
2 pages
Sample LP-III Chits
No ratings yet
Sample LP-III Chits
6 pages
GrowthLink - DS
No ratings yet
GrowthLink - DS
8 pages
DM Lab Assignment 2
No ratings yet
DM Lab Assignment 2
2 pages
Assignment 2
No ratings yet
Assignment 2
3 pages
ML Notes
No ratings yet
ML Notes
25 pages
Numpy Module
No ratings yet
Numpy Module
10 pages
Assignment 2
No ratings yet
Assignment 2
3 pages
Machine Learning (Assignment 1-5)
No ratings yet
Machine Learning (Assignment 1-5)
3 pages
COM7039M MachineLearning Assignment Brief-Level 7-1
No ratings yet
COM7039M MachineLearning Assignment Brief-Level 7-1
12 pages
Systems Developmentfor Records Archivingand Digital Documents Repository ACase Study
No ratings yet
Systems Developmentfor Records Archivingand Digital Documents Repository ACase Study
19 pages
CS4038D Data Mining Assignment 2 - 2024
No ratings yet
CS4038D Data Mining Assignment 2 - 2024
2 pages
CS60050 - Machine Learning - Programming Assignment - 3
No ratings yet
CS60050 - Machine Learning - Programming Assignment - 3
5 pages
F21DL 2024-25 Coursework-1 - 240918 - 110502
No ratings yet
F21DL 2024-25 Coursework-1 - 240918 - 110502
7 pages
Data Mining & Machine Learning Courseoutline
No ratings yet
Data Mining & Machine Learning Courseoutline
7 pages
HP LaserJet Pro P1106 Printer Software and Driver Downloads - HP® Customer Support
No ratings yet
HP LaserJet Pro P1106 Printer Software and Driver Downloads - HP® Customer Support
2 pages
CSC 603 - Final Project
No ratings yet
CSC 603 - Final Project
3 pages
CPE531 S18 MT Sol PDF
No ratings yet
CPE531 S18 MT Sol PDF
3 pages
Data Mining - UOG (HH) - Final - F23-1
No ratings yet
Data Mining - UOG (HH) - Final - F23-1
10 pages
Google - Professional Machine Learning Engineer.v2021 07 27.q25
No ratings yet
Google - Professional Machine Learning Engineer.v2021 07 27.q25
11 pages
Introduction To Deep Learning Assignment 0: September 2023
No ratings yet
Introduction To Deep Learning Assignment 0: September 2023
3 pages
Syllabus AIML
No ratings yet
Syllabus AIML
14 pages
Answer
No ratings yet
Answer
5 pages
DVT Userguide
No ratings yet
DVT Userguide
118 pages
3d Ghost Gun
No ratings yet
3d Ghost Gun
3 pages
Syl3 ML
No ratings yet
Syl3 ML
5 pages
5 Axis CNC Breakout Board
No ratings yet
5 Axis CNC Breakout Board
13 pages
AA Syllabus 2024 25
No ratings yet
AA Syllabus 2024 25
4 pages
Assignment2 2024
No ratings yet
Assignment2 2024
4 pages
Assignment 3-PDS Python-24S3
No ratings yet
Assignment 3-PDS Python-24S3
5 pages
Beshir Sid Ahmed
No ratings yet
Beshir Sid Ahmed
4 pages
7641 Assignment 1
No ratings yet
7641 Assignment 1
4 pages
Project Assignment.2024
No ratings yet
Project Assignment.2024
2 pages
MLT Syllabus
No ratings yet
MLT Syllabus
3 pages
M.L.CSE Syllabus
No ratings yet
M.L.CSE Syllabus
3 pages
How To Use The Apo Alert Monitor For Reporting
100% (1)
How To Use The Apo Alert Monitor For Reporting
10 pages
Reusable Preschool Calendar Blank
No ratings yet
Reusable Preschool Calendar Blank
15 pages
Plane Extraction
No ratings yet
Plane Extraction
11 pages
Lecture - 9 Abstract Classes and Abstract Methods
No ratings yet
Lecture - 9 Abstract Classes and Abstract Methods
35 pages
Durga Black Book
No ratings yet
Durga Black Book
36 pages
Q-1 What Is Parsing? Explain XML Parsing and JSON Parsing With Example. OR Explain JSON Parsing With Example
No ratings yet
Q-1 What Is Parsing? Explain XML Parsing and JSON Parsing With Example. OR Explain JSON Parsing With Example
36 pages
Ajp Notes Chap6
No ratings yet
Ajp Notes Chap6
42 pages
Vocabulary Building Documentation
No ratings yet
Vocabulary Building Documentation
79 pages
Evs xt2 Apercu Quick View
No ratings yet
Evs xt2 Apercu Quick View
6 pages
User Guide
No ratings yet
User Guide
31 pages
Structured Cabling
No ratings yet
Structured Cabling
22 pages
Single Sign-On Implementation
No ratings yet
Single Sign-On Implementation
19 pages
Dynamic Queries and The Foundation Design Pattern - p12
No ratings yet
Dynamic Queries and The Foundation Design Pattern - p12
12 pages
Choosing The Most Suitable Predictive Maintenance Sensor
No ratings yet
Choosing The Most Suitable Predictive Maintenance Sensor
5 pages
Cheat Python
No ratings yet
Cheat Python
8 pages
2.1 Workbook
No ratings yet
2.1 Workbook
26 pages
WEBAPPS - Practice Exercise 7 - PHP Repetition Statement
No ratings yet
WEBAPPS - Practice Exercise 7 - PHP Repetition Statement
3 pages
How To Find
No ratings yet
How To Find
1 page