01 Course Logistics

Dr. Saravanan Thirumuruganathan, an expert in AI and data mining, introduces a course focused on practical applications of data science using Python. The course will utilize Moodle for communication, feature programming assignments, and cover various topics including visualization, classification, and clustering. Grading will be based on programming assignments, tests, and a final exam, with an emphasis on collaborative learning and applied techniques in an enterprise context.

Uploaded by

abby.iitpkd

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views12 pages

01 Course Logistics

Uploaded by

abby.iitpkd

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 12

Course Intro and Logistics

Dr. Saravanan (Sara) Thirumuruganathan

My Background
• MS/PhD from University of Texas at Arlington
• Prev: 2016-2022: Senior Scientist at QCRI, Qatar
• Prev: 2020-2024: Co-founder and Chief Scientist of a Customer
Onboarding startup
• Current: 2024- : Co-founder and CEO of a startup building customer
engagement platform (chatbots and more) using AI/LLMs
• Other: Consultant to multiple governments, international
organizations and large enterprises
(Research) Interests
• SLMs and LLMs
• Deep/Machine learning , Artificial Intelligence , Data mining
• Data Integration
• Cybersecurity

• Python, Golang, Typescript aficionado

• And purveyor of very many languages and frameworks

• Lectiophile especially of Fantasy, Science Fiction and Comics

Course Details
• Moodle LMS
• Slides, Forums, etc
• This will be the primary way to talk about the course
• So if you have course related comments / doubts etc, please use Moodle
• Contact
• [email protected]
• Use this for non-public correspondence
• Office Hours
• Before or after class
• By appointment
Textbooks
• There is no single book to cover all course topics
• Slides will be the primary reference material.
• The instructor will also share some reading materials (chapters from
some book, research papers, blog posts etc)
• All the textbooks will be online and publicly available
• You are welcome to buy the books, but it is not needed
Textbooks
• [MMDS] Mining of Massive Datasets by Jure Leskovec, Anand Rajaraman,
Jeff Ullman
• http://www.mmds.org/
• [ISLP] An Introduction to Statistical Learning by Gareth James, Daniela
Witten, Trevor Hastie, Robert Tibshirani, Jonathan Taylor
• https://www.statlearning.com/
• [IDM] Introduction to Data Mining by Pang-Ning Tan, Michael Steinbach,
Anuj Karpatne, Vipin Kumar
• https://www-users.cse.umn.edu/~kumar001/dmbook/index.php
• [IIR] Introduction to Information Retrieval by Christopher D. Manning,
Prabhakar Raghavan and Hinrich Schutze.
• https://nlp.stanford.edu/IR-book/
Grading
• 40% (four) Programming Assignments
• 20% Test 1 and Test 2
• 40% Final exam (comprehensive)
Topics relevant to Programming Assignments
• Scientific Python: numpy, pandas/modin, sklearn
• Env management: pyenv, pipx, poetry/pdm/rye
• Code quality: pylint, ruff, type annotations, pyright, pydantic, pytest
• Profiling/Debugging: scalene, wat, pyinstrument, loguru,
• Web stuff: httpx, FastAPI
• Databases: sqlite, duckdb, PRQL
• Misc: tqdm, click/argparse
• Data formats: JSON, TOML, YAML
• Viz: matplotlib, seaborn, altair
Programming Assignments
• Goal: expose you to important data mining tools to make you
productive as a data scientist
• Team based, 1-3 members
• Coding will be in Python
• All of them will be intensive
• Startup code, testing code will be provided
• Budget approx. 20 hours per assignment (Learning + Coding time)
• Teams might require less time based on how you split the tasks
Programming Assignments
• Start early
• Find good team members
• Okay to change teams per project
• Everyone in team gets same score
• Collaboration/Brainstorming is Okay!
• Plagiarism is not ☺
Course Topics: Design Goals
• Breadth of topics rather than depth
• Biased selection based on how useful they are in an enterprise setting
• Applied focus : given a technique
• When to it?
• How to use it?
• When not to use it?
Course Topics
• Visualization
• Pattern mining
• Finding similar items
• Classification
• Simple models: Decision trees, kNN, Naïve Bayes
• Ensemble models: Random forests, Boosting and Bagging
• Model Comparison and Evaluation
• Clustering + Dimensionality Reduction
• Recommenders
• Data mining in the wild: sampling, simulations, hypothesis testing, MAB, A/B
• Presenting data mining results: narrative storytelling

ACCA - Performance Management - Syllabus and Study Guide
No ratings yet
ACCA - Performance Management - Syllabus and Study Guide
20 pages
Syllabus - CIS 509 Data Mining II (Fall 2019)
No ratings yet
Syllabus - CIS 509 Data Mining II (Fall 2019)
7 pages
Lesson Plan in Community Engagement
83% (6)
Lesson Plan in Community Engagement
3 pages
Python Crash Course
0% (1)
Python Crash Course
15 pages
Ai and Data Science
No ratings yet
Ai and Data Science
9 pages
Machine Learning and Data Science Master
No ratings yet
Machine Learning and Data Science Master
19 pages
AIML Curriculum
No ratings yet
AIML Curriculum
25 pages
Ai&ml 20250109 074314
No ratings yet
Ai&ml 20250109 074314
8 pages
Ai and Data Science
No ratings yet
Ai and Data Science
9 pages
ML Roadmap
No ratings yet
ML Roadmap
11 pages
Ai & ML FDP
No ratings yet
Ai & ML FDP
7 pages
Pre-M.Sc. (3 Months Before Starting M.SC.) : Goal
No ratings yet
Pre-M.Sc. (3 Months Before Starting M.SC.) : Goal
15 pages
Full Stack Roadmap
No ratings yet
Full Stack Roadmap
25 pages
DS Course Curriculum
No ratings yet
DS Course Curriculum
19 pages
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
No ratings yet
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
16 pages
Data Science Student Schedule
No ratings yet
Data Science Student Schedule
7 pages
? Ultimate Data Science Topic List - (Beginner To ...
No ratings yet
? Ultimate Data Science Topic List - (Beginner To ...
4 pages
The Complete Data Science Course
No ratings yet
The Complete Data Science Course
5 pages
Master of Science in Machine Learning & AI - Liverpool Joh Moore University
No ratings yet
Master of Science in Machine Learning & AI - Liverpool Joh Moore University
6 pages
Machine Learning With Python
No ratings yet
Machine Learning With Python
4 pages
Course Flyer Course Overview and Sample Certificate Together For Data Science Course
No ratings yet
Course Flyer Course Overview and Sample Certificate Together For Data Science Course
4 pages
Data Science C
No ratings yet
Data Science C
21 pages
Data Science Curriculum PDF
No ratings yet
Data Science Curriculum PDF
19 pages
Data Science ML Full Stack Roadmap
No ratings yet
Data Science ML Full Stack Roadmap
35 pages
Artificial Intelligence & Machine Learning Curriculum Pregrad
No ratings yet
Artificial Intelligence & Machine Learning Curriculum Pregrad
12 pages
Data Scientist & Data Analyst
No ratings yet
Data Scientist & Data Analyst
24 pages
AIML Roadmap
No ratings yet
AIML Roadmap
2 pages
AI-Internship Syllabus
No ratings yet
AI-Internship Syllabus
3 pages
Data Science Course Outline CES LUMS
No ratings yet
Data Science Course Outline CES LUMS
4 pages
Data Science Roadmap
No ratings yet
Data Science Roadmap
5 pages
Datasciencewith AI
No ratings yet
Datasciencewith AI
12 pages
DS Curriculum 2024
No ratings yet
DS Curriculum 2024
12 pages
INF385T IMLsyllabus
No ratings yet
INF385T IMLsyllabus
4 pages
Data Sceince and AI Training Curriculum - V4.0
No ratings yet
Data Sceince and AI Training Curriculum - V4.0
19 pages
1 Introduction
No ratings yet
1 Introduction
58 pages
Course Outline - ML IIFT Delhi MBA (BA) Sep-Dec 24
No ratings yet
Course Outline - ML IIFT Delhi MBA (BA) Sep-Dec 24
5 pages
Python For Data Science and Machine Learning Bootcamp
No ratings yet
Python For Data Science and Machine Learning Bootcamp
15 pages
Data Analytics 2025 V2.0
No ratings yet
Data Analytics 2025 V2.0
18 pages
Action PlanJournaling
No ratings yet
Action PlanJournaling
7 pages
Data Science and Machine Learning With Python
No ratings yet
Data Science and Machine Learning With Python
11 pages
PDF
No ratings yet
PDF
25 pages
SEM 5 Syllabus
No ratings yet
SEM 5 Syllabus
28 pages
Pregrad2 0-1
No ratings yet
Pregrad2 0-1
16 pages
UPDATED Data Science Syllabus
No ratings yet
UPDATED Data Science Syllabus
20 pages
Certification Course On Data Science Latest
No ratings yet
Certification Course On Data Science Latest
8 pages
AI - Proposal For ASU
No ratings yet
AI - Proposal For ASU
26 pages
Interpretable Machine Learning
No ratings yet
Interpretable Machine Learning
3 pages
New Microsoft Office Excel Worksheet
No ratings yet
New Microsoft Office Excel Worksheet
44 pages
Diploma in Data Science Online Training Content by MR Navin NareshIT Modified
No ratings yet
Diploma in Data Science Online Training Content by MR Navin NareshIT Modified
10 pages
Executive PG Programme in Data Science: Curriculum
No ratings yet
Executive PG Programme in Data Science: Curriculum
12 pages
Data Science Masters 2.0 - PW Skills
No ratings yet
Data Science Masters 2.0 - PW Skills
15 pages
Final Unit 4
No ratings yet
Final Unit 4
107 pages
Data Science Detaiuls of Course
No ratings yet
Data Science Detaiuls of Course
5 pages
BCA507
No ratings yet
BCA507
2 pages
Inceptez Fullstack Datascience, Bigdata and Cloud 2021
No ratings yet
Inceptez Fullstack Datascience, Bigdata and Cloud 2021
36 pages
Program Calendar PGDDS March
No ratings yet
Program Calendar PGDDS March
2 pages
Course Logistics and Introduction: CSN-526 Machine Learning
No ratings yet
Course Logistics and Introduction: CSN-526 Machine Learning
23 pages
Course-Outline - Introduction To ML
No ratings yet
Course-Outline - Introduction To ML
3 pages
Artificial Intelligence Syllabus Shshbs
No ratings yet
Artificial Intelligence Syllabus Shshbs
8 pages
FCH Hello IITK
No ratings yet
FCH Hello IITK
3 pages
Adavanced - Applied Artificial Intelligence (Practical Implementations)
No ratings yet
Adavanced - Applied Artificial Intelligence (Practical Implementations)
9 pages
data science course training in india hyderabad: innomatics research labs
From Everand
data science course training in india hyderabad: innomatics research labs
innomatics research labs
No ratings yet
03 Charts
No ratings yet
03 Charts
78 pages
02 Intro To Data Viz
No ratings yet
02 Intro To Data Viz
93 pages
Lecture 2 MLrecap
No ratings yet
Lecture 2 MLrecap
23 pages
Lecture 3 MLP
No ratings yet
Lecture 3 MLP
35 pages
Research Article: Aircraft Failure Rate Prediction Method Based On CEEMD and Combined Model
No ratings yet
Research Article: Aircraft Failure Rate Prediction Method Based On CEEMD and Combined Model
19 pages
MSCA DN PARASOL Recruitment Document FINAL v2
No ratings yet
MSCA DN PARASOL Recruitment Document FINAL v2
8 pages
SIMMODE Paper of Learning Team 3
No ratings yet
SIMMODE Paper of Learning Team 3
34 pages
Lesson Plan Template: Different Ways To Assess Student Learning and How To Do Learning Centers
No ratings yet
Lesson Plan Template: Different Ways To Assess Student Learning and How To Do Learning Centers
4 pages
Jev English Research
No ratings yet
Jev English Research
14 pages
Activity Guide and Assesment Rubric - Phase 6 - Consolidation of The Protocol and Final Evaluation of The Project
No ratings yet
Activity Guide and Assesment Rubric - Phase 6 - Consolidation of The Protocol and Final Evaluation of The Project
7 pages
Dissertation Acknowledgement Template
100% (2)
Dissertation Acknowledgement Template
9 pages
Chinese People View Cyberbullying
No ratings yet
Chinese People View Cyberbullying
14 pages
Nhs FPX 4000 Assessment 4 Analyzing A Current Health Care Problem or Issue
No ratings yet
Nhs FPX 4000 Assessment 4 Analyzing A Current Health Care Problem or Issue
6 pages
CBAR Proposal
No ratings yet
CBAR Proposal
4 pages
Week 2 - Motivation To Be A Midwife
No ratings yet
Week 2 - Motivation To Be A Midwife
4 pages
SHG Final Report in Himachal Pradesh
No ratings yet
SHG Final Report in Himachal Pradesh
165 pages
ArtikelProsidingISEHTUNNES HamdanHuseinBatubara
No ratings yet
ArtikelProsidingISEHTUNNES HamdanHuseinBatubara
9 pages
Argumentative Essay English 10
No ratings yet
Argumentative Essay English 10
2 pages
GINA Report 2008
No ratings yet
GINA Report 2008
116 pages
AFM 20530: Business Finance Semester I Group Assignment I - Intake 14 and 13 EX
No ratings yet
AFM 20530: Business Finance Semester I Group Assignment I - Intake 14 and 13 EX
2 pages
Learning Module No. 7: Content Standards
No ratings yet
Learning Module No. 7: Content Standards
12 pages
GED - 3211 Smart Village Studies (Report 1)
No ratings yet
GED - 3211 Smart Village Studies (Report 1)
19 pages
2023 Specimen Paper 4 Mark Scheme
No ratings yet
2023 Specimen Paper 4 Mark Scheme
10 pages
Rolip2 Report GNN
No ratings yet
Rolip2 Report GNN
6 pages
Pilot Evaluation of The Elementary Social-Emotional Learning Program Sources of Strength
No ratings yet
Pilot Evaluation of The Elementary Social-Emotional Learning Program Sources of Strength
12 pages
Bba Ca
No ratings yet
Bba Ca
92 pages
200 Homonyms
No ratings yet
200 Homonyms
46 pages
P5 Method Study - Value Analysis
No ratings yet
P5 Method Study - Value Analysis
2 pages
Course Evaluation Form
No ratings yet
Course Evaluation Form
3 pages
Mindless Reading
No ratings yet
Mindless Reading
3 pages
English M2
No ratings yet
English M2
3 pages
Shared Leadership Knowledge Work
No ratings yet
Shared Leadership Knowledge Work
13 pages

01 Course Logistics

Uploaded by

01 Course Logistics

Uploaded by

Course Intro and Logistics

Dr. Saravanan (Sara) Thirumuruganathan

• Python, Golang, Typescript aficionado

• Lectiophile especially of Fantasy, Science Fiction and Comics

You might also like