0% found this document useful (0 votes)

96 views4 pages

Syllabus FDS

Foundation of Data Science Syllabus - IoE, TU

Uploaded by

078msdsa001.baikuntha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

96 views4 pages

Syllabus FDS

Foundation of Data Science Syllabus - IoE, TU

Uploaded by

078msdsa001.baikuntha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

FOUNDATION OF DATA SCIENCE

ENCT 202

Lecture :3 Year : II
Tutorial :1 Part : I
Practical :3

Course Objectives:
The objective of this course is to introduce the core concepts, tools, and methodologies
of data science, focusing on the tools and techniques needed to analyze and interpret
data effectively. Using data science tools, students will cover the entire data science
process, from data acquisition, data manipulation, visualization, probability, statistics,
and machine learning, with applications in business and engineering.

1 Introduction to Data Science (3 hours)

1.1 Overview of data science
1.2 Jargons of data science
1.3 Modern data ecosystem
1.4 Data science lifecycle
1.5 Trends, markets and applications of data science
1.6 Tools and technologies in data science
1.7 Data scientist and their roles

2 Mathematics for Data Science (10 hours)

2.1 Introduction to linear algebra for data science
2.2 Vectors, matrices and matrix factorization
2.3 Gradient descent for optimization
2.4 Introduction to probability and random variable
2.5 Probability distributions: Normal, Bernoulli, Binomial, Poisson
2.6 Descriptive and inferential statistics
2.7 Central limit theorem and sample distribution concepts
2.8 Normal approximation; hypothesis testing procedures: Tests about the
mean of a normal population
2.9 The t-test, Z-tests for differences between two populations means, the two-
sample t-test, confidence interval for mean of normal population
2.10 ANOVA

3 Data Understanding and Preprocessing (10 hours)

3.1 Types of data: Structured, unstructured, semi-structured
3.2 Data preprocessing requirements
3.3 Data sources and collection methods
3.4 Data cleaning and preparation
3.5 Data wrangling and associated tools
3.6 Data enrichment, validation and publishing
3.7 Data transformation and normalization
3.8 Dimensionality reduction linear factor model, principal component analysis
(PCA)

4 Data Analysis (8 hours)

4.1 Data analytics: Descriptive, diagnostic, predictive and prescriptive analytics
4.2 Exploratory data analysis using descriptive statistics
4.3 Data visualization
4.4 Data visualization techniques
4.5 Principles of effective data visualization
4.6 Feature engineering and other aspects of data manipulation

5 Regression and Predictive Modeling (5 hours)

5.1 Empirical models, simple linear regression, MLE and least square estimator
5.2 Multiple linear regression, matrix approach to multiple linear regression,
polynomial regression models, categorical regressors, indicator variables,
selection of variables and model building
5.3 Logistic regression

6 Modeling and Validation Processes (6 hours)

6.1 Introduction to machine learning
6.2 Introduction to supervised, unsupervised and reinforcement learning
6.3 Modeling process, training /validating model, cross validation methods,
predicting new observations interpretation
6.4 Measures for model performance and evaluation: Classification accuracy,
confusion matrix, sensitivity, specificity, precision, recall, F-score, ROC
curve, clustering performance measures, other measures

7 Ethics and Recent Trends (3 hours)

7.1 Ethical considerations in data science
7.2 Data privacy regulations
7.3 Responsible data usage
7.4 The five Cs
7.5 Future trends

Tutorial (15 hours)

1. Solution of data problems using linear algebra, vectors and matrices
2. Solution of the problems related probability and statistics to understand
application in data science
3. Identification of the data types and performing data cleaning,
transformation, wrangling, and dimensionality reduction Including EDA and
feature engineering
4. Solution of the problem related to linear and logistic regression
5. Understanding machine learning basics by model training, cross-validation,
and performance evaluation

Practical (45 hours)

1. Get acquainted with data science tools and perform statistical analysis
2. Hypothesis tests (e.g., t-tests, Z-tests) on sample datasets to compare
population means
3. Simulate and apply the central limit theorem (CLT) to demonstrate how
sample distributions converge to a normal distribution
4. Perform data wrangling and ETL processes on a dataset, followed by
exploratory data analysis (EDA)
5. Utilize tools to create effective data visualizations (e.g., line charts, bar
charts, heat maps, box plots) to derive key insights from the dataset
6. Implement feature extraction and selection techniques, including
experimenting with encoding methods like one-hot encoding and creating
new features based on domain expertise
7. Develop a simple linear regression model, extend it to multiple linear
regression with several variables, and visualize both the regression line and
residual plots
8. Apply logistic regression and evaluate the model using metrics such as
accuracy, precision, recall, and the ROC curve
9. Apply K-means clustering and assess cluster quality using evaluation
metrics like the silhouette score

By the end of the practical, students are required to submit a project where they
develop a prototype to solve a real-world problem.

Final Exam
The questions will cover all the chapters in the syllabus. The evaluation scheme will be
as indicated in the table below:
Chapter Hours Marks distribution*
1 3 6
2 10 12
3 10 12
4 8 9
5 5 6
6 6 9
7 3 6
Total 45 60
* There may be minor deviation in marks distribution.
References
1. Ozdemir, S. (2016). Principles of Data Science. Germany: Packt Publishing.
2. Maheshwari A. (2018). Data Science for Dummies, Wiley.
3. Grus, J. (2019). Data Science from Scratch: First Principles with
Python. United States: O'Reilly Media.
4. Bruce, P., Bruce, A. (2017). Practical Statistics for Data Scientists: 50
Essential Concepts. United States: O'Reilly Media.
5. VanderPlas, J. (2016). Python Data Science Handbook: Essential Tools for
Working with Data. United States: O'Reilly Media.
6. Provost, F., Fawcett, T. (2013). Data Science for Business: What You Need
to Know about Data Mining and Data-Analytic Thinking. United
States: O'Reilly Media.

Ocs353dsf Unit Wise Notes
100% (2)
Ocs353dsf Unit Wise Notes
121 pages
Final Data Science Course (Practicals)
No ratings yet
Final Data Science Course (Practicals)
5 pages
Sem 6
No ratings yet
Sem 6
12 pages
U23AD492 - Data Science Syllabus
No ratings yet
U23AD492 - Data Science Syllabus
4 pages
DES-IBM Certificate in Data Science
No ratings yet
DES-IBM Certificate in Data Science
3 pages
ADS Syllabus
No ratings yet
ADS Syllabus
5 pages
Introduction To Data Science: Cpts 483-06 - Syllabus
No ratings yet
Introduction To Data Science: Cpts 483-06 - Syllabus
5 pages
Intro To Data-Science Final
No ratings yet
Intro To Data-Science Final
3 pages
Data Science Course in Hyderabad - Innomatics
No ratings yet
Data Science Course in Hyderabad - Innomatics
10 pages
Prime Classes Brochure
No ratings yet
Prime Classes Brochure
14 pages
Data Science Syl Lab Us
No ratings yet
Data Science Syl Lab Us
4 pages
CS5103 Lecture Plan - Fundamnetals of Data Science
No ratings yet
CS5103 Lecture Plan - Fundamnetals of Data Science
2 pages
Course Outline PDF
No ratings yet
Course Outline PDF
2 pages
Introduction To Data Science Course Outline
No ratings yet
Introduction To Data Science Course Outline
5 pages
325E6B
No ratings yet
325E6B
1 page
Data Science With Python-Sasmita PDF
67% (3)
Data Science With Python-Sasmita PDF
9 pages
1152CS239-Intro. To Data Science-Syllabus
No ratings yet
1152CS239-Intro. To Data Science-Syllabus
6 pages
Ya5uE5 Syllabus Instructors
No ratings yet
Ya5uE5 Syllabus Instructors
2 pages
Data Science Course Content Chapter 1: Introduction To Data Science
No ratings yet
Data Science Course Content Chapter 1: Introduction To Data Science
8 pages
Data Science Master
No ratings yet
Data Science Master
11 pages
Module 1 - Introduction To Data Science
No ratings yet
Module 1 - Introduction To Data Science
3 pages
Intro To Data Science Study Guide
No ratings yet
Intro To Data Science Study Guide
2 pages
Fundamental of Data Science
No ratings yet
Fundamental of Data Science
20 pages
Course Plan - FDS Theory
No ratings yet
Course Plan - FDS Theory
7 pages
5 Weeks Data Science Boot Camp Learning Structure
No ratings yet
5 Weeks Data Science Boot Camp Learning Structure
2 pages
Data Science Diary
No ratings yet
Data Science Diary
10 pages
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
No ratings yet
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
16 pages
Artificial Intelligence
No ratings yet
Artificial Intelligence
10 pages
Internship
No ratings yet
Internship
28 pages
DSP U1
No ratings yet
DSP U1
89 pages
Data Science 1
100% (4)
Data Science 1
133 pages
Data Science CS481 - Course Outline Spring 2020
No ratings yet
Data Science CS481 - Course Outline Spring 2020
3 pages
Foundation of Data Science Syllabus
No ratings yet
Foundation of Data Science Syllabus
4 pages
20ad41e2 - Data Science
No ratings yet
20ad41e2 - Data Science
2 pages
Data Scientist Roadmap 2025-26
No ratings yet
Data Scientist Roadmap 2025-26
32 pages
Full Detailed I Need
No ratings yet
Full Detailed I Need
7 pages
Edit Ds
No ratings yet
Edit Ds
37 pages
AI & ML Syllabus
No ratings yet
AI & ML Syllabus
10 pages
Data Science and Machine Learning Syllabus V1.0
No ratings yet
Data Science and Machine Learning Syllabus V1.0
6 pages
Data Science Syllabus
No ratings yet
Data Science Syllabus
3 pages
IC Outlines For Data Science Machine Learning
No ratings yet
IC Outlines For Data Science Machine Learning
19 pages
Data Science Complete Course
No ratings yet
Data Science Complete Course
5 pages
Data Science Report
No ratings yet
Data Science Report
32 pages
Data Science Syllabus: Foundations 40 - 100
No ratings yet
Data Science Syllabus: Foundations 40 - 100
4 pages
Syllabus PDF
No ratings yet
Syllabus PDF
4 pages
19CS003 Handout
No ratings yet
19CS003 Handout
5 pages
Self Learning Material - Introduction To Data Science
No ratings yet
Self Learning Material - Introduction To Data Science
10 pages
Data Scientist Analyitcs Syllabus - Tech Transition
No ratings yet
Data Scientist Analyitcs Syllabus - Tech Transition
7 pages
Master in Data Science-Syllabus
No ratings yet
Master in Data Science-Syllabus
15 pages
Data Science Assignment
No ratings yet
Data Science Assignment
9 pages
Applied Data Science
100% (1)
Applied Data Science
279 pages
Birla Institute of Technology & Science, Pilani: Work Integrated Learning Programmes Part A: Content Design
No ratings yet
Birla Institute of Technology & Science, Pilani: Work Integrated Learning Programmes Part A: Content Design
6 pages
Internship Report: T.J.Instituteoftechnology
No ratings yet
Internship Report: T.J.Instituteoftechnology
29 pages
CourseOutline FDS
No ratings yet
CourseOutline FDS
2 pages
DSP U2
No ratings yet
DSP U2
172 pages
Data Science Course Brochure
No ratings yet
Data Science Course Brochure
6 pages
Mastering Data Science: From Basics to Expert Proficiency
From Everand
Mastering Data Science: From Basics to Expert Proficiency
William Smith
No ratings yet
Mastering Data Science: A Comprehensive Guide to Techniques and Applications
From Everand
Mastering Data Science: A Comprehensive Guide to Techniques and Applications
Adam Jones
No ratings yet
Introduction to Machine Learning and Neural Classification
From Everand
Introduction to Machine Learning and Neural Classification
Trilokesh Khatri
No ratings yet
Técnicas Estadísticas para la Ciencia de Datos a través de R. Aprendizaje Supervisado: Análisis Discriminante, Árboles de Decisión, Redes Neuronales y Modelos Lineales Generalizados
From Everand
Técnicas Estadísticas para la Ciencia de Datos a través de R. Aprendizaje Supervisado: Análisis Discriminante, Árboles de Decisión, Redes Neuronales y Modelos Lineales Generalizados
César Pérez López
No ratings yet
Predictive Breast Cancer Statistical Modelling For Early Diagnosis
No ratings yet
Predictive Breast Cancer Statistical Modelling For Early Diagnosis
14 pages
Customer Churn Prediction For A Retail
No ratings yet
Customer Churn Prediction For A Retail
8 pages
Daf Brochure 181220242312
No ratings yet
Daf Brochure 181220242312
23 pages
B.Tech CSE 2024 2025
No ratings yet
B.Tech CSE 2024 2025
213 pages
Class PPT - Unit2
No ratings yet
Class PPT - Unit2
139 pages
Tasks of A Business Analyst
No ratings yet
Tasks of A Business Analyst
42 pages
Final010524 (2019R)
No ratings yet
Final010524 (2019R)
24 pages
Shreyas Report
No ratings yet
Shreyas Report
11 pages
Naan Muthalvan Project Report Stock Market Forecast 4310
No ratings yet
Naan Muthalvan Project Report Stock Market Forecast 4310
29 pages
Intro
No ratings yet
Intro
26 pages
EDA and Cleaning
No ratings yet
EDA and Cleaning
24 pages
Statistics For Management
No ratings yet
Statistics For Management
20 pages
Forecasting Stability Categories Using Neural Networks
No ratings yet
Forecasting Stability Categories Using Neural Networks
5 pages
(Ebooks PDF) Download Statistics Slam Dunk (MEAP V11) Gary Sutton Full Chapters
100% (2)
(Ebooks PDF) Download Statistics Slam Dunk (MEAP V11) Gary Sutton Full Chapters
65 pages
Rainfall Prediction Using Machine Learnin1
No ratings yet
Rainfall Prediction Using Machine Learnin1
11 pages
Essential Python
No ratings yet
Essential Python
16 pages
Music Recommendation System
No ratings yet
Music Recommendation System
24 pages
Data Analysis
No ratings yet
Data Analysis
17 pages
Computational Thinking Theory Answers
No ratings yet
Computational Thinking Theory Answers
2 pages
10 Machine Learning
No ratings yet
10 Machine Learning
9 pages
Unit 3
No ratings yet
Unit 3
31 pages
Notes Data Visualization Unit 5
No ratings yet
Notes Data Visualization Unit 5
15 pages
Data Visulization and Power Bi Lab Manual
No ratings yet
Data Visulization and Power Bi Lab Manual
42 pages
Dashboards and Storytelling With Data
No ratings yet
Dashboards and Storytelling With Data
2 pages
Engineering Statistics Handbook 2003
No ratings yet
Engineering Statistics Handbook 2003
1,522 pages
Data Analyst Roadmap 2024
No ratings yet
Data Analyst Roadmap 2024
1 page
AIML Dom 25 Nov 2024
No ratings yet
AIML Dom 25 Nov 2024
22 pages
Advanced Certificate Programme DS
No ratings yet
Advanced Certificate Programme DS
34 pages
Data Science Zom A To Project
No ratings yet
Data Science Zom A To Project
47 pages
Introduction To Visual Representation
No ratings yet
Introduction To Visual Representation
4 pages

Syllabus FDS

Uploaded by

Syllabus FDS

Uploaded by

FOUNDATION OF DATA SCIENCE

1 Introduction to Data Science (3 hours)

2 Mathematics for Data Science (10 hours)

3 Data Understanding and Preprocessing (10 hours)

4 Data Analysis (8 hours)

5 Regression and Predictive Modeling (5 hours)

6 Modeling and Validation Processes (6 hours)

7 Ethics and Recent Trends (3 hours)

Tutorial (15 hours)

Practical (45 hours)

You might also like