Data Science

Data Science involves analyzing data through techniques like statistics and machine learning to derive insights. It encompasses various applications, stages of AI projects, and data types, including structured and unstructured data. Key concepts include data collection, preprocessing, visualization, and algorithms like K-Nearest Neighbors (KNN), which classify data based on proximity.

Uploaded by

srishithsrinand

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views

Data Science

Uploaded by

srishithsrinand

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

1.What is Data Science?

Data Science is the study of data using techniques like analysis,
statistics, and machine learning to extract insights and make
decisions.
2.Relation between Data Science and Machine Learning:
Machine Learning is a subset of Data Science that uses
algorithms to make predictions and automate tasks based on
data.
3.Applications of Data Science:
● Fraud detection
● Healthcare predictions
● Recommendation systems (e.g., Netflix)
● Marketing analytics
4.Stages of AI Project Cycle:
● Problem identification
● Data collection
● Data preparation
● Model building
● Evaluation
● Deployment
5.4Ws Canvas for Scoping a Problem:
● What: Define the problem.
● Why: Understand the need.
● Where: Identify the context.
● Who: Determine stakeholders.
6.Steps in Data Collection:

Define objectives.

Identify data sources.

Collect data (manual/automated).

Validate and clean the data.

7.Difference Between Numerical and Categorical Data:

Numerical data contains numbers (e.g., age), while categorical
data includes labels (e.g., colors).

8.Define Data Visualization:

Data visualization uses charts and graphs to represent data for
better understanding and analysis.

9.Compare Structured, Semi-structured, and Unstructured Data:

● Structured: Organized in tables (e.g., databases).

● Semi-structured: Partially organized (e.g., XML).
● Unstructured: No organization (e.g., videos).
10. Steps in Data Preprocessing:
● Data cleaning
● Transformation
● Integration
● Reduction
11. Role of Libraries in Data Science:
Libraries like NumPy, Pandas, Matplotlib, and Seaborn simplify
data analysis, visualization, and manipulation in Python.
12. Statistical Learning in Data Science:
Statistical learning involves algorithms that use statistical models
to analyze and predict data patterns.
13. Difference Between Supervised and Unsupervised Learning:
Supervised learning uses labeled data, while unsupervised
learning analyzes unlabeled data to find patterns.
14. Define K-Nearest Neighbors (KNN):
KNN is a machine learning algorithm that classifies data points
based on their nearest neighbors.
15. Impact of K Value in KNN:
The value of K affects classification accuracy. A small K may
cause overfitting, while a large K generalizes better.
16. Advantages/Disadvantages of KNN:
Advantages: Simple, intuitive.
Disadvantages: Slow with large data, sensitive to irrelevant
features.
17. Role of Statistical Measures:
Mean, median, mode, and standard deviation summarize and
describe data distribution and variability.
18. Importance of Data Visualization:
Visualization helps identify patterns, detect outliers, and
communicate insights effectively.
19. Explain Box Plot:
A box plot visualizes data spread, outliers, and central
tendencies using quartiles and whiskers.

Montessori Materials PDF
100% (4)
Montessori Materials PDF
7 pages
TYCS Data Science Questions Bank
No ratings yet
TYCS Data Science Questions Bank
3 pages
Year 5 Mid Term English Paper 2023
No ratings yet
Year 5 Mid Term English Paper 2023
5 pages
Data-Science-and-Analytics-Reviewer
No ratings yet
Data-Science-and-Analytics-Reviewer
5 pages
data science notes 1
No ratings yet
data science notes 1
3 pages
DS_UNIT I
No ratings yet
DS_UNIT I
3 pages
Introduction to Data Science Important Questions
No ratings yet
Introduction to Data Science Important Questions
3 pages
Notes On Data Science
No ratings yet
Notes On Data Science
3 pages
DS
No ratings yet
DS
7 pages
Fd45092a Ccad 459e Bc18 b01536fd6bac Untitled
No ratings yet
Fd45092a Ccad 459e Bc18 b01536fd6bac Untitled
53 pages
Short Answer
No ratings yet
Short Answer
19 pages
data science notes
No ratings yet
data science notes
3 pages
Module 1_ Introduction to Data Science
No ratings yet
Module 1_ Introduction to Data Science
3 pages
Introduction to Data Science
No ratings yet
Introduction to Data Science
3 pages
Data Science
No ratings yet
Data Science
10 pages
Data Science
No ratings yet
Data Science
44 pages
Unit-4
No ratings yet
Unit-4
6 pages
Fundamentals of Data Science
No ratings yet
Fundamentals of Data Science
2 pages
Data Science Syllabus From Beginner to Advanced
No ratings yet
Data Science Syllabus From Beginner to Advanced
7 pages
Unit 4 & 5-Data Science and Computer Vision
No ratings yet
Unit 4 & 5-Data Science and Computer Vision
18 pages
Intro To Data Science Study Guide
No ratings yet
Intro To Data Science Study Guide
2 pages
PDS Question Bank
No ratings yet
PDS Question Bank
19 pages
Data Science
No ratings yet
Data Science
2 pages
PDF Data Science
No ratings yet
PDF Data Science
7 pages
DTS 201 LECTURE NOTE
No ratings yet
DTS 201 LECTURE NOTE
24 pages
TRAINING Report
No ratings yet
TRAINING Report
32 pages
Data Science Report - Compress
No ratings yet
Data Science Report - Compress
31 pages
Ds
No ratings yet
Ds
5 pages
FDSNotes
No ratings yet
FDSNotes
12 pages
5th Sem Internship Eport
No ratings yet
5th Sem Internship Eport
83 pages
Notes Data Science
No ratings yet
Notes Data Science
5 pages
Title_ An Overview of Data Science and Its Applications
No ratings yet
Title_ An Overview of Data Science and Its Applications
3 pages
TE Sem1 UNIT 1 (Data Science and Visualization) HONOURS - TE (SEM V)
No ratings yet
TE Sem1 UNIT 1 (Data Science and Visualization) HONOURS - TE (SEM V)
28 pages
Unit I
No ratings yet
Unit I
52 pages
Data Science Report
No ratings yet
Data Science Report
32 pages
Data Science PDF
No ratings yet
Data Science PDF
11 pages
Data Science QB Solve SEM6
No ratings yet
Data Science QB Solve SEM6
157 pages
data science
No ratings yet
data science
2 pages
FDS UNIT 1 QB
No ratings yet
FDS UNIT 1 QB
7 pages
Impact of Data Science Across Industries
No ratings yet
Impact of Data Science Across Industries
3 pages
Big_Data_Questions_Answers
No ratings yet
Big_Data_Questions_Answers
2 pages
Data-Science-Report - Priyesh
No ratings yet
Data-Science-Report - Priyesh
32 pages
Unit 1
No ratings yet
Unit 1
21 pages
Datascience Slide preparation notes
No ratings yet
Datascience Slide preparation notes
3 pages
Data Science Is A Multidisciplinary Field That Uses Scientific Methods
No ratings yet
Data Science Is A Multidisciplinary Field That Uses Scientific Methods
2 pages
introduction to data science
No ratings yet
introduction to data science
8 pages
File of ML
No ratings yet
File of ML
42 pages
Combinepdf
No ratings yet
Combinepdf
15 pages
Data Science Report
No ratings yet
Data Science Report
32 pages
Internship Report: T.J.Instituteoftechnology
No ratings yet
Internship Report: T.J.Instituteoftechnology
29 pages
Mastering Data Science
No ratings yet
Mastering Data Science
10 pages
EDS Unit 1?
No ratings yet
EDS Unit 1?
15 pages
MLM FDS
No ratings yet
MLM FDS
19 pages
hammad raza.
No ratings yet
hammad raza.
28 pages
data-science-report
No ratings yet
data-science-report
32 pages
Self Learning Material - Introduction To Data Science
No ratings yet
Self Learning Material - Introduction To Data Science
10 pages
Data Science Unit-1 Notes
No ratings yet
Data Science Unit-1 Notes
19 pages
Title: Data Science: Foundations, Techniques, and Applications
No ratings yet
Title: Data Science: Foundations, Techniques, and Applications
5 pages
Chapter 6_Data science and k nearest neighbour model (PART B)
No ratings yet
Chapter 6_Data science and k nearest neighbour model (PART B)
5 pages
datascience
No ratings yet
datascience
12 pages
"Big Data Science" Basic Concepts and Applications
From Everand
"Big Data Science" Basic Concepts and Applications
Sukanta Bhattacharya
No ratings yet
Exploring the World of Data Science and Machine Learning
From Everand
Exploring the World of Data Science and Machine Learning
NIBEDITA Sahu
No ratings yet
Guadalupe Esparza Resume
No ratings yet
Guadalupe Esparza Resume
1 page
Syntax
No ratings yet
Syntax
26 pages
(English (Auto-Generated) ) The Myth of The Native Speaker (With David Crystal) (DownSub - Com)
100% (1)
(English (Auto-Generated) ) The Myth of The Native Speaker (With David Crystal) (DownSub - Com)
17 pages
7 Resume
No ratings yet
7 Resume
8 pages
Individual Performance Commitment and Review (Ipcr) Form
No ratings yet
Individual Performance Commitment and Review (Ipcr) Form
1 page
Lecture 3.1.4
No ratings yet
Lecture 3.1.4
26 pages
Lean Six Sigma Yellow Belt Sample Questions
No ratings yet
Lean Six Sigma Yellow Belt Sample Questions
3 pages
Lotte Application Form 2016
No ratings yet
Lotte Application Form 2016
10 pages
Wine Tourism Destination Management and Marketing: Theory and Cases Marianna Sigala download
100% (5)
Wine Tourism Destination Management and Marketing: Theory and Cases Marianna Sigala download
63 pages
Pratiti Technologies Company Overview Document
No ratings yet
Pratiti Technologies Company Overview Document
9 pages
Python Course DQLab
No ratings yet
Python Course DQLab
18 pages
Notes of Personality Development (Unit 1 & 2)
No ratings yet
Notes of Personality Development (Unit 1 & 2)
12 pages
Provincial/Division Athletic Meet 2019 List of Qualified Athletes, Coaches and Chaperons Legislative District 1
No ratings yet
Provincial/Division Athletic Meet 2019 List of Qualified Athletes, Coaches and Chaperons Legislative District 1
12 pages
Yatch Guidance
No ratings yet
Yatch Guidance
39 pages
WEB BASED RESULT PUBLICATION SYSTEM FOR EDUCATIgffON BOARDS
0% (1)
WEB BASED RESULT PUBLICATION SYSTEM FOR EDUCATIgffON BOARDS
2 pages
Textbook of Critical Care Sixth Edition Expert Consult Premium Edition Jean-Louis Vincent All Chapters Instant Download
No ratings yet
Textbook of Critical Care Sixth Edition Expert Consult Premium Edition Jean-Louis Vincent All Chapters Instant Download
49 pages
RRS RRL Finalll
No ratings yet
RRS RRL Finalll
5 pages
Ublatt12 en
No ratings yet
Ublatt12 en
2 pages
Mathematics 9740/01 Higher 2 Paper 1: Meridian Junior College
No ratings yet
Mathematics 9740/01 Higher 2 Paper 1: Meridian Junior College
6 pages
10 Qualities of A Good Teacher
No ratings yet
10 Qualities of A Good Teacher
6 pages
CAPR-III_04123 (1)
No ratings yet
CAPR-III_04123 (1)
120 pages
Marxian Class Approach To Political Sociology
No ratings yet
Marxian Class Approach To Political Sociology
1 page
Contoh Application Letter
No ratings yet
Contoh Application Letter
6 pages
Annotation Cot 1 2docx
100% (3)
Annotation Cot 1 2docx
8 pages
Definition of Secondary Education
No ratings yet
Definition of Secondary Education
2 pages
Dental Health Program - Department of Health Website PDF
No ratings yet
Dental Health Program - Department of Health Website PDF
10 pages
Ccna Lab Manual Version 5.0
No ratings yet
Ccna Lab Manual Version 5.0
720 pages
Growing Veg Soup SEq
No ratings yet
Growing Veg Soup SEq
9 pages

Data Science

Uploaded by

Data Science

Uploaded by

1.​What is Data Science?

Identify data sources.

Collect data (manual/automated).

7.Difference Between Numerical and Categorical Data:​

8.Define Data Visualization:​

9.Compare Structured, Semi-structured, and Unstructured Data:

●​ Structured: Organized in tables (e.g., databases).

You might also like

1.What is Data Science?

7.Difference Between Numerical and Categorical Data:

8.Define Data Visualization:

● Structured: Organized in tables (e.g., databases).