0% found this document useful (0 votes)

3 views31 pages

L1 FA23 BST AB Spring 2025

The document outlines the fundamentals of data science, covering key terminologies such as data types, data collection methods, and the concept of synthetic data. It introduces artificial intelligence (AI), its definitions, types, and the distinction between artificial and human intelligence. Additionally, it discusses the DIKW framework and suggests future class initiatives and topics for further exploration in data science.

Uploaded by

umarfiaz1199

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views31 pages

L1 FA23 BST AB Spring 2025

Uploaded by

umarfiaz1199

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 31

DATA SCIENCE

FUNDAMENTALS

FA23-BST-
SPRING2025
Lecture 1
Dr. Asma Arshad
Associate Prof. PHED
TODAY’S AGENDA

Introduction – Basic Terminologies

 Data Collection Ways
• Generated
• Collected
• Retrieved
 Synthetic Data
 Artificial Intelligence
• Why artificial?
 DIKW
BASIC TERMINOLOGIES

DATA

TYPES

NUMERICA
HYBRID Non-Numerical
L
BASIC
TERMINOLOGIES
FOR DATA SCIENCE
NAVIGATING THE FUTURE AI & ML
DATA CAN BE

Generated Simulation

Collected Primary Secondary

Data Algorithm Similarity

Retrieved structures s Measures
1. GENERATED DATA

Generated data is artificially created rather than collected from real-world

sources. It is often used in simulations, testing, or predictive modeling.

🔹 How it's generated: Through simulations, synthetic data generation, or

computational models.

🔹 Examples:
 Monte Carlo Simulation: Used in risk analysis and financial forecasting.

 Synthetic Data in Machine Learning: AI-generated images (e.g., using GANs),

synthetic customer transactions for fraud detection.
 Game Development: Simulated player behavior for AI testing.

 Physics & Weather Forecasting: Climate models simulate future temperature

trends.
2. COLLECTED DATA

Collected data comes from real-world observations, experiments, or existing

databases. It is divided into Primary and Secondary data.

🔸 Primary Data (Collected firsthand)

 Data that is collected directly for a specific research purpose.
 Examples:

o Surveys: A company conducts a survey to understand customer satisfaction.

o Experiments: A scientist records lab results from a chemical reaction.

o Sensor Data: IoT devices collecting temperature data.

o Field Research: Biologists tracking animal migration patterns.

2. COLLECTED DATA

🔸 Secondary Data (Collected from existing sources)

 Data that has already been collected by someone else and is reused.
 Examples:
o Census Data: Governments use past census data for policy planning.

o Stock Market Data: Investors analyze past market trends from financial
reports.
o Medical Records: A researcher uses past patient records for disease
prediction.

Wikipedia & Public Datasets: AI models trained on pre-existing datasets.

o.
3. RETRIEVED DATA

Retrieved data involves extracting useful information using data structures, algorithms, and
similarity measures. This category is essential for fields like big data, information retrieval,
and AI applications.

🔸 Data Structures

 How data is stored efficiently for quick retrieval.

 Examples:

o Databases (SQL, NoSQL): Storing customer records in MySQL.

o Hash Tables: Fast lookup for a dictionary app.

o Graphs: Social networks (Facebook friend connections).

o Trees: Search engines use tree structures for indexing web pages.
3. RETRIEVED DATA

🔸 Algorithms
 How data is retrieved, sorted, and analyzed.
 Examples:

o Search Algorithms: Google uses PageRank to find relevant web pages.

o Sorting Algorithms: E-commerce sites sort products by price.

o Machine Learning Models: Netflix recommends shows based on user data.

o Pattern Recognition: AI detects spam emails based on past spam patterns.

3. RETRIEVED DATA

🔸 Similarity Measures
 How we compare and retrieve similar data points.
 Examples:

o Euclidean Distance: Measuring similarity in face recognition systems.

o Cosine Similarity: Finding similar documents in text analysis.

o Jaccard Similarity: Detecting plagiarism between two texts.

KNN (k-Nearest Neighbors): Classifying email as spam or not based on past

messages.
SYNTHETIC DATA

In Data Science & AI (Synthetic Data)

o Artificially generated data that mimics real-
world data but does not come from actual
observations.
o Used when real data is unavailable, expensive, or
sensitive (e.g., medical data).
o Example: AI-generated customer transactions to
train fraud detection models.
Category Definition Examples

Monte Carlo simulations, AI-

Simulated or artificially created
Generated generated images, climate
data
models

Surveys, experiments, IoT

Collected (Primary) Data collected firsthand
sensor data

Pre-existing data used for Census data, stock market

Collected (Secondary)
analysis history, public datasets

Retrieved (Data Databases, graphs, trees, hash

Organizing data efficiently
Structures) tables

Search engines, ML
Retrieved (Algorithms) Extracting and processing data
recommendations, sorting

Retrieved (Similarity Comparing and finding related Face recognition, plagiarism

Measures) data detection, KNN classification
AI

• What is AI (Artificial Intelligence)?

Artificial Intelligence (AI) refers to the simulation of human

intelligence in machines that can perform tasks typically requiring
human thinking, such as learning, reasoning, problem-solving,
perception, and decision-making.

AI enables machines to:

✅ Learn from data (Machine Learning)
✅ Recognize patterns (Face recognition, speech processing)
✅ Make decisions (Self-driving cars, chatbots)
✅ Understand language (ChatGPT, Google Assistant)
WHY IS IT CALLED "ARTIFICIAL"?

• The term "artificial" means man-made, not natural.

• We call it Artificial Intelligence because:

• 🔹 It is not real human intelligence but simulated using

algorithms and computers.

• 🔹 Machines do not think like humans but process

information based on predefined rules and learning models.

• 💡 Example:

• A human can learn from experience and make decisions naturally.

• AI can learn from data and make predictions but only within the
limits of the algorithms.
TYPES OF AI

1 Narrow AI (Weak AI) – Designed for specific tasks

1️⃣

🔸 Example: Google Search, Siri, Spam filters

2️⃣General AI (Strong AI) – Hypothetical AI that can think like humans

🔸 Example: AI that understands emotions, reasons, and makes

decisions like a person (not yet achieved).

3️⃣Super AI – AI that surpasses human intelligence (theoretical)

🔸 Example: AI that can innovate and improve itself without human

help.
BASIC TERMS FOR AI

Term Meaning

Machines that simulate human

AI
intelligence
Man-made, not naturally
Artificial
occurring
AI for specific tasks (e.g., Google
Narrow AI
Search, chatbots)
AI with human-like intelligence
General AI
(not yet achieved)
AI surpassing human intelligence
Super AI
(theoretical)
DIKW
EXPANSIO
N
UNLOCKING NEW HORIZONS
DIKW
Data Processe
d
Information Validatio
n

Knowledge Thinking

Wisdom
DIKW
INNOVATIVE
SOLUTIONS
From the MovieLens dataset documentation, this file has 5
columns:
Column
Description
Name
user_id Unique identifier for each user
age Age of the user
Gender (M = Male, F =
gender
Female)
occupation User's occupation
zip_code User's zip code
What we want?

📊 Suggested Data Analysis

Now that we understand the dataset, let's perform some
key analyses.

Basic Summary Statistics

🔹 Insights:
 The average user age, min/max age, gender distribution, and
most common occupations.
What we want?

💡 Conclusion
By performing these analyses, you can get
demographic insights into the MovieLens
dataset.
Would you like more advanced analysis, such as
correlating age with occupation trends? 🚀
NEXT LECTURE INITIATIVES

1. Bring laptops… to get with the

python
2. Technology integration. To exploare
the sharing of files via whatsapp.
3. Collaborative woking. Fost learning
to proceed with real datasets..
NEXT CLASS AGENDA

Introduction – Basic Terminologies

 What is Data Science?
• Big Data and Data Science Hype
• Getting Past the Hype
 Why Now?

 Datafication

 Data Science Jobs

 What is a Data scientist?

• In academia

• In industry
THANK YOU
ANY QUESTIONS?

[email protected]

Christ Lecture 9 AI Intro, Evolution, & Terminology
No ratings yet
Christ Lecture 9 AI Intro, Evolution, & Terminology
62 pages
Lec 3
No ratings yet
Lec 3
39 pages
Ai Life Cycle
No ratings yet
Ai Life Cycle
30 pages
AI and ML
No ratings yet
AI and ML
68 pages
Class Ix AI Assignment
No ratings yet
Class Ix AI Assignment
12 pages
Final
No ratings yet
Final
24 pages
Chapter 2, 3, 4&5
No ratings yet
Chapter 2, 3, 4&5
121 pages
Class x Data Science
No ratings yet
Class x Data Science
29 pages
Data Science PPT-2
No ratings yet
Data Science PPT-2
34 pages
Q ClassX AI Ch2 Public
No ratings yet
Q ClassX AI Ch2 Public
10 pages
Data Science ML
No ratings yet
Data Science ML
63 pages
Chapter 4 - Data Curation
No ratings yet
Chapter 4 - Data Curation
34 pages
1-Pre Requisite For Data Scientist-03!01!2025
No ratings yet
1-Pre Requisite For Data Scientist-03!01!2025
26 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
6 pages
Unit 1
No ratings yet
Unit 1
26 pages
Module 1
No ratings yet
Module 1
192 pages
Xi Ai - Unit 1 Notes & Exercise
No ratings yet
Xi Ai - Unit 1 Notes & Exercise
18 pages
ClassXAICh09082024103659 0
No ratings yet
ClassXAICh09082024103659 0
14 pages
AI Part B Question Bank 2
No ratings yet
AI Part B Question Bank 2
10 pages
DA106 Week1 Material
No ratings yet
DA106 Week1 Material
10 pages
@ai Full Book Notes
No ratings yet
@ai Full Book Notes
5 pages
DS Notes
No ratings yet
DS Notes
31 pages
Lecture 01 05.08.2024 AI-ML Introduction
No ratings yet
Lecture 01 05.08.2024 AI-ML Introduction
46 pages
Aids
No ratings yet
Aids
20 pages
BCA Lecture I
No ratings yet
BCA Lecture I
20 pages
AI and ML
No ratings yet
AI and ML
16 pages
Unit 1 2 Notes
No ratings yet
Unit 1 2 Notes
9 pages
Introduction To Artificial Intelligence and Data Science
No ratings yet
Introduction To Artificial Intelligence and Data Science
23 pages
Introduction To Data Analytics
No ratings yet
Introduction To Data Analytics
74 pages
AI Intro Session
No ratings yet
AI Intro Session
21 pages
Artificial Intelligence
No ratings yet
Artificial Intelligence
5 pages
Ai for Chemical Div 1 Lecture 2.Docx
No ratings yet
Ai for Chemical Div 1 Lecture 2.Docx
16 pages
Domains of AI
No ratings yet
Domains of AI
11 pages
1 - Data Mining and Analysis
No ratings yet
1 - Data Mining and Analysis
34 pages
AI - Book - 9 Handout For Website Upload
No ratings yet
AI - Book - 9 Handout For Website Upload
216 pages
Ai Notes
No ratings yet
Ai Notes
7 pages
Ai Project Cycle
No ratings yet
Ai Project Cycle
30 pages
Data Science Using ML and AI at Learn N Build Yashvardhan 19evj
No ratings yet
Data Science Using ML and AI at Learn N Build Yashvardhan 19evj
22 pages
Artificial Intelligence Some Information
No ratings yet
Artificial Intelligence Some Information
3 pages
L-1 Revisiting AI Project Cycle
No ratings yet
L-1 Revisiting AI Project Cycle
49 pages
Ai Notes Neural - Data Lit
No ratings yet
Ai Notes Neural - Data Lit
13 pages
AI Class PDF
No ratings yet
AI Class PDF
542 pages
Term 2 Ai Notes
No ratings yet
Term 2 Ai Notes
14 pages
Important Ai Questions With Answer For Exam
No ratings yet
Important Ai Questions With Answer For Exam
6 pages
Part B Unit 2 Running Notes and Textbook Questions
No ratings yet
Part B Unit 2 Running Notes and Textbook Questions
27 pages
Data Acquisition
No ratings yet
Data Acquisition
19 pages
Amity International School: Artificial Intelligence (417) Class XI (Session-2022)
No ratings yet
Amity International School: Artificial Intelligence (417) Class XI (Session-2022)
6 pages
Made Syllabus
No ratings yet
Made Syllabus
5 pages
01 AI Trends Report 2023
No ratings yet
01 AI Trends Report 2023
15 pages
Introduction Am
No ratings yet
Introduction Am
74 pages
843 AI Student HandbookXI - PDF 20240803 173743 0000
No ratings yet
843 AI Student HandbookXI - PDF 20240803 173743 0000
16 pages
Intro To AI - Course Notes
No ratings yet
Intro To AI - Course Notes
27 pages
Chapter 2 Data Science
No ratings yet
Chapter 2 Data Science
32 pages
Introduction To Emerging Technologies
No ratings yet
Introduction To Emerging Technologies
43 pages
Data Science Note
No ratings yet
Data Science Note
91 pages
Data Science
No ratings yet
Data Science
244 pages
Introduction To Artificial Intelligence
No ratings yet
Introduction To Artificial Intelligence
6 pages
Lecture 4 - Machine Learning Pipeline
No ratings yet
Lecture 4 - Machine Learning Pipeline
38 pages
Local Literature
No ratings yet
Local Literature
5 pages
Stralis Trakker Euro Vi
No ratings yet
Stralis Trakker Euro Vi
23 pages
Business Computer PDF
No ratings yet
Business Computer PDF
3 pages
Learning Area Grade Level Quarter Date I. Lesson Title Ii. Most Essential Learning Competencies (Melcs) Iii. Content/Core Content
100% (2)
Learning Area Grade Level Quarter Date I. Lesson Title Ii. Most Essential Learning Competencies (Melcs) Iii. Content/Core Content
8 pages
Mech Energy Practice
No ratings yet
Mech Energy Practice
20 pages
Prashant Singh
No ratings yet
Prashant Singh
9 pages
CIE A2 Physics Paper5 Q2 Tips
No ratings yet
CIE A2 Physics Paper5 Q2 Tips
9 pages
Paint Tool Sai File Manual
No ratings yet
Paint Tool Sai File Manual
68 pages
Science Form 5 Synthetic Materials in Industry
100% (11)
Science Form 5 Synthetic Materials in Industry
10 pages
Tle Exam
75% (4)
Tle Exam
3 pages
Bernabe 09
No ratings yet
Bernabe 09
4 pages
2015 RAMS Fundamentals of Fmeas
100% (1)
2015 RAMS Fundamentals of Fmeas
35 pages
Designing and Optimization of Microbial Fuel Cell Using Bio-Waste
No ratings yet
Designing and Optimization of Microbial Fuel Cell Using Bio-Waste
5 pages
Are Maintening
No ratings yet
Are Maintening
4 pages
Recambios Esquemas Zebra ZT411 ZT421 en
No ratings yet
Recambios Esquemas Zebra ZT411 ZT421 en
11 pages
Screw Conveyor Data Sheet
100% (1)
Screw Conveyor Data Sheet
1 page
4-Farmakologi Obat Penyakit Mata
No ratings yet
4-Farmakologi Obat Penyakit Mata
30 pages
GR 4 Science 1st 4th
100% (1)
GR 4 Science 1st 4th
349 pages
Chapter Four
No ratings yet
Chapter Four
15 pages
Introduction To Drug Design
No ratings yet
Introduction To Drug Design
9 pages
Strictly Forbidden A Dark Mafia Romance Piper Stone Download
100% (1)
Strictly Forbidden A Dark Mafia Romance Piper Stone Download
26 pages
Reviewer in P.E
No ratings yet
Reviewer in P.E
2 pages
ForlPHS Serisi Yedek Par
No ratings yet
ForlPHS Serisi Yedek Par
22 pages
Unit 2
No ratings yet
Unit 2
5 pages
GDPR Consent Form, ENG
No ratings yet
GDPR Consent Form, ENG
1 page
3D GeoModelling
No ratings yet
3D GeoModelling
4 pages
Kami Export - TEST - Ecology & Biome PDF
No ratings yet
Kami Export - TEST - Ecology & Biome PDF
6 pages
T Ai Chi Classics Waysun Liao Download
No ratings yet
T Ai Chi Classics Waysun Liao Download
110 pages
Emco Concept Mill Techspec PDF
No ratings yet
Emco Concept Mill Techspec PDF
23 pages