0% found this document useful (0 votes)

7 views

Assignament

Uploaded by

Sami Ullah

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views

Assignament

Uploaded by

Sami Ullah

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Name

Noshaba Muneer

Registration No

Math 211101076(6B)

Course:

Data Science

Khawaja Fareed University of Engineering and Information Technology

What is Data Science?

 Data Science is a blend of various tools, algorithms, and machine learning principles with
the goal to discover hidden patterns from the raw data. But how is this different from
what statisticians have been doing for years?
 Data Science is primarily used to make decisions and predictions making use of
predictive causal analytics, prescriptive analytics (predictive plus decision science) and
machine learning.

What is Big Data?

Big data refers to extremely large and diverse collections of structured, unstructured, and
semistructured data that continue to grow exponentially over time. Let’s break down what this
means:

Three V’s of Big Data:

1. Volume: Big data encompasses a vast volume of information. It’s not just a few
gigabytes; we’re talking about terabytes, petabytes, or even exabytes of data.

2. Velocity: Data is generated at an incredibly high speed. Think of social media posts,
sensor data, financial transactions, and more pouring in rapidly.

3. Variety: Big data comes in various formats: text, images, videos, logs, sensor readings,
and more. It’s not neatly organized; it’s a mix of structured and unstructured data.

Sources of Big Data

 Social Media: Comments, posts, tweets, and interactions on platforms like Facebook,
Twitter, and Instagram.
 Internet of Things (IoT): Data from connected devices, sensors, wearables, and smart
appliances.
 Business Transactions: Sales records, customer orders, invoices, and financial data
 Web Logs: Information from web servers, user behavior, and website visits.
 Scientific Research: Genomic data, climate models, and simulations.
 Healthcare: Electronic health records, medical imaging, and patient data.

Challenges and Opportunities:

 Handling Complexity: Big data is messy, and separating valuable insights from noise
can be challenging
 Storage and Processing: Storing and analyzing massive datasets require specialized
infrastructure and tools.
 Data Privacy and Security: Protecting sensitive information is crucial.
 Business Insights: Big data analytics can reveal patterns, trends, and correlations that
drive business decisions.

Use Cases

 Personalization: Recommending products, movies, or music based on user preferences.

 Healthcare: Predictive analytics for disease outbreaks, personalized treatments, and drug
discovery.
 Finance: Fraud detection, risk assessment, and algorithmic trading.
 Smart Cities: Optimizing traffic flow, energy consumption, and waste management.
 Scientific Research: Climate modeling, particle physics, and genomics.

Data science vs. Data engineering:

 Data science is the computational science of extracting meaningful insights from raw data
and then effectively communicating those insights to generate value.
 Data engineering, on the other hand is an engineering domain that’s dedicated to building
and maintaining systems that overcome data processing and data handling problems for
applications that consume, process, and store large volumes, varieties, and velocities of
data.
 Data science focuses on extracting insights from data using statistical and machine
learning techniques
 While data engineering involves designing and maintaining the infrastructure to collect,
store, and process data efficiently
 Both roles are crucial for successful data-driven decision-making within an organization

Who can use data science?

 You
 Your organization
 Your employer
 Anyone who has a bit of understanding and training can begin using data insights to
improve their lives, their careers and the well-being of their businesses

Structured vs. Unstructured:

Structured data entails data that is categorized and stored in a file according to a particular
format description, where unstructured data is free-form text that takes on a number of types.

 Website links
 Emails
 Twitter responses
 Product reviews
 Pictures/images
 Written text on various platforms

Ocs353dsf Unit Wise Notes
100% (2)
Ocs353dsf Unit Wise Notes
121 pages
Lead List Tech Companies 51-100employees
No ratings yet
Lead List Tech Companies 51-100employees
12 pages
Ds Capstone Template Coursera
No ratings yet
Ds Capstone Template Coursera
47 pages
R Programming UNIT-1
No ratings yet
R Programming UNIT-1
48 pages
IDS-UNIT-1-FINAL (1)
No ratings yet
IDS-UNIT-1-FINAL (1)
30 pages
AD3491 UNIT 1 NOTES EduEngg
100% (1)
AD3491 UNIT 1 NOTES EduEngg
35 pages
Unit-1 IDS
No ratings yet
Unit-1 IDS
26 pages
Data Science Unit I
No ratings yet
Data Science Unit I
13 pages
Unit1 R Full Material
No ratings yet
Unit1 R Full Material
11 pages
Data Science Unit 1
No ratings yet
Data Science Unit 1
70 pages
Introduction To Datasciecne
No ratings yet
Introduction To Datasciecne
50 pages
20IT501_BDA_Unit1
No ratings yet
20IT501_BDA_Unit1
18 pages
Data Science Unit-I
No ratings yet
Data Science Unit-I
13 pages
Data Science - FYBCA-Sem-II
No ratings yet
Data Science - FYBCA-Sem-II
13 pages
Fds Module 1
No ratings yet
Fds Module 1
65 pages
Fods MQP Solutions - 025136
No ratings yet
Fods MQP Solutions - 025136
76 pages
mod 3
No ratings yet
mod 3
96 pages
Dsbda Unit 1
No ratings yet
Dsbda Unit 1
119 pages
Data
No ratings yet
Data
43 pages
DS-BDS (Unit 1) Technical
No ratings yet
DS-BDS (Unit 1) Technical
22 pages
Big Data in Data Science
No ratings yet
Big Data in Data Science
3 pages
unit 1 final (1)
No ratings yet
unit 1 final (1)
75 pages
Data Science and Big Data Analytics Unit 1 notes
No ratings yet
Data Science and Big Data Analytics Unit 1 notes
13 pages
Foundations of Data Science PPT TEXT BOOK
No ratings yet
Foundations of Data Science PPT TEXT BOOK
132 pages
Ds Unit 1
No ratings yet
Ds Unit 1
18 pages
AIDS C04-Session-19
No ratings yet
AIDS C04-Session-19
29 pages
IDS- UNIT-1
No ratings yet
IDS- UNIT-1
14 pages
Fundamentals of Data Science
100% (3)
Fundamentals of Data Science
62 pages
DSA QB
No ratings yet
DSA QB
25 pages
Unit 1
No ratings yet
Unit 1
76 pages
Data Science: by Neha Tyagi
100% (1)
Data Science: by Neha Tyagi
17 pages
Unit 3 Part 1
No ratings yet
Unit 3 Part 1
43 pages
Research On Data Science, Data Analytics and Big Data Rahul Reddy Nadikattu
No ratings yet
Research On Data Science, Data Analytics and Big Data Rahul Reddy Nadikattu
7 pages
EDS Unit 1?
No ratings yet
EDS Unit 1?
15 pages
IDS UNIT 1,2,3,4 & 5
No ratings yet
IDS UNIT 1,2,3,4 & 5
117 pages
Extended_Comprehensive_Guide_to_Data_Science
No ratings yet
Extended_Comprehensive_Guide_to_Data_Science
2 pages
INTRODUCTION and M1-CH-1
No ratings yet
INTRODUCTION and M1-CH-1
63 pages
e4f1fb7f-a61e-4090-9018-344695f0d7d4 (2)
No ratings yet
e4f1fb7f-a61e-4090-9018-344695f0d7d4 (2)
30 pages
Data Science PDF
No ratings yet
Data Science PDF
8 pages
DSUP Chapter 1 PDF
No ratings yet
DSUP Chapter 1 PDF
31 pages
Unit I
No ratings yet
Unit I
61 pages
DS R Unit-1
No ratings yet
DS R Unit-1
41 pages
paper
No ratings yet
paper
4 pages
Data Science
No ratings yet
Data Science
244 pages
Introduction to Data Science Lecture 1
No ratings yet
Introduction to Data Science Lecture 1
4 pages
Lecture 1 & 2
No ratings yet
Lecture 1 & 2
53 pages
Data Science
From Everand
Data Science
Chloe Martin
No ratings yet
Chapter No.4 Exercise Solution (Computer)
No ratings yet
Chapter No.4 Exercise Solution (Computer)
8 pages
Lecture 2-Quick Overview of Data Science
No ratings yet
Lecture 2-Quick Overview of Data Science
18 pages
introduction to data science
No ratings yet
introduction to data science
8 pages
Project Report
No ratings yet
Project Report
29 pages
Defining Data Science
100% (1)
Defining Data Science
167 pages
22UCS303 DS-Unit I-N
No ratings yet
22UCS303 DS-Unit I-N
42 pages
Introduction to Data Science_students
No ratings yet
Introduction to Data Science_students
237 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
37 pages
Data Science Presentation Enhanced (1)
No ratings yet
Data Science Presentation Enhanced (1)
34 pages
Big Data & Data Science - PIK - C5
No ratings yet
Big Data & Data Science - PIK - C5
10 pages
Data Science Ppt1 Update
No ratings yet
Data Science Ppt1 Update
67 pages
data science chacha
No ratings yet
data science chacha
150 pages
"Big Data Science" Basic Concepts and Applications
From Everand
"Big Data Science" Basic Concepts and Applications
Sukanta Bhattacharya
No ratings yet
Data Science Essentials: Machine Learning and Natural Language Processing
From Everand
Data Science Essentials: Machine Learning and Natural Language Processing
Angel Gabaldon
No ratings yet
From Data to Decisions: A Practical Guide to Implementing Modern Decision Intelligence
From Everand
From Data to Decisions: A Practical Guide to Implementing Modern Decision Intelligence
Raissa Gomez
No ratings yet
Azure Book 126
No ratings yet
Azure Book 126
1 page
Event Management2
No ratings yet
Event Management2
16 pages
Ebook Ebook PDF Introduction To Management Science 13Th Global Edition All Chapter PDF Docx Kindle
100% (36)
Ebook Ebook PDF Introduction To Management Science 13Th Global Edition All Chapter PDF Docx Kindle
42 pages
Subject Outline Digital Finance
No ratings yet
Subject Outline Digital Finance
9 pages
Digital Marketing Strategy Canvas
No ratings yet
Digital Marketing Strategy Canvas
2 pages
Control System in Mahindra Satyam: Focusing Failure of Satyam and Its Rebranding
No ratings yet
Control System in Mahindra Satyam: Focusing Failure of Satyam and Its Rebranding
27 pages
Customer Service Software Landscape May 2017
No ratings yet
Customer Service Software Landscape May 2017
320 pages
Business Excellence Framework
100% (1)
Business Excellence Framework
36 pages
Michael J. Carney: Marketing, Sales & Operations C-Level Executive
No ratings yet
Michael J. Carney: Marketing, Sales & Operations C-Level Executive
2 pages
2019 May IT404-A - Ktu Qbank
No ratings yet
2019 May IT404-A - Ktu Qbank
2 pages
Machine Learning The Ultimate Guide To Understand Artificial Intelligence and Big
100% (1)
Machine Learning The Ultimate Guide To Understand Artificial Intelligence and Big
162 pages
Success2-13. Which Decisions in This Story Could Be Considered Unstructured Problems?structured Problems?
No ratings yet
Success2-13. Which Decisions in This Story Could Be Considered Unstructured Problems?structured Problems?
1 page
Test Bank For Business Statistics in Practice 8th Edition by Bowerman Chapters 1 18
100% (1)
Test Bank For Business Statistics in Practice 8th Edition by Bowerman Chapters 1 18
27 pages
Guide How To Build A Culture of Growth
No ratings yet
Guide How To Build A Culture of Growth
24 pages
MLinCricket_MLA
No ratings yet
MLinCricket_MLA
26 pages
Goldman Sachs' Digital Journey-Unlocked-Selection
No ratings yet
Goldman Sachs' Digital Journey-Unlocked-Selection
8 pages
Trade Marketing and Demand Planning Alignment
No ratings yet
Trade Marketing and Demand Planning Alignment
6 pages
Gartner - GenAI Planning Workbook
100% (1)
Gartner - GenAI Planning Workbook
12 pages
AI in Logistics and Supply Chain - Case Study
No ratings yet
AI in Logistics and Supply Chain - Case Study
21 pages
Exploring Marketing Research 11th Edition by Babin Zikmund ISBN Test Bank
100% (41)
Exploring Marketing Research 11th Edition by Babin Zikmund ISBN Test Bank
12 pages
Operational Readiness Checklist For The Hybrid Cloud USLtr
No ratings yet
Operational Readiness Checklist For The Hybrid Cloud USLtr
8 pages
Hybrid IT Management Simplify Your IT Transformation 158868746422498
No ratings yet
Hybrid IT Management Simplify Your IT Transformation 158868746422498
11 pages
Jvims Mba College Internal Exam Assignment Semester II
No ratings yet
Jvims Mba College Internal Exam Assignment Semester II
3 pages
Ibm Flashsystem Telecommunications, Media & Entertainment (Tme) Sales & Marketing Kit
No ratings yet
Ibm Flashsystem Telecommunications, Media & Entertainment (Tme) Sales & Marketing Kit
42 pages
BDA Mini Project Sem-7
No ratings yet
BDA Mini Project Sem-7
11 pages
Everest Group - Turning Challenges Into Growth Opportunities - CXM State of The Market 2023 - Update Excerpt
No ratings yet
Everest Group - Turning Challenges Into Growth Opportunities - CXM State of The Market 2023 - Update Excerpt
12 pages
Ebook - Arbutus-Final Jan 10 - MISTI Edited ARB Mar 2022
No ratings yet
Ebook - Arbutus-Final Jan 10 - MISTI Edited ARB Mar 2022
21 pages
Explore and Understand Gartn 317886
No ratings yet
Explore and Understand Gartn 317886
23 pages

Assignament

Uploaded by

Assignament

Uploaded by

Name

Khawaja Fareed University of Engineering and Information Technology

What is Big Data?

Three V’s of Big Data:

Sources of Big Data

Challenges and Opportunities:

 Personalization: Recommending products, movies, or music based on user preferences.

Data science vs. Data engineering:

Who can use data science?

Structured vs. Unstructured:

You might also like