0% found this document useful (0 votes)

9 views4 pages

Data Analytics

Uploaded by

3131Nair Athira

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views4 pages

Data Analytics

Uploaded by

3131Nair Athira

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Analytics Fundamentals

1.1 Data Analytics and Data Science: Introduction, Characteristics, and Need
Introduction:

• Data Analytics refers to the process of examining datasets to draw conclusions about the
information they contain. It involves various techniques and tools to analyze raw data for
insights.

• Data Science is a broader field that uses scientific methods, processes, algorithms, and systems
to extract knowledge and insights from structured and unstructured data.

Characteristics:

• Data Analytics focuses on specific queries and provides direct insights to support decision-
making. It is often used in business intelligence.

• Data Science involves a more complex process that includes predictive modeling, machine
learning, and data engineering. It aims to discover new questions that data can answer.

Need:

• Businesses require Data Analytics to make informed decisions, improve operational efficiency,
and gain a competitive edge.

• Data Science is essential for discovering patterns and trends in large datasets, leading to new
innovations, product development, and strategic planning.

1.2 Attribute Measurement Levels: Ordinal, Nominal, Ratio, Interval

• Ordinal: Represents categories with a meaningful order, like rankings (e.g., 1st, 2nd, 3rd). The
difference between ranks is not consistent.

• Nominal: Categories without any inherent order (e.g., gender, color). It’s used for labeling
variables without any quantitative value.

• Ratio: Similar to interval data but with a true zero point (e.g., height, weight). It allows for the
computation of ratios.

• Interval: Numerical data with meaningful intervals between values but no true zero (e.g.,
temperature in Celsius). You can add and subtract values, but multiplying or dividing them isn’t
meaningful.
1.3 Data Analytics Life Cycle
1. Discovery: Identify business problems and objectives. Understand the data requirements and
define the project’s scope.

2. Data Preparation: Clean and preprocess data, handle missing values, and transform data to be
ready for analysis.

3. Model Planning: Select algorithms and techniques to model the data. Prepare for the modeling
phase.

4. Model Building: Develop models based on the chosen methods. Fine-tune and validate models.

5. Communicate Results: Interpret the model outcomes and present findings to stakeholders using
visualizations and reports.

6. Operationalize: Deploy the model in a production environment. Ensure the model is accessible
and usable by end-users.

7. Data Analytics Principles: Focus on accuracy, consistency, validity, and reliability in the entire
process to ensure the quality of insights.

Targeted Domains for Data Analytics Applications

Data Analytics can be applied across multiple domains, including:

• Healthcare: Predictive analytics for patient outcomes, improving clinical decision-making, and
optimizing operations.

• Finance: Risk management, fraud detection, and customer behavior analysis.

• Retail: Customer segmentation, inventory management, and personalized marketing.

• Manufacturing: Predictive maintenance, quality control, and supply chain optimization.

Data Acquisition and Web Scraping

2.1 Needs and Process

Needs:

• Data Acquisition is crucial for gathering raw data necessary for analysis. Without accurate and
relevant data, the analytics process is ineffective.

• Web Scraping is used to extract large amounts of data from websites for further analysis, which
is especially useful for research, competitive analysis, and price monitoring.
Process:

• Define the objective.

• Identify and access data sources.

• Collect and store the data systematically.

2.2 Primary and Secondary Data Sources: Repositories and Approaches

• Primary Data Sources: Data collected directly from original sources through surveys,
experiments, or interviews. They are usually more reliable but costlier and time-consuming.

• Secondary Data Sources: Data collected from existing sources such as reports, books, or
databases. It is cost-effective and easily accessible but may not be as specific.

Repositories: Data repositories include databases, data lakes, and cloud storage, where vast amounts of
data are stored and accessed for analytics.

Approaches: Approaches to data acquisition can range from automated scripts for web scraping to
manual collection methods like surveys and interviews.

2.3 Data Acquisition Techniques

• Surveys: A method of gathering data by asking people questions directly. It is widely used in
market research.

• Data Scraping: Automated extraction of data from websites using scripts or tools.

• Biometric Techniques: Collecting data from biological attributes like fingerprints or facial
recognition.

• Sensing: Collecting data through sensors, like IoT devices in smart cities or wearables.

2.4 Data Scraping Methods

• Screen Scraping: Capturing data directly from the display output of an application.

• Web Scraping: Extracting data from websites using automated bots or scripts.

• Report Mining: Extracting data from reports or documents using text mining techniques.
Data Transformation

3.1 Needs and Impacts

Needs:

• Data Transformation is crucial for converting raw data into a format that can be easily analyzed.
It involves cleaning, normalizing, and structuring data.

Impacts:

• Transformed data leads to more accurate analysis, better insights, and improved decision-
making. It also enhances the performance of data models.

3.2 Handling Missing Values: Removal, Imputations

• Removal: Simply removing rows or columns with missing data, which is straightforward but may
lead to loss of valuable information.

• Imputations: Replacing missing values with substitutes like the mean, median, mode, or using
more sophisticated methods like regression or K-nearest neighbors (KNN).

3.3 Reshaping Data Frames and Restructuring Data

• Reshaping Data Frames: Changing the structure of a data frame, for example, pivoting or
melting data for better analysis.

• Restructuring Data: Adjusting the data's structure to align with the requirements of the
analytical process, such as aggregating, filtering, or splitting data sets.

3.4 Feature Engineering and Extraction Techniques

• Feature Engineering: Creating new features or modifying existing ones to improve the
performance of machine learning models. It includes techniques like binning, encoding
categorical variables, and creating interaction terms.

• Feature Extraction: Reducing the dimensionality of the data by identifying and selecting the
most important features, using methods like Principal Component Analysis (PCA) or Linear
Discriminant Analysis (LDA).

Internship Report Data Science
100% (1)
Internship Report Data Science
58 pages
Antim Prahar 2024 Data Analytics For Business Decisions
50% (2)
Antim Prahar 2024 Data Analytics For Business Decisions
38 pages
Products Barcodes 2024-04-05T10 38 12.851448Z
No ratings yet
Products Barcodes 2024-04-05T10 38 12.851448Z
16 pages
Math9 Q4 W1-W8-52pages
No ratings yet
Math9 Q4 W1-W8-52pages
52 pages
Data Science
No ratings yet
Data Science
207 pages
Big - Data Unit-2
100% (2)
Big - Data Unit-2
64 pages
Advanced Data Analytics Assignment
No ratings yet
Advanced Data Analytics Assignment
6 pages
Biomedical Waste Management Guidelines - Compressed
No ratings yet
Biomedical Waste Management Guidelines - Compressed
60 pages
Beginners Guide To Data Science - A Twics Guide 1
100% (1)
Beginners Guide To Data Science - A Twics Guide 1
41 pages
ISPFL9 Module1
100% (1)
ISPFL9 Module1
22 pages
Grid-Connected EV Charging With Renewable Energy Integration in Parking Lots
No ratings yet
Grid-Connected EV Charging With Renewable Energy Integration in Parking Lots
64 pages
DA Notes
No ratings yet
DA Notes
10 pages
Chakan Iv, Pune: Indospace - in
No ratings yet
Chakan Iv, Pune: Indospace - in
16 pages
CHAPTER 8 Auditing Marketing and Sales
No ratings yet
CHAPTER 8 Auditing Marketing and Sales
26 pages
Dtv-md-0359-Directv Shef Public Beta Command Set-V1.0
No ratings yet
Dtv-md-0359-Directv Shef Public Beta Command Set-V1.0
25 pages
Intro
No ratings yet
Intro
144 pages
Introduction To Data Analysis
No ratings yet
Introduction To Data Analysis
94 pages
Operation/Technical Manual
No ratings yet
Operation/Technical Manual
64 pages
Grammar Now Plus 2 - SB Answer Keys
No ratings yet
Grammar Now Plus 2 - SB Answer Keys
59 pages
22UCS303 DS-Unit II-N
No ratings yet
22UCS303 DS-Unit II-N
71 pages
Commissioning Report For Boiler Air and Flue Gas System Unit 1
No ratings yet
Commissioning Report For Boiler Air and Flue Gas System Unit 1
6 pages
Shanabrook Forensic Audit
No ratings yet
Shanabrook Forensic Audit
63 pages
DA-1,2,3 (1) Merged
No ratings yet
DA-1,2,3 (1) Merged
39 pages
Data Analytics For IOT
No ratings yet
Data Analytics For IOT
57 pages
Gearbox
100% (1)
Gearbox
5 pages
Module 1 & 2 DAEH QB
No ratings yet
Module 1 & 2 DAEH QB
69 pages
1708443470801
No ratings yet
1708443470801
71 pages
Comprehensive Guide To Business Analytics
No ratings yet
Comprehensive Guide To Business Analytics
10 pages
Microsoft Powerpoint Tips and Tricks
No ratings yet
Microsoft Powerpoint Tips and Tricks
8 pages
Data Similarity and Dissimilarity
No ratings yet
Data Similarity and Dissimilarity
73 pages
MSE Merged
No ratings yet
MSE Merged
78 pages
All About Data Science
No ratings yet
All About Data Science
35 pages
Chapter-1 Introduction To Data Analytics
No ratings yet
Chapter-1 Introduction To Data Analytics
34 pages
FDS Introduction
No ratings yet
FDS Introduction
41 pages
Unit 1
No ratings yet
Unit 1
36 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
29 pages
Introduction To Data Science Methodology
No ratings yet
Introduction To Data Science Methodology
45 pages
Big Data Day II
No ratings yet
Big Data Day II
38 pages
Predictive Modeling
No ratings yet
Predictive Modeling
27 pages
DTS 201 Lecture Note
No ratings yet
DTS 201 Lecture Note
24 pages
MIDs POR IDENTIFICAR
No ratings yet
MIDs POR IDENTIFICAR
34 pages
Hair Transplant in Nepal
100% (1)
Hair Transplant in Nepal
3 pages
Wound Dressing Jurnal
No ratings yet
Wound Dressing Jurnal
32 pages
DataAnalytics Chap 1
No ratings yet
DataAnalytics Chap 1
36 pages
Chapter 5 & 6
No ratings yet
Chapter 5 & 6
28 pages
Data Analytics
No ratings yet
Data Analytics
30 pages
EDHRM - HR Metrics 2023 Course Outline - Revised
No ratings yet
EDHRM - HR Metrics 2023 Course Outline - Revised
4 pages
CSR Bernard Madoff Case Analysis and Conclusion
No ratings yet
CSR Bernard Madoff Case Analysis and Conclusion
6 pages
Data Science
No ratings yet
Data Science
17 pages
Data Warehousing & Data Mining Unit-3 Notes
No ratings yet
Data Warehousing & Data Mining Unit-3 Notes
27 pages
Da Unit-Ii
No ratings yet
Da Unit-Ii
21 pages
Da Unit 2
No ratings yet
Da Unit 2
18 pages
Ds Unit 1 Notes
No ratings yet
Ds Unit 1 Notes
23 pages
Unit 2 Data Gathering
No ratings yet
Unit 2 Data Gathering
14 pages
Exhibit 0224
No ratings yet
Exhibit 0224
16 pages
FDS-Unit II-ECE
No ratings yet
FDS-Unit II-ECE
22 pages
Unit 3
No ratings yet
Unit 3
22 pages
Unit1 Introduction To Data Analytics and Data Analytics Lifecycle Notes
No ratings yet
Unit1 Introduction To Data Analytics and Data Analytics Lifecycle Notes
13 pages
Wordpluginhowtoxpto 2003
No ratings yet
Wordpluginhowtoxpto 2003
15 pages
Power and Communication
No ratings yet
Power and Communication
14 pages
MBA Data Mining Unit 1 Notes
No ratings yet
MBA Data Mining Unit 1 Notes
12 pages
CHC Rotortales 2004 Annual Edition
No ratings yet
CHC Rotortales 2004 Annual Edition
16 pages
Technical Report Writing For Ca2 Examination: Topic: Introduction To Data Science
No ratings yet
Technical Report Writing For Ca2 Examination: Topic: Introduction To Data Science
7 pages
Internship Report
No ratings yet
Internship Report
9 pages
Business Analytics Summary (Units 1.2 - 1.8)
No ratings yet
Business Analytics Summary (Units 1.2 - 1.8)
8 pages
Kajian Manajemen Transportasi Pada Daerah Hinterland (Studi Kasus Di Pelabuhan Ketapang Banyuwangi)
No ratings yet
Kajian Manajemen Transportasi Pada Daerah Hinterland (Studi Kasus Di Pelabuhan Ketapang Banyuwangi)
13 pages
Unit2 DATA SCIENCE
No ratings yet
Unit2 DATA SCIENCE
8 pages
Data Analytics Syllabus PDF
No ratings yet
Data Analytics Syllabus PDF
5 pages
AARM CAIA Benchmarks-1
No ratings yet
AARM CAIA Benchmarks-1
12 pages
UNIT-1: What Is Data Analytics? Why Data Analytics Is Important? What Is The Role of Data Analytics and Ways To Use It?
No ratings yet
UNIT-1: What Is Data Analytics? Why Data Analytics Is Important? What Is The Role of Data Analytics and Ways To Use It?
10 pages
Abhijitya Midsem
No ratings yet
Abhijitya Midsem
6 pages
Analytics and Data Science
No ratings yet
Analytics and Data Science
12 pages
GMW 16443 Type 1: Adhesion Performance Requirements For Adhesive Backed Light Trim and Foam
No ratings yet
GMW 16443 Type 1: Adhesion Performance Requirements For Adhesive Backed Light Trim and Foam
10 pages
As You Delve Into The World of Data Analytics
No ratings yet
As You Delve Into The World of Data Analytics
10 pages
Chapter 1 Introduction To Data Analytics
No ratings yet
Chapter 1 Introduction To Data Analytics
4 pages
Data Analytics
No ratings yet
Data Analytics
5 pages
Data Analytics 1
No ratings yet
Data Analytics 1
4 pages
Data Science MBA
No ratings yet
Data Science MBA
6 pages
Assignment Week 2 BDA
No ratings yet
Assignment Week 2 BDA
4 pages
Data Analytics
No ratings yet
Data Analytics
6 pages
Here Is An Even More Detailed and Expanded Version of Chapter 1
No ratings yet
Here Is An Even More Detailed and Expanded Version of Chapter 1
5 pages
Ds Final
No ratings yet
Ds Final
3 pages
Data Mining Overview
No ratings yet
Data Mining Overview
4 pages
ROCKET
No ratings yet
ROCKET
4 pages
Plutopia Chapters 19-20, 22, 30
No ratings yet
Plutopia Chapters 19-20, 22, 30
3 pages
Problem Set 1 Significant Figures Answer Sheet
No ratings yet
Problem Set 1 Significant Figures Answer Sheet
2 pages
BlakeBlossomXXX OnlyFans Pictures & Videos Complete Siterip 3 Download
No ratings yet
BlakeBlossomXXX OnlyFans Pictures & Videos Complete Siterip 3 Download
1 page
Data Analytics with Generative AI
From Everand
Data Analytics with Generative AI
Younish P
No ratings yet
DATA ANALYSIS AND DATA SCIENCE: Unlock Insights and Drive Innovation with Advanced Analytical Techniques (2024 Guide)
From Everand
DATA ANALYSIS AND DATA SCIENCE: Unlock Insights and Drive Innovation with Advanced Analytical Techniques (2024 Guide)
WINTON CLEM
No ratings yet
"Big Data Science" Basic Concepts and Applications
From Everand
"Big Data Science" Basic Concepts and Applications
Sukanta Bhattacharya
No ratings yet

Data Analytics

Uploaded by

Data Analytics

Uploaded by

Analytics Fundamentals

1.2 Attribute Measurement Levels: Ordinal, Nominal, Ratio, Interval

Targeted Domains for Data Analytics Applications

• Finance: Risk management, fraud detection, and customer behavior analysis.

• Retail: Customer segmentation, inventory management, and personalized marketing.

• Manufacturing: Predictive maintenance, quality control, and supply chain optimization.

Data Acquisition and Web Scraping

2.1 Needs and Process

• Define the objective.

• Identify and access data sources.

• Collect and store the data systematically.

2.2 Primary and Secondary Data Sources: Repositories and Approaches

2.3 Data Acquisition Techniques

2.4 Data Scraping Methods

3.1 Needs and Impacts

3.2 Handling Missing Values: Removal, Imputations

3.3 Reshaping Data Frames and Restructuring Data

3.4 Feature Engineering and Extraction Techniques

You might also like