0% found this document useful (0 votes)

9 views2 pages

Unit 1 Big Data Analysis

Big Data refers to large and complex data sets that require advanced tools for processing and analysis. It is characterized by the 5Vs: Volume, Velocity, Variety, Veracity, and Value, and features such as scalability and real-time analysis. Various technologies like Hadoop and Spark support Big Data applications across sectors like healthcare, retail, and banking.

Uploaded by

Mahesh veera

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views2 pages

Unit 1 Big Data Analysis

Uploaded by

Mahesh veera

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Unit 1: Introduction to Big Data

1. Definition of Big Data

Big Data refers to large and complex data sets that cannot be processed efficiently using traditional data

processing tools. It involves capturing, storing, managing, and analyzing huge volumes of data to extract

valuable insights.

2. Characteristics of Big Data (5Vs)

1. Volume - Large amounts of data (terabytes to zettabytes).

2. Velocity - High speed of data generation (real-time or near-real-time).

3. Variety - Different data formats (text, images, videos, logs, etc.).

4. Veracity - Data quality, accuracy, and trustworthiness.

5. Value - Usefulness of the data in decision-making.

3. Features of Big Data

- Scalability - Systems must scale horizontally to manage large data sets.

- Fault Tolerance - Systems should handle failures gracefully.

- Distributed Storage - Data is stored across multiple machines.

- Parallel Processing - Tasks are executed concurrently across nodes.

- Real-Time Analysis - Insights can be extracted in real-time or near real-time.

- Cost Efficiency - Uses commodity hardware and open-source tools like Hadoop.

- Flexibility - Supports multiple data formats and sources.

- Data Redundancy - Ensures data availability through replication.

4. Types of Digital Data

- Structured - Tabular data (e.g., SQL databases).

- Semi-Structured - Partially organized (e.g., XML, JSON).

- Unstructured - No predefined format (e.g., videos, emails, social media posts).

5. Traditional vs Big Data Systems

Unit 1: Introduction to Big Data

Traditional Systems vs Big Data Systems:

Storage: Centralized vs Distributed

Processing: Batch vs Batch & Real-Time

Data Types: Structured vs All types

Scalability: Vertical vs Horizontal

Cost: Expensive vs Cost-effective

6. Technologies Supporting Big Data

- Hadoop - Distributed storage and processing.

- MapReduce - Programming model for parallel data processing.

- Spark - In-memory, faster processing framework.

- NoSQL - MongoDB, Cassandra for flexible data models.

7. Applications of Big Data

- Healthcare - Patient analytics, disease prediction.

- Retail - Customer behavior prediction.

- Banking - Fraud detection, risk analysis.

- Government - Smart cities, public safety.

- Social Media - Trend analysis, sentiment mining.

Big Data
No ratings yet
Big Data
190 pages
Big Data Analytics Compiled Notes
No ratings yet
Big Data Analytics Compiled Notes
130 pages
Mca Big Data PDF Sem 3
No ratings yet
Mca Big Data PDF Sem 3
193 pages
Big Data Hadoop Complete Final Spaced
No ratings yet
Big Data Hadoop Complete Final Spaced
15 pages
It - (R20) - 4-1 - Big Data Analytics - Digital Notes
No ratings yet
It - (R20) - 4-1 - Big Data Analytics - Digital Notes
117 pages
Big Data Notes
No ratings yet
Big Data Notes
89 pages
Microsoft Word - Lecture 1
No ratings yet
Microsoft Word - Lecture 1
55 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
Data Science and Big Data Analytics - Unit - 1
No ratings yet
Data Science and Big Data Analytics - Unit - 1
47 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
BIG Data Analytics 21CSH-471: Computer Science & Engineering
No ratings yet
BIG Data Analytics 21CSH-471: Computer Science & Engineering
13 pages
Bda U2
No ratings yet
Bda U2
68 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
Syllabus
No ratings yet
Syllabus
7 pages
Big Data 1
No ratings yet
Big Data 1
28 pages
Unit 1 - BDS - DS307
No ratings yet
Unit 1 - BDS - DS307
47 pages
Big Data Analytics Unit - 1 Notes
No ratings yet
Big Data Analytics Unit - 1 Notes
24 pages
BDA Unit 1
No ratings yet
BDA Unit 1
10 pages
BDA ESE Questions
No ratings yet
BDA ESE Questions
22 pages
Big Data Unit 1
No ratings yet
Big Data Unit 1
21 pages
CS8091 LN
No ratings yet
CS8091 LN
68 pages
Unit-I Material
No ratings yet
Unit-I Material
32 pages
IET Udaipur BDA Unit-1
No ratings yet
IET Udaipur BDA Unit-1
10 pages
Non Parametric Tests R Examples
No ratings yet
Non Parametric Tests R Examples
4 pages
Big Data A Comprehensive Overview
No ratings yet
Big Data A Comprehensive Overview
25 pages
Big Data Analytics (R20a0520)
No ratings yet
Big Data Analytics (R20a0520)
84 pages
Unit Iv PDF
No ratings yet
Unit Iv PDF
26 pages
Big Data Unit 1 Overview
No ratings yet
Big Data Unit 1 Overview
2 pages
Big Data Analytics Overview
No ratings yet
Big Data Analytics Overview
17 pages
BD 1
No ratings yet
BD 1
15 pages
Firewalls
No ratings yet
Firewalls
2 pages
Updated Unit-2
0% (1)
Updated Unit-2
55 pages
UNIT-1:Overview of Big Data
No ratings yet
UNIT-1:Overview of Big Data
10 pages
Big Data Analytics - Notes
No ratings yet
Big Data Analytics - Notes
13 pages
CS8091 Big Data Analytics
No ratings yet
CS8091 Big Data Analytics
28 pages
BDA Notes Part 1
No ratings yet
BDA Notes Part 1
11 pages
Big Data Imp-1
No ratings yet
Big Data Imp-1
16 pages
Jamal Class Note
No ratings yet
Jamal Class Note
2 pages
Unit 1 B Tech 3 Year BD
No ratings yet
Unit 1 B Tech 3 Year BD
10 pages
Introduction To Big Data Notes
No ratings yet
Introduction To Big Data Notes
4 pages
Reinforcement Learning Enhanced
No ratings yet
Reinforcement Learning Enhanced
3 pages
BD by Maaz
No ratings yet
BD by Maaz
19 pages
Bda Unit-1 Notes
No ratings yet
Bda Unit-1 Notes
10 pages
Ak As2
No ratings yet
Ak As2
15 pages
Reinforcement Learning Overview
No ratings yet
Reinforcement Learning Overview
2 pages
BIG Data Analytics 21CSH-471: Computer Science & Engineering
No ratings yet
BIG Data Analytics 21CSH-471: Computer Science & Engineering
17 pages
Experiment No - 1 Bda
No ratings yet
Experiment No - 1 Bda
10 pages
Unit 1
No ratings yet
Unit 1
18 pages
BD Course Handout
No ratings yet
BD Course Handout
5 pages
Big Data Comprehensive Guide
No ratings yet
Big Data Comprehensive Guide
2 pages
Topic 1 Big Data Technologies
No ratings yet
Topic 1 Big Data Technologies
5 pages
BD Unit 1
No ratings yet
BD Unit 1
5 pages
Big Data Basics - Simple Notes
No ratings yet
Big Data Basics - Simple Notes
4 pages
Syllabus of BDA
No ratings yet
Syllabus of BDA
2 pages
Unit 1 BD
No ratings yet
Unit 1 BD
3 pages
Big Data Ashish
No ratings yet
Big Data Ashish
7 pages
Midsem Assignment
No ratings yet
Midsem Assignment
1 page
Coursera Report Divyansh Sahai CSF443
No ratings yet
Coursera Report Divyansh Sahai CSF443
7 pages
Cp5293 Big Data Analytics Question Bank
0% (1)
Cp5293 Big Data Analytics Question Bank
13 pages
Unit 1 BDA
No ratings yet
Unit 1 BDA
3 pages
BD - Unit - I - Introduction To Big Data
No ratings yet
BD - Unit - I - Introduction To Big Data
18 pages
cp5293 Big Data Analytics Question Bank
0% (1)
cp5293 Big Data Analytics Question Bank
13 pages
CS8091 BDA Unit1
No ratings yet
CS8091 BDA Unit1
63 pages
The Power of Big Data: Transforming Industries and Shaping the Future
From Everand
The Power of Big Data: Transforming Industries and Shaping the Future
Tom Henricksen
No ratings yet

Unit 1 Big Data Analysis

Uploaded by

Unit 1 Big Data Analysis

Uploaded by

Unit 1: Introduction to Big Data

1. Definition of Big Data

2. Characteristics of Big Data (5Vs)

1. Volume - Large amounts of data (terabytes to zettabytes).

2. Velocity - High speed of data generation (real-time or near-real-time).

3. Variety - Different data formats (text, images, videos, logs, etc.).

4. Veracity - Data quality, accuracy, and trustworthiness.

5. Value - Usefulness of the data in decision-making.

3. Features of Big Data

- Scalability - Systems must scale horizontally to manage large data sets.

- Fault Tolerance - Systems should handle failures gracefully.

- Distributed Storage - Data is stored across multiple machines.

- Parallel Processing - Tasks are executed concurrently across nodes.

- Real-Time Analysis - Insights can be extracted in real-time or near real-time.

- Flexibility - Supports multiple data formats and sources.

- Data Redundancy - Ensures data availability through replication.

4. Types of Digital Data

- Structured - Tabular data (e.g., SQL databases).

- Semi-Structured - Partially organized (e.g., XML, JSON).

- Unstructured - No predefined format (e.g., videos, emails, social media posts).

5. Traditional vs Big Data Systems

Traditional Systems vs Big Data Systems:

Storage: Centralized vs Distributed

Processing: Batch vs Batch & Real-Time

Data Types: Structured vs All types

Scalability: Vertical vs Horizontal

Cost: Expensive vs Cost-effective

6. Technologies Supporting Big Data

- Hadoop - Distributed storage and processing.

- MapReduce - Programming model for parallel data processing.

- Spark - In-memory, faster processing framework.

- NoSQL - MongoDB, Cassandra for flexible data models.

7. Applications of Big Data

- Healthcare - Patient analytics, disease prediction.

- Retail - Customer behavior prediction.

- Banking - Fraud detection, risk analysis.

- Government - Smart cities, public safety.

- Social Media - Trend analysis, sentiment mining.

You might also like