Syllabus of BDA

The document outlines a course syllabus on Big Data, covering three main units: Introduction to Big Data, Big Data Technologies, and Data Science in Big Data. It includes topics such as the characteristics of Big Data, Hadoop ecosystem, NoSQL databases, AI applications, and the iterative nature of data science projects. The syllabus also highlights tools and frameworks used in Big Data analytics and data science, including Jupyter Notebook and Tableau.

Uploaded by

a64394127

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views2 pages

Syllabus of BDA

Uploaded by

a64394127

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Course Syllabus and Suggestive Readings

Unit-1 Unit 1: Introduction to Big Data Contact Hours: 15

Understanding Big Data Introduction to Big Data – Definition and Characteristics; The 5 V’s of
and the 5 V’s Big Data – Volume: Data at scale, Velocity: Real-time data processing,
Variety: Structured, semi-structured, unstructured data, Veracity:
Uncertainty and trustworthiness in data, Value: Transforming data into
insights; Challenges and Opportunities in Big Data; Big Data Use Cases
in Real-World Applications
Big Data Architecture Fundamentals of Big Data Architecture: Data ingestion, storage,
processing and visualization layers

Hadoop Ecosystem in Big Data Architecture: Tools like HDFS, YARN,

Hive and Sqoop

Streaming Data in Big Data: Tools such as Apache Kafka and Flink

Real-World Big Data Architecture: Lambda and Kappa Architectures,

Hybrid Architecture for batch and real-time processing
The Hadoop Ecosystem Introduction to the Hadoop Ecosystem; HDFS (Hadoop Distributed File
System): Architecture and Functionality; MapReduce Programming
Model: Workflow and Applications; YARN (Yet Another Resource
Negotiator): Resource Management; Tools in the Ecosystem: Pig, HBase,
Flume, and Oozie; Data Processing with Hadoop: ETL, Analytics and
Reporting
Unit-2 Big Data Technologies Contact Hours: 15
Big Data Frameworks Big Data Frameworks: Hadoop, Apache Spark, and their Comparison;
NoSQL databases: MongoDB, Cassandra, and HBase; Big Data
Visualization Tools: Tableau, Power BI, and Zeppelin; Real-Time Big
Data Processing: Apache Storm and Flink; Emerging trends in Big Data
Technologies.
Big SQL and NO SQL Overview of SQL vs. NoSQL: Differences and Use Cases; Introduction
Databases to Big SQL: Big SQL Features – Scalability, support for structured and
unstructured data, Query optimization Techniques in Big SQL; NoSQL
Database Types: Key-Value stores (Redis, DynamoDB), Document
stores (CouchDB), Column-family stores (Cassandra, HBase), Graph
Databases (Neo4j); Advantages and limitations of Big SQL and NoSQL.
AI in Big Data Introduction to IBM Watson: Overview and capabilities of Watson AI,
Watson’s role in Big data and decision-making; Key Watson Services:
Watson Discovery, Watson Studio, and Watson Assistant, Integration of
Watson with Big Data tools;

AI and Machine Learning Applications in Big Data: Natural Language

Processing (NLP), Sentiment Analysis and Predictive Analytics.
Unit-3 Data Science in Big Data Contact Hours: 15
The Iterative Nature of Introduction to Data Science Projects: Stages and Lifecycle; Iterative
Data Science Projects process in Data Science: Problem Definition, Data collection and
exploration, Model development and evaluation; Refinement and
deployment; Importance of Iteration: Continuous improvement and error
correction; Tools supporting Iteration: Notebooks, Version Control and
CI/CD
Notebooks in Data Science Introduction to Data Science Notebooks: Characteristics – Interactive,
reproducible and modular workflow, Key benefits – Visualization,
documentation and collaboration;

Programming Languages for Data Science: Python – Libraries like

pandas, NumPy and Matplotlib, R – Strengths in statistical analysis and
visualization; Mechanisms and Tolls in Notebooks: Code cells,
markdown, widgets, and extensions, Integration with Git and other data
tools
Notebooks and Data Major Data Science Notebooks: Jupyter Notebook, Google Colab and
Science tools in Big Data Zeppelin, Comparing features: Offline vs. cloud, extensions and
performance;

Getting started with Jupyter Notebook: Installation, environment setup,

and basic usage, Working with Python and R in Jupyter;

Introduction to Tableau: Key features and use-cases, Data connection,

visualization building and dashboard creation;

Collaboration and Presentation tools for Data Insights

Ocs353dsf Unit Wise Notes
100% (2)
Ocs353dsf Unit Wise Notes
121 pages
TE Computer 2019 Course 22.06.2021-52-99
No ratings yet
TE Computer 2019 Course 22.06.2021-52-99
48 pages
Data Science Training Content Naresh IT Hyderabad
No ratings yet
Data Science Training Content Naresh IT Hyderabad
13 pages
2nd - Semester - Data Science
No ratings yet
2nd - Semester - Data Science
16 pages
Bda - Digital Notes
No ratings yet
Bda - Digital Notes
85 pages
It - (R20) - 4-1 - Big Data Analytics - Digital Notes
No ratings yet
It - (R20) - 4-1 - Big Data Analytics - Digital Notes
117 pages
2nd - Semester - Data Science - Final - Updated
No ratings yet
2nd - Semester - Data Science - Final - Updated
15 pages
HTB Academy Report Template
No ratings yet
HTB Academy Report Template
24 pages
Big Data Engineer Course
No ratings yet
Big Data Engineer Course
31 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
FODS Full Notes
No ratings yet
FODS Full Notes
217 pages
Bca Bigdata Fifth - Sem Approved Syllabus
No ratings yet
Bca Bigdata Fifth - Sem Approved Syllabus
23 pages
Ids Unit 1,2,3,4 & 5
No ratings yet
Ids Unit 1,2,3,4 & 5
117 pages
Solarwind Interview Questions
No ratings yet
Solarwind Interview Questions
9 pages
Bda U2
No ratings yet
Bda U2
68 pages
Data Science and Big Data Analytics - Unit - 1
No ratings yet
Data Science and Big Data Analytics - Unit - 1
47 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
310251: Data Science and Big Data Analytics
No ratings yet
310251: Data Science and Big Data Analytics
2 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
LAB Report # 1: An Introduction To PCB Designing Using Proteus
No ratings yet
LAB Report # 1: An Introduction To PCB Designing Using Proteus
6 pages
Question Paper DSBDA
No ratings yet
Question Paper DSBDA
16 pages
20IT503 - Big Data Analytics - Unit1
No ratings yet
20IT503 - Big Data Analytics - Unit1
59 pages
Foundation of Data Science Syllabus
No ratings yet
Foundation of Data Science Syllabus
4 pages
Java PPT Ch08
No ratings yet
Java PPT Ch08
34 pages
Data Science and Big Data Analytics
No ratings yet
Data Science and Big Data Analytics
2 pages
Big Data 1
No ratings yet
Big Data 1
28 pages
Big Data Analytics (R20a0520)
No ratings yet
Big Data Analytics (R20a0520)
84 pages
L8 Big Data Management en
No ratings yet
L8 Big Data Management en
58 pages
Basic Shell Scripting
No ratings yet
Basic Shell Scripting
6 pages
COMP9313: Big Data Management
No ratings yet
COMP9313: Big Data Management
79 pages
Chapter 2 - Intro. To Data Sciences
No ratings yet
Chapter 2 - Intro. To Data Sciences
27 pages
YOLO-Based Video Processing For CCTV Surveillance
No ratings yet
YOLO-Based Video Processing For CCTV Surveillance
5 pages
Big Data Analytics - Notes
No ratings yet
Big Data Analytics - Notes
13 pages
2 Data Science
No ratings yet
2 Data Science
27 pages
Old M.tech BDA Curriculum
No ratings yet
Old M.tech BDA Curriculum
32 pages
SAP SD Test Sample Case Document PDF
50% (2)
SAP SD Test Sample Case Document PDF
25 pages
DA-1,2,3 (1) Merged
No ratings yet
DA-1,2,3 (1) Merged
39 pages
Data Science Syllabus New PDF
0% (1)
Data Science Syllabus New PDF
1 page
Big Data
No ratings yet
Big Data
41 pages
Siddharth Big Data Report 1000016431
No ratings yet
Siddharth Big Data Report 1000016431
6 pages
Data Science Big Data Notes
No ratings yet
Data Science Big Data Notes
2 pages
Word's Shortcuts Practice
No ratings yet
Word's Shortcuts Practice
4 pages
BIG Data Analytics 21CSH-471: Computer Science & Engineering
No ratings yet
BIG Data Analytics 21CSH-471: Computer Science & Engineering
7 pages
2nd - Semester - Data Science - Modified
No ratings yet
2nd - Semester - Data Science - Modified
14 pages
Coursera Report Ishaan Taneja 1000016551
No ratings yet
Coursera Report Ishaan Taneja 1000016551
7 pages
Microsoft Terminology 20070130
No ratings yet
Microsoft Terminology 20070130
274 pages
إدخال الكود السعودى لتصميم الطرق داخل برنامج السيفيل ثرى دى
No ratings yet
إدخال الكود السعودى لتصميم الطرق داخل برنامج السيفيل ثرى دى
11 pages
Chapter 2 - Data Science
No ratings yet
Chapter 2 - Data Science
20 pages
Experiment No - 1 Bda
No ratings yet
Experiment No - 1 Bda
10 pages
Control Expeert Operation Guide
No ratings yet
Control Expeert Operation Guide
44 pages
Unit 1 BD
No ratings yet
Unit 1 BD
3 pages
Aql Datascience Careers
No ratings yet
Aql Datascience Careers
7 pages
Bigdata - Important Topics For Exam
No ratings yet
Bigdata - Important Topics For Exam
1 page
XChange 5.5 Local Update Guide
No ratings yet
XChange 5.5 Local Update Guide
3 pages
Bigdata Engineer Complete Syllabus: Presented by
No ratings yet
Bigdata Engineer Complete Syllabus: Presented by
21 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
3 pages
PCAC2009
No ratings yet
PCAC2009
3 pages
Unit 1 Big Data Analysis
No ratings yet
Unit 1 Big Data Analysis
2 pages
Data Science
No ratings yet
Data Science
2 pages
Topic 1 Big Data Technologies
No ratings yet
Topic 1 Big Data Technologies
5 pages
TravelMate P645-S P645-SG Compal LA-B731P
No ratings yet
TravelMate P645-S P645-SG Compal LA-B731P
58 pages
Data Science
No ratings yet
Data Science
9 pages
Process To Export Test Plans From Excel Into Quality Center: 1. Install and Configure The Microsoft Excel Add-In
No ratings yet
Process To Export Test Plans From Excel Into Quality Center: 1. Install and Configure The Microsoft Excel Add-In
15 pages
DE Python
No ratings yet
DE Python
11 pages
BDA2023 Outline
No ratings yet
BDA2023 Outline
7 pages
Coursera Report Divyansh Sahai CSF443
No ratings yet
Coursera Report Divyansh Sahai CSF443
7 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
6 pages
ER Diagram
No ratings yet
ER Diagram
49 pages
8 Weeks Plan
No ratings yet
8 Weeks Plan
4 pages
SIC - HLDD - Big Data - v1.4.GUIA - TEMARIO
No ratings yet
SIC - HLDD - Big Data - v1.4.GUIA - TEMARIO
5 pages
Data Analytics TOC
No ratings yet
Data Analytics TOC
6 pages
Big Data Technologies Course Outline
No ratings yet
Big Data Technologies Course Outline
2 pages
24aa08 - 24lc08 Eeprom PDF
No ratings yet
24aa08 - 24lc08 Eeprom PDF
40 pages
WP Socket Hijacking
No ratings yet
WP Socket Hijacking
8 pages
Binary Addition
No ratings yet
Binary Addition
7 pages
EC-BOS-8 Install Startup - UG
No ratings yet
EC-BOS-8 Install Startup - UG
58 pages
English Assignment
100% (1)
English Assignment
2 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Control System Application
No ratings yet
Control System Application
3 pages
Handover Document
No ratings yet
Handover Document
99 pages
DLL 01-16-20-2023
No ratings yet
DLL 01-16-20-2023
5 pages
Project Tracking
No ratings yet
Project Tracking
4 pages
Siemens Power Link
No ratings yet
Siemens Power Link
14 pages
BDA Syllabus
No ratings yet
BDA Syllabus
4 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
QLE8142 Datasheet
No ratings yet
QLE8142 Datasheet
2 pages
Citation Styles - Editing Step-By-Step (Zotero Documentation)
No ratings yet
Citation Styles - Editing Step-By-Step (Zotero Documentation)
4 pages
OOP Question Bank-Updated
No ratings yet
OOP Question Bank-Updated
4 pages
Use Plotly Offline To Generate Graphs As Images: 5 Answers
No ratings yet
Use Plotly Offline To Generate Graphs As Images: 5 Answers
1 page
Hadoop Ecosystem for Big Data
From Everand
Hadoop Ecosystem for Big Data
Dr. Zemelak Goraga
No ratings yet

Syllabus of BDA

Uploaded by

Syllabus of BDA

Uploaded by

Course Syllabus and Suggestive Readings

Unit-1 Unit 1: Introduction to Big Data Contact Hours: 15

Hadoop Ecosystem in Big Data Architecture: Tools like HDFS, YARN,

Real-World Big Data Architecture: Lambda and Kappa Architectures,

AI and Machine Learning Applications in Big Data: Natural Language

Programming Languages for Data Science: Python – Libraries like

Getting started with Jupyter Notebook: Installation, environment setup,

Introduction to Tableau: Key features and use-cases, Data connection,

Collaboration and Presentation tools for Data Insights

You might also like