0% found this document useful (0 votes)

12 views2 pages

Big Data Questions Answers

The document outlines various data structures in Big Data, including structured, semi-structured, unstructured, graph, and key-value formats, emphasizing the need for flexibility in handling large volumes of data. It describes the Big Data ecosystem, detailing components for storage, processing, data ingestion, querying, analytics, and visualization. Additionally, it covers the data analytics lifecycle, K-means clustering, association rules, and the responsibilities of a data scientist.

Uploaded by

Ratnesh hirnaik

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views2 pages

Big Data Questions Answers

Uploaded by

Ratnesh hirnaik

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Q1: Explain different data structures in Big Data.

- Structured: Tabular data stored in relational databases (e.g., MySQL, Oracle).

- Semi-structured: Data with some organization but not strictly tabular (e.g., XML, JSON).

- Unstructured: Raw data without a specific format (e.g., text, images, videos).

- Graph: Data modeled as nodes and edges (e.g., social networks).

- Key-Value: Data stored as key-value pairs (e.g., Redis, DynamoDB).

Big Data requires flexible data structures to store and process massive volumes efficiently.

Q2: Explain Big Data Ecosystem.

- Storage: HDFS, Amazon S3 for data storage.

- Processing: Hadoop, Spark for distributed processing.

- Data Ingestion: Apache Flume, Sqoop, Kafka for importing data.

- Querying: Hive, Pig, Impala for querying large datasets.

- Analytics: MLlib, Mahout for machine learning.

- Visualization: Tableau, Power BI for interpreting results.

The ecosystem supports the collection, storage, processing, and analysis of Big Data.

Q3: Explain Discovery of data phase of data analytics lifecycle.

- Identify business goals and problems.

- Understand data sources and availability.

- Define analytics objectives and success metrics.

- Form hypotheses and assumptions.

- Prepare a project plan and timeline.

This phase ensures objectives are clear before data preparation.

Q4: Write a short note on K-means.

- K-means is an unsupervised machine learning algorithm.

- Used for clustering data into K groups based on features.

- Starts with random centroids, then assigns points to nearest centroid.

- Updates centroids by averaging assigned points.

- Stops when centroids stabilize or max iterations reached.

- Applications: customer segmentation, image compression.

Q5: Explain Association Rule.

- Association rules identify relationships between variables.

- Used in market basket analysis (e.g., bread -> butter).

- Metrics:

- Support: Frequency of itemset.

- Confidence: Likelihood of item Y with X.

- Lift: Strength of association.

- Algorithm: Apriori.

- Helps in decision-making and recommendations.

Q6: Explain responsibilities of a Data Scientist.

- Collect and clean large datasets.

- Analyze data for meaningful patterns.

- Build predictive models using ML.

- Communicate findings via visualizations.

- Collaborate with stakeholders.

- Monitor and optimize models.

- Stay updated with new data science tools.

TYCS Data Science Questions Bank
No ratings yet
TYCS Data Science Questions Bank
3 pages
Big Data Analytics Exam Answers Cleaned
No ratings yet
Big Data Analytics Exam Answers Cleaned
4 pages
Data Science and Analytics Reviewer
No ratings yet
Data Science and Analytics Reviewer
5 pages
Q1. Explain Data Science Process Along With Detailed Diagram
No ratings yet
Q1. Explain Data Science Process Along With Detailed Diagram
7 pages
Big Data (Imp-Questions)
No ratings yet
Big Data (Imp-Questions)
17 pages
Bda Answers
No ratings yet
Bda Answers
18 pages
Data Science
No ratings yet
Data Science
31 pages
Data Science
No ratings yet
Data Science
3 pages
Data Science
No ratings yet
Data Science
3 pages
DS 3-Marks Semeseter Suggestion
No ratings yet
DS 3-Marks Semeseter Suggestion
54 pages
Aql Datascience Careers
No ratings yet
Aql Datascience Careers
7 pages
DS
No ratings yet
DS
7 pages
Question Bank With Answers
No ratings yet
Question Bank With Answers
103 pages
Data Science Notes 1
No ratings yet
Data Science Notes 1
3 pages
Ixs8h l8mgc
No ratings yet
Ixs8h l8mgc
40 pages
Data Science
No ratings yet
Data Science
10 pages
Dsbda May Solved 2022
No ratings yet
Dsbda May Solved 2022
22 pages
Data Science Notes
No ratings yet
Data Science Notes
3 pages
Ads Imp Qna 2025 15 04 06 06 35
No ratings yet
Ads Imp Qna 2025 15 04 06 06 35
33 pages
10 Most Commonly Asked DA Interview Questions and Answers
No ratings yet
10 Most Commonly Asked DA Interview Questions and Answers
3 pages
FDSNotes
No ratings yet
FDSNotes
12 pages
Data Science Interview Best
No ratings yet
Data Science Interview Best
48 pages
Ds
No ratings yet
Ds
5 pages
Data Science PDF
No ratings yet
Data Science PDF
11 pages
Revision
No ratings yet
Revision
19 pages
ML Chapter 2
No ratings yet
ML Chapter 2
9 pages
DS - Unit I
No ratings yet
DS - Unit I
3 pages
Chapter No.4 Exercise Solution (Computer)
No ratings yet
Chapter No.4 Exercise Solution (Computer)
8 pages
DA PUT Solutions
No ratings yet
DA PUT Solutions
30 pages
Data Science Assignment
No ratings yet
Data Science Assignment
9 pages
DTS 201 Lecture Note
No ratings yet
DTS 201 Lecture Note
24 pages
DA-1,2,3 (1) Merged
No ratings yet
DA-1,2,3 (1) Merged
39 pages
Intorduction of DA
No ratings yet
Intorduction of DA
5 pages
Resume Building Tips by Prafful
No ratings yet
Resume Building Tips by Prafful
7 pages
Ds Revision 1
No ratings yet
Ds Revision 1
5 pages
Ds Short
No ratings yet
Ds Short
2 pages
BDA Module
No ratings yet
BDA Module
6 pages
Introduction To Data Science - 23CSH-283
100% (1)
Introduction To Data Science - 23CSH-283
48 pages
Ba Notes Short
No ratings yet
Ba Notes Short
50 pages
II CSE - A&B (96) DS-int 1 QP ANS-set1
No ratings yet
II CSE - A&B (96) DS-int 1 QP ANS-set1
7 pages
Big Data Unit1 Long Answers
No ratings yet
Big Data Unit1 Long Answers
7 pages
Notes On Data Science
No ratings yet
Notes On Data Science
3 pages
Data Science Unit 01
No ratings yet
Data Science Unit 01
19 pages
Set. No - 1 P18pecs021-Data Science QP - Ph.d.
No ratings yet
Set. No - 1 P18pecs021-Data Science QP - Ph.d.
20 pages
Unit I 2 Marks With Ans
No ratings yet
Unit I 2 Marks With Ans
7 pages
Program: MBA Semester-III Course: Syndicated Learning Program (SLP-3) Academic Year: 2023-24 Department of Marketing & Strategy IBS, IFHE, Hyderabad
No ratings yet
Program: MBA Semester-III Course: Syndicated Learning Program (SLP-3) Academic Year: 2023-24 Department of Marketing & Strategy IBS, IFHE, Hyderabad
81 pages
Data Science
No ratings yet
Data Science
14 pages
Fdsa 12 - 2M
No ratings yet
Fdsa 12 - 2M
15 pages
Data Science Fundamentals
No ratings yet
Data Science Fundamentals
3 pages
DS Mcqs
No ratings yet
DS Mcqs
19 pages
Summary DS231
No ratings yet
Summary DS231
11 pages
12 2marks With Ans
No ratings yet
12 2marks With Ans
21 pages
Roadmap To Becoming A Data Scientist
No ratings yet
Roadmap To Becoming A Data Scientist
3 pages
Data Mining Question Bank 3,4,5
No ratings yet
Data Mining Question Bank 3,4,5
7 pages
DA Unitwise Notes Detailed Cleaned
No ratings yet
DA Unitwise Notes Detailed Cleaned
5 pages
ChatGPT - MyLearning On Big Data, Data Science and Machine Learning
No ratings yet
ChatGPT - MyLearning On Big Data, Data Science and Machine Learning
44 pages
Module 1 - Introduction To Data Science
No ratings yet
Module 1 - Introduction To Data Science
3 pages
Super 25 Unit 1 and Unit 2
No ratings yet
Super 25 Unit 1 and Unit 2
15 pages
Databases: System Concepts, Designs, Management, and Implementation
From Everand
Databases: System Concepts, Designs, Management, and Implementation
Jonathan Rigdon
No ratings yet
Practical Data Strategies and Recipes
From Everand
Practical Data Strategies and Recipes
Tom Henricksen
No ratings yet

Big Data Questions Answers

Uploaded by

Big Data Questions Answers

Uploaded by

Q1: Explain different data structures in Big Data.

- Structured: Tabular data stored in relational databases (e.g., MySQL, Oracle).

- Graph: Data modeled as nodes and edges (e.g., social networks).

- Key-Value: Data stored as key-value pairs (e.g., Redis, DynamoDB).

Q2: Explain Big Data Ecosystem.

- Storage: HDFS, Amazon S3 for data storage.

- Processing: Hadoop, Spark for distributed processing.

- Data Ingestion: Apache Flume, Sqoop, Kafka for importing data.

- Querying: Hive, Pig, Impala for querying large datasets.

- Analytics: MLlib, Mahout for machine learning.

- Visualization: Tableau, Power BI for interpreting results.

Q3: Explain Discovery of data phase of data analytics lifecycle.

- Identify business goals and problems.

- Understand data sources and availability.

- Define analytics objectives and success metrics.

- Form hypotheses and assumptions.

- Prepare a project plan and timeline.

This phase ensures objectives are clear before data preparation.

Q4: Write a short note on K-means.

- K-means is an unsupervised machine learning algorithm.

- Starts with random centroids, then assigns points to nearest centroid.

- Updates centroids by averaging assigned points.

- Stops when centroids stabilize or max iterations reached.

- Applications: customer segmentation, image compression.

Q5: Explain Association Rule.

- Association rules identify relationships between variables.

- Used in market basket analysis (e.g., bread -> butter).

- Support: Frequency of itemset.

- Confidence: Likelihood of item Y with X.

- Lift: Strength of association.

- Helps in decision-making and recommendations.

Q6: Explain responsibilities of a Data Scientist.

- Collect and clean large datasets.

- Analyze data for meaningful patterns.

- Build predictive models using ML.

- Communicate findings via visualizations.

- Collaborate with stakeholders.

- Monitor and optimize models.

- Stay updated with new data science tools.

You might also like