MCS-226 Data Science and Big Data

The document outlines the assignment details for the course MCS-226: Data Science & Big Data, including submission deadlines, marking scheme, and the requirement to answer 10 questions worth 8 marks each, along with a viva voce component. The questions cover various topics such as Exploratory Data Analysis, hypothesis testing, data preprocessing, big data concepts, and machine learning techniques. Students are encouraged to use illustrations and follow presentation guidelines from the Programme Guide.

Uploaded by

mailabhiabhi7

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

68 views1 page

MCS-226 Data Science and Big Data

Uploaded by

mailabhiabhi7

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

Course Code : MCS-226

Course Title : Data Science & Big Data

Assignment Number : MCAOL(III)/218/Assign/2024
Maximum Marks : 100
Weightage : 30%
Last Dates for Submission : 30th April, 2024 (for January session)
31st October, 2024 (for July session)

This assignment has 10 questions of 8 Marks each, answer all questions. Rest 20 marks are
for viva voce. You may use illustrations and diagrams to enhance the explanations. Please go
through the guidelines regarding assignments given in the Programme Guide for the format of
presentation.

Q1: What is Exploratory Data Analysis (EDA) and why is it important in the data science workflow? What
are the key components of the data science process?

Q2: Discuss the implications of hypothesis testing results in decision-making. Provide examples of real-
world situations where statistical hypothesis testing is commonly used.

Q3: What is data preprocessing, and why is it a crucial step in the data science workflow? Why is it
important to identify and handle outliers in a dataset during data preprocessing?

Q4: Discuss the significance of the three Vs (Volume, Velocity, Variety) in the context of big data. Provide
examples of each of the three Vs in real-world scenarios. How does MapReduce facilitate parallel
processing of large datasets? Explain the functionality of the Map function in the MapReduce
paradigm with the help of an example.

Q5: Explain the purpose of Apache Hive in the Hadoop ecosystem. How does Spark address limitations of
the traditional MapReduce model?

Q6: Define NoSQL databases and explain the primary motivations behind their development. Provide
examples of scenarios where each type of NoSQL database is suitable.

Q7: How does collaborative filtering contribute to enhancing user experience and engagement in
recommendation systems? Provide examples of industries or platforms where collaborative filtering is
widely used.

Q8: What is a Data Stream Bloom Filter? Explain its primary purpose in data stream processing. Also,
introduce the Flajolet-Martin Algorithm and its role in estimating the cardinality of a data stream.

Q9: Describe the role of link analysis in the PageRank algorithm. How are links between web pages
interpreted in the context of PageRank?

Q10: Explain the concept of decision trees in classification. Provide an example of building and visualizing
a decision tree using R. How can K-means clustering be applied to a dataset in R?

CCS0021L (Information Management) (F4-Formative) Formative Assessment 4
No ratings yet
CCS0021L (Information Management) (F4-Formative) Formative Assessment 4
34 pages
Data Science Training Content Naresh IT Hyderabad
No ratings yet
Data Science Training Content Naresh IT Hyderabad
13 pages
MCA - NEW - IIIrd Semester
No ratings yet
MCA - NEW - IIIrd Semester
11 pages
Dpa-Set - 2
No ratings yet
Dpa-Set - 2
4 pages
MCS 226 (2025)
No ratings yet
MCS 226 (2025)
3 pages
IGNOU MCA Data Science and Big Data Previous Years Unsolved Papers MCS 226
From Everand
IGNOU MCA Data Science and Big Data Previous Years Unsolved Papers MCS 226
Manish Soni
No ratings yet
MCA - NEW 3rd Semester Assignment (January 2023)
No ratings yet
MCA - NEW 3rd Semester Assignment (January 2023)
11 pages
Data Science
No ratings yet
Data Science
31 pages
MCS 226
No ratings yet
MCS 226
4 pages
Block 1
No ratings yet
Block 1
4 pages
Unit I 2 Marks With Ans
No ratings yet
Unit I 2 Marks With Ans
7 pages
Untitled Document
No ratings yet
Untitled Document
8 pages
Imp Mid Sem
No ratings yet
Imp Mid Sem
8 pages
MCA - NEW - IIIrd Semester
No ratings yet
MCA - NEW - IIIrd Semester
12 pages
Big Data Analytics - Notes
No ratings yet
Big Data Analytics - Notes
13 pages
Set. No - 1 P18PECS031-Data Preparation and Analysis QP - PH.D.
No ratings yet
Set. No - 1 P18PECS031-Data Preparation and Analysis QP - PH.D.
22 pages
Chapter 2 - Intro. To Data Sciences
No ratings yet
Chapter 2 - Intro. To Data Sciences
27 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Set. No - 2 P18PECS031-Data Preparation & Analysis - PH.D.
No ratings yet
Set. No - 2 P18PECS031-Data Preparation & Analysis - PH.D.
17 pages
Prectical List MCA-304 (Data Science and Big Data)
No ratings yet
Prectical List MCA-304 (Data Science and Big Data)
1 page
Data Science
No ratings yet
Data Science
9 pages
DSBDA Merge PDF
No ratings yet
DSBDA Merge PDF
10 pages
Data Analytics
No ratings yet
Data Analytics
11 pages
Big Data
No ratings yet
Big Data
22 pages
2 DS # 1 Introduction To DS
No ratings yet
2 DS # 1 Introduction To DS
12 pages
Big Data Technologies Course Outline
No ratings yet
Big Data Technologies Course Outline
2 pages
Oops Lesson Plan
No ratings yet
Oops Lesson Plan
28 pages
BD Question Bank MCQ Answered
No ratings yet
BD Question Bank MCQ Answered
8 pages
Chapter - 2 - Data Science
No ratings yet
Chapter - 2 - Data Science
32 pages
Chapter Two Data Science: by Abdulaziz Oumer
No ratings yet
Chapter Two Data Science: by Abdulaziz Oumer
29 pages
IDS - Sem Ans Unit 1
No ratings yet
IDS - Sem Ans Unit 1
10 pages
7th Sem Syllabus
No ratings yet
7th Sem Syllabus
9 pages
BDA PYQ - Copyy
No ratings yet
BDA PYQ - Copyy
3 pages
BDA R22 Question Bank
No ratings yet
BDA R22 Question Bank
14 pages
Data Science MCQs Sample Mid2xlsx 2024 11-29-23!19!54
No ratings yet
Data Science MCQs Sample Mid2xlsx 2024 11-29-23!19!54
8 pages
2 Data Science
No ratings yet
2 Data Science
27 pages
CCS334 - Bda - QB - Sec A
No ratings yet
CCS334 - Bda - QB - Sec A
12 pages
Data Science
No ratings yet
Data Science
244 pages
1st Internal Solved
No ratings yet
1st Internal Solved
12 pages
Syllabus E63 Spring2016-2
No ratings yet
Syllabus E63 Spring2016-2
3 pages
MCA 3rd Semester Big Data Analytics Syllabus
No ratings yet
MCA 3rd Semester Big Data Analytics Syllabus
15 pages
Sem Bda Quest
No ratings yet
Sem Bda Quest
12 pages
DAI101 Detailed Syllabus
No ratings yet
DAI101 Detailed Syllabus
1 page
Islamic Answer
No ratings yet
Islamic Answer
27 pages
Module 1 - 1
No ratings yet
Module 1 - 1
48 pages
MCS 226
No ratings yet
MCS 226
6 pages
Information Technology s7 & s8
No ratings yet
Information Technology s7 & s8
317 pages
Apply R Tool For Developing and Evaluating Real Time Applications
No ratings yet
Apply R Tool For Developing and Evaluating Real Time Applications
1 page
May Jun 2024
No ratings yet
May Jun 2024
2 pages
DSBDAlab Manual
No ratings yet
DSBDAlab Manual
116 pages
Bda Nov-Dec 2022
No ratings yet
Bda Nov-Dec 2022
2 pages
Chapter Two
No ratings yet
Chapter Two
14 pages
MR20 Vi-I Syllabus
No ratings yet
MR20 Vi-I Syllabus
22 pages
Chapter - 2 - Data Science
No ratings yet
Chapter - 2 - Data Science
33 pages
BDA Question Bank
100% (1)
BDA Question Bank
10 pages
Revision
No ratings yet
Revision
19 pages
DSBDA Merged
No ratings yet
DSBDA Merged
13 pages
Recent Trend in IT IMP
No ratings yet
Recent Trend in IT IMP
26 pages
L8 Big Data Management en
No ratings yet
L8 Big Data Management en
58 pages
Dsbda QP
No ratings yet
Dsbda QP
12 pages
Data Science: Concepts, Strategies, and Applications
From Everand
Data Science: Concepts, Strategies, and Applications
Zemelak Goraga
No ratings yet
MCSL 222
No ratings yet
MCSL 222
1 page
MCSL 228
No ratings yet
MCSL 228
1 page
MCS-220 WEB Technology
No ratings yet
MCS-220 WEB Technology
1 page
MCS-231 Mobile Computing
No ratings yet
MCS-231 Mobile Computing
1 page
Unit 2
No ratings yet
Unit 2
69 pages
EX 10 Trigger
No ratings yet
EX 10 Trigger
4 pages
InstallationChecklist - Primtech - R16 - EN PDF
No ratings yet
InstallationChecklist - Primtech - R16 - EN PDF
7 pages
Ip Project
No ratings yet
Ip Project
27 pages
SnowflakeSQL Intro
No ratings yet
SnowflakeSQL Intro
33 pages
(IT) - Security Development Tool
No ratings yet
(IT) - Security Development Tool
19 pages
Project Introduction: Chinook Database
No ratings yet
Project Introduction: Chinook Database
42 pages
SQL (Structured Query Language) Is Used To Perform Operations On The Records Stored in The Database
No ratings yet
SQL (Structured Query Language) Is Used To Perform Operations On The Records Stored in The Database
35 pages
Subqueries
No ratings yet
Subqueries
32 pages
Unit 2 DBMS
No ratings yet
Unit 2 DBMS
38 pages
QB Test
No ratings yet
QB Test
19 pages
Database Management System Project
No ratings yet
Database Management System Project
8 pages
Timescaledb: SQL Made Scalable For Time-Series Data: 1 Background
No ratings yet
Timescaledb: SQL Made Scalable For Time-Series Data: 1 Background
7 pages
Chapter 2.2.Entity-Relationship-Model
No ratings yet
Chapter 2.2.Entity-Relationship-Model
44 pages
Main Phases of Database Design
No ratings yet
Main Phases of Database Design
2 pages
What Is Information Schema in Snowflake
No ratings yet
What Is Information Schema in Snowflake
7 pages
Install Oracle in Silent Mode 12C Release 2
No ratings yet
Install Oracle in Silent Mode 12C Release 2
27 pages
Mirroring PPT
No ratings yet
Mirroring PPT
6 pages
Typeface - Project Assignment Questions
No ratings yet
Typeface - Project Assignment Questions
3 pages
Poland JPK - VDEK - SD Enhancement
No ratings yet
Poland JPK - VDEK - SD Enhancement
5 pages
Ax+7.0+Admin+Guide+ +Installing+Ax
No ratings yet
Ax+7.0+Admin+Guide+ +Installing+Ax
135 pages
PSK DWH Material
No ratings yet
PSK DWH Material
134 pages
Task 1 Description
No ratings yet
Task 1 Description
7 pages
Student Attendance Management Sysytem
No ratings yet
Student Attendance Management Sysytem
19 pages
Spark SQL
100% (1)
Spark SQL
25 pages
Requirements Gathering Stage
No ratings yet
Requirements Gathering Stage
2 pages
Questions
No ratings yet
Questions
3 pages
NoSQL Module 2
No ratings yet
NoSQL Module 2
76 pages
SQL Notes Grade 10 - 100428
No ratings yet
SQL Notes Grade 10 - 100428
6 pages

MCS-226 Data Science and Big Data

Uploaded by

MCS-226 Data Science and Big Data

Uploaded by

Course Code : MCS-226

Course Title : Data Science & Big Data

You might also like