Data Preparation and Analysis (MCST-231)

This document is an examination paper for the II Semester of the M.Tech program in Computer Science & Engineering, focusing on Data Preparation and Analysis. It consists of five questions, each with multiple parts covering topics such as scalability issues, Big Data, Hadoop, data cleaning methods, and data visualization. Students are required to attempt all questions, with equal marks allocated to each part.

Uploaded by

swastikiit2023

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views1 page

Data Preparation and Analysis (MCST-231)

Uploaded by

swastikiit2023

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

Sub Code: MCST-231 ROLL NO……………..……………..

II SEMESTER EXAMINATION, 2022 – 23

Year: 1st, Programme: M.Tech,
Branch: Computer Science & Engineering
Subject: Data Preparation and Analysis
Duration: 3:00 hrs Max Marks: 100
Note: - Attempt all questions. All Questions carry equal marks. In case of any ambiguity or missing data,
the same may be assumed and state the assumption made in the answer.

Q 1. Answer any four parts of the following. 5x4=20

a) Explain the Scalability issues in data preparation.
b) Write the overview of preparing data tables.
c) Explain Regression ANOVA.
d) Discuss about Big Data and its importance.
e) Explain the working of Hadoop.
f) Explain predictive analysis with suitable example.
Q 2. Answer any four parts of the following. 5x4=20
a) Explain the 4 V’s of Big Data.
b) Describe about Converting Continuous Data to Categories.
c) What are the data cleaning methods?
d) Discuss about EDA.
e) Explain Data Visualization with suitable example
f) Differentiate between correlation and simple linear regression.
Q 3. Answer any two parts of the following. 10x2= 20
a) Explain creating the components of Hadoop Map reduce jobs
b) Discuss the installation of and running Hive QL.
c) Explain Oracle Big Data in detail.
Q 4. Answer any two parts of the following. 10x2= 20
a) Explain investigating the Hadoop Distributed File System Selecting appropriate
execution modes: local, pseudo-distributed, fully distributed.
b) Explain Inter- and Trans-Firewall Analytics also explain information
management
c) Describe with an example of Geolocated data visualization.
Q 5. Answer any two parts of the following. 10x2= 20
a) Explain how to deal with the missing data in data cleaning process?
b) Explain distributing data processing across server farms in detail with example
c) Explain how to Visualize similarities between social network groups using
multidimensional scaling (MDS)

**********

Active Directory BloodHound
No ratings yet
Active Directory BloodHound
139 pages
Data Lakehouse, Data Mesh, and Data Fabric - SqlBits
No ratings yet
Data Lakehouse, Data Mesh, and Data Fabric - SqlBits
35 pages
Bda Pyq
No ratings yet
Bda Pyq
4 pages
Last Year Question Paper - Big Data - (BCS 061)
No ratings yet
Last Year Question Paper - Big Data - (BCS 061)
9 pages
MCA - BigData Notes
No ratings yet
MCA - BigData Notes
136 pages
PYTHON PROGRAMMING (M.Tech)
No ratings yet
PYTHON PROGRAMMING (M.Tech)
2 pages
Set. No - 1 P18PECS031-Data Preparation and Analysis QP - PH.D.
No ratings yet
Set. No - 1 P18PECS031-Data Preparation and Analysis QP - PH.D.
22 pages
Set. No - 2 P18PECS031-Data Preparation & Analysis - PH.D.
No ratings yet
Set. No - 2 P18PECS031-Data Preparation & Analysis - PH.D.
17 pages
Department of Computer Science and Engineering Question Bank B.TECH (R17) (Iv Year - I Sem) (2020-21)
No ratings yet
Department of Computer Science and Engineering Question Bank B.TECH (R17) (Iv Year - I Sem) (2020-21)
67 pages
DS MCQ Semester Suggesstion
No ratings yet
DS MCQ Semester Suggesstion
26 pages
3.3x-Modeling Data Exercise
No ratings yet
3.3x-Modeling Data Exercise
18 pages
AS400 Basics FAQs
100% (2)
AS400 Basics FAQs
140 pages
PRACTICAL CS XII MySQL 2022-23
No ratings yet
PRACTICAL CS XII MySQL 2022-23
18 pages
Dpa-Set - 2
No ratings yet
Dpa-Set - 2
4 pages
Gujarat Technological University
No ratings yet
Gujarat Technological University
1 page
1234 Yrf
No ratings yet
1234 Yrf
72 pages
Environmental Studies (BEST-101)
No ratings yet
Environmental Studies (BEST-101)
1 page
DSBDA Merge PDF
No ratings yet
DSBDA Merge PDF
10 pages
3 Hours / 70 Marks: Instructions
100% (1)
3 Hours / 70 Marks: Instructions
2 pages
Dsbda QP
No ratings yet
Dsbda QP
12 pages
Data Definition Language (DDL) Commands: Sql-Lab 1
No ratings yet
Data Definition Language (DDL) Commands: Sql-Lab 1
5 pages
Figures For Chapter 8 Introduction To Data Mining: by Tan, Steinbach, Kumar
No ratings yet
Figures For Chapter 8 Introduction To Data Mining: by Tan, Steinbach, Kumar
41 pages
Combined Question Bank 22684
No ratings yet
Combined Question Bank 22684
3 pages
Data Analytics V.IMP + PYQs (Edushine Classes)
No ratings yet
Data Analytics V.IMP + PYQs (Edushine Classes)
8 pages
NCERT Class 10 Unit 5 Answer Key
No ratings yet
NCERT Class 10 Unit 5 Answer Key
7 pages
A Customized Data Recovery Tool
No ratings yet
A Customized Data Recovery Tool
10 pages
Unit 4 - Linux Forensics
No ratings yet
Unit 4 - Linux Forensics
6 pages
AIX Manual Sysmgt
No ratings yet
AIX Manual Sysmgt
24 pages
Big Data Processing Concepts
No ratings yet
Big Data Processing Concepts
9 pages
DAN PYQ 3 Set
No ratings yet
DAN PYQ 3 Set
6 pages
Suggestions of Data Analytics For Fianl Exam
No ratings yet
Suggestions of Data Analytics For Fianl Exam
3 pages
Data Science and Big Data Analysis
No ratings yet
Data Science and Big Data Analysis
8 pages
3 Hours / 70 Marks: Seat No
No ratings yet
3 Hours / 70 Marks: Seat No
2 pages
Merged
No ratings yet
Merged
7 pages
Data Analytics and R Programming - Cmca22et3
No ratings yet
Data Analytics and R Programming - Cmca22et3
3 pages
M.SC - ITSem II Big Data Analytics R2020
No ratings yet
M.SC - ITSem II Big Data Analytics R2020
2 pages
CS 3306 01 Written Assignment Unit 2
No ratings yet
CS 3306 01 Written Assignment Unit 2
5 pages
Docu51453 - Data Domain DD2200 and DD2500 Systems Head Unit Expansion Guide
No ratings yet
Docu51453 - Data Domain DD2200 and DD2500 Systems Head Unit Expansion Guide
12 pages
KIT 601 - DA PUE - Question Paper - Updated
No ratings yet
KIT 601 - DA PUE - Question Paper - Updated
2 pages
QuestionBank DataAnalytics
No ratings yet
QuestionBank DataAnalytics
2 pages
Lab Exercise#3
No ratings yet
Lab Exercise#3
9 pages
Bda Nov-Dec 2022
No ratings yet
Bda Nov-Dec 2022
2 pages
Mining CN
No ratings yet
Mining CN
3 pages
Environmental Studies (Aht-001)
No ratings yet
Environmental Studies (Aht-001)
1 page
Big Data Question Paper
No ratings yet
Big Data Question Paper
1 page
BDA Merged
No ratings yet
BDA Merged
7 pages
Cyber Security (CST-316)
No ratings yet
Cyber Security (CST-316)
1 page
DataBase Management (VBSPU 4th Sem)
No ratings yet
DataBase Management (VBSPU 4th Sem)
108 pages
Big Data Analytics (BDA) UNIT 1: Introduction To Big Data
No ratings yet
Big Data Analytics (BDA) UNIT 1: Introduction To Big Data
3 pages
Big Data Analytics April 2023
No ratings yet
Big Data Analytics April 2023
4 pages
Dsbda Nov2023
No ratings yet
Dsbda Nov2023
3 pages
Sppu Dsbda QP Nov - Dec - 2023
No ratings yet
Sppu Dsbda QP Nov - Dec - 2023
3 pages
Bda Model Aids 1
No ratings yet
Bda Model Aids 1
4 pages
Readme
No ratings yet
Readme
4 pages
Da Kit 601 It3
No ratings yet
Da Kit 601 It3
2 pages
Big 22
No ratings yet
Big 22
2 pages
Winter 2024
No ratings yet
Winter 2024
2 pages
Iscsi Configuration
No ratings yet
Iscsi Configuration
3 pages
Spark Cheatsheet - BEPEC
No ratings yet
Spark Cheatsheet - BEPEC
1 page
Online Toy Store Management System: TCS Internal
No ratings yet
Online Toy Store Management System: TCS Internal
3 pages
20SDS803 - Big Data Analytics
No ratings yet
20SDS803 - Big Data Analytics
2 pages
Mini Project Report
No ratings yet
Mini Project Report
10 pages
KDS601 Big Data and Analytics
No ratings yet
KDS601 Big Data and Analytics
1 page
Data Analytics Analysis
No ratings yet
Data Analytics Analysis
8 pages
Database Systems CSE 414: Announcements
No ratings yet
Database Systems CSE 414: Announcements
7 pages
Kcs051 Data Analytics
No ratings yet
Kcs051 Data Analytics
2 pages
AD 1304 - CGPA - (21) (3CR) ) : Pre-Processing
No ratings yet
AD 1304 - CGPA - (21) (3CR) ) : Pre-Processing
2 pages
KCS061 Big Data
No ratings yet
KCS061 Big Data
2 pages
Da 2022-23 Aktu Paper
No ratings yet
Da 2022-23 Aktu Paper
2 pages
FND Global and FND Profile PDF
No ratings yet
FND Global and FND Profile PDF
4 pages
GTU Big Data Analysis Question Paper Summer 2022
No ratings yet
GTU Big Data Analysis Question Paper Summer 2022
1 page
Summer 2024
No ratings yet
Summer 2024
1 page
Dsbda May2022
No ratings yet
Dsbda May2022
2 pages
CEGP013091: (5353) - 600 T.E. (I.T) (End-Sem) Data Science and Big Data Analytics (2015 Pattern)
No ratings yet
CEGP013091: (5353) - 600 T.E. (I.T) (End-Sem) Data Science and Big Data Analytics (2015 Pattern)
2 pages
Gujarat Technological University
No ratings yet
Gujarat Technological University
1 page
ST1 - 5th Sem
No ratings yet
ST1 - 5th Sem
8 pages
BIT - Practical Work Sample2021
No ratings yet
BIT - Practical Work Sample2021
2 pages
Big Data Analytics
No ratings yet
Big Data Analytics
1 page
DBMS (R20) Unit - 1
No ratings yet
DBMS (R20) Unit - 1
14 pages
Winter 2023
No ratings yet
Winter 2023
1 page
BDS SampleQP EC2R
No ratings yet
BDS SampleQP EC2R
2 pages
Linux Chown Command: Updated: 01/24/2018 by Computer Hope
No ratings yet
Linux Chown Command: Updated: 01/24/2018 by Computer Hope
9 pages
Ivth Year, B.Tech Cs&E Big Data Processing: Odd Semester Examination, 2023 - 24
No ratings yet
Ivth Year, B.Tech Cs&E Big Data Processing: Odd Semester Examination, 2023 - 24
1 page
Data Analytics Kit 601
No ratings yet
Data Analytics Kit 601
2 pages
May Jun 2022
No ratings yet
May Jun 2022
2 pages
TMC 304
No ratings yet
TMC 304
2 pages
Project 1
No ratings yet
Project 1
7 pages
Btech Oe 8 Sem Big Data Koe 097 2023
No ratings yet
Btech Oe 8 Sem Big Data Koe 097 2023
2 pages
Data Analytics Kit601
No ratings yet
Data Analytics Kit601
2 pages
Introduction To Data Analytics and Visualization Question Paper
100% (1)
Introduction To Data Analytics and Visualization Question Paper
2 pages
2022 Dec. ITT401-A
No ratings yet
2022 Dec. ITT401-A
2 pages
Idoc Basics For Functional Consultants: Share Share
No ratings yet
Idoc Basics For Functional Consultants: Share Share
26 pages
Excel Ninja Tracker
No ratings yet
Excel Ninja Tracker
5 pages
IGNOU MCA Data Science and Big Data Previous Years Unsolved Papers MCS 226
From Everand
IGNOU MCA Data Science and Big Data Previous Years Unsolved Papers MCS 226
Manish Soni
No ratings yet

Data Preparation and Analysis (MCST-231)

Uploaded by

Data Preparation and Analysis (MCST-231)

Uploaded by

Sub Code: MCST-231 ROLL NO……………..……………..

II SEMESTER EXAMINATION, 2022 – 23

Q 1. Answer any four parts of the following. 5x4=20

You might also like