Open navigation menu

Scribd

0% found this document useful (0 votes)

8 views3 pages

2024 May Data Science and Big Data Analytics Ds Bda Pattern 2019

The document is an examination paper for a Data Science and Big Data Analytics course, consisting of 8 questions. Candidates must answer specific pairs of questions and are allowed to use scientific calculators. The paper covers various topics including data preparation, regression analysis, clustering, and the Hadoop ecosystem.

Uploaded by

swaroopsandanshive

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views3 pages

2024 May Data Science and Big Data Analytics Ds Bda Pattern 2019

The document is an examination paper for a Data Science and Big Data Analytics course, consisting of 8 questions. Candidates must answer specific pairs of questions and are allowed to use scientific calculators. The paper covers various topics including data preparation, regression analysis, clustering, and the Hadoop ecosystem.

Uploaded by

swaroopsandanshive

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Total No. of Questions : 8] SEAT No.

8
23
PB4430 [6262]-43 [Total No. of Pages : 3

ic-
tat
T.E. (Computer Engineering)

6s
DATA SCIENCE AND BIG DATA ANALYTICS

2:0
02 91
(2019 Pattern) (Semester- II) (310251)

9:4
0
40
Time : 2½ Hours ] 5/0 13 [Max. Marks : 70
0
Instructions to the candidates:
5/2
.23 GP

1) Answer Q.1 or Q.2, Q.3 or Q.4, Q.5 or Q.6, Q.7 or Q.8.

2) Neat diagrams must be drawn wherever necessary.
E
81

8
3) Figures to the right side indicate full marks.
C

23
ic-
4) Assume suitable data if necessary.
16

tat
5) Use of Scientific Calculator is permitted.
8.2

6s
.24

2:0
Q1) a) What is the data Preparation phase in Data Analytics Lifecycle. What is
91
49

9:4
the Analytics Sandbox and ETLT process in this phase? [8]
30
40

b) List out different stakeholders of an analytics project. What they usually

01
02

expect at the conclusion (key outputs) of a project? [8]

5/2
GP

OR
5/0
CE
81

8
Q2) a) List out the activities to be carried out in model planning and model

23
.23

building phase. What are different tools used for these phases? [8]
ic-
16

tat
b) What is linear regression, and what are its primary objectives? What is
8.2

6s

the difference between simple linear regression and multiple linear

.24

2:0

regression? How do you evaluate the performance of linear regression?[8]

91
49

9:4
30
40

Q3) a) What is logistic regression, and how does it differ from linear regression?
01
02

What is the sigmoid function, and what role does it play in logistic
5/2

regression? [9]
GP
5/0

b) Suppose you are given a dataset containing information about whether

CE
81

emails are spam or not spam, along with two features: the presence of
the word "offer" (1 for present, 0 for absent) and the presence of the
.23

word "free" (1 for present, 0 for absent). You are tasked with classifying
16

a new email with the following feature values: "offer"=1 and "free"=1.[9]
8.2
.24
49

P.T.O.
Given the training dataset:

8
23
Email Offer Free Spam

ic-
tat
1 1 0 No

6s
2 0 1 Yes

2:0
02 91
3 1 1 Yes

9:4
0
40
4 0 1 No
5/0 13
5 1 1 Yes
0
5/2
.23 GP

Calculate the probability that the new email is spam using Naive Bayes.
E
81

8
C

23
OR

ic-
16

tat
Q4) a) How does the Apriori algorithm discover frequent itemsets in a dataset?
8.2

6s
What is the role of support and confidence in the context of association
.24

2:0
rule mining using the Apriori algoritm? [9]
91
49

9:4
b) Explain the process of building a decision tree? What are the criteria
30
40

used for splitting nodes in a decision tree? [9]

01
02
5/2
GP
5/0

Q5) a) Suppose you have the following dataset containing the coordinates of
CE

points in a 2-dimensional space: [9]

81

8
23
.23

Point X Coordinate Y Coordinate

ic-
16

tat
A 2 3
8.2

6s

B 4 7
.24

2:0
91

C 3 5
49

9:4
30
40

D 6 9
01
02

E 8 6
5/2
GP

F 7 8
5/0
CE

Perform K-means clustering on this dataset with K = 2. Assume the

81

initial centroids to be (2,3) and (8,6). Compute the new centroids after
.23

each iteration until convergence, and assign points to their nearest

16

centroids.
8.2
.24
49

[6262]-43 2
b) How do you handle noise and irrelevant information in text data during

8
23
preprocessing? Explain the terms bag of words and TF IDF in text

ic-
analytics. [9]

tat
6s
OR

2:0
02 91
Q6) a) Explain how hierarchical clustering can be used for visualizing hierarchical

9:4
relationships in data with suitable example? What are some real-world

0
40
applications of hierarchical clustering?
5/0 13
0 [9]

b) What is the holdout method, and how does it work? Explain the difference
5/2
.23 GP

between training set, validation set, and test set in the holdout method.[9]
E
81

8
C

23
ic-
Q7) a) What is a histogram? How is it used to visualize the distribution of data?
16

tat
How is it different from a density plot? [9]
8.2

6s
.24

2:0
b) What is the Hadoop ecosystem, and what are its primary components?
91
49

9:4
What is MapReduce, and how does it fit into the Hadoop ecosystem?[9]
30
40

OR
01
02
5/2

Q8) a) What is a box plot? Explain the different components of a box plot?
GP
5/0

How do you interpret the median, quartiles, and whiskers in a box plot?
CE

What does the interquartile range (IQR) represent in a box plot? [9]
81

8
23
.23

b) Explain the role of Apache Pig in data processing workflows on Hadoop?

ic-
16

What is Apache Spark, and how does it complement Hadoop for big
tat
8.2

data processing? [9]

6s
.24

2:0
91
49

9:4
30
40


01
02
5/2
GP
5/0
CE
81
.23
16
8.2
.24
49

[6262]-43 3

You might also like

Company Wise Data Science Interview Questions
100% (2)
Company Wise Data Science Interview Questions
39 pages
DSBDA Merged
No ratings yet
DSBDA Merged
13 pages
Ids Past Papers Merged
No ratings yet
Ids Past Papers Merged
62 pages
May Jun 2022
No ratings yet
May Jun 2022
2 pages
Dsbda May2022
No ratings yet
Dsbda May2022
2 pages
Bda Answers
No ratings yet
Bda Answers
18 pages
Be - Artificial Intelligence and Data Science - Semester 6 - 2024 - May - Data Science 2019 Pattern
No ratings yet
Be - Artificial Intelligence and Data Science - Semester 6 - 2024 - May - Data Science 2019 Pattern
2 pages
Ds 2
No ratings yet
Ds 2
2 pages
BigDatal PDF
No ratings yet
BigDatal PDF
50 pages
Dsa - DK Question Paper
No ratings yet
Dsa - DK Question Paper
4 pages
Data Science QnA
No ratings yet
Data Science QnA
15 pages
CMT308 A
No ratings yet
CMT308 A
6 pages
Da Insem All
No ratings yet
Da Insem All
217 pages
Vani Vidyalaya Senior Secondary and Junior College: Answer
No ratings yet
Vani Vidyalaya Senior Secondary and Junior College: Answer
7 pages
Be - Artificial Intelligence and Data Science - Semester 6 - 2023 - May - Data Science 2019 Pattern
No ratings yet
Be - Artificial Intelligence and Data Science - Semester 6 - 2023 - May - Data Science 2019 Pattern
2 pages
Ds 1
No ratings yet
Ds 1
2 pages
DSDBA Sppu Dsbda QP
No ratings yet
DSDBA Sppu Dsbda QP
11 pages
Datanest - Data Science Interview
No ratings yet
Datanest - Data Science Interview
19 pages
AIL Quiz
No ratings yet
AIL Quiz
30 pages
AIL Quiz Loc
No ratings yet
AIL Quiz Loc
33 pages
Mcqs 1
No ratings yet
Mcqs 1
34 pages
Data Science Exam Material
No ratings yet
Data Science Exam Material
10 pages
Mca Apr-2024 (2020 Pattern)
No ratings yet
Mca Apr-2024 (2020 Pattern)
11 pages
M.C.A. (2020 Pattern)
No ratings yet
M.C.A. (2020 Pattern)
44 pages
640005
No ratings yet
640005
4 pages
Data Science Mcqs - Hamza Zahoor
No ratings yet
Data Science Mcqs - Hamza Zahoor
9 pages
DS MCQs
No ratings yet
DS MCQs
11 pages
Soal CISDM
No ratings yet
Soal CISDM
3 pages
Top Data Science Interview Questions and Answers in 2023 PDF
100% (1)
Top Data Science Interview Questions and Answers in 2023 PDF
14 pages
Endsem May Jun 2024
No ratings yet
Endsem May Jun 2024
2 pages
Wa0034.
No ratings yet
Wa0034.
2 pages
Artificial Intelligence Code 843
No ratings yet
Artificial Intelligence Code 843
12 pages
Question Big Data-1
No ratings yet
Question Big Data-1
11 pages
Basic Concepts of BDA
No ratings yet
Basic Concepts of BDA
2 pages
21ad62 Model Paper
No ratings yet
21ad62 Model Paper
38 pages
Artificial Intelligence: Book 10 Mcqs Unit 2: Ai Project Cycle
No ratings yet
Artificial Intelligence: Book 10 Mcqs Unit 2: Ai Project Cycle
6 pages
Dmbi Mcqs Mcqs For Data Mining and Business Intelligence
No ratings yet
Dmbi Mcqs Mcqs For Data Mining and Business Intelligence
24 pages
IT6006-Data Analytics Question Bank
No ratings yet
IT6006-Data Analytics Question Bank
7 pages
Alm 8 (Bda)
No ratings yet
Alm 8 (Bda)
5 pages
BE Information Technology 0
No ratings yet
BE Information Technology 0
655 pages
Adt308 Comprehensive Course Work, December 2024
No ratings yet
Adt308 Comprehensive Course Work, December 2024
6 pages
Question Bank For All 5 Units: Department of Computer Science and Engineering & Department of Information Technology
No ratings yet
Question Bank For All 5 Units: Department of Computer Science and Engineering & Department of Information Technology
14 pages
It 6001 Da 2 Marks With Answer PDF
No ratings yet
It 6001 Da 2 Marks With Answer PDF
10 pages
Previous Year Paper - Sem 7
No ratings yet
Previous Year Paper - Sem 7
12 pages
BIPS - Grade IX - CH-04 B
No ratings yet
BIPS - Grade IX - CH-04 B
10 pages
DSBDA Easy Solution 2019
No ratings yet
DSBDA Easy Solution 2019
58 pages
AI CT3 MCQs
No ratings yet
AI CT3 MCQs
5 pages
SS2 AI Set2
No ratings yet
SS2 AI Set2
5 pages
B.E. (Electronics & Computer Engineering) Data Science & Visualization (2019 Pattern) (Semester-VII) (410341)
No ratings yet
B.E. (Electronics & Computer Engineering) Data Science & Visualization (2019 Pattern) (Semester-VII) (410341)
2 pages
CT-2 - 6th Sem
No ratings yet
CT-2 - 6th Sem
6 pages
BD Question Bank MCQ Answered
No ratings yet
BD Question Bank MCQ Answered
8 pages
Data Science Questions and Answers - Letsfindcourse
100% (1)
Data Science Questions and Answers - Letsfindcourse
5 pages
Data Engineering Vs Data Science
No ratings yet
Data Engineering Vs Data Science
26 pages
Revision Worksheet Ai - Grade Xii 2025 Ans Key
No ratings yet
Revision Worksheet Ai - Grade Xii 2025 Ans Key
14 pages
Sem 7-Endsem Paper
No ratings yet
Sem 7-Endsem Paper
7 pages
May Jun 2024
No ratings yet
May Jun 2024
2 pages
Data Science
No ratings yet
Data Science
10 pages
D-DS-FN-23 Dell Data Science Foundations 2023 Updated Dumps
No ratings yet
D-DS-FN-23 Dell Data Science Foundations 2023 Updated Dumps
16 pages
DA QnBank Full 17jan22 NoKey
No ratings yet
DA QnBank Full 17jan22 NoKey
16 pages
IGNOU MCA Cloud Computing and IoT Previous year Unsolved Papers MCS 227
From Everand
IGNOU MCA Cloud Computing and IoT Previous year Unsolved Papers MCS 227
Manish Soni
No ratings yet
78 - Rutuja Surve - AISC - Exp1
No ratings yet
78 - Rutuja Surve - AISC - Exp1
5 pages
Libopenabe v1.0.0 Design
No ratings yet
Libopenabe v1.0.0 Design
30 pages
(Java - C++ - Python) One Pass O (N) - LeetCode Discuss
No ratings yet
(Java - C++ - Python) One Pass O (N) - LeetCode Discuss
1 page
HW 5 Soln
100% (1)
HW 5 Soln
12 pages
Decision Trees Another Example Problem
No ratings yet
Decision Trees Another Example Problem
6 pages
Topic 1 - Basic Notions
No ratings yet
Topic 1 - Basic Notions
36 pages
Postal: Computer Science & IT
No ratings yet
Postal: Computer Science & IT
2 pages
Null 2
No ratings yet
Null 2
8 pages
IV-Sem-MACHINE LEARNING
No ratings yet
IV-Sem-MACHINE LEARNING
2 pages
I 24 Nov 2023 Lab Exam Questions Material
No ratings yet
I 24 Nov 2023 Lab Exam Questions Material
2 pages
Lecture 5
No ratings yet
Lecture 5
114 pages
Spam Detection in Text Using Machine Learning 1
No ratings yet
Spam Detection in Text Using Machine Learning 1
85 pages
Finding Probability
No ratings yet
Finding Probability
5 pages
Figure 1 Original Image
No ratings yet
Figure 1 Original Image
12 pages
Sliding Mode Controller For PWM Based Buck-Boost DC/DC Converter As State Space Averaging Method in Continuous Conduction Mode
No ratings yet
Sliding Mode Controller For PWM Based Buck-Boost DC/DC Converter As State Space Averaging Method in Continuous Conduction Mode
5 pages
GPG SetPref
No ratings yet
GPG SetPref
3 pages
Problem Sheet 1 Answers
No ratings yet
Problem Sheet 1 Answers
4 pages
How To Solve Age Problems Part 1: The Number Word Problem Series
No ratings yet
How To Solve Age Problems Part 1: The Number Word Problem Series
4 pages
Process Control Systems
100% (1)
Process Control Systems
3 pages
MFCC CZT
No ratings yet
MFCC CZT
10 pages
Malaku
100% (1)
Malaku
20 pages
9036 - English
No ratings yet
9036 - English
2 pages
Problem Proposal: Flipping Bits in A String
No ratings yet
Problem Proposal: Flipping Bits in A String
3 pages
Algoritma Dinic
No ratings yet
Algoritma Dinic
4 pages
DIP Final
No ratings yet
DIP Final
3 pages
Physics Homework Rubric
No ratings yet
Physics Homework Rubric
1 page
Managing and Summarizing Large Excel Datasets: Pivottable Calculations
No ratings yet
Managing and Summarizing Large Excel Datasets: Pivottable Calculations
2 pages
Deep Learning Lecture 6
No ratings yet
Deep Learning Lecture 6
8 pages
Ada 3
No ratings yet
Ada 3
2 pages
FT of AI
No ratings yet
FT of AI
109 pages