Prectical List MCA-304 (Data Science and Big Data)

The document outlines a practical list for the Third Semester MCA course at LNCT University, focusing on Data Science and Big Data. It includes tasks such as exploratory data analysis, risk evaluation in big data environments, statistical calculations in R, model building, and performance evaluation using various data processing tools. The exercises aim to enhance students' understanding of data handling, analysis, and visualization techniques in large datasets.

Uploaded by

anandiit8

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views1 page

Prectical List MCA-304 (Data Science and Big Data)

Uploaded by

anandiit8

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

LNCT UNIVERSITY, BHOPAL

Third –Semester
MCA- 304
Introduction to Data Science and Big Data
Prectical List

1. Use a large dataset to perform exploratory data analysis (EDA). Analyze the relationships
between variables such as age, gender, and survival rate. What patterns do you observe?
2. Using a Big Data tool (like Hadoop or Spark), evaluate the risks associated with handling large
datasets. How would you mitigate the risks of data privacy and security in a large-scale data
environment?

3. Load a dataset into R and calculate the mean, median, mode, variance, and standard deviation.
Analyze how these measures describe the distribution of the data.
4. Using R, create a scatter plot with a regression line to visualize the relationship between two
variables (e.g., height and weight). How does the regression line help predict outcomes?

5. Apply a linear regression model to a dataset and evaluate the model's performance using
metrics such as R-squared and RMSE (Root Mean Square Error). What does this tell you about
the model's accuracy?
6. Build a classification model in R using logistic regression to predict whether a customer will
buy a product based on demographic factors. How would you evaluate the model's
effectiveness?

7. Using Hadoop and HDFS, perform a basic data storage and retrieval task on a large dataset
(e.g., log files). Analyze the performance differences between HDFS and traditional RDBMS
for large-scale data.
8. Implement a MapReduce algorithm in Hadoop to calculate the average transaction value from a
dataset of customer transactions. How would you implement a distributed algorithm using
MapReduce?

9. Use stream processing tools to analyze a continuous stream of data, such as real-time web
traffic. How would you filter the stream to extract useful information?
10. Implement a decaying window algorithm in stream analytics to track the moving
average of a dataset over time. How would you visualize and interpret this trend in real-time?

Ocs353dsf Unit Wise Notes
100% (2)
Ocs353dsf Unit Wise Notes
121 pages
Data Science Training in Naresh I Technologies
100% (3)
Data Science Training in Naresh I Technologies
18 pages
Data Science Training Content Naresh IT Hyderabad
No ratings yet
Data Science Training Content Naresh IT Hyderabad
13 pages
TE Computer 2019 Course 22.06.2021-52-99
No ratings yet
TE Computer 2019 Course 22.06.2021-52-99
48 pages
Data Scientist RoadMap
No ratings yet
Data Scientist RoadMap
8 pages
Ids Unit 1,2,3,4 & 5
No ratings yet
Ids Unit 1,2,3,4 & 5
117 pages
Data Science and Big Data Analytics
No ratings yet
Data Science and Big Data Analytics
2 pages
Bca Bigdata Fifth - Sem Approved Syllabus
No ratings yet
Bca Bigdata Fifth - Sem Approved Syllabus
23 pages
Computer Skills - Eng Only-2024
No ratings yet
Computer Skills - Eng Only-2024
69 pages
DSBDAlab Manual
No ratings yet
DSBDAlab Manual
116 pages
1152CS239-Intro. To Data Science-Syllabus
No ratings yet
1152CS239-Intro. To Data Science-Syllabus
6 pages
DSBDA Manual
No ratings yet
DSBDA Manual
76 pages
MCS-226 Data Science and Big Data
No ratings yet
MCS-226 Data Science and Big Data
1 page
Big Data Data Analytics
No ratings yet
Big Data Data Analytics
5 pages
DS&BD Lab Manul
No ratings yet
DS&BD Lab Manul
98 pages
Blda Pract 2024
No ratings yet
Blda Pract 2024
59 pages
2022-23-BDA-LAB Manual
No ratings yet
2022-23-BDA-LAB Manual
59 pages
Bda Skill
No ratings yet
Bda Skill
34 pages
CS8091 BDA Unit1
No ratings yet
CS8091 BDA Unit1
63 pages
Data Science Syl Lab Us
No ratings yet
Data Science Syl Lab Us
4 pages
Essentials of Big Data Griet
No ratings yet
Essentials of Big Data Griet
2 pages
Old M.tech BDA Curriculum
No ratings yet
Old M.tech BDA Curriculum
32 pages
Data Science Immersive Syllabus: Course
No ratings yet
Data Science Immersive Syllabus: Course
4 pages
PINCLICK
No ratings yet
PINCLICK
12 pages
DSBDAL Lab Manual
No ratings yet
DSBDAL Lab Manual
26 pages
Edit Ds
No ratings yet
Edit Ds
37 pages
Lab Manual FOR CSE 355/ Data Science Professional Certification Name
No ratings yet
Lab Manual FOR CSE 355/ Data Science Professional Certification Name
20 pages
MCA-SEM-III-Syllabus Mobile Computing
No ratings yet
MCA-SEM-III-Syllabus Mobile Computing
12 pages
Pre-M.Sc. (3 Months Before Starting M.SC.) : Goal
No ratings yet
Pre-M.Sc. (3 Months Before Starting M.SC.) : Goal
15 pages
AIML Curriculum
No ratings yet
AIML Curriculum
25 pages
AIADS 7th Sem Syllabus Signed
No ratings yet
AIADS 7th Sem Syllabus Signed
19 pages
GCD Detailed Syllabus
No ratings yet
GCD Detailed Syllabus
24 pages
AIML 2nd Year
No ratings yet
AIML 2nd Year
5 pages
PDS Merged New
No ratings yet
PDS Merged New
19 pages
Sample Tlep
No ratings yet
Sample Tlep
12 pages
Account Management (GDCE) 1
No ratings yet
Account Management (GDCE) 1
3 pages
DS Project Titles
No ratings yet
DS Project Titles
5 pages
Data Science
No ratings yet
Data Science
9 pages
Coursera Report Ishaan Taneja 1000016551
No ratings yet
Coursera Report Ishaan Taneja 1000016551
7 pages
Diploma in Data Science Online Training Content by MR Navin NareshIT Modified
No ratings yet
Diploma in Data Science Online Training Content by MR Navin NareshIT Modified
10 pages
M.SC - II Sem - Curriculum and Syllabus.
No ratings yet
M.SC - II Sem - Curriculum and Syllabus.
10 pages
BIG Data Analytics 21CSH-471: Computer Science & Engineering
No ratings yet
BIG Data Analytics 21CSH-471: Computer Science & Engineering
7 pages
DSI Detailed Syllabus v10.2
No ratings yet
DSI Detailed Syllabus v10.2
4 pages
Skill Based Projects - Data - Science (See List On Last Page)
No ratings yet
Skill Based Projects - Data - Science (See List On Last Page)
4 pages
Coursera Report Divyansh Sahai CSF443
No ratings yet
Coursera Report Divyansh Sahai CSF443
7 pages
Minor Cse Dsv2
No ratings yet
Minor Cse Dsv2
7 pages
24CSPPC106 - Essentials of Data Science
No ratings yet
24CSPPC106 - Essentials of Data Science
3 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Data Analytics TOC
No ratings yet
Data Analytics TOC
6 pages
Instructions For Big Data Assignment
No ratings yet
Instructions For Big Data Assignment
5 pages
Final Data Science Course (Practicals)
No ratings yet
Final Data Science Course (Practicals)
5 pages
Set 2
No ratings yet
Set 2
3 pages
Big Data Analytics Lab
No ratings yet
Big Data Analytics Lab
2 pages
4 III BTech Minor DS Courses Syllabus
No ratings yet
4 III BTech Minor DS Courses Syllabus
5 pages
CIT 4401big Data Analytics Course Outline
No ratings yet
CIT 4401big Data Analytics Course Outline
5 pages
DS Curriculum
No ratings yet
DS Curriculum
4 pages
Introduction To Big Data Ecosystems: Description
No ratings yet
Introduction To Big Data Ecosystems: Description
4 pages
U23AD492 - Data Science Syllabus
No ratings yet
U23AD492 - Data Science Syllabus
4 pages
Project Ideas For Beginner Data Scientists and Engineers
No ratings yet
Project Ideas For Beginner Data Scientists and Engineers
2 pages
DAI101 Detailed Syllabus
No ratings yet
DAI101 Detailed Syllabus
1 page
Advance Big Data Science Using Python-R-Hadoop-Spark (1/3) : Total Duration: 90 Hours + Practice
No ratings yet
Advance Big Data Science Using Python-R-Hadoop-Spark (1/3) : Total Duration: 90 Hours + Practice
1 page
Download
No ratings yet
Download
1 page
Hadoop Ecosystem for Big Data
From Everand
Hadoop Ecosystem for Big Data
Dr. Zemelak Goraga
No ratings yet
Data Mining: Fundamentals and Applications
From Everand
Data Mining: Fundamentals and Applications
Fouad Sabry
No ratings yet

Prectical List MCA-304 (Data Science and Big Data)

Uploaded by

Prectical List MCA-304 (Data Science and Big Data)

Uploaded by

LNCT UNIVERSITY, BHOPAL

You might also like