0% found this document useful (0 votes)

19 views5 pages

FDS 1

The document consists of a series of questions and answers related to data science concepts, including applications, definitions, and methods. Key topics covered include data types, outlier detection, data visualization libraries, and data cleaning techniques. Additionally, it discusses the 3Vs of data science and exploratory data analysis (EDA).

Uploaded by

f95850369

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

19 views5 pages

FDS 1

Uploaded by

f95850369

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

1

Q1) Attempt any Eight of the following : [8 × 1 = 8]

a) List any two applications of Data Science.

Answer: Healthcare analytics, Fraud detection

b) What is outlier?
Answer: An outlier is a data point that differs significantly from other observations in a
dataset.

c) What is missing values?

Answer: Missing values are data points where no value is stored for a variable in an
observation.

d) Define variance.
Answer: Variance measures how far each number in a dataset is from the mean.

e) What is nominal attribute?

Answer: A nominal attribute is a categorical variable without any order, e.g., colors or
names.

f) What is data transformation?

Answer: It's the process of converting data into a suitable format or structure for
analysis.

g) What is one hot coding?

Answer: It converts categorical variables into binary vectors representing each
category.

h) What is the use of Bubble plot?

Answer: A bubble plot visualizes relationships between three variables using x, y, and
bubble size.

i) Define data visualisation.

Answer: It is the graphical representation of data and information to identify patterns
and insights.

j) Define standard deviation.

Answer: It measures the amount of variation or dispersion in a dataset.
2

Q2) Attempt any four of the following : [4 × 2 = 8]

a) Differentiate structured and unstructured data.

Answer:

• Structured Data: Organized in rows and columns (e.g., databases).

• Unstructured Data: Not organized, e.g., images, videos, emails.

b) What is inferential statistics?

Answer:
It uses a random sample of data to make inferences or predictions about a larger
population.

c) What do you mean by data preprocessing?

Answer:
Data preprocessing is a technique to clean, transform, and organize raw data into a usable
format.

d) Define data discretization.

Answer:
Data discretization is the process of converting continuous data into discrete buckets or
intervals.

e) What is visual encoding?

Answer:
Visual encoding refers to how data values are mapped to visual elements like position, size,
shape, or color in a chart or graph.
3

Q3) Attempt any two of the following : [2 × 4 = 8]

a) Explain outlier detection methods in brief.

Answer:

1. Z-Score Method: Detects outliers by measuring how far a point is from the mean in
terms of standard deviations.

2. IQR Method (Interquartile Range): Values lying below Q1 - 1.5×IQR or above Q3 +

1.5×IQR are outliers.

3. Box Plot: Graphical method to identify outliers visually.

4. DBSCAN: A clustering algorithm that can detect outliers as noise points.

b) Write different data visualization libraries in Python.

Answer:

1. Matplotlib – Basic plotting library.

2. Seaborn – Built on matplotlib; used for statistical graphs.

3. Plotly – Interactive web-based visualizations.

4. Altair – Declarative statistical visualization.

5. Bokeh – Interactive visualization for modern web browsers.

c) What is data cleaning? Explain any two data cleaning methods.

Answer:
Data Cleaning involves detecting and correcting inaccurate or incomplete data.
Two methods:

• Handling Missing Data: Replace with mean/median or drop rows.

• Removing Duplicates: Use tools like drop_duplicates() in pandas to remove

repeated entries.
4

Q4) Attempt any two of the following : [2 × 4 = 8]

a) Explain 3V’s of Data Science.

Answer:

1. Volume: Refers to the amount of data (large scale).

2. Velocity: Speed at which data is generated and processed.

3. Variety: Different types of data – structured, unstructured, and semi-structured.

b) Explain data cube aggregation method in detail.

Answer:
Data cube aggregation summarizes data along multiple dimensions. It uses aggregation
functions (sum, average) to compute statistics across various levels of detail.
For example, sales data can be aggregated by region, time, and product to support OLAP
(Online Analytical Processing).

c) Explain any two data transformation techniques in detail.

Answer:

1. Normalization: Scaling data to fit within a specific range, like 0 to 1.

Example: Min-Max normalization

2. Encoding Categorical Variables: Converting categories into numeric format, e.g.,

one-hot encoding or label encoding.
5

Q5) Attempt any one of the following : [1 × 3 = 3]

a) Write a short note on feature extraction.

Answer:
Feature extraction is the process of transforming raw data into a set of useful features that
represent the underlying problem.
For example, extracting keywords from text, or edges from images. It helps in improving
model accuracy by providing relevant data.

b) Explain Exploratory Data Analysis (EDA) in detail.

Answer:
EDA is a technique to analyze and summarize datasets using visual methods.
Key steps include:

• Understanding the structure of data (types, missing values).

• Detecting outliers and anomalies.

• Visualizing distributions using histograms, box plots, scatter plots.

• Identifying relationships between variables using correlation matrices.

It helps form hypotheses and guides further analysis or modeling.

Introduction To Econometrics (3 Updated Edition, Global Edition)
No ratings yet
Introduction To Econometrics (3 Updated Edition, Global Edition)
8 pages
Analisis Beban Kerja Perawat
No ratings yet
Analisis Beban Kerja Perawat
13 pages
FDS PYQ Solution
No ratings yet
FDS PYQ Solution
8 pages
Foundation of Data Science Previous Year Question Paper
No ratings yet
Foundation of Data Science Previous Year Question Paper
40 pages
Ds Paper Question
No ratings yet
Ds Paper Question
6 pages
FDS - 4 Solved
No ratings yet
FDS - 4 Solved
21 pages
FDS Sem5
No ratings yet
FDS Sem5
20 pages
FDS Imp Docs
No ratings yet
FDS Imp Docs
22 pages
FDS
No ratings yet
FDS
7 pages
FDS - 3 Solved
No ratings yet
FDS - 3 Solved
21 pages
FDS - 5 Solved
No ratings yet
FDS - 5 Solved
13 pages
FDS - 2 Solved
No ratings yet
FDS - 2 Solved
14 pages
Data Science Quiz Answers
No ratings yet
Data Science Quiz Answers
5 pages
FDS - 1 Solved
No ratings yet
FDS - 1 Solved
17 pages
Big Data (Imp-Questions)
No ratings yet
Big Data (Imp-Questions)
17 pages
FDS 2 Marks 50 Questions
No ratings yet
FDS 2 Marks 50 Questions
2 pages
Ty - Data Science Qb-1
No ratings yet
Ty - Data Science Qb-1
4 pages
Sfds Aat
No ratings yet
Sfds Aat
8 pages
Data Science One Mark Question
No ratings yet
Data Science One Mark Question
3 pages
ML Chapter 2
No ratings yet
ML Chapter 2
9 pages
Question Bank With Answers
No ratings yet
Question Bank With Answers
103 pages
Data Science
No ratings yet
Data Science
14 pages
Assignment 02
No ratings yet
Assignment 02
9 pages
Unit 1
No ratings yet
Unit 1
34 pages
EDA Question Bank Answers
No ratings yet
EDA Question Bank Answers
24 pages
Data Mining
No ratings yet
Data Mining
34 pages
Data Science Interview Best
No ratings yet
Data Science Interview Best
48 pages
Data Science - Model Exam Question Paper
No ratings yet
Data Science - Model Exam Question Paper
2 pages
Endsem Imp Bi Unit 4
No ratings yet
Endsem Imp Bi Unit 4
36 pages
01.ad3491 Fdsa QB
No ratings yet
01.ad3491 Fdsa QB
16 pages
Data Science Assignment
No ratings yet
Data Science Assignment
9 pages
DS Bits Mid-2 Student
No ratings yet
DS Bits Mid-2 Student
3 pages
Data Science Mcqs - Hamza Zahoor
No ratings yet
Data Science Mcqs - Hamza Zahoor
9 pages
DS Unit 1 Essay Answers.
No ratings yet
DS Unit 1 Essay Answers.
18 pages
CS3352-QB Fds
No ratings yet
CS3352-QB Fds
12 pages
DS&ML 4
No ratings yet
DS&ML 4
9 pages
AD3491 - Unit 1 - Introduction To Data Science Important Questions 2 Marks With Answer - 3-8
No ratings yet
AD3491 - Unit 1 - Introduction To Data Science Important Questions 2 Marks With Answer - 3-8
6 pages
II CSE - A&B (96) DS-int 1 QP ANS-set1
No ratings yet
II CSE - A&B (96) DS-int 1 QP ANS-set1
7 pages
Unit I 2 Marks
No ratings yet
Unit I 2 Marks
5 pages
1569928600-7cs It3a dmwh-3555
No ratings yet
1569928600-7cs It3a dmwh-3555
2 pages
Cognizant Data Analyst Interview Questions 1745235888
No ratings yet
Cognizant Data Analyst Interview Questions 1745235888
18 pages
DS - Question Paper
No ratings yet
DS - Question Paper
3 pages
6.data Science
No ratings yet
6.data Science
6 pages
Ixs8h l8mgc
No ratings yet
Ixs8h l8mgc
40 pages
Fds 2 Marks
No ratings yet
Fds 2 Marks
14 pages
DS
No ratings yet
DS
7 pages
FDS Unit 1 QB
No ratings yet
FDS Unit 1 QB
7 pages
Ad3301 Apr May 2024 Answer Key
No ratings yet
Ad3301 Apr May 2024 Answer Key
31 pages
Data Science
No ratings yet
Data Science
10 pages
1 Green IT446 Test Bank 2 2
No ratings yet
1 Green IT446 Test Bank 2 2
61 pages
CEUC502 - DMBI - Question - Bank
No ratings yet
CEUC502 - DMBI - Question - Bank
12 pages
Data Science MCQs Sample Mid2xlsx 2024 11-29-23!19!54
No ratings yet
Data Science MCQs Sample Mid2xlsx 2024 11-29-23!19!54
8 pages
DS End Sem.
No ratings yet
DS End Sem.
31 pages
DS Bits Mid-2 Exam
No ratings yet
DS Bits Mid-2 Exam
4 pages
DM UNIT-1 Question and Answer
No ratings yet
DM UNIT-1 Question and Answer
25 pages
DS Honor Sem 5 Endsem Paper 1
No ratings yet
DS Honor Sem 5 Endsem Paper 1
2 pages
Ch.4.Data Science X-1
No ratings yet
Ch.4.Data Science X-1
3 pages
Crash Course Data Science
No ratings yet
Crash Course Data Science
7 pages
Data Science QnA
No ratings yet
Data Science QnA
15 pages
QB 2
No ratings yet
QB 2
3 pages
Assignment Questions - Data Analysis and Visualization Using Power BI and Tableau
No ratings yet
Assignment Questions - Data Analysis and Visualization Using Power BI and Tableau
2 pages
Python Based Questions
No ratings yet
Python Based Questions
3 pages
Logarithms
No ratings yet
Logarithms
4 pages
Nss 1
No ratings yet
Nss 1
2 pages
Solutions Part 1
No ratings yet
Solutions Part 1
15 pages
Solving Simple Problems Based On Quadratic Equations Solutions
No ratings yet
Solving Simple Problems Based On Quadratic Equations Solutions
47 pages
Lesson 5
No ratings yet
Lesson 5
5 pages
Statistics For Managers Using Microsoft Excel: The Simple Linear Regression Model and Correlation
No ratings yet
Statistics For Managers Using Microsoft Excel: The Simple Linear Regression Model and Correlation
94 pages
3334 Exam Cheat Sheet
No ratings yet
3334 Exam Cheat Sheet
26 pages
Assignment 1
No ratings yet
Assignment 1
2 pages
Chapter 5 Exercises 9 and 40
No ratings yet
Chapter 5 Exercises 9 and 40
6 pages
2.central Tendency and Dispersion
No ratings yet
2.central Tendency and Dispersion
114 pages
Part A) Years of Work Experience Salary (In $'000)
No ratings yet
Part A) Years of Work Experience Salary (In $'000)
5 pages
When Can We Trust The Limits On A Process Behavior Chart?: Home Content
No ratings yet
When Can We Trust The Limits On A Process Behavior Chart?: Home Content
2 pages
ch14 Nonlinear Regression Models
100% (1)
ch14 Nonlinear Regression Models
18 pages
Central Tendency, The Variability and Distribution of Your Dataset Is Important To Understand When Performing Descriptive Statistics.
No ratings yet
Central Tendency, The Variability and Distribution of Your Dataset Is Important To Understand When Performing Descriptive Statistics.
14 pages
Mit
No ratings yet
Mit
119 pages
Solucionario Econometria Jeffrey M Wooldridge PDF
11% (9)
Solucionario Econometria Jeffrey M Wooldridge PDF
4 pages
Formula Sheet For Statistics Agriculture
No ratings yet
Formula Sheet For Statistics Agriculture
5 pages
Statistical Approach To PPQ
100% (1)
Statistical Approach To PPQ
26 pages
Hypothesis Testing
No ratings yet
Hypothesis Testing
57 pages
SAGE Quantitative Research Methods
50% (2)
SAGE Quantitative Research Methods
4 pages
Types of Statistics
No ratings yet
Types of Statistics
7 pages
Employee Satisfaction and Productivity
No ratings yet
Employee Satisfaction and Productivity
2 pages
Module 2
No ratings yet
Module 2
37 pages
Research Revision Questions 2-1-1
No ratings yet
Research Revision Questions 2-1-1
23 pages
Cheat SHeet ECON 334
No ratings yet
Cheat SHeet ECON 334
2 pages
Related Samples T Test Lecture
No ratings yet
Related Samples T Test Lecture
43 pages
Evaluation of Melon Cucumis Melo L
No ratings yet
Evaluation of Melon Cucumis Melo L
10 pages
14622inferenceforsingleproportions 160909005557
No ratings yet
14622inferenceforsingleproportions 160909005557
19 pages
Two Stage Cluster Sampling
No ratings yet
Two Stage Cluster Sampling
42 pages
Task Card 4 - The Normal Distribution
No ratings yet
Task Card 4 - The Normal Distribution
3 pages
Chapter 17 Uses and Abuses of Statistics
85% (20)
Chapter 17 Uses and Abuses of Statistics
15 pages
Autocorrelation Notes PDF
No ratings yet
Autocorrelation Notes PDF
6 pages