0% found this document useful (0 votes)

26 views7 pages

Stats Lab (4-6)

The document outlines programs for calculating central tendency and measures of dispersion using Python, including mean, median, mode, variance, and standard deviation. It also describes cross-validation techniques to measure RMSE, MAE, and R2 error, alongside displaying various statistical distributions such as Normal, Binomial, Poisson, and Bernoulli. The use of libraries like numpy, scipy, and matplotlib is emphasized for performing these statistical analyses.

Uploaded by

Sai Kishan .s

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views7 pages

Stats Lab (4-6)

Uploaded by

Sai Kishan .s

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 7

4.

Program to measure central tendency and measures of dispersion:

Mean, median, mode, standard deviation, variance, mean deviation
and quartile deviation for a frequency distribution/data.

In statistics, understanding the central tendency and measures of dispersion is

crucial for analyzing data. Central tendency provides a summary measure that
represents the entire dataset, while measures of dispersion indicate the spread or
variability of the data. Below, we will explore how to compute these statistics using
Python.

Required Libraries
To perform these calculations, we will utilize the numpy and scipy libraries. If you
haven't installed these libraries yet, you can do so using pip:

pip install numpy scipy

Sample Data
Let's assume we have a frequency distribution represented as a list of tuples, where
each tuple contains a value and its corresponding frequency. For example:

data = [(1, 5), (2, 10), (3, 15), (4, 20), (5, 10)]

Mean: The mean is calculated as the sum of all values multiplied by their
frequencies divided by the total frequency.

Median: The median is the middle value when the data is sorted. If the number of
observations is even, it is the average of the two middle values.

Mode: The mode is the value that appears most frequently in the dataset.

Calculating Measures of Dispersion

Variance: Variance measures how far a set of numbers is spread out from their
average value.
Standard Deviation: The standard deviation is the square root of the variance,
providing a measure of the average distance from the mean.

Mean Deviation: This is the average of the absolute deviations from the mean.

Quartile Deviation: This is half the difference between the first quartile (Q1) and
the third quartile (Q3).

Implementation

import numpy as np
from scipy import stats

# Sample frequency distribution

data = [(1, 5), (2, 10), (3, 15), (4, 20), (5, 10)]

# Expanding the data based on frequency

expanded_data = []
for value, frequency in data:
expanded_data.extend([value] * frequency)

# Convert to numpy array for calculations

expanded_data = np.array(expanded_data)

# Central Tendency
mean = np.mean(expanded_data)
median = np.median(expanded_data)
mode = stats.mode(expanded_data)[0][0]
# Measures of Dispersion
variance = np.var(expanded_data)
std_deviation = np.std(expanded_data)
mean_deviation = np.mean(np.abs(expanded_data - mean))

# Quartiles
Q1 = np.percentile(expanded_data, 25)
Q3 = np.percentile(expanded_data, 75)
quartile_deviation = (Q3 - Q1) / 2

# Displaying the results

print(f"Mean: {mean}")
print(f"Median: {median}")
print(f"Mode: {mode}")
print(f"Variance: {variance}")
print(f"Standard Deviation: {std_deviation}")
print(f"Mean Deviation: {mean_deviation}")
print(f"Quartile Deviation: {quartile_deviation}")

Conclusion
This program effectively calculates the central tendency and measures of dispersion
for a frequency distribution. By utilizing Python's powerful libraries, we can easily
perform statistical analysis, making it a valuable tool for data scientists and
analysts. Understanding these measures allows for better insights into the data,
guiding informed decision-making.

5. Program to perform cross validation for a given dataset to measure

Root Mean Squared Error (RMSE), Mean Absolute Error (MAE) and R2
Error using validation set, Leave one out cross-validation(LOOCV)
and k-fold cross-validation approaches.
import numpy as np
from sklearn.model_selection import KFold, LeaveOneOut
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression

# Generate synthetic data

X, y = make_regression(n_samples=100, n_features=1, noise=10)

# Initialize model
model = LinearRegression()

# K-Fold Cross Validation

kf = KFold(n_splits=5)
for train_index, test_index in kf.split(X):
X_train, X_test = X[train_index], X[test_index]
y_train, y_test = y[train_index], y[test_index]

model.fit(X_train, y_train)
predictions = model.predict(X_test)

print("K-Fold Metrics:")
print("RMSE:", np.sqrt(mean_squared_error(y_test, predictions)))
print("MAE:", mean_absolute_error(y_test, predictions))
print("R-squared:", r2_score(y_test, predictions))

# Leave-One-Out Cross Validation

loo = LeaveOneOut()
for train_index, test_index in loo.split(X):
X_train, X_test = X[train_index], X[test_index]
y_train, y_test = y[train_index], y[test_index]

model.fit(X_train, y_train)
predictions = model.predict(X_test)

print("LOOCV Metrics:")
print("RMSE:", np.sqrt(mean_squared_error(y_test, predictions)))
print("MAE:", mean_absolute_error(y_test, predictions))
print("R-squared:", r2_score(y_test, predictions))

6. Program to display Normal, Binomial Poisson , Bernoulli distributions

for a given frequency distribution and analyze the results.
import numpy as np
import matplotlib.pyplot as plt

# Function to calculate normal distribution

def normal_distribution(x, mu, sigma):
return (1 / (sigma * np.sqrt(2 * np.pi))) * np.exp(-0.5 * ((x - mu) / sigma) **
2)

# Function to calculate binomial distribution

def binomial_distribution(n, p, k):
from math import comb
return comb(n, k) * (p ** k) * ((1 - p) ** (n - k))

# Function to calculate Poisson distribution

def poisson_distribution(lmbda, k):
from math import exp, factorial
return (lmbda ** k * exp(-lmbda)) / factorial(k)

# Function to calculate Bernoulli distribution

def bernoulli_distribution(p, k):
return p ** k * (1 - p) ** (1 - k)

# Parameters
mu = 0
sigma = 1
n = 10
p = 0.5
lmbda = 3

# X values for normal distribution

x = np.linspace(-5, 5, 100)
normal_y = normal_distribution(x, mu, sigma)

# X values for binomial distribution

k_values = np.arange(0, n + 1)
binomial_y = [binomial_distribution(n, p, k) for k in k_values]

# X values for Poisson distribution

poisson_k_values = np.arange(0, 15)
poisson_y = [poisson_distribution(lmbda, k) for k in poisson_k_values]

# X values for Bernoulli distribution

bernoulli_k_values = [0, 1]
bernoulli_y = [bernoulli_distribution(p, k) for k in bernoulli_k_values]

# Plotting
plt.figure(figsize=(12, 8))

# Normal Distribution
plt.subplot(2, 2, 1)
plt.plot(x, normal_y, label='Normal Distribution', color='blue')
plt.title('Normal Distribution')
plt.xlabel('X')
plt.ylabel('Probability Density')
plt.grid()

# Binomial Distribution
plt.subplot(2, 2, 2)
plt.bar(k_values, binomial_y, label='Binomial Distribution', color='orange')
plt.title('Binomial Distribution')
plt.xlabel('Number of Successes')
plt.ylabel('Probability')
plt.grid()

# Poisson Distribution
plt.subplot(2, 2, 3)
plt.bar(poisson_k_values, poisson_y, label='Poisson Distribution',
color='green')
plt.title('Poisson Distribution')
plt.xlabel('Number of Events')
plt.ylabel('Probability')
plt.grid()
# Bernoulli Distribution
plt.subplot(2, 2, 4)
plt.bar(bernoulli_k_values, bernoulli_y, label='Bernoulli Distribution',
color='red')
plt.title('Bernoulli Distribution')
plt.xlabel('Outcome')
plt.ylabel('Probability')
plt.xticks(bernoulli_k_values)
plt.grid()

plt.tight_layout()
plt.show()

Conclusion
Normal Distribution: The function normal_distribution computes the PDF for a
range of x values.
Binomial Distribution: The function binomial_distribution calculates the
probability for each number of successes.
Poisson Distribution: The function poisson_distribution computes the
probabilities for a range of events.
Bernoulli Distribution: The function bernoulli_distribution calculates the
probabilities for two outcomes (success and failure).

Fresco
100% (2)
Fresco
17 pages
4 12
No ratings yet
4 12
17 pages
Edaunit IV
No ratings yet
Edaunit IV
15 pages
Python Code - Summary Statistics
No ratings yet
Python Code - Summary Statistics
6 pages
ML Lab Manual
No ratings yet
ML Lab Manual
27 pages
Exp-4 Abhayraj Singh
No ratings yet
Exp-4 Abhayraj Singh
11 pages
ML Lab Manual
No ratings yet
ML Lab Manual
28 pages
Machine Learning
No ratings yet
Machine Learning
3 pages
Machine Learning Lab Word 12-1-2025. Document
No ratings yet
Machine Learning Lab Word 12-1-2025. Document
68 pages
Data Science Experiments
No ratings yet
Data Science Experiments
31 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
ML Lab Final R22
No ratings yet
ML Lab Final R22
67 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
34 pages
ML Lab
No ratings yet
ML Lab
12 pages
ML Programs
No ratings yet
ML Programs
41 pages
DS Chapter - 2
No ratings yet
DS Chapter - 2
73 pages
DA Practical Lab 02 Statistical Functions
No ratings yet
DA Practical Lab 02 Statistical Functions
6 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
Solutions Modernstatistics
No ratings yet
Solutions Modernstatistics
144 pages
Group 2 Practical
No ratings yet
Group 2 Practical
9 pages
Probability and Statistics Course
No ratings yet
Probability and Statistics Course
5 pages
Distributions Demo
No ratings yet
Distributions Demo
28 pages
Industrial Statistics - A Computer Based Approach With Python
No ratings yet
Industrial Statistics - A Computer Based Approach With Python
140 pages
Workshop 5: PDF Sampling and Statistics: Preview: Generating Random Numbers
No ratings yet
Workshop 5: PDF Sampling and Statistics: Preview: Generating Random Numbers
10 pages
Intro To Statistics (CH1&2)
No ratings yet
Intro To Statistics (CH1&2)
38 pages
Program-1
No ratings yet
Program-1
15 pages
5 - Data Summaries and Visualization
No ratings yet
5 - Data Summaries and Visualization
87 pages
5 - Data Summaries and Visualization
No ratings yet
5 - Data Summaries and Visualization
97 pages
Skewness 2025
No ratings yet
Skewness 2025
62 pages
Frequency Distribution Table: Measure of Dispersion: Range, Variance, Standard Deviation
No ratings yet
Frequency Distribution Table: Measure of Dispersion: Range, Variance, Standard Deviation
4 pages
Indexml Merged
No ratings yet
Indexml Merged
32 pages
5-MEASURES of DISPERSION-02-Aug-2019Material I 02-Aug-2019 Exp. No. 1 - Measures of Central Tendency Dispersion Skewness and Kurtosi
No ratings yet
5-MEASURES of DISPERSION-02-Aug-2019Material I 02-Aug-2019 Exp. No. 1 - Measures of Central Tendency Dispersion Skewness and Kurtosi
10 pages
Ad3411 - Data Science and Analytics Laboratory
No ratings yet
Ad3411 - Data Science and Analytics Laboratory
26 pages
ML Experiment - 1
No ratings yet
ML Experiment - 1
1 page
Ad3411-Data Science and Analytics Laboratory
No ratings yet
Ad3411-Data Science and Analytics Laboratory
27 pages
Statistical Analysis: 1 Data Analysis: Mean, Variance, Boxplots
No ratings yet
Statistical Analysis: 1 Data Analysis: Mean, Variance, Boxplots
4 pages
Principles of AI Laboratory Varshadr
No ratings yet
Principles of AI Laboratory Varshadr
54 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
38 pages
Staff Manual 03
No ratings yet
Staff Manual 03
3 pages
Numpy and Pandas
No ratings yet
Numpy and Pandas
11 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
EXP-1 - Statistics and Plotting
No ratings yet
EXP-1 - Statistics and Plotting
23 pages
Unit 2 1
No ratings yet
Unit 2 1
54 pages
Measures of Dispersion
No ratings yet
Measures of Dispersion
2 pages
Data Science Algorithmen Master - 02 Data Handling
No ratings yet
Data Science Algorithmen Master - 02 Data Handling
76 pages
Data Mining Lab Maual Through Python 031023
No ratings yet
Data Mining Lab Maual Through Python 031023
22 pages
Unit 5 Descriptive Statistics
No ratings yet
Unit 5 Descriptive Statistics
7 pages
Session 3
No ratings yet
Session 3
61 pages
Measures of Location and Spread
No ratings yet
Measures of Location and Spread
1 page
CPL Practical 1
No ratings yet
CPL Practical 1
14 pages
Ps Project File
No ratings yet
Ps Project File
33 pages
AD3411 - 1 To 5
No ratings yet
AD3411 - 1 To 5
11 pages
ML2 Math Algo
No ratings yet
ML2 Math Algo
72 pages
Lab Plan 5: Statistics and Probability: Describing A Single Set of Data
No ratings yet
Lab Plan 5: Statistics and Probability: Describing A Single Set of Data
19 pages
MECH 262 - Notes (Statistics)
No ratings yet
MECH 262 - Notes (Statistics)
7 pages
Fha-Pyhton Program Unit 1-4
No ratings yet
Fha-Pyhton Program Unit 1-4
13 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Basic Exercises for Competitive Programming: Python
From Everand
Basic Exercises for Competitive Programming: Python
Jan Pol
No ratings yet
Module 2
No ratings yet
Module 2
7 pages
Stats Lab (10-12)
No ratings yet
Stats Lab (10-12)
4 pages
Develop A Program For Error Detecting Code Using CRC-CCITT (16-Bits)
No ratings yet
Develop A Program For Error Detecting Code Using CRC-CCITT (16-Bits)
15 pages
4 MR&MM
No ratings yet
4 MR&MM
25 pages
Question Bank 1
No ratings yet
Question Bank 1
2 pages
Ddco Module 4 Notes
No ratings yet
Ddco Module 4 Notes
17 pages
Ddco Lab Manual
No ratings yet
Ddco Lab Manual
35 pages
DS Manual 22scheme BCSL305
No ratings yet
DS Manual 22scheme BCSL305
78 pages
Unit-I Probability and Random Variables
No ratings yet
Unit-I Probability and Random Variables
25 pages
Assignment 9
No ratings yet
Assignment 9
2 pages
Syllabus
No ratings yet
Syllabus
38 pages
MA8402 Probability and Queueing MCQ
No ratings yet
MA8402 Probability and Queueing MCQ
18 pages
99ebook Com Msg00388
0% (4)
99ebook Com Msg00388
15 pages
Statistics Made Easy Volume 2 Probability and Probability Distributions by Pritish Ranjan Gayali
100% (1)
Statistics Made Easy Volume 2 Probability and Probability Distributions by Pritish Ranjan Gayali
321 pages
Mutually Exclusive Events
No ratings yet
Mutually Exclusive Events
3 pages
Random Variables: Lesson 1.1
No ratings yet
Random Variables: Lesson 1.1
24 pages
DLL Week 1 Stat
No ratings yet
DLL Week 1 Stat
4 pages
CLASS-X - TEST-MCQs-PROBABILITY
No ratings yet
CLASS-X - TEST-MCQs-PROBABILITY
3 pages
First Course in Stochastic Processes
0% (1)
First Course in Stochastic Processes
6 pages
The Poisson Distribution
No ratings yet
The Poisson Distribution
13 pages
Activities - Mathematics - Class XII
No ratings yet
Activities - Mathematics - Class XII
17 pages
Lecture 13
No ratings yet
Lecture 13
27 pages
Exercise On Probability
No ratings yet
Exercise On Probability
1 page
Recitation and Review Questions
No ratings yet
Recitation and Review Questions
4 pages
Class: 9 Sample Questions: International Olympiad of Mathematics - iOM' 22
No ratings yet
Class: 9 Sample Questions: International Olympiad of Mathematics - iOM' 22
1 page
2.6 Uncertainity and Bay's Theorem
No ratings yet
2.6 Uncertainity and Bay's Theorem
84 pages
Discrete Random Variables
No ratings yet
Discrete Random Variables
15 pages
CBSE Maths Module 6 Projects - Manuals
No ratings yet
CBSE Maths Module 6 Projects - Manuals
29 pages
(Ebook PDF) Statistics Learning From Data by Roxy Peck Download
100% (1)
(Ebook PDF) Statistics Learning From Data by Roxy Peck Download
58 pages
Stat Exam
No ratings yet
Stat Exam
2 pages
Module 3 - HUT 310 - Ktunotes - in
No ratings yet
Module 3 - HUT 310 - Ktunotes - in
62 pages
Sampling Theory Homework Help 1
No ratings yet
Sampling Theory Homework Help 1
2 pages
Financial Risk Management - Introduction
No ratings yet
Financial Risk Management - Introduction
32 pages
507 Probability II
No ratings yet
507 Probability II
21 pages
Probabilistic Methods in Geotechnical Engineering PDF
No ratings yet
Probabilistic Methods in Geotechnical Engineering PDF
17 pages
Let A and B Are Two Independent Events
No ratings yet
Let A and B Are Two Independent Events
6 pages
Lesson 3 - Finding The Possible Values of A Random Variable
100% (1)
Lesson 3 - Finding The Possible Values of A Random Variable
2 pages
Assign. Mathematics III M (CSE) 301
No ratings yet
Assign. Mathematics III M (CSE) 301
2 pages