0% found this document useful (0 votes)

27 views7 pages

Python Programs

The document is a lab manual for BCA V Semester focusing on statistical concepts and their applications, including probability calculations, significance tests (T-Test, ANOVA, Chi-Square), and correlation and regression analysis. It provides practical examples using Python libraries such as NumPy, SciPy, and Matplotlib to demonstrate concepts like probability distributions, hypothesis testing, and regression modeling. The manual includes code snippets and outputs for various statistical analyses using datasets like Titanic and Iris.

Uploaded by

Deeksha Devadas

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views7 pages

Python Programs

Uploaded by

Deeksha Devadas

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

BCA V SEM DA Part-B LAB MANUAL(NEP)

1. Probability
a. Calculating the simple probabilities.
b. Applications of Probability distributions to real life problems.
# Simple probability
# Probability of rolling a 4 on a six-sided die
total_outcomes = 6
favorable_outcomes = 1 # Rolling a 4
probability_4 = favorable_outcomes / total_outcomes
print(f"Probability of rolling a 4: {probability_4}")

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm, poisson, binom, expon
# Normal Distribution - Quality Control example
# Generating and plotting a normal distribution
mean = 50
std_dev = 10
samples = np.random.normal(mean, std_dev, 1000)
plt.figure(figsize=(8, 6))
plt.hist(samples, bins=30, density=True, alpha=0.6, color='blue')
x = np.linspace(mean - 4*std_dev, mean + 4*std_dev, 100)
plt.plot(x, norm.pdf(x, mean, std_dev), 'r-', lw=2, label='Normal Distribution')
plt.title('Normal Distribution Example (Quality Control)')
plt.xlabel('Values')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()

# Poisson Distribution - Service and Arrival Rates example

# Calculating the probability of a certain number of events occurring in a time frame
lambda_param = 5 # Arrival rate per hour
k = 3 # Number of events
prob_3_events = poisson.pmf(k, lambda_param)
print(f"Probability of 3 events occurring in an hour: {prob_3_events}")

# Binomial Distribution - Decision Making example

# Estimating probability of success or failure in fixed number of trials
n = 10 # Number of trials
p = 0.6 # Probability of success
k_success = 7 # Number of successes
prob_7_success = binom.pmf(k_success, n, p)
print(f"Probability of 7 successes out of 10 trials: {prob_7_success}")

-------------------------------------------------------------------------------------------

P a g e 1|7
BCA V SEM DA Part-B LAB MANUAL(NEP)

# Exponential Distribution - Reliability Analysis example

# Simulating and plotting an exponential distribution
exp_samples = np.random.exponential(scale=2, size=1000)
plt.figure(figsize=(8, 6))
plt.hist(exp_samples, bins=30, density=True, alpha=0.6, color='green')
x_exp = np.linspace(0, 10, 100)
plt.plot(x_exp, expon.pdf(x_exp, scale=2), 'r-', lw=2, label='Exponential
Distribution')
plt.title('Exponential Distribution Example (Reliability Analysis)')
plt.xlabel('Values')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()

OUTPUT
Probability of rolling a 4: 0.16666666666666666

Probability of 3 events occurring in an hour: 0.1403738958142805

Probability of 7 successes out of 10 trials: 0.21499084799999976

-------------------------------------------------------------------------------------------

P a g e 2|7
BCA V SEM DA Part-B LAB MANUAL(NEP)

2. Test of Significance
a. T-Test: one sample, two independent samples and paired
b. ANOVA & Chi-Square Test.

import pandas as pd
from scipy import stats
# Load Titanic dataset
titanic_data = pd.read_csv('train.csv') # Replace 'train.csv' with your dataset file
# One Sample T-Test: Checking mean age against a hypothetical mean
hypothetical_mean_age = 30
ttest_one_sample = stats.ttest_1samp(titanic_data['Age'].dropna(),
hypothetical_mean_age)
print("One Sample T-Test:")
print("T-statistic:", ttest_one_sample.statistic)
print("p-value:", ttest_one_sample.pvalue)

-------------------------------------------------------------------------------------------

P a g e 3|7
BCA V SEM DA Part-B LAB MANUAL(NEP)

# Two Independent Samples T-Test: Comparing ages of male and female passengers
male_ages = titanic_data[titanic_data['Sex'] == 'male']['Age'].dropna()
female_ages = titanic_data[titanic_data['Sex'] == 'female']['Age'].dropna()
ttest_two_ind_samples = stats.ttest_ind(male_ages, female_ages)
print("\nTwo Independent Samples T-Test:")
print("T-statistic:", ttest_two_ind_samples.statistic)
print("p-value:", ttest_two_ind_samples.pvalue)
# Paired T-Test: Comparing fares before and after
before_fares = titanic_data['Fare'].dropna()
after_fares = before_fares * 1.2 # Assuming a 20% increase in fares
ttest_paired = stats.ttest_rel(before_fares, after_fares)
print("\nPaired T-Test:")
print("T-statistic:", ttest_paired.statistic)
print("p-value:", ttest_paired.pvalue)
# ANOVA Test: Impact of passenger class on fares
anova_result = stats.f_oneway(titanic_data[titanic_data['Pclass'] == 1]['Fare'].dropna(),
titanic_data[titanic_data['Pclass'] == 2]['Fare'].dropna(),
titanic_data[titanic_data['Pclass'] == 3]['Fare'].dropna())
print("\nANOVA Test Result:")
print("F-statistic:", anova_result.statistic)
print("p-value:", anova_result.pvalue)
# Chi-Square Test: Relationship between survival status and passenger class
chi2_table = pd.crosstab(titanic_data['Survived'], titanic_data['Pclass'])
chi2_result = stats.chi2_contingency(chi2_table)
print("\nChi-Square Test Result:")
print("Chi-Square statistic:", chi2_result[0])
print("p-value:", chi2_result[1])
OUTPUT
One Sample T-Test:

T-statistic: -0.5534583115970276
p-value: 0.5801231230388639

Two Independent Samples T-Test:

T-statistic: 2.499206354920835
p-value: 0.012671296797013709

Paired T-Test:
T-statistic: -19.344277455944212
p-value: 7.255925461999273e-70

ANOVA Test Result:

F-statistic: 242.34415651744814
p-value: 1.0313763209141171e-84

Chi-Square Test Result:

Chi-Square statistic: 102.88898875696056
p-value: 4.549251711298793e-23

-------------------------------------------------------------------------------------------

P a g e 4|7
BCA V SEM DA Part-B LAB MANUAL(NEP)

3. Correlation and Regression analysis

a. Scattered diagram, calculating of correlation coefficient
b. Linear regression: fitting, testing model adequacy and prediction
c. Fitting of logistic regression.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris

# Generating sample data

np.random.seed(42)
X = np.random.rand(100, 1) * 10
y = 2 * X.squeeze() + np.random.randn(100) * 2

# Scatter plot and correlation coefficient

plt.figure(figsize=(8, 4))
plt.scatter(X, y)
plt.title('Scatter Plot')
plt.xlabel('X')
plt.ylabel('Y')
plt.grid(True)
correlation_coefficient = np.corrcoef(X.squeeze(), y)[0, 1]
print(f"Correlation Coefficient: {correlation_coefficient}")

# Linear regression fitting

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)
lin_reg = LinearRegression()
lin_reg.fit(X_train, y_train)

-------------------------------------------------------------------------------------------

P a g e 5|7
BCA V SEM DA Part-B LAB MANUAL(NEP)

# Testing model adequacy and prediction

y_pred = lin_reg.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Mean Squared Error: {mse}")
print(f"R-squared Score: {r2}")

plt.figure(figsize=(8, 4))
plt.scatter(X_test, y_test, color='black')
plt.plot(X_test, y_pred, color='blue', linewidth=3)
plt.title('Linear Regression Prediction')
plt.xlabel('X')
plt.ylabel('Y')
plt.grid(True)

# Fitting logistic regression (using Iris dataset as an example)

iris = load_iris()
X_iris = iris.data[:, :2] # Using only the first two features for simplicity
y_iris = iris.target
log_reg = LogisticRegression()
log_reg.fit(X_iris, y_iris)

# Generating a meshgrid for decision boundary visualization

x_min, x_max = X_iris[:, 0].min() - 1, X_iris[:, 0].max() + 1
y_min, y_max = X_iris[:, 1].min() - 1, X_iris[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.1), np.arange(y_min, y_max,
0.1))
Z = log_reg.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.figure(figsize=(8, 6))
plt.contourf(xx, yy, Z, alpha=0.4)
plt.scatter(X_iris[:, 0], X_iris[:, 1], c=y_iris, s=20, edgecolor='k')
plt.title('Logistic Regression (Iris dataset)')
plt.xlabel('Sepal Length')
plt.ylabel('Sepal Width')
plt.grid(True)
plt.show()

-------------------------------------------------------------------------------------------

P a g e 6|7
BCA V SEM DA Part-B LAB MANUAL(NEP)

OUTPUT
Correlation Coefficient: 0.9529657473628446
Mean Squared Error: 2.6147980548680083
R-squared Score: 0.9287298556395622

-------------------------------------------------------------------------------------------

P a g e 7|7

Probability and Statistical Analysis Lab Manual
No ratings yet
Probability and Statistical Analysis Lab Manual
7 pages
Data Analysis & Processing Guide
100% (2)
Data Analysis & Processing Guide
17 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
AD3411
No ratings yet
AD3411
28 pages
Hands On With Probability and Statistical
No ratings yet
Hands On With Probability and Statistical
9 pages
Indexml Merged
No ratings yet
Indexml Merged
32 pages
4 12
No ratings yet
4 12
17 pages
Python Workshop: PDF Sampling & Statistics
No ratings yet
Python Workshop: PDF Sampling & Statistics
10 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
Statistical Analysis For Data Science
No ratings yet
Statistical Analysis For Data Science
2 pages
Data Science Experiments
No ratings yet
Data Science Experiments
31 pages
Diabetic Retinopathy Risk Modeling
No ratings yet
Diabetic Retinopathy Risk Modeling
24 pages
Probability Distributions and MLE Analysis
No ratings yet
Probability Distributions and MLE Analysis
11 pages
Projectpdf
No ratings yet
Projectpdf
12 pages
ML Lab
No ratings yet
ML Lab
12 pages
Python Statistical Modeling Lab
No ratings yet
Python Statistical Modeling Lab
33 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
Statistical Analysis With Scipy?
No ratings yet
Statistical Analysis With Scipy?
9 pages
Chapter 0 Introduction
No ratings yet
Chapter 0 Introduction
14 pages
2a EDA
No ratings yet
2a EDA
16 pages
Exercise 3 Computer Intensive Statistics
No ratings yet
Exercise 3 Computer Intensive Statistics
10 pages
Understanding Probability and Distributions
No ratings yet
Understanding Probability and Distributions
7 pages
Simulating Continuous and Non-Continuous Distributions
No ratings yet
Simulating Continuous and Non-Continuous Distributions
17 pages
DL Prac1
No ratings yet
DL Prac1
3 pages
Exp 4 Statistical Data Analysis With Python SDK Ok
No ratings yet
Exp 4 Statistical Data Analysis With Python SDK Ok
18 pages
Ad3411-Data Science and Analytics Laboratory
No ratings yet
Ad3411-Data Science and Analytics Laboratory
27 pages
ABD Formulas
No ratings yet
ABD Formulas
55 pages
ML Exp 3-7 Manuval
No ratings yet
ML Exp 3-7 Manuval
21 pages
Pattern Recognition
No ratings yet
Pattern Recognition
26 pages
ADS Practical Exam Questions
No ratings yet
ADS Practical Exam Questions
14 pages
Data Sci HW1
No ratings yet
Data Sci HW1
8 pages
Probability and Statistics Course
No ratings yet
Probability and Statistics Course
5 pages
Ad3411 - Data Science and Analytics Laboratory
No ratings yet
Ad3411 - Data Science and Analytics Laboratory
26 pages
Cosc 416
No ratings yet
Cosc 416
6 pages
2a Eda
No ratings yet
2a Eda
17 pages
Coding Final Study Guide Notes
No ratings yet
Coding Final Study Guide Notes
3 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
ML Updated File
No ratings yet
ML Updated File
36 pages
Data Analysis with Python
No ratings yet
Data Analysis with Python
38 pages
Sem 5
No ratings yet
Sem 5
25 pages
DA Manual - Part B
No ratings yet
DA Manual - Part B
13 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
Data Science Practical With Solutions BSC Cs Sem 6
No ratings yet
Data Science Practical With Solutions BSC Cs Sem 6
29 pages
STATSCHEATSHeet
No ratings yet
STATSCHEATSHeet
5 pages
Reliability Theory and Survival Analysis Final
No ratings yet
Reliability Theory and Survival Analysis Final
12 pages
Bayesian Analysis of Failure Time Data Using P Splines Best Quality Download
No ratings yet
Bayesian Analysis of Failure Time Data Using P Splines Best Quality Download
17 pages
DSBDA Practicals
No ratings yet
DSBDA Practicals
16 pages
Data Analysis and Visualization Guide
No ratings yet
Data Analysis and Visualization Guide
16 pages
Probability & Statistics Solutions
No ratings yet
Probability & Statistics Solutions
56 pages
Ad3411 - Student
No ratings yet
Ad3411 - Student
27 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
Bda Assign
No ratings yet
Bda Assign
15 pages
4-10 Aiml
No ratings yet
4-10 Aiml
25 pages
Data Science Practicals
No ratings yet
Data Science Practicals
47 pages
Python Data Analytics Techniques
No ratings yet
Python Data Analytics Techniques
10 pages
Patil ML
No ratings yet
Patil ML
9 pages
Review Statistics
No ratings yet
Review Statistics
24 pages
Papaleo 2009
No ratings yet
Papaleo 2009
11 pages
Biologi Form 4 Pat k3
No ratings yet
Biologi Form 4 Pat k3
8 pages
Kisi Math 6
No ratings yet
Kisi Math 6
7 pages
Google Earth Fixes Atlantis Error
No ratings yet
Google Earth Fixes Atlantis Error
2 pages
50 - AMC Lectures-4 Text
No ratings yet
50 - AMC Lectures-4 Text
3 pages
Crookes Valley Park - Masterplan-Ponderosa - Philadelphia Greenspace
No ratings yet
Crookes Valley Park - Masterplan-Ponderosa - Philadelphia Greenspace
195 pages
Release Note SCX-8240 Series V5.E6.03.EC1509.07 PDF
No ratings yet
Release Note SCX-8240 Series V5.E6.03.EC1509.07 PDF
4 pages
Coaching for Hotel Staff Development
No ratings yet
Coaching for Hotel Staff Development
52 pages
Understanding Attacker Economics
No ratings yet
Understanding Attacker Economics
47 pages
Bank Exam Inequality Practice
No ratings yet
Bank Exam Inequality Practice
4 pages
MGT 420 Notes CHP 6, 9, 10
No ratings yet
MGT 420 Notes CHP 6, 9, 10
6 pages
CAE Essay 2015
No ratings yet
CAE Essay 2015
2 pages
MYP Interactive Unit Planner Final6
0% (1)
MYP Interactive Unit Planner Final6
7 pages
Foucault's Power Dynamics Explained
No ratings yet
Foucault's Power Dynamics Explained
7 pages
Photoshop7.0 FINAL PDF
0% (2)
Photoshop7.0 FINAL PDF
75 pages
A Companion To Derrida 1st Edition Zeynep Direk Download
100% (10)
A Companion To Derrida 1st Edition Zeynep Direk Download
106 pages
Dr. Greg Hetland - Profile Tolerancing Proof of Compliance - Vs - Process Feedback
No ratings yet
Dr. Greg Hetland - Profile Tolerancing Proof of Compliance - Vs - Process Feedback
38 pages
Rebecca Hobbs - Resume
No ratings yet
Rebecca Hobbs - Resume
2 pages
Student Inclusive Conferences Parent Guardian Resource 2024nov
No ratings yet
Student Inclusive Conferences Parent Guardian Resource 2024nov
2 pages
VHDL Controller for Rotating LED Lights
No ratings yet
VHDL Controller for Rotating LED Lights
2 pages
Find The Number of Positive Integers Less Than 101 That Cannot Be Written As The Difference of Two Squares of Integers
No ratings yet
Find The Number of Positive Integers Less Than 101 That Cannot Be Written As The Difference of Two Squares of Integers
1 page
Excel Skills Test Instructions
0% (1)
Excel Skills Test Instructions
8 pages
Dynamic Synthesis of A Classic, Manual Gearbox: American Journal of Engineering and Applied Sciences
No ratings yet
Dynamic Synthesis of A Classic, Manual Gearbox: American Journal of Engineering and Applied Sciences
12 pages
AGA 3842-2022-2023. Descriptive Statistics
No ratings yet
AGA 3842-2022-2023. Descriptive Statistics
101 pages
《雅思阅读真题语料库》
No ratings yet
《雅思阅读真题语料库》
4 pages
Nama: Fazlun Nisak NIM: 180170127 MK: Kecerdasan Buatan (A2) Tugas Perceptron
No ratings yet
Nama: Fazlun Nisak NIM: 180170127 MK: Kecerdasan Buatan (A2) Tugas Perceptron
8 pages
Half Girlfriend: Struggles and Success
No ratings yet
Half Girlfriend: Struggles and Success
6 pages
School Form 2 Attendance Guide
No ratings yet
School Form 2 Attendance Guide
73 pages
Evaluating A Case Study Using Bloom's Taxonomy of Education: ASE Tudy
No ratings yet
Evaluating A Case Study Using Bloom's Taxonomy of Education: ASE Tudy
10 pages
Outsmart Your Cancer Alternative Nontoxic Treatments That Work Second Editionwith CD 2nd Revised Enlarged Tanya Harter Pierce 2025 Easy Download
No ratings yet
Outsmart Your Cancer Alternative Nontoxic Treatments That Work Second Editionwith CD 2nd Revised Enlarged Tanya Harter Pierce 2025 Easy Download
149 pages

Python Programs

Uploaded by

Python Programs

Uploaded by

BCA V SEM DA Part-B LAB MANUAL(NEP)

# Poisson Distribution - Service and Arrival Rates example

# Binomial Distribution - Decision Making example

# Exponential Distribution - Reliability Analysis example

Probability of 3 events occurring in an hour: 0.1403738958142805

Two Independent Samples T-Test:

ANOVA Test Result:

Chi-Square Test Result:

3. Correlation and Regression analysis

# Generating sample data

# Scatter plot and correlation coefficient

# Linear regression fitting

# Testing model adequacy and prediction

# Fitting logistic regression (using Iris dataset as an example)

# Generating a meshgrid for decision boundary visualization

You might also like