0% found this document useful (0 votes)

2 views

CODE2

The code performs normality tests on numeric columns from a CSV dataset containing NVDA stock data. It uses Shapiro-Wilk, Kolmogorov-Smirnov, D’Agostino, and Anderson-Darling tests to assess normality, and visualizes the results with histograms and Q-Q plots. The results are compiled into a DataFrame for display.

Uploaded by

suryanshu

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views

CODE2

Uploaded by

suryanshu

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

CODE

import csv

import pandas as pd

import scipy.stats as stats

import seaborn as sns

import matplotlib.pyplot as plt

# Load the dataset

df = pd.read_csv("NVDA.csv")

# Select numeric columns

numeric_cols = df.select_dtypes(include=['number']).dropna()

# Create an empty list to store results

results = []

# Perform normality tests on each numeric column

for col in numeric_cols.columns:

shapiro_stat, shapiro_p = stats.shapiro(numeric_cols[col])

ks_stat, ks_p = stats.kstest(numeric_cols[col], 'norm',

args=(numeric_cols[col].mean(), numeric_cols[col].std()))

dagostino_stat, dagostino_p = stats.normaltest(numeric_cols[col])

anderson_stat = stats.anderson(numeric_cols[col], dist='norm')

# Store results in a dictionary

results.append({

"Column": col,

"Shapiro-Wilk Stat": round(shapiro_stat, 4),

"Shapiro-Wilk p-value": round(shapiro_p, 4),

"Kolmogorov-Smirnov Stat": round(ks_stat, 4),

"Kolmogorov-Smirnov p-value": round(ks_p, 4),

"D’Agostino K² Stat": round(dagostino_stat, 4),

"D’Agostino K² p-value": round(dagostino_p, 4),

"Anderson-Darling Stat": round(anderson_stat.statistic, 4),

})

# Histogram & Q-Q Plot

fig, ax = plt.subplots(1, 2, figsize=(12, 5))

sns.histplot(numeric_cols[col], kde=True, bins=20, ax=ax[0])

ax[0].set_title(f"Histogram of {col}")

stats.probplot(numeric_cols[col], dist="norm", plot=ax[1])

ax[1].set_title(f"Q-Q Plot of {col}")

plt.show()

# Convert results into a DataFrame

results_df = pd.DataFrame(results)

# Display the table

print(results_df)

RESULT
Column Shapiro-Wilk Stat ... D’Agostino K² p-value Anderson-Darling Stat

0 Adj Close 0.3999 ... 0.0 1488.3597

1 Close 0.4002 ... 0.0 1486.6029

2 High 0.4000 ... 0.0 1487.3982

3 Low 0.4005 ... 0.0 1485.8193

4 Open 0.4000 ... 0.0 1487.1525

5 Volume 0.7517 ... 0.0 293.6605

[6 rows x 8 columns]

Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
100% (3)
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
9 pages
Heart Disease Prediction! ❤️?
No ratings yet
Heart Disease Prediction! ❤️?
52 pages
Clustering Documentation Python Code
No ratings yet
Clustering Documentation Python Code
8 pages
Data Science Code
No ratings yet
Data Science Code
29 pages
DSA_1
No ratings yet
DSA_1
8 pages
Practical 1
No ratings yet
Practical 1
7 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
Correlation: Import As Import As Import As Import As From Import From Import Import Matplotlib Import
No ratings yet
Correlation: Import As Import As Import As Import As From Import From Import Import Matplotlib Import
1 page
Dovdush_KN-305_lab3
No ratings yet
Dovdush_KN-305_lab3
2 pages
BTVN1 - Colaboratory
No ratings yet
BTVN1 - Colaboratory
4 pages
Pandas
No ratings yet
Pandas
4 pages
Vertopal.com Heart Failure Prediction With Detailed Headings
No ratings yet
Vertopal.com Heart Failure Prediction With Detailed Headings
12 pages
Bse 500 Forecast Correlogram of Raw Dataset
No ratings yet
Bse 500 Forecast Correlogram of Raw Dataset
6 pages
KNN - Jupyter Notebook (1)
No ratings yet
KNN - Jupyter Notebook (1)
7 pages
Ex No3
No ratings yet
Ex No3
17 pages
Granger Causality and VAR Models
No ratings yet
Granger Causality and VAR Models
1 page
Machine Learning Lab Manual (1)
No ratings yet
Machine Learning Lab Manual (1)
42 pages
Python Solution
No ratings yet
Python Solution
30 pages
ARIMA Predict Forecast
No ratings yet
ARIMA Predict Forecast
1 page
hw-1
No ratings yet
hw-1
11 pages
Formulario - EA
No ratings yet
Formulario - EA
6 pages
Solution Matlab
No ratings yet
Solution Matlab
46 pages
Diabetes - Prediction - Project - Ipynb - Colab
No ratings yet
Diabetes - Prediction - Project - Ipynb - Colab
11 pages
a4 dsbda sana (2)
No ratings yet
a4 dsbda sana (2)
16 pages
Principal Component Analysis Matlab Code: Ram Sharan Timilsina (065/BEL/327)
No ratings yet
Principal Component Analysis Matlab Code: Ram Sharan Timilsina (065/BEL/327)
6 pages
PROBLEMARIO
No ratings yet
PROBLEMARIO
2 pages
AD3411 (2)
No ratings yet
AD3411 (2)
28 pages
Heart Disease Prediction (1) (1) - 1
No ratings yet
Heart Disease Prediction (1) (1) - 1
1 page
Exp1a
No ratings yet
Exp1a
5 pages
Implementing OLS Regression On Boston Housing Secondary Dataset. Also Check The Data For Missing Values and Outliers.
No ratings yet
Implementing OLS Regression On Boston Housing Secondary Dataset. Also Check The Data For Missing Values and Outliers.
26 pages
Project 3 - Diabetes Prediction.ipynb - Colab
No ratings yet
Project 3 - Diabetes Prediction.ipynb - Colab
4 pages
Python - How To Make A 4d Plot With Matplotlib Using Arbitrary Data - Stack Overflow
No ratings yet
Python - How To Make A 4d Plot With Matplotlib Using Arbitrary Data - Stack Overflow
13 pages
Assignment 03
No ratings yet
Assignment 03
6 pages
ModuleAr Merged
No ratings yet
ModuleAr Merged
42 pages
Week 6 9922103174 Suyash Singh
No ratings yet
Week 6 9922103174 Suyash Singh
17 pages
Shailesh020902@gmail - Com 1
No ratings yet
Shailesh020902@gmail - Com 1
1 page
Rapport ACP TD2-1
No ratings yet
Rapport ACP TD2-1
6 pages
k-fold
No ratings yet
k-fold
2 pages
graphs using matplotlib
No ratings yet
graphs using matplotlib
23 pages
Fds Mannual
No ratings yet
Fds Mannual
39 pages
ML 1st Program
No ratings yet
ML 1st Program
3 pages
DATA SCIENCE IDC 302 End Sem Project
No ratings yet
DATA SCIENCE IDC 302 End Sem Project
1 page
mine5
No ratings yet
mine5
8 pages
Ecotric Project
No ratings yet
Ecotric Project
3 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
DAL Experiment Outputs 6to10
No ratings yet
DAL Experiment Outputs 6to10
16 pages
Report
No ratings yet
Report
10 pages
S11202415 - Lab 3
No ratings yet
S11202415 - Lab 3
10 pages
cern-electron-mass-prediction-0-9859-r
No ratings yet
cern-electron-mass-prediction-0-9859-r
53 pages
AS Notebook - PCA - Wine Data-4
100% (1)
AS Notebook - PCA - Wine Data-4
1 page
CLASS 12 IP PRACTICAL FILE (2)-pages-deleted (1)-output
No ratings yet
CLASS 12 IP PRACTICAL FILE (2)-pages-deleted (1)-output
17 pages
Bank Loan
No ratings yet
Bank Loan
85 pages
Mayank Chaudhary DEV Practicals
No ratings yet
Mayank Chaudhary DEV Practicals
14 pages
Graphic: Tugas Statistika Claudia Astika Putri/ 121400440
No ratings yet
Graphic: Tugas Statistika Claudia Astika Putri/ 121400440
5 pages
1 Solution1
No ratings yet
1 Solution1
6 pages
LP Practical ! Jupyter Notebook
No ratings yet
LP Practical ! Jupyter Notebook
6 pages
Week 4 Laboratory Activity
No ratings yet
Week 4 Laboratory Activity
6 pages
Dovdush_KN-305_lab2
No ratings yet
Dovdush_KN-305_lab2
2 pages
GCSE Maths Revision: Cheeky Revision Shortcuts
From Everand
GCSE Maths Revision: Cheeky Revision Shortcuts
Scool Revision
3.5/5 (2)

CODE2

Uploaded by

CODE2

Uploaded by

CODE

import scipy.stats as stats

import seaborn as sns

import matplotlib.pyplot as plt

# Load the dataset

# Select numeric columns

# Create an empty list to store results

# Perform normality tests on each numeric column

for col in numeric_cols.columns:

shapiro_stat, shapiro_p = stats.shapiro(numeric_cols[col])

ks_stat, ks_p = stats.kstest(numeric_cols[col], 'norm',

dagostino_stat, dagostino_p = stats.normaltest(numeric_cols[col])

anderson_stat = stats.anderson(numeric_cols[col], dist='norm')

# Store results in a dictionary

"Shapiro-Wilk Stat": round(shapiro_stat, 4),

"Kolmogorov-Smirnov Stat": round(ks_stat, 4),

"Kolmogorov-Smirnov p-value": round(ks_p, 4),

"D’Agostino K² Stat": round(dagostino_stat, 4),

"D’Agostino K² p-value": round(dagostino_p, 4),

"Anderson-Darling Stat": round(anderson_stat.statistic, 4),

# Histogram & Q-Q Plot

fig, ax = plt.subplots(1, 2, figsize=(12, 5))

sns.histplot(numeric_cols[col], kde=True, bins=20, ax=ax[0])

stats.probplot(numeric_cols[col], dist="norm", plot=ax[1])

ax[1].set_title(f"Q-Q Plot of {col}")

# Convert results into a DataFrame

# Display the table

0 Adj Close 0.3999 ... 0.0 1488.3597

1 Close 0.4002 ... 0.0 1486.6029

2 High 0.4000 ... 0.0 1487.3982

4 Open 0.4000 ... 0.0 1487.1525

5 Volume 0.7517 ... 0.0 293.6605

You might also like