0% found this document useful (0 votes)

89 views6 pages

ANOVA and T-Test Analysis Guide

This document discusses and provides examples of performing one-way ANOVA and t-tests in Python using libraries like scipy, statsmodels, and pingouin. It shows how to conduct one-way ANOVA on different groups of performance data and explore differences between groups. It also demonstrates three methods of performing two-sample t-tests to compare two groups of data and determine if their means are statistically different.

Uploaded by

Garuma Abdisa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

89 views6 pages

ANOVA and T-Test Analysis Guide

Uploaded by

Garuma Abdisa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

One-way ANOVA:

# Importing library

from [Link] import f_oneway

# Performance when each of the engine

# oil is applied

performance1 = [89, 89, 88, 78, 79]

performance2 = [93, 92, 94, 89, 88]

performance3 = [89, 88, 89, 93, 90]

performance4 = [81, 78, 81, 92, 82]

# Conduct the one-way ANOVA

print(f_oneway(performance1, performance2, performance3, performance4))

Output: F_onewayResult(statistic=4.625000000000002, pvalue=0.016336459839780215)

###############################################

import pandas as pd

# load data file

df = pd.read_excel("C:/Users/user/Documents/[Link]")

# reshape the d dataframe suitable for statsmodels package

df_melt = [Link](df.reset_index(), id_vars=['index'], value_vars=['A', 'B', 'C', 'D'])

# replace column names

df_melt.columns = ['index', 'treatments', 'value']

# generate a boxplot to see the data distribution by treatments. Using boxplot, we can

# easily detect the differences between different treatments

import [Link] as plt

import seaborn as sns

ax = [Link](x='treatments', y='value', data=df_melt, color='#99c2a2')

ax = [Link](x="treatments", y="value", data=df_melt, color='#7d0013')

[Link]()

import [Link] as stats

# stats f_oneway functions takes the groups as input and returns ANOVA F and p value

fvalue, pvalue = stats.f_oneway(df['A'], df['B'], df['C'], df['D'])

print(fvalue, pvalue)

# 17.492810457516338 2.639241146210922e-05

# get ANOVA table as R like output

import [Link] as sm

from [Link] import ols

# Ordinary Least Squares (OLS) model

model = ols('value ~ C(treatments)', data=df_melt).fit()

anova_table = [Link].anova_lm(model, typ=2)

print(anova_table)

#######################

# install

pip install bioinfokit

# upgrade to latest version

pip install bioinfokit --upgrade

# uninstall

pip uninstall bioinfokit

################################
t-test

import [Link] as stats

import numpy as np

# Creating data groups

data_group1 = [Link]([14, 15, 15, 16, 13, 8, 14,

17, 16, 14, 19, 20, 21, 15,

15, 16, 16, 13, 14, 12])

data_group2 = [Link]([15, 17, 14, 17, 14, 8, 12,

19, 19, 14, 17, 22, 24, 16,

13, 16, 13, 18, 15, 13])

# Print the variance of both data groups

print([Link](data_group1), [Link](data_group2))

output: 7.727500000000001 12.260000000000002

1. Performing Two-Sample T-Test

Method 1

# Python program to demonstrate how to

# perform two sample T-test

# Import the library

import [Link] as stats

import numpy as np

# Creating data groups

data_group1 = [Link]([14, 15, 15, 16, 13, 8, 14,

17, 16, 14, 19, 20, 21, 15,

15, 16, 16, 13, 14, 12])

data_group2 = [Link]([15, 17, 14, 17, 14, 8, 12,

19, 19, 14, 17, 22, 24, 16,

13, 16, 13, 18, 15, 13])

# Perform the two sample t-test with equal variances

print(stats.ttest_ind(a=data_group1, b=data_group2, equal_var=True))

output: Ttest_indResult(statistic=-0.6337397070250238, pvalue=0.5300471010405257)

method 2

# Python program to conduct two-sample

# T-test using pingouin library

# Importing library

from [Link] import ttest_ind

import numpy as np

import pingouin as pg

# Creating data groups

data_group1 = [Link]([160, 150, 160, 156.12, 163.24,

160.56, 168.56, 174.12,

167.123, 165.12])

data_group2 = [Link]([157.97, 146, 140.2, 170.15,

167.34, 176.123, 162.35, 159.123,

169.43, 148.123])

# Conducting two-sample ttest

result = [Link](data_group1,

data_group2,

correction=True)
# Print the result

print(result)

output: T dof alternative ... cohen-d BF10 power

T-test 0.653148 14.389477 two-sided ... 0.292097 0.462 0.094912

Method 3

from [Link] import ttest_ind

import numpy as np

import pingouin as pg

# Creating data groups

data_group1 = [Link]([160, 150, 160, 156.12,

163.24,

160.56, 168.56, 174.12,

167.123, 165.12])

data_group2 = [Link]([157.97, 146, 140.2, 170.15,

167.34, 176.123, 162.35,

159.123, 169.43, 148.123])

# Conducting two-sample ttest

print(ttest_ind(data_group1, data_group2))

output: (0.6531479162158739, 0.5219170107019715, 18.0) ….> t-stat, p-val, df

linear regression

pip install sklearn-pandas==1.5.0

Stats Lab (7-9)
No ratings yet
Stats Lab (7-9)
8 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
4 12
No ratings yet
4 12
17 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
Pratical 11 Python DP
No ratings yet
Pratical 11 Python DP
5 pages
Staff Manual 06
No ratings yet
Staff Manual 06
3 pages
188007259941509
No ratings yet
188007259941509
2 pages
Regression and Hypothesis Testing Methods
No ratings yet
Regression and Hypothesis Testing Methods
8 pages
Python Data Analytics Techniques
No ratings yet
Python Data Analytics Techniques
10 pages
Ex. No.: 01 Working With Numpy Arrays
No ratings yet
Ex. No.: 01 Working With Numpy Arrays
30 pages
Data Science Practical With Solutions BSC Cs Sem 6
No ratings yet
Data Science Practical With Solutions BSC Cs Sem 6
29 pages
Exercises 2 Unfinished
No ratings yet
Exercises 2 Unfinished
8 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
Annotated Follow-Along Guide - Explore One-Way Versus Two-Way ANOVA Tests With Python
No ratings yet
Annotated Follow-Along Guide - Explore One-Way Versus Two-Way ANOVA Tests With Python
17 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
Mat Lab Workbooks Ta THW 4
No ratings yet
Mat Lab Workbooks Ta THW 4
4 pages
7406HW02 1
No ratings yet
7406HW02 1
3 pages
Manual vs Auto Transmission MPG Analysis
No ratings yet
Manual vs Auto Transmission MPG Analysis
5 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
DA Manual - Part B
No ratings yet
DA Manual - Part B
13 pages
Statistical Analysis With Scipy?
No ratings yet
Statistical Analysis With Scipy?
9 pages
Machine Learning Practical File MRIEM
No ratings yet
Machine Learning Practical File MRIEM
49 pages
Data Science Practical
No ratings yet
Data Science Practical
22 pages
Machine Learning Lab Experiments Guide
No ratings yet
Machine Learning Lab Experiments Guide
47 pages
Fha-Pyhton Program Unit 1-4
No ratings yet
Fha-Pyhton Program Unit 1-4
13 pages
BAN5
No ratings yet
BAN5
2 pages
TS Final
No ratings yet
TS Final
13 pages
Data Analysis and Visualization Guide
No ratings yet
Data Analysis and Visualization Guide
16 pages
Machine Learning Cheat Sheet
No ratings yet
Machine Learning Cheat Sheet
15 pages
Anova 2
No ratings yet
Anova 2
4 pages
ML Updated File
No ratings yet
ML Updated File
36 pages
En Tanagra Python StatsModels PDF
No ratings yet
En Tanagra Python StatsModels PDF
20 pages
Tinywow Matlabworkbookstathw4 83108852
No ratings yet
Tinywow Matlabworkbookstathw4 83108852
16 pages
Data Analytics Lab
No ratings yet
Data Analytics Lab
46 pages
Project Inferential Statistics-Checkpoint
No ratings yet
Project Inferential Statistics-Checkpoint
11 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
ANOVA Analysis in R Guide
No ratings yet
ANOVA Analysis in R Guide
7 pages
Machine Learning Evaluation Guide
100% (1)
Machine Learning Evaluation Guide
504 pages
Medium Com Sarowar Saurav10 20 Advanced Statistical Approaches Every Data Scientist Should Know Ccc70ae4df28
No ratings yet
Medium Com Sarowar Saurav10 20 Advanced Statistical Approaches Every Data Scientist Should Know Ccc70ae4df28
15 pages
Principal Component Analysis Python
No ratings yet
Principal Component Analysis Python
7 pages
1
No ratings yet
1
13 pages
Business Analytics Assignment
No ratings yet
Business Analytics Assignment
26 pages
Mtcars Dataset: Multilinear Regression Analysis
No ratings yet
Mtcars Dataset: Multilinear Regression Analysis
13 pages
Machine Learning 2
No ratings yet
Machine Learning 2
45 pages
Regression Analysis Cheat Sheet
No ratings yet
Regression Analysis Cheat Sheet
9 pages
Agniva
No ratings yet
Agniva
16 pages
Parametric
No ratings yet
Parametric
15 pages
ADS EXP Assignments
No ratings yet
ADS EXP Assignments
38 pages
7708 - MBA PredAnanBigDataNov21
No ratings yet
7708 - MBA PredAnanBigDataNov21
11 pages
Data Analytics Lab Manual Final1
No ratings yet
Data Analytics Lab Manual Final1
32 pages
Da Rec
No ratings yet
Da Rec
29 pages
Fdsa New Lab
No ratings yet
Fdsa New Lab
14 pages
Ad3411-Data Science and Analytics Laboratory
No ratings yet
Ad3411-Data Science and Analytics Laboratory
27 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
Statistics Cheatsheet 1703847367
No ratings yet
Statistics Cheatsheet 1703847367
8 pages
Data Science
No ratings yet
Data Science
15 pages
ANCOVA Implementation in Python Guide
No ratings yet
ANCOVA Implementation in Python Guide
4 pages
Modern Physics, Final Exam
No ratings yet
Modern Physics, Final Exam
2 pages
Python OOP and Tkinter Guide
No ratings yet
Python OOP and Tkinter Guide
3 pages
t-Tests in Pandas: A Step-by-Step Guide
No ratings yet
t-Tests in Pandas: A Step-by-Step Guide
5 pages
Central Limit Theorem & Confidence Intervals
100% (1)
Central Limit Theorem & Confidence Intervals
14 pages
Research Subjects (Respondents) : (Mesa, Chica, Bastos, Bonamigo, & Duquia, 2014) - According To
No ratings yet
Research Subjects (Respondents) : (Mesa, Chica, Bastos, Bonamigo, & Duquia, 2014) - According To
2 pages
Get PDF of Data Abstraction and Problem Solving With C Walls and Mirrors 7th Edition Carrano
No ratings yet
Get PDF of Data Abstraction and Problem Solving With C Walls and Mirrors 7th Edition Carrano
317 pages
Chapter 8A
No ratings yet
Chapter 8A
26 pages
Multivariate Statistics With R
No ratings yet
Multivariate Statistics With R
190 pages
Time Series Forecasting Using Deep Learning - MATLAB & Simulink
100% (1)
Time Series Forecasting Using Deep Learning - MATLAB & Simulink
6 pages
Random Sampling Techniques Guide
No ratings yet
Random Sampling Techniques Guide
22 pages
Technology Literacy in Grade 12 TVL-CSS Students
No ratings yet
Technology Literacy in Grade 12 TVL-CSS Students
23 pages
EXERCISE#9 Measures of Variability 2
No ratings yet
EXERCISE#9 Measures of Variability 2
2 pages
Ain Shams University Faculty of Engineering
No ratings yet
Ain Shams University Faculty of Engineering
8 pages
J Clinic Periodontology - 2022 - Michelson - Lack of Attention To Sex and Gender in Periodontitis Related Randomized
No ratings yet
J Clinic Periodontology - 2022 - Michelson - Lack of Attention To Sex and Gender in Periodontitis Related Randomized
14 pages
Dissertation Guide Book - Third Edition
No ratings yet
Dissertation Guide Book - Third Edition
27 pages
Responsibility and Authority - QMS
50% (2)
Responsibility and Authority - QMS
47 pages
Summary of Student Comments For Spring 2014 Courses PDF
No ratings yet
Summary of Student Comments For Spring 2014 Courses PDF
300 pages
Business Quantitative Analysis Guide
No ratings yet
Business Quantitative Analysis Guide
3 pages
Probability Concepts Quiz
No ratings yet
Probability Concepts Quiz
3 pages
Group 2 Final Paper 1
No ratings yet
Group 2 Final Paper 1
48 pages
Revised PNP DSWD
No ratings yet
Revised PNP DSWD
48 pages
Advanced Probability Theory For Biomedical Engineers
No ratings yet
Advanced Probability Theory For Biomedical Engineers
106 pages
Line of Best Fit Worksheet PDF
100% (2)
Line of Best Fit Worksheet PDF
2 pages
Module 3-Descriptive Statisics and Measures of Central Tendency
No ratings yet
Module 3-Descriptive Statisics and Measures of Central Tendency
67 pages
Multimedia Instruction in Teaching Grade 10 Mathematics: A Comparative Study Using Multiple Series Design
No ratings yet
Multimedia Instruction in Teaching Grade 10 Mathematics: A Comparative Study Using Multiple Series Design
12 pages
MBA Business Statistics Tutorial
No ratings yet
MBA Business Statistics Tutorial
2 pages
Negative Refraction Metamaterials Fundamental Principles and Applications 1st Edition G. V. Eleftheriades Download
100% (4)
Negative Refraction Metamaterials Fundamental Principles and Applications 1st Edition G. V. Eleftheriades Download
72 pages
Importance of Research Methodology 5-6
No ratings yet
Importance of Research Methodology 5-6
4 pages
Eviews
No ratings yet
Eviews
3 pages
Inequality and Violent Crime
No ratings yet
Inequality and Violent Crime
39 pages
Chernoz Hansen 2006 JoE
No ratings yet
Chernoz Hansen 2006 JoE
35 pages
Probability Concepts for Statisticians
No ratings yet
Probability Concepts for Statisticians
78 pages
Talking About Second Language Acquisition Karim Sadeghi Full Chapters Included
No ratings yet
Talking About Second Language Acquisition Karim Sadeghi Full Chapters Included
160 pages

ANOVA and T-Test Analysis Guide

Uploaded by

ANOVA and T-Test Analysis Guide

Uploaded by

One-way ANOVA:

from [Link] import f_oneway

# Performance when each of the engine

performance1 = [89, 89, 88, 78, 79]

performance2 = [93, 92, 94, 89, 88]

performance3 = [89, 88, 89, 93, 90]

performance4 = [81, 78, 81, 92, 82]

# Conduct the one-way ANOVA

print(f_oneway(performance1, performance2, performance3, performance4))

Output: F_onewayResult(statistic=4.625000000000002, pvalue=0.016336459839780215)

# load data file

# reshape the d dataframe suitable for statsmodels package

df_melt = [Link](df.reset_index(), id_vars=['index'], value_vars=['A', 'B', 'C', 'D'])

# replace column names

df_melt.columns = ['index', 'treatments', 'value']

# easily detect the differences between different treatments

import [Link] as plt

import seaborn as sns

ax = [Link](x="treatments", y="value", data=df_melt, color='#7d0013')

import [Link] as stats

fvalue, pvalue = stats.f_oneway(df['A'], df['B'], df['C'], df['D'])

# get ANOVA table as R like output

from [Link] import ols

# Ordinary Least Squares (OLS) model

model = ols('value ~ C(treatments)', data=df_melt).fit()

anova_table = [Link].anova_lm(model, typ=2)

pip install bioinfokit

# upgrade to latest version

pip install bioinfokit --upgrade

pip uninstall bioinfokit

import [Link] as stats

# Creating data groups

data_group1 = [Link]([14, 15, 15, 16, 13, 8, 14,

17, 16, 14, 19, 20, 21, 15,

15, 16, 16, 13, 14, 12])

data_group2 = [Link]([15, 17, 14, 17, 14, 8, 12,

19, 19, 14, 17, 22, 24, 16,

13, 16, 13, 18, 15, 13])

# Print the variance of both data groups

output: 7.727500000000001 12.260000000000002

1. Performing Two-Sample T-Test

# Python program to demonstrate how to

# perform two sample T-test

# Import the library

import [Link] as stats

# Creating data groups

data_group1 = [Link]([14, 15, 15, 16, 13, 8, 14,

17, 16, 14, 19, 20, 21, 15,

15, 16, 16, 13, 14, 12])

19, 19, 14, 17, 22, 24, 16,

13, 16, 13, 18, 15, 13])

# Perform the two sample t-test with equal variances

print(stats.ttest_ind(a=data_group1, b=data_group2, equal_var=True))

output: Ttest_indResult(statistic=-0.6337397070250238, pvalue=0.5300471010405257)

# Python program to conduct two-sample

# T-test using pingouin library

from [Link] import ttest_ind

# Creating data groups

data_group1 = [Link]([160, 150, 160, 156.12, 163.24,

160.56, 168.56, 174.12,

data_group2 = [Link]([157.97, 146, 140.2, 170.15,

167.34, 176.123, 162.35, 159.123,

# Conducting two-sample ttest

output: T dof alternative ... cohen-d BF10 power

T-test 0.653148 14.389477 two-sided ... 0.292097 0.462 0.094912

from [Link] import ttest_ind

# Creating data groups

data_group1 = [Link]([160, 150, 160, 156.12,

160.56, 168.56, 174.12,

data_group2 = [Link]([157.97, 146, 140.2, 170.15,

167.34, 176.123, 162.35,

159.123, 169.43, 148.123])

# Conducting two-sample ttest

output: (0.6531479162158739, 0.5219170107019715, 18.0) ….> t-stat, p-val, df

pip install sklearn-pandas==1.5.0

You might also like