0% found this document useful (0 votes)

40 views6 pages

Statistical Data Analysis - Ipynb - Colaboratory

Uploaded by

Varad Kulkarni

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views6 pages

Statistical Data Analysis - Ipynb - Colaboratory

Uploaded by

Varad Kulkarni

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

5/17/23, 1:23 AM Copy of Statistical data analysis.

ipynb - Colaboratory

name : shreya bhangale

roll no : se entc 18 name : shreya bhangale roll no : se entc 18 experiment no:04
experiment no:04

#Import the required Packages

import pandas as pd
import numpy as np

from google.colab import files

uploaded = files.upload()

Choose Files No file chosen Upload widget is only available when the cell has been executed in
the current browser session. Please rerun this cell to enable.
Saving IBM-313 Marks xlsx to IBM-313 Marks xlsx

path = "IBM-313 Marks.xlsx"

table = pd.read_excel(path)
print (table)

S.No. MTE (25) Mini Project (25) Total (50) ETE (50) Total
0 1 5.00 20 25.00 12.0 37.00
1 2 11.05 20 31.05 26.0 57.05
2 3 8.10 20 28.10 14.0 42.10
3 4 6.00 10 16.00 13.0 29.00
4 5 11.35 20 31.35 17.0 48.35
.. ... ... ... ... ... ...
74 75 12.05 10 22.05 20.0 42.05
75 76 12.25 10 22.25 28.0 50.25
76 77 1.75 10 11.75 NaN 0.00
77 78 3.00 10 13.00 NaN 0.00
78 79 5.80 10 15.80 12.0 27.80

[79 rows x 6 columns]

table.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 79 entries, 0 to 78
Data columns (total 6 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 S.No. 79 non-null int64
1 MTE (25) 79 non-null float64
2 Mini Project (25) 79 non-null int64
3 Total (50) 79 non-null float64
4 ETE (50) 77 non-null float64
5 Total 79 non-null float64
dtypes: float64(4), int64(2)
memory usage: 3.8 KB

x = table['Total']
np.mean(x)

46.90632911392405

np.median(x)

45.0

import scipy
from scipy import stats
m1=stats.mode(x)
print(m1)

ModeResult(mode=array([0.]), count=array([2]))
<ipython-input-7-625da3d35865>:3: FutureWarning: Unlike other reduction functions (e.g. `skew`, `kurtosis`), the default behavior of `mo
m1=stats.mode(x)

li = [1, 2, 3, 3, 2, 2, 2, 1, 2]
print (stats.mode(li))

https://colab.research.google.com/drive/1apFRrvkiXDm2KVY7jq9fPctuxdxi8D-G#scrollTo=epYJ7wb4zlRr&printMode=true 1/6
5/17/23, 1:23 AM Copy of Statistical data analysis.ipynb - Colaboratory

ModeResult(mode=array([2]), count=array([5]))
<ipython-input-8-5c66091584e9>:2: FutureWarning: Unlike other reduction functions (e.g. `skew`, `kurtosis`), the default behavior of `mo
print (stats.mode(li))

a = np.array([1,2,3,4,5])
p = np.percentile(a,50)
print (p)

3.0

k = ['Ram', 65, 2.5]

print (k)

['Ram', 65, 2.5]

k = ['Ram', 65, 2.5]

for i in k:
print (i)

Ram
65
2.5

for i in range(10, 20, 2): print(i)

10
12
14
16
18

for i in range(10, 20, 2): print(i, end=',')

10,12,14,16,18,

FUNCTIONS IN PYTHON

def greet():
print("Hi")
print("Good Evening")
greet()

Hi
Good Evening

def add(p,q): #Function add is created to add 2 Numbers.

c = p+q
print(c)

add(10,4)

Finding Minimum and Maximum Value in an Array

data = [1,3,4,463,2,3,6,8,9,4,254,6,72]
min(data), max(data)

(1, 463)

data = [1,3,4,463,2,3,6,8,9,4,254,6,72]
def min_and_max(data): \
#Creates a function min_and_max which retrns the minimum and maximum values of array.
min_val = min(data)
max_val = max(data)

return (min_val, max_val)

https://colab.research.google.com/drive/1apFRrvkiXDm2KVY7jq9fPctuxdxi8D-G#scrollTo=epYJ7wb4zlRr&printMode=true 2/6
5/17/23, 1:23 AM Copy of Statistical data analysis.ipynb - Colaboratory
min_and_max(data)

(1, 463)

def rangeef(data):
min_val = min(data)
max_val = max(data)

return (max_val - min_val)

rangeef (data)

462

Quartile

a = np.array([1,2,3,4,5])
q1 = np.percentile(a,25)
print (q1)

2.0

a = np.array([1,2,3,4,5])
q2 = np.percentile(a,50)
print (q2)

3.0

a = np.array([1,2,3,4,5])
q3 = np.percentile(a,75)
print (q3)

4.0

Inter Quartile Range

IQ = q3 - q1
IQ

2.0

Variance

np.var(x)

262.7814789296587

Population Standard Deviation

import statistics
statistics.pstdev(x)

16.210536046955966

Sample Standard Deviation

np.std(x)

16.210536046955966

Skewness

from scipy.stats import skew

skew(x)

0.10226407464884266

https://colab.research.google.com/drive/1apFRrvkiXDm2KVY7jq9fPctuxdxi8D-G#scrollTo=epYJ7wb4zlRr&printMode=true 3/6
5/17/23, 1:23 AM Copy of Statistical data analysis.ipynb - Colaboratory

Box Plot

from matplotlib import pyplot as plt

plt.boxplot (x, sym = 'o') # * impliers data goes beyond max and min value.
plt.show()

table.describe()

S.No. MTE (25) Mini Project (25) Total (50) ETE (50) Total

count 79.000000 79.000000 79.000000 79.000000 77.000000 79.000000

mean 40.000000 10.178481 16.556962 26.735443 21.016234 46.906329

std 22.949219 4.961924 4.900934 8.504976 8.091209 16.314119

min 1.000000 0.700000 10.000000 11.200000 7.000000 0.000000

25% 20.500000 6.500000 11.000000 19.600000 17.000000 38.000000

50% 40.000000 10.300000 15.000000 27.500000 20.000000 45.000000

75% 59.500000 12.975000 22.000000 33.250000 24.000000 55.375000

max 79.000000 23.500000 22.000000 45.500000 50.000000 94.500000

from scipy.stats import skew

import numpy as np
import pylab as p

x1 = np.linspace( -5, 5, 1000 )

y1 = 1./(np.sqrt(2.*np.pi)) * np.exp( -.5*(x1)**2 )

p.plot(x1, y1, '*')

print( '\nSkewness for data : ', skew(y1))

https://colab.research.google.com/drive/1apFRrvkiXDm2KVY7jq9fPctuxdxi8D-G#scrollTo=epYJ7wb4zlRr&printMode=true 4/6
5/17/23, 1:23 AM Copy of Statistical data analysis.ipynb - Colaboratory

Skewness for data : 1.1108237139164436

from scipy.stats import skew

import numpy as np

# random values based on a normal distribution

x = np.random.normal(0, 2, 10000)

print ("X : \n", x)

print('\nSkewness for data : ', skew(x))

X :
[ 1.13126468 -2.2362244 4.36431696 ... -0.65830856 1.24609437
-1.98773246]

Skewness for data : 0.015454783893490075

from scipy.stats import skew

import numpy as np
import pylab as p

x1 = np.linspace( -5, 12, 1000 )

y1 = 1./(np.sqrt(2.*np.pi)) * np.exp( -.5*(x1)**2 )

p.plot(x1, y1, '.')

print( '\nSkewness for data : ', skew(y1))

Skewness for data : 1.917677776148478

https://colab.research.google.com/drive/1apFRrvkiXDm2KVY7jq9fPctuxdxi8D-G#scrollTo=epYJ7wb4zlRr&printMode=true 5/6
5/17/23, 1:23 AM Copy of Statistical data analysis.ipynb - Colaboratory

https://colab.research.google.com/drive/1apFRrvkiXDm2KVY7jq9fPctuxdxi8D-G#scrollTo=epYJ7wb4zlRr&printMode=true 6/6

Data Science Lab Program Printout
No ratings yet
Data Science Lab Program Printout
43 pages
pandas_ds
No ratings yet
pandas_ds
18 pages
Student - Linear Regression Example - Colaboratory
No ratings yet
Student - Linear Regression Example - Colaboratory
6 pages
Ds Pract 5 Data Analytics1 Vedanti
No ratings yet
Ds Pract 5 Data Analytics1 Vedanti
7 pages
ML Lab Manual 1-10
No ratings yet
ML Lab Manual 1-10
58 pages
Dsa 1
No ratings yet
Dsa 1
8 pages
ML Practice Assignment
No ratings yet
ML Practice Assignment
7 pages
Bigdata - Ipynb - Colab
No ratings yet
Bigdata - Ipynb - Colab
28 pages
Gold Prediction 1719293155
No ratings yet
Gold Prediction 1719293155
13 pages
Panda Merged
No ratings yet
Panda Merged
19 pages
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
No ratings yet
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
12 pages
DAR CompleteFile 1
No ratings yet
DAR CompleteFile 1
41 pages
Ai Tools and Applications-Lab
No ratings yet
Ai Tools and Applications-Lab
33 pages
Dsbda 3a
No ratings yet
Dsbda 3a
11 pages
Interactive Mapping in Python With UK Census Data
No ratings yet
Interactive Mapping in Python With UK Census Data
24 pages
Programs of Python Pandas
No ratings yet
Programs of Python Pandas
15 pages
A926534728 - 28953 - 8 - 2025 - Spark Mllib
No ratings yet
A926534728 - 28953 - 8 - 2025 - Spark Mllib
8 pages
Merged
No ratings yet
Merged
35 pages
4 PythonPandas
No ratings yet
4 PythonPandas
8 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
DS Manual 1
No ratings yet
DS Manual 1
96 pages
Ml1.ipynb - Colaboratory
No ratings yet
Ml1.ipynb - Colaboratory
5 pages
Data Pre Processing 1
No ratings yet
Data Pre Processing 1
35 pages
Practical No 1 - Merged
No ratings yet
Practical No 1 - Merged
6 pages
Prg7a - Jupyter Notebook
No ratings yet
Prg7a - Jupyter Notebook
12 pages
1 Simple Linear Regression
No ratings yet
1 Simple Linear Regression
9 pages
Data Science Practical Problems
No ratings yet
Data Science Practical Problems
40 pages
Ip Project
No ratings yet
Ip Project
27 pages
#Pip Install Pandas #Pandas Can Be Installed Using:: Import
No ratings yet
#Pip Install Pandas #Pandas Can Be Installed Using:: Import
6 pages
Data Loading - Jupyter Notebook
No ratings yet
Data Loading - Jupyter Notebook
15 pages
DAV Practicle File
No ratings yet
DAV Practicle File
28 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
Data Science Practicals - Ipynb
No ratings yet
Data Science Practicals - Ipynb
54 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
Terro's REA
No ratings yet
Terro's REA
43 pages
Descriptive Statistics With Pandas: Data Handling Using Pandas - II
100% (1)
Descriptive Statistics With Pandas: Data Handling Using Pandas - II
37 pages
23bet10114 Naman Gupta Assignment-1
No ratings yet
23bet10114 Naman Gupta Assignment-1
17 pages
Open Lab 2
No ratings yet
Open Lab 2
15 pages
Practical File Ip
No ratings yet
Practical File Ip
27 pages
Camp Class Moving Cluster
No ratings yet
Camp Class Moving Cluster
22 pages
Data Exploration in Python PDF
No ratings yet
Data Exploration in Python PDF
1 page
AI Final PDF
No ratings yet
AI Final PDF
38 pages
Statistics Exp 1
100% (1)
Statistics Exp 1
15 pages
Unit 5 Descriptive Statistics
No ratings yet
Unit 5 Descriptive Statistics
7 pages
Data Analytics Lab
No ratings yet
Data Analytics Lab
14 pages
230103-ECON209 S2025 Lab 2.ipynb-Colab
No ratings yet
230103-ECON209 S2025 Lab 2.ipynb-Colab
10 pages
Unit3 - 3) Pandas - Ipynb - Colab
No ratings yet
Unit3 - 3) Pandas - Ipynb - Colab
11 pages
Howxtre
No ratings yet
Howxtre
8 pages
Muh 2122051 M
No ratings yet
Muh 2122051 M
9 pages
DSC Lab Programs
No ratings yet
DSC Lab Programs
24 pages
2020 01 02 - 11h36mn59
No ratings yet
2020 01 02 - 11h36mn59
2 pages
Data Science Python Cheat Sheet
No ratings yet
Data Science Python Cheat Sheet
25 pages
Week 3 GGG
No ratings yet
Week 3 GGG
17 pages
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Microsoft Visual Basic Interview Questions: Microsoft VB Certification Review
From Everand
Microsoft Visual Basic Interview Questions: Microsoft VB Certification Review
Equity Press
No ratings yet
Amazing Java: Learn Java Quickly
From Everand
Amazing Java: Learn Java Quickly
Andrei Besedin
No ratings yet
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Wa0045.
No ratings yet
Wa0045.
1 page
Experminent 4
No ratings yet
Experminent 4
10 pages
Experminent 5
No ratings yet
Experminent 5
7 pages
Key Roles of SOC Analyst
No ratings yet
Key Roles of SOC Analyst
6 pages
Module 3 Dynamic Analysis
No ratings yet
Module 3 Dynamic Analysis
14 pages
Module 2 Static Analysis
No ratings yet
Module 2 Static Analysis
13 pages
MC
No ratings yet
MC
112 pages
Quantitative Techniques For Business Decisions
0% (1)
Quantitative Techniques For Business Decisions
8 pages
Starting Out in Statistics An Introduction For Students of Human Health Disease and Psychology 1st Edition Patricia de Winter
100% (1)
Starting Out in Statistics An Introduction For Students of Human Health Disease and Psychology 1st Edition Patricia de Winter
51 pages
Statistics and Probability STAT 112 Grade11 Week 1 20 Kuya SAGUIL
No ratings yet
Statistics and Probability STAT 112 Grade11 Week 1 20 Kuya SAGUIL
179 pages
Sampling Designs Final Material
No ratings yet
Sampling Designs Final Material
52 pages
Written Report (Group 1) - 2
No ratings yet
Written Report (Group 1) - 2
21 pages
Effect of Market Segmentation On The Performance of Micro, Small and Medium Enterprises in Makurdi Metropolis, Benue State, Nigeria
No ratings yet
Effect of Market Segmentation On The Performance of Micro, Small and Medium Enterprises in Makurdi Metropolis, Benue State, Nigeria
7 pages
Pengaruh Motif Penggunaan Media Sosial Instagram @sisilism Terhadap Kepuasan Followers Terkait Sex Education
No ratings yet
Pengaruh Motif Penggunaan Media Sosial Instagram @sisilism Terhadap Kepuasan Followers Terkait Sex Education
8 pages
- MAT1004 22070450 Trần Nguyên Quân
No ratings yet
- MAT1004 22070450 Trần Nguyên Quân
26 pages
Statistical Distributions
No ratings yet
Statistical Distributions
170 pages
MAT 240 Real Estate Data
No ratings yet
MAT 240 Real Estate Data
5 pages
Exercise
No ratings yet
Exercise
2 pages
7.ama Data File
No ratings yet
7.ama Data File
18 pages
The Neurocognitive Consequences of Sleep Restriction - A Meta-Analytic Review
No ratings yet
The Neurocognitive Consequences of Sleep Restriction - A Meta-Analytic Review
65 pages
STAT1008 Assignment
No ratings yet
STAT1008 Assignment
10 pages
U02Lecture07 Classification
100% (1)
U02Lecture07 Classification
56 pages
Data:: Cusum Test Example
No ratings yet
Data:: Cusum Test Example
4 pages
Edu 533 1st Sem Sy 2223 Practice Test 1
No ratings yet
Edu 533 1st Sem Sy 2223 Practice Test 1
53 pages
p3 Assesslearners Report
No ratings yet
p3 Assesslearners Report
8 pages
Handbook of Applied Econometrics and Statistical Inference 1st Edition Viktor K. Jirsa
No ratings yet
Handbook of Applied Econometrics and Statistical Inference 1st Edition Viktor K. Jirsa
84 pages
Day 22 Stats Day 1
No ratings yet
Day 22 Stats Day 1
6 pages
SPSS For Starters, Part 2
100% (15)
SPSS For Starters, Part 2
16 pages
Project Report
No ratings yet
Project Report
3 pages
Statistics For Business and Economics,: 11E Anderson/Sweeney/Williams
No ratings yet
Statistics For Business and Economics,: 11E Anderson/Sweeney/Williams
39 pages
Practice Exam (Resit 2023-24) - Solutions
No ratings yet
Practice Exam (Resit 2023-24) - Solutions
29 pages
T Distribution
100% (3)
T Distribution
33 pages
MachineLearning Unit-III
No ratings yet
MachineLearning Unit-III
26 pages
Sele 2
No ratings yet
Sele 2
18 pages
Holding & SPC
No ratings yet
Holding & SPC
11 pages
2006 Legg & Nagy Why Most Conservation Monitoring Is, But Need Not Be, A Waste of Time
No ratings yet
2006 Legg & Nagy Why Most Conservation Monitoring Is, But Need Not Be, A Waste of Time
6 pages
Unit-5 ML Notes
No ratings yet
Unit-5 ML Notes
72 pages

Statistical Data Analysis - Ipynb - Colaboratory

Uploaded by

Statistical Data Analysis - Ipynb - Colaboratory

Uploaded by

5/17/23, 1:23 AM Copy of Statistical data analysis.

name : shreya bhangale

#Import the required Packages

from google.colab import files

path = "IBM-313 Marks.xlsx"

[79 rows x 6 columns]

k = ['Ram', 65, 2.5]

['Ram', 65, 2.5]

k = ['Ram', 65, 2.5]

for i in range(10, 20, 2): print(i)

for i in range(10, 20, 2): print(i, end=',')

def add(p,q): #Function add is created to add 2 Numbers.

Finding Minimum and Maximum Value in an Array

return (min_val, max_val)

return (max_val - min_val)

Inter Quartile Range

Population Standard Deviation

Sample Standard Deviation

from scipy.stats import skew

from matplotlib import pyplot as plt

count 79.000000 79.000000 79.000000 79.000000 77.000000 79.000000

mean 40.000000 10.178481 16.556962 26.735443 21.016234 46.906329

std 22.949219 4.961924 4.900934 8.504976 8.091209 16.314119

min 1.000000 0.700000 10.000000 11.200000 7.000000 0.000000

25% 20.500000 6.500000 11.000000 19.600000 17.000000 38.000000

50% 40.000000 10.300000 15.000000 27.500000 20.000000 45.000000

75% 59.500000 12.975000 22.000000 33.250000 24.000000 55.375000

max 79.000000 23.500000 22.000000 45.500000 50.000000 94.500000

from scipy.stats import skew

x1 = np.linspace( -5, 5, 1000 )

p.plot(x1, y1, '*')

print( '\nSkewness for data : ', skew(y1))

Skewness for data : 1.1108237139164436

from scipy.stats import skew

# random values based on a normal distribution

print ("X : \n", x)

print('\nSkewness for data : ', skew(x))

Skewness for data : 0.015454783893490075

from scipy.stats import skew

x1 = np.linspace( -5, 12, 1000 )

p.plot(x1, y1, '.')

print( '\nSkewness for data : ', skew(y1))

Skewness for data : 1.917677776148478

You might also like