Lab02 Summary Measures - Ipynb

The document discusses calculating summary statistics such as mean, median, mode, variance, and percentiles using NumPy functions. It creates sample data and demonstrates calculating various summary metrics in one line of code.

Uploaded by

joumana.r.daher

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views2 pages

Lab02 Summary Measures - Ipynb

Uploaded by

joumana.r.daher

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

{"nbformat":4,"nbformat_minor":0,"metadata":{"colab":{"provenance":

[],"collapsed_sections":[],"toc_visible":true},"kernelspec":
{"name":"python3","display_name":"Python 3"},"language_info":
{"name":"python"}},"cells":[{"cell_type":"markdown","source":["***Objective:***\
n","\n","Summary statistics summarize and provide information about your sample
data. It tells you something about the values in your data set\n","\n","The main
objective in this notebook is to learn how to use already built in functions in
numpy to calculate easily these summary statistics measures such as the mean, mode,
median, maximum, minimum, quantiles, percentiles...etc. in one line of code and in
less than 1 minute instead of calculating them manually\n","\n"],"metadata":
{"id":"KFnwvRv68Zmj"}},{"cell_type":"markdown","source":["# Summary
Statistics"],"metadata":{"id":"kU3lKYnyA3El"}},{"cell_type":"markdown","source":
["**Importing Libraries**\n"],"metadata":{"id":"18qlkn6q8n2O"}},
{"cell_type":"code","source":["import numpy as np"],"metadata":
{"id":"OGuh4PFJBAmN"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["**Creating a Dataframe with 5 columns : septal
length, width, petal length, width and the species** (pandas
introduction)"],"metadata":{"id":"u4UCVDd982nB"}},{"cell_type":"code","source":
["#First lets create a list and convert it to numpy array \n","x =
np.array([5.1,4.9,5.8,7.9,5.9,6.2,6.3,5.7])\n","# y=
[4.9,3,1.4,0.2,5.4,3.9,1.7,0.4]\n"],"metadata":
{"id":"6e8Ao8O_Dg5k"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["## **Sample Mean**\n"," \n"],"metadata":
{"id":"kfEubN1gJLj-"}},{"cell_type":"markdown","source":["$$\\frac{1}{n} \\
sum_{i=i}^{n} x_{i}$$"],"metadata":{"id":"yj3vCfwPF9Ft"}},
{"cell_type":"markdown","source":["**Let's Calculate the mean for the septal length
column specifically**"],"metadata":{"id":"yJOyfx109lGC"}},
{"cell_type":"markdown","source":["**Use already built in a function
called .mean()**\n"],"metadata":{"id":"qMGAGwbnAfNH"}},
{"cell_type":"code","source":["x_mean = np.mean(x)\n","x_mean"],"metadata":
{"id":"MDIXJxkDJYFD"},"execution_count":null,"outputs":[]},
{"cell_type":"code","source":["# alternative way use the method?\n","x_mean2 =
x.mean()\n","x_mean2"],"metadata":
{"id":"_3gTpZlF4G0P"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["## **Population Variance**\n"],"metadata":
{"id":"bglLkh0qJdLZ"}},{"cell_type":"markdown","source":["$$\\sigma^2 = \\frac{\\
displaystyle\\sum_{i=1}^{n}(x_i - \\mu)^2} {N}$$"],"metadata":
{"id":"CYSJtRTTGb_8"}},{"cell_type":"markdown","source":["**Use already built in a
function called .var()**\n"],"metadata":{"id":"nWCxyGXAB7UQ"}},
{"cell_type":"code","source":["\n","var = np.var(x)\n","var"],"metadata":
{"id":"pyBrhH8MJjrf"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["##**Population Standard
Deviation**"],"metadata":{"id":"IlVmmfvvJvaU"}},{"cell_type":"markdown","source":
["$$\\sigma = \\sqrt\\frac{\\sum(x_i - \\mu)^2}{N}$$"],"metadata":
{"id":"9idGZJbpt3ZC"}},{"cell_type":"code","source":["# 1st Method\
n","np.sqrt(np.var(x))"],"metadata":
{"id":"bgVGjFi2JzXO"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["**Now use a function already built in for the
standard deviation**"],"metadata":{"id":"DBNq55NVCYcZ"}},
{"cell_type":"code","source":["# 2nd Method\n","std = np.std(x)\
n","std"],"metadata":{"id":"2DXTfHQdJ3gA"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["# Sample Variance"],"metadata":
{"id":"SqnkzrHs41yZ"}},{"cell_type":"markdown","source":["$$s^2 = \\frac{\\
displaystyle\\sum_{i=1}^{n}(x_i - \\bar x)^2} {n-1}$$"],"metadata":
{"id":"sNXd9a2X5G58"}},{"cell_type":"code","source":["\n","var = np.var(x, ddof =
1)\n","var"],"metadata":{"id":"lvGFCQuD4zVa"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["##**Minimum and Maximum**"],"metadata":
{"id":"RAy5G05aKFSu"}},{"cell_type":"code","source":["np.min(x)"],"metadata":
{"id":"KYslx3SZKAmv"},"execution_count":null,"outputs":[]},
{"cell_type":"code","source":["np.max(x)"],"metadata":{"id":"n-
NMIbKPKISo"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":
["##**Mode**"],"metadata":{"id":"8p-hH_F6KKk-"}},{"cell_type":"code","source":
["import statistics\n","z = [4, 1, 2, 2, 3, 5]\n","statistics.mode(z)"],"metadata":
{"id":"sNB07xBbKOLa"},"execution_count":null,"outputs":[]},
{"cell_type":"code","source":["z1=
[\"few\", \"few\", \"many\", \"some\", \"many\",\"few\"]\
n","statistics.mode(z1)"],"metadata":{"id":"P-
dq0EoFEXhM"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":
["\n","##**Percentiles**\n"],"metadata":{"id":"um8Xn-p-C7gR"}},
{"cell_type":"markdown","source":["###**25th Percentile**"],"metadata":{"id":"S-
yimGUIC0ZA"}},{"cell_type":"code","source":["# Store the following values in an
array named arr \n","arr = [20, 2, 7, 1, 34]\n","print(\"arr : \",
arr)"],"metadata":{"id":"2qOBHMIlWvSS"},"execution_count":null,"outputs":[]},
{"cell_type":"code","source":["print(\"25th percentile of arr : \",\n","
np.percentile(arr, 25))"],"metadata":
{"id":"3cwoutQeVhO6"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["###**75th percentile**"],"metadata":
{"id":"JSno9J_lC_8I"}},{"cell_type":"code","source":["print(\"75th percentile of
arr : \",\n"," np.percentile(arr, 75))"],"metadata":
{"id":"OWR8YN6_KaRE"},"execution_count":null,"outputs":[]},
{"cell_type":"code","source":["np.percentile(arr, q=[25, 75],
interpolation='lower')"],"metadata":
{"id":"RxWr7yAWKc6C"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["###**50th Percentile OR Median**"],"metadata":
{"id":"rTyskfjJKtAH"}},{"cell_type":"code","source":["#Easiest way to calculate the
median using a built in function called .median()\n","np.median(arr)"],"metadata":
{"id":"xISFQtZqK0XP"},"execution_count":null,"outputs":[]},
{"cell_type":"code","source":["# Or we can use the 50th percentile\n","print(\"The
median is : \",\n"," np.percentile(arr, 50))"],"metadata":
{"id":"lyNqedwBXHpO"},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":["TO DO EXERCISE:\n","\n","1- CREATE A NUMPY ARRAY
THAT CONTAINS THE FOLLOWING NUMBERS 4.9,3,1.4,0.2,5.4,3.9,1.7,0.4\n","\n","2- NOW
APPLY THE FOLLOWING SUMMARY MEASURES: MEAN, VARIANCE, STD, MIN, MAX, 40TH
PERCENTILE\n","\n","3- FINALLY CALCULATE THE MEDIAN USING 2 DIFFERENT
METHODS"],"metadata":{"id":"7j2glQvPXinq"}},{"cell_type":"markdown","source":
["https://github.com/rasbt/data-science-tutorial/blob/master/code/summary-
stats.ipynb\n"],"metadata":{"id":"bEeSg-zpFEAh"}}]}

LET Review Prof Education Assessment of Learning
100% (5)
LET Review Prof Education Assessment of Learning
32 pages
Essential n8n Playbook
From Everand
Essential n8n Playbook
Leandro Calado
No ratings yet
Hands On Data Visualization Using Matplotlib
100% (1)
Hands On Data Visualization Using Matplotlib
7 pages
Shrieves Casting Company Chapter 12 (11ed-11) Cash Flow Estimation and Risk Analysis
100% (1)
Shrieves Casting Company Chapter 12 (11ed-11) Cash Flow Estimation and Risk Analysis
12 pages
Sport Obermeyer
No ratings yet
Sport Obermeyer
4 pages
Capital Budgeting - Risk Analysis: Questions & Answers
100% (1)
Capital Budgeting - Risk Analysis: Questions & Answers
4 pages
Prac2 23bme053
No ratings yet
Prac2 23bme053
3 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
Machine Learning Lab Word 12-1-2025. Document
No ratings yet
Machine Learning Lab Word 12-1-2025. Document
68 pages
ML Lab Manual
No ratings yet
ML Lab Manual
28 pages
Data Preparation
No ratings yet
Data Preparation
11 pages
Lab ML
No ratings yet
Lab ML
26 pages
EE2211 CheatSheet
No ratings yet
EE2211 CheatSheet
15 pages
Lab05 Normal Distribution - Ipynb
No ratings yet
Lab05 Normal Distribution - Ipynb
1 page
AD3411
No ratings yet
AD3411
28 pages
HW7 Code
No ratings yet
HW7 Code
3 pages
Data Sci HW1
No ratings yet
Data Sci HW1
8 pages
Machine Learning
No ratings yet
Machine Learning
31 pages
Keeratsi HW8
No ratings yet
Keeratsi HW8
17 pages
2.3 SciPy-1
No ratings yet
2.3 SciPy-1
17 pages
Neural Network
No ratings yet
Neural Network
7 pages
Python Code - Summary Statistics
No ratings yet
Python Code - Summary Statistics
6 pages
Aiml Lab
No ratings yet
Aiml Lab
37 pages
Dav Lab Manual
No ratings yet
Dav Lab Manual
28 pages
ML Programs
No ratings yet
ML Programs
41 pages
STATSCHEATSHeet
No ratings yet
STATSCHEATSHeet
5 pages
Data Science Using Python Lab Week8
No ratings yet
Data Science Using Python Lab Week8
23 pages
ML Lab
No ratings yet
ML Lab
12 pages
ModuleAr Merged
No ratings yet
ModuleAr Merged
42 pages
Assignment II Machine Learning
No ratings yet
Assignment II Machine Learning
8 pages
4 12
No ratings yet
4 12
17 pages
Tutprac 1
No ratings yet
Tutprac 1
8 pages
ML Labs
No ratings yet
ML Labs
14 pages
Data Science Manual
No ratings yet
Data Science Manual
16 pages
ML Lab Manual
No ratings yet
ML Lab Manual
27 pages
E21CSEU0770 Lab4
No ratings yet
E21CSEU0770 Lab4
4 pages
Basic Arrays
No ratings yet
Basic Arrays
3 pages
Fda Batch2program
No ratings yet
Fda Batch2program
18 pages
Assignment 4 - Jupyter Notebook
No ratings yet
Assignment 4 - Jupyter Notebook
6 pages
Advanced Matplotlib in Python 1695062970
No ratings yet
Advanced Matplotlib in Python 1695062970
54 pages
Mayank Chaudhary DEV Practicals
No ratings yet
Mayank Chaudhary DEV Practicals
14 pages
Data Analytics Lab Manual
No ratings yet
Data Analytics Lab Manual
26 pages
Aiml
No ratings yet
Aiml
18 pages
DataFrame Statistics
No ratings yet
DataFrame Statistics
41 pages
Standard Deviation in Python
No ratings yet
Standard Deviation in Python
2 pages
ML Lab Final R22
No ratings yet
ML Lab Final R22
67 pages
PythonforScientificComputing AEC QuestionBank
No ratings yet
PythonforScientificComputing AEC QuestionBank
8 pages
Gaurav - Data Mining Lab Assignment
No ratings yet
Gaurav - Data Mining Lab Assignment
36 pages
7 Data Transformation - Jupyter Notebook
No ratings yet
7 Data Transformation - Jupyter Notebook
3 pages
Importing Libraries: Pandas PD Matplotlib - Pyplot PLT Numpy NP
No ratings yet
Importing Libraries: Pandas PD Matplotlib - Pyplot PLT Numpy NP
10 pages
Dsa Lab Manual
No ratings yet
Dsa Lab Manual
17 pages
Ad3411 - Student
No ratings yet
Ad3411 - Student
27 pages
MN TP01
No ratings yet
MN TP01
1 page
External
No ratings yet
External
11 pages
Data Science Algorithmen Master - 02 Data Handling
No ratings yet
Data Science Algorithmen Master - 02 Data Handling
76 pages
Data Science Using R
No ratings yet
Data Science Using R
11 pages
DSBDA6
No ratings yet
DSBDA6
6 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
First Lab DM1.Ipynb - Colab
No ratings yet
First Lab DM1.Ipynb - Colab
1 page
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
11 Chapter 4
No ratings yet
11 Chapter 4
16 pages
Anjali Presentation Original
No ratings yet
Anjali Presentation Original
39 pages
By Armstrong, Richard A. Hilton, Anthony C
100% (1)
By Armstrong, Richard A. Hilton, Anthony C
173 pages
Qb-It Iind Year I Sem
No ratings yet
Qb-It Iind Year I Sem
42 pages
EEC-13 English Solved Assignment 2017-18
No ratings yet
EEC-13 English Solved Assignment 2017-18
14 pages
Understanding and Using Factor Scores - Considerations For The App
No ratings yet
Understanding and Using Factor Scores - Considerations For The App
12 pages
Assessment 2-Hoang Vu
No ratings yet
Assessment 2-Hoang Vu
35 pages
Beg Guide Measurement Mech Eng PDF
100% (1)
Beg Guide Measurement Mech Eng PDF
52 pages
Chapter 1 The Investment Setting
No ratings yet
Chapter 1 The Investment Setting
81 pages
BA Assignment
No ratings yet
BA Assignment
6 pages
Control Valve Impact-Fisher
No ratings yet
Control Valve Impact-Fisher
16 pages
The Manager
No ratings yet
The Manager
33 pages
IAPM CH 4 - Introduction To Portfolio Management
No ratings yet
IAPM CH 4 - Introduction To Portfolio Management
46 pages
Sensors: Indoor Positioning Algorithm Based On The Improved RSSI Distance Model
No ratings yet
Sensors: Indoor Positioning Algorithm Based On The Improved RSSI Distance Model
15 pages
A Simple Definition of Detection Limit: Charles H. P
No ratings yet
A Simple Definition of Detection Limit: Charles H. P
23 pages
Research Paper
No ratings yet
Research Paper
14 pages
3.01 Portfolio Risk and Return Part I - Answers
No ratings yet
3.01 Portfolio Risk and Return Part I - Answers
35 pages
Geostatistics Assignment 5 1 A) Statistics and Variogram Modelling For Domain 1 North
No ratings yet
Geostatistics Assignment 5 1 A) Statistics and Variogram Modelling For Domain 1 North
12 pages
ASGKIT PROG1 (Primera Asignacion) PSP
No ratings yet
ASGKIT PROG1 (Primera Asignacion) PSP
14 pages
Using English Songs To Improve Young Learners Listening Skill
No ratings yet
Using English Songs To Improve Young Learners Listening Skill
12 pages
Weekly Wages in Rs. No. of Persons Weekly Wages in Rs. No of Persons
No ratings yet
Weekly Wages in Rs. No. of Persons Weekly Wages in Rs. No of Persons
15 pages
Ss2 Maths Exam
No ratings yet
Ss2 Maths Exam
4 pages
Comparing Student Success Between Developmental Math Courses Offered Online, Blended, and Face-To-Face
No ratings yet
Comparing Student Success Between Developmental Math Courses Offered Online, Blended, and Face-To-Face
13 pages
BF Notes Risk and Return Single Asset
No ratings yet
BF Notes Risk and Return Single Asset
5 pages
Computers & Education: Daniel Darghan Felisoni, Alexandra Strommer Godoi Mark
No ratings yet
Computers & Education: Daniel Darghan Felisoni, Alexandra Strommer Godoi Mark
13 pages

Lab02 Summary Measures - Ipynb

Uploaded by

Lab02 Summary Measures - Ipynb

Uploaded by

{"nbformat":4,"nbformat_minor":0,"metadata":{"colab":{"provenance":

You might also like