Calculating Mpi Pi

1. The document describes calculating pi in parallel using MPI by decomposing the task of numerical integration into discrete parts that can be computed independently by different processes. 2. Each process is assigned a range of quadrature points to compute its contribution to the integral, with the results then combined using a global sum reduction. 3. Performance analysis shows that as the number of processes increases, efficiency decreases due to the increased communication overhead of the global sum operation.

Uploaded by

Fanny Ojeda

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

116 views13 pages

Calculating Mpi Pi

Uploaded by

Fanny Ojeda

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 13

Calculating !

in Parallel
Using MPI
Aiichiro Nakano
Collaboratory for Advanced Computing & Simulations
Department of Computer Science
Department of Physics & Astronomy
Department of Chemical Engineering & Materials Science
University of Southern California
Email: [email protected]
Objectives
1. Task decomposition (parallel programming= who does what)
2. Scalability analysis
Integral Representation of !
!
dx
4
1+ x
2
=
d"
cos
2
"
4
1+ tan
2
"
0
# / 4
$
=
0
1
$
4d"
0
# / 4
$
= #
Numerical Integration of !
Integration
Discretization:
" = 1/N: step = 1/NBIN
x
i
= (i+0.5)" (i = 0,,N-1)
!
4
1+ x
2
dx
0
1
"
= #
!
4
1+ x
i
2
i=0
N"1
#
$ % &
#include <stdio.h>
#define NBIN 10000000
void main() {
int i; double step,x,sum=0.0,pi;
step = 1.0/NBIN;
for (i=0; i<NBIN; i++) {
x = (i+0.5)*step;
sum += 4.0/(1.0+x*x);
}
pi = sum*step;
printf(PI = %f\n,pi);
}
Parallelization: Who Does What?
...
for (i=myid; i<NBIN; i+=nprocs)
{
x = (i+0.5)*step;
partial += 4.0/(1.0+x*x);
}
partial *= step;
pi = global_sum(partial);
...
Interleaved assignment of
quadrature points (bins) to
MPI processes
myid = MPI rank
nprocs = Number of MPI processes
Make global_sum() double & use MPI_DOUBLE in it
Use double MPI_Wtime()to measure the running time in seconds
Parallel Running Time
global_pi.c: NBIN = 10
7
, on hpc-login2
How Efcient Is the Parallel Program?
#PBS -l nodes=16:ppn=1,arch=x86_64
...
np=$(cat $PBS_NODEFILE | wc -l)
mpirun -np $np -machinefile $PBS_NODEFILE ./global_pi
mpirun -np 8 -machinefile $PBS_NODEFILE ./global_pi
mpirun -np 4 -machinefile $PBS_NODEFILE ./global_pi
mpirun -np 2 -machinefile $PBS_NODEFILE ./global_pi
mpirun -np 1 -machinefile $PBS_NODEFILE ./global_pi
Parallel Efciency
Execution time: T(W,P)
W: Workload
P: Number of processors
Speed:
Speedup:
Efciency:
How to scale W
P
with P?
!
S(W, P) =
W
T(W, P)
!
S
P
=
S(W
P
, P)
S(W
1
,1)
=
W
P
T(W
1
,1)
W
1
T(W
P
, P)
!
E
P
=
S
P
P
=
W
P
T(W
1
,1)
PW
1
T(W
P
, P)
Fixed Problem-Size Scaling
W
P
= Wconstant (strong scaling)
Speedup:
Efciency:
Amdahls law: f (= sequential fraction of the workload)
limits the asymptotic speedup
!
S
P
=
T(W,1)
T(W, P)
!
E
P
=
T(W,1)
PT(W, P)
!
T(W, P) = fT(W,1) +
(1" f )T(W,1)
P
!
"S
P
=
T(W,1)
T(W, P)
=
1
f + (1# f ) / P
!
"S
P
#
1
f
P #$ ( )
Isogranular Scaling
W
P
= Pw (weak scaling)
w = constant workload per processor (granularity)
Speedup:
Efciency:
!
S
P
=
S(P w, P)
S(w,1)
=
P w/T(P w, P)
w/T(w,1)
=
PT(w,1)
T(P w, P)
!
E
P
=
S
P
P
=
T(w,1)
T(P w, P)
Analysis of Global_Pi Program
Workload # Number of quadrature points, N (or NBIN in
the program)
Parallel execution time on P processors:
> Local computation # N/P
> Buttery computation/communication in global() # logP
!
T(N, P) = T
comp
(N, P) + T
global
(P)
="
N
P
+ #logP
for (i=myid; i<N; i+=P){
x = (i+0.5)*step; partial += 4.0/(1.0+x*x);
}
for (l=0; l<log
2
P; ++l) {
partner = myid XOR 2
l
;
send mydone to partner;
receive hisdone from partner;
mydone += hisdone
}
Fixed Problem-Size Scaling
Speedup:
Efciency:
!
S
P
=
T(N,1)
T(N, P)
=
"N
"N / P + #logP
=
P
1+
#
"
PlogP
N
!
E
P
=
S
P
P
=
1
1+
"
#
PlogP
N
global_pi.c: N = 10
7
, on hpc-login2
!
S
P
=
T (N,1)
T (N, P)
!
T (N, P) vs. P
!
E
P
=
T (N,1)
PT (N, P)
Fixed Problem-Size Scaling
Speedup model:
!
E
P
=
S
P
P
=
1
1+
"
#
PlogP
N
global_pi.c: N = 10
7
, on hpc-login2
Runtime Variance among Ranks
Isogranular Scaling
n = N/P = constant
Efciency:
global_pi_iso.c: N/P = 10
7
, on HPC
!
E
P
=
T(n,1)
T(nP, P)
=
an
"n + #logP
=
1
1+
#
"n
logP
!
T (P n, P) vs. P
!
E
P
=
T (n,1)
T (P n, P)

MP C6503SP/C8003SP (D257/D258) Parts Catalog
No ratings yet
MP C6503SP/C8003SP (D257/D258) Parts Catalog
470 pages
MPI Tutorial Fall Break 2022
No ratings yet
MPI Tutorial Fall Break 2022
60 pages
2 Mpi
No ratings yet
2 Mpi
13 pages
HW2 Solutions
No ratings yet
HW2 Solutions
4 pages
Lecture 8
No ratings yet
Lecture 8
18 pages
01 - Lecture Intro To HPC
No ratings yet
01 - Lecture Intro To HPC
62 pages
Assignment (T)
No ratings yet
Assignment (T)
13 pages
Slides
No ratings yet
Slides
44 pages
Embarrassingly Parallel Computations
No ratings yet
Embarrassingly Parallel Computations
22 pages
Introduction To Parallel Computing: What Is Parallel Computing? CS 480 - II Parallel and Scientific Computing
No ratings yet
Introduction To Parallel Computing: What Is Parallel Computing? CS 480 - II Parallel and Scientific Computing
10 pages
Codigo
No ratings yet
Codigo
4 pages
AML Report Bricola-1
No ratings yet
AML Report Bricola-1
5 pages
MPI Plamen Krastev
No ratings yet
MPI Plamen Krastev
49 pages
STS Advance User Manual
No ratings yet
STS Advance User Manual
89 pages
MPP Exercises
No ratings yet
MPP Exercises
8 pages
2 ParallelArchExec
No ratings yet
2 ParallelArchExec
46 pages
Experiment 3
No ratings yet
Experiment 3
5 pages
HPC Fall 2010: Prof. Robert Van Engelen
No ratings yet
HPC Fall 2010: Prof. Robert Van Engelen
35 pages
CSCE626 Amato LN PerformanceAnalysisMethodology
No ratings yet
CSCE626 Amato LN PerformanceAnalysisMethodology
19 pages
MPI Python Workshop Day1 Fall2024
No ratings yet
MPI Python Workshop Day1 Fall2024
22 pages
Homework 1 Uchenna Ogunka 227001144 CSCE 685 Department of Mechanical Engineering Texas A&M University, College Station
No ratings yet
Homework 1 Uchenna Ogunka 227001144 CSCE 685 Department of Mechanical Engineering Texas A&M University, College Station
8 pages
HPC Parallel
No ratings yet
HPC Parallel
122 pages
Brief Overview of Parallel Computing
No ratings yet
Brief Overview of Parallel Computing
14 pages
CSE4001 Parallel and Distributed Computing: Lab Assignment 6
No ratings yet
CSE4001 Parallel and Distributed Computing: Lab Assignment 6
8 pages
Parallelizing Particle-In-Cell Codes With Openmp and Mpi: Nils Magnus Larsgård
No ratings yet
Parallelizing Particle-In-Cell Codes With Openmp and Mpi: Nils Magnus Larsgård
74 pages
Lab3
No ratings yet
Lab3
4 pages
Course Outcome 1:: 15Cs4180 - Parallel Computing
No ratings yet
Course Outcome 1:: 15Cs4180 - Parallel Computing
23 pages
HPC Lecture (1) Summary
No ratings yet
HPC Lecture (1) Summary
8 pages
High Performance Computing For Computational Mechanics: ISCM-10
No ratings yet
High Performance Computing For Computational Mechanics: ISCM-10
63 pages
CW 1
No ratings yet
CW 1
3 pages
1.hello World Programme in Mpi
No ratings yet
1.hello World Programme in Mpi
11 pages
Report - Viber String
No ratings yet
Report - Viber String
26 pages
Monte Carlo Lab
No ratings yet
Monte Carlo Lab
3 pages
Sunil Kumar L 24
No ratings yet
Sunil Kumar L 24
21 pages
MPI Reduce PPMPI
No ratings yet
MPI Reduce PPMPI
2 pages
FortiAuthenticator 6.6.0 Administration Guide
No ratings yet
FortiAuthenticator 6.6.0 Administration Guide
281 pages
RajSingh HPC Exp1-7
No ratings yet
RajSingh HPC Exp1-7
23 pages
Week 3 Lab 1 + Answer
No ratings yet
Week 3 Lab 1 + Answer
6 pages
HPC MPI LAB 1 Vector Addition
No ratings yet
HPC MPI LAB 1 Vector Addition
9 pages
2 New Module 2 Performance Analysis of Multiprocessor Architectures Students Version
No ratings yet
2 New Module 2 Performance Analysis of Multiprocessor Architectures Students Version
13 pages
Assignment 2 Cluster Computing
No ratings yet
Assignment 2 Cluster Computing
3 pages
Parallel Distributed Computing Using Pyt
No ratings yet
Parallel Distributed Computing Using Pyt
41 pages
HPC Lab Manual 2317 Merged Organized
No ratings yet
HPC Lab Manual 2317 Merged Organized
35 pages
Code: First Method:: (1) Write A C Program Using Open MP To Estimate The Value of PI (Use Minimum Two Methods)
No ratings yet
Code: First Method:: (1) Write A C Program Using Open MP To Estimate The Value of PI (Use Minimum Two Methods)
8 pages
Map55611 1 2
No ratings yet
Map55611 1 2
6 pages
Problemes MPI
No ratings yet
Problemes MPI
4 pages
Case Study 1
No ratings yet
Case Study 1
12 pages
Pi-Calculation by Parallel Programming: Mr. Paopat Ratpunpairoj
No ratings yet
Pi-Calculation by Parallel Programming: Mr. Paopat Ratpunpairoj
8 pages
COMPUTING PI USING OpenMP DIRECTIVES
No ratings yet
COMPUTING PI USING OpenMP DIRECTIVES
13 pages
Building and Testing Linpack For Windows HPC
No ratings yet
Building and Testing Linpack For Windows HPC
14 pages
Include
No ratings yet
Include
11 pages
Exercise - 4
No ratings yet
Exercise - 4
8 pages
Lecture15 PDF
No ratings yet
Lecture15 PDF
32 pages
PDC ch#5
No ratings yet
PDC ch#5
12 pages
Intro To MPI
No ratings yet
Intro To MPI
44 pages
RajSingh HPCexp5
No ratings yet
RajSingh HPCexp5
3 pages
Untitled Document
No ratings yet
Untitled Document
23 pages
MPI Exercises PDF
No ratings yet
MPI Exercises PDF
7 pages
Unit 5 - Design Concept (Sofrware Engineering) - NSG Academy
No ratings yet
Unit 5 - Design Concept (Sofrware Engineering) - NSG Academy
11 pages
Mpi
No ratings yet
Mpi
46 pages
HPC Overview
No ratings yet
HPC Overview
45 pages
Parallel & Distributed Computing: MPI - Message Passing Interface
No ratings yet
Parallel & Distributed Computing: MPI - Message Passing Interface
49 pages
Mpi Openmp Examples
No ratings yet
Mpi Openmp Examples
27 pages
Assessment - 2 - Cyber - Security - by - Bigyan WORD
No ratings yet
Assessment - 2 - Cyber - Security - by - Bigyan WORD
13 pages
Fallsem2019-20 Cse4001 Eth Vl2019201001348 Reference Material Cse4001 Parallel and Distributed Computing May 2019 (003) 18
No ratings yet
Fallsem2019-20 Cse4001 Eth Vl2019201001348 Reference Material Cse4001 Parallel and Distributed Computing May 2019 (003) 18
4 pages
Model 300300 User Manual
No ratings yet
Model 300300 User Manual
108 pages
Fundamentals of Internet of Things Eeemechcsecsm
No ratings yet
Fundamentals of Internet of Things Eeemechcsecsm
2 pages
527280-005G XPS Card Printer Driver 8.4
No ratings yet
527280-005G XPS Card Printer Driver 8.4
238 pages
Adamopoulou-Moussiades2020 Chapter AnOverviewOfChatbotTechnology
No ratings yet
Adamopoulou-Moussiades2020 Chapter AnOverviewOfChatbotTechnology
12 pages
FactoryTalk Action Manager
No ratings yet
FactoryTalk Action Manager
9 pages
Industrial Training
No ratings yet
Industrial Training
13 pages
Assessment 2 Cyber Security by Bigyan
No ratings yet
Assessment 2 Cyber Security by Bigyan
15 pages
STM STM32H533CEU6 Datasheet
No ratings yet
STM STM32H533CEU6 Datasheet
231 pages
Solved SBI Clerk 27 July 2014 Paper With Solutions
No ratings yet
Solved SBI Clerk 27 July 2014 Paper With Solutions
81 pages
Billing System
No ratings yet
Billing System
40 pages
User's Guide: Ver. 1.0 EN
No ratings yet
User's Guide: Ver. 1.0 EN
36 pages
AI Unit 5
No ratings yet
AI Unit 5
17 pages
Assessment I - Appendix 1 - Network Function Matrix
No ratings yet
Assessment I - Appendix 1 - Network Function Matrix
17 pages
Version 7.1.4 Release Notes
No ratings yet
Version 7.1.4 Release Notes
20 pages
Chapter Seven
No ratings yet
Chapter Seven
66 pages
Advances in Dataflow Programming Languages: University of Ulster
No ratings yet
Advances in Dataflow Programming Languages: University of Ulster
34 pages
Bda (21cs71) Module-2
No ratings yet
Bda (21cs71) Module-2
64 pages
Design: Checklist For Fashionwave PHP Project
No ratings yet
Design: Checklist For Fashionwave PHP Project
4 pages
CS101 Midterm Solved MCQS Subjective
No ratings yet
CS101 Midterm Solved MCQS Subjective
35 pages
6.3.2.3 - Case Study - Prototype - Test The Solution
No ratings yet
6.3.2.3 - Case Study - Prototype - Test The Solution
6 pages
Bolla Szilard
No ratings yet
Bolla Szilard
15 pages
GeoEvent Server - AIS Connector
No ratings yet
GeoEvent Server - AIS Connector
12 pages
Tuted - iRWA Answers
No ratings yet
Tuted - iRWA Answers
5 pages
Lab 2 F20
No ratings yet
Lab 2 F20
4 pages
Labtask2 Oop
No ratings yet
Labtask2 Oop
5 pages
Instructions: Answer Any Four Que"stions From Part - 8 in Detalf. Different Sub-Parts of A Question Are To Be Attempted Adjacent
No ratings yet
Instructions: Answer Any Four Que"stions From Part - 8 in Detalf. Different Sub-Parts of A Question Are To Be Attempted Adjacent
2 pages
Norika WM Communication Quick Reference
No ratings yet
Norika WM Communication Quick Reference
1 page
Vikram Choudhary On Twitter - What Are The Proper Steps To Learn JavaScript - A Thread ??? Https - T.co - y3riJ9MChL - Twitter
No ratings yet
Vikram Choudhary On Twitter - What Are The Proper Steps To Learn JavaScript - A Thread ??? Https - T.co - y3riJ9MChL - Twitter
1 page
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet

Calculating Mpi Pi

Uploaded by

Calculating Mpi Pi

Uploaded by

Calculating !

You might also like