0% found this document useful (0 votes)

11 views121 pages

M2R HP Arch

The document discusses high-performance computing architectures, focusing on cluster and grid computing, parallel modeling, and communication methods. It outlines the objectives of understanding hardware and software architectures, the evolution of processor numbers, and the motivation for using clusters in various applications. Additionally, it highlights the significance of parallel computing in scientific challenges and provides examples of research projects and commercial software in the field.

Uploaded by

mess687 kaskh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views121 pages

M2R HP Arch

Uploaded by

mess687 kaskh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 121

Architectures

Hautes Performances

Arnaud Legrand
Chargé de Recherches, CNRS/ID-IMAG

Jean-François Méhaut
Professeur, UJF/ID-IMAG
Objectifs

• Comprendre
 Architecture matérielle et logicielle des grappes
et des grilles de calcul
 Aspects fondamentaux et technologiques
 Différents types d'application

 Nouvelles problématiques scientifiques

Plan du cours

• Architectures pour le calcul haute performance (JFM)

 Cluster Computing, Grid Computing, Internet Computing, Intranet Computing

• Modélisation et algorithmique parallèle (AL)

 Tâches parallèles
 Ordonnancement avec communications
 Tâches divisibles
 Steady state

• Communication sur réseaux rapides (JFM)

 Techniques et méthodes de transfert des données, MPI
 Pourquoi MPI ne peut pas optimiser davantage ?
Calcul hautes performances
Pourquoi ?
Computing Power Drivers
Résolution d'applications “Grand Challenge” en utilisant
la puissance des ordinateurs
modélisation, simulation et analyse

Life Sciences Aerospace

E-commerce

CAD/CAM Digital Biology Military Applications

Calcul hautes performances
Évolution du nombre de processeurs

1998
ASCI RED
1TFlop
10k Ppro@333

Nombre
2006 Xbox 360
de machines 64k-128k 1TFlop
32k-64k
300 16k-32k
8k-16k
1 GPU
4k-8k
250 2k-4k
1k-2k
200 513-1024
257-512
129-256
150 65-128
33-64
17-32
2006 AMD
100
5-8
9-16
Opteron
Nombre
50
1
2
3-4
de processeurs 3Gflop
0
19
19
19
19
19
19
19
20
20
20
20
20
20
20
93
94
95
96
97
98
99
00
01
02
03
04
05
06
Calcul hautes performances
Programmation des machines parallèles
Calcul hautes performances
Programmation des machines parallèles

Communications entre processus

Mémoire partagée : OpenMP
Passage de message : MPI
Calcul hautes performances
Évolution du MTBF dans le futur

BlueGene/L

1 PetaFlop =
200k 5Gflop CPU

Avec du matériel fiable actuel (ASCI

white), une machine de cette
dimension subit
1 défaillance par heure
The Large Hadron Collider Project
4 detectors CMS
ATLAS

LHCb

CERN
The Large Hadron Collider Project
4 detectors CMS
ATLAS

Storage capacity–
Raw recording rate 0.1 – 1 GBytes/sec

Accumulating at 5-8 PetaBytes/year

10 PetaBytes of disk
LHCb
Computing Power –
200,000 of today’s fastest PCs

CERN
Earthquake Hazard Assessment
2001 Gujarati (M 7.7) Earthquake, India

Use parallel computing to

simulate earthquakes

Learn about structure of the

Earth based upon seismic
waves (tomography)

Produce seismic hazard

maps (local/regional scale)
e.g. Los Angeles, Tokyo, 20,000 people killed
167,000 injured
Mexico City, Seattle
≈ 339,000 buildings destroyed
783,000 buildings damaged
What is a cluster?

• A cluster is a type of parallel or distributed processing

system (MIMD),
 which consists of a collection of interconnected stand-alone/complete
computers cooperatively working together as a single, integrated
computing resource.
• A typical cluster:
 Network: Faster, closer connection than a typical network (LAN)
 Low latency communication protocols
 Looser connection than SMP
• Cluster Usage
 Dedicated computation (rack, no screen and mouse)
 Non dedicated computation
 Classical usage during the day (word, latex, mail, gcc…)
 HPC applications usage during the night and week-end
Cluster computing

◆ Architecture homogène, faiblement hétérogène

Grappes (Cluster, COW), machines //
➙ PC, stations de travail
➙ SCI, Myrinet, Giganet, MPC, ...
Protocoles de communication
➙ BIP, SISCI, SciOS, VIA, TCP, UDP, ...

Commutateur
Myrinet/BIP
81.6 Gflops (216 nodes) + top 500 (385) June 2001
http://clic.mandrakesoft.com
HP Cluster : 104 HPBi Itanium 2
Example Clusters: Berkeley NOW

◆ 100 Sun
UltraSparcs
200 disks
◆ Myrinet SAN
160 MB/s
◆ Fast comm.
AM, MPI, ...
◆ Ether/ATM
switched external
net
◆ Global OS
◆ Self Config
Motivation for using Clusters

• The communications bandwidth between

workstations is increasing as new networking
technologies and protocols are implemented in
LANs and WANs.

• Workstation clusters are easier to integrate into

existing networks than special parallel
computers.
Motivation for using Clusters

• Surveys show utilisation of CPU cycles of desktop

workstations is typically <10%.

• Performance of workstations and PCs is rapidly

improving

• As performance grows, percent utilisation will

decrease even further!
• Organisations are reluctant to buy large
supercomputers, due to the large expense and short
useful life span.
Motivation for using Clusters

• The development tools for workstations are more mature

than the contrasting proprietary solutions for parallel
computers - mainly due to the non-standard nature of many
parallel systems.

• Workstation clusters are a cheap and readily available

alternative to specialised High Performance Computing
(HPC) platforms.

• Use of clusters of workstations as a distributed compute

resource is very cost effective - incremental growth of
system!!!
Cluster Computing - Research Projects

◆ OAR/ (Grenoble) - France

◆ Beowulf (CalTech and NASA) - USA
◆ CCS (Computing Centre Software) - Paderborn, Germany
◆ Condor - Wisconsin State University, USA
◆ DQS (Distributed Queuing System) - Florida State University, US.
◆ EASY - Argonne National Lab, USA
◆ HPVM -(High Performance Virtual Machine),UIUC&UCSB,US
◆ MOSIX - Hebrew University of Jerusalem, Israel
◆ MPI (MPI Forum, MPICH is one of the popular implementations)
◆ NOW (Network of Workstations) - Berkeley, USA
◆ NetSolve - University of Tennessee, USA
◆ PM2 (Lyon, Lille, Bordeaux) - France
Cluster Computing - Commercial Software

◆ Codine (Computing in Distributed Network Environment) - GENIAS

GmbH, Germany
◆ LoadLeveler - IBM Corp., USA
◆ LSF (Load Sharing Facility) - Platform Computing, Canada
◆ OpenFrame - Centre for Development of Advanced Computing,
India
◆ RWPC (Real World Computing Partnership), Japan
◆ Unixware (SCO-Santa Cruz Operations), USA
◆ ClusterTools (A number for free HPC clusters tools from Sun)
◆ A number of commercial vendors worldwide are offering clustering
solutions including IBM, HP-Compaq, Microsoft, a number of
startups like TurboLinux, HPTI, Scali, BlackStone…..)
Cluster Components...1a Nodes

• Multiple High Performance Components:

 PCs
 Workstations
 SMPs (CLUMPS)

• Cluster is mainly homogeneous

 Node (processor, memory, cache, disk)
 Operating System
 Network
Cluster Components...1bProcessors

• There are many (CISC/RISC/VLIW/Vector..)

 Intel: Pentiums, Xeon, Merceed….
 Sun: SPARC, ULTRASPARC
 HP PA
 IBM RS6000/PowerPC
 SGI MIPS
 Digital Alphas

• Integrate Memory, processing and networking

into a single chip
 IRAM (CPU & Mem): (http://iram.cs.berkeley.edu)
 Alpha 21366 (CPU, Memory Controller, NI)
Hyperthreading, SMT, NUMA
Architecture Scalaire
Register File
qqs ~Go/s Functional Unit
~10 cy (mult, add)
mémoire
Cache
~500 Mo/s
Processeur
~100 cycles

◆Reduced Instruction Set (RISC) Architecture:

Les instructions load/store font référence à la mémoire
Les unités fonctionnelles travaillent sur des données stockées
dans les registres
Hiérarchie mémoire dans une architecture scalaire :
 Les éléments utilisés récemment sont copiés dans le cache,
 Les accès au cache sont plus rapides que les accès à la
mémoire.
Architecture SMP UMA
Register Register
File File
Functional Functional
Unit Unit
mémoire (mult, add) (mult, add)

Cache Cache
Coherency Cache Cache
Coherency
Unit Unit
Processor Processor

Bus d’intercommunication OS

Protocole de cohérence cache

Plusieurs processeurs modifient des éléments de la même ligne de cache
Mémoire centrale et E/S
Partagées par tous les processeurs
Modèle de programmation
Extension du modèle de programmation monoprocesseur
Bus d’interconnexion entre la mémoire et les processeurs
Faible nombre de processeurs
Programmation Mono-Threadée

• Exécution séquentielle d’un programme

 Instruction par instruction
 Instructions: Calcul, Mémoire, Branchement, appel de procédure,…
• Processus, processus Lourd
 Structuration des systèmes d’exploitation
 Multi-programmation, temps-partagé
• Caractéristiques
 Entité active directement supportée par l’OS
 Flot d’exécution
 Pile des contextes de procédure
 Espace d’adressage privé
 Ressources systèmes
• Coût de gestion élevé
 Allocation des ressources (mémoire,…)
 Appels systèmes (Fork, exec, …)
Instruction Level Parallelism

• Programme séquentiel
 N’y aurait-il pas des instructions indépendante qui pourraient être
exécutées en parallèle?
• Comment générer de l’ILP?
 Pipe-line du processeur
 Recouvrement d’exécution d’instructions
 Limité par la divisibilité de l’instruction
 Superscalaire
 Plusieurs unités fonctionnelles
 Limité par le parallélisme intrinsèque du programme seq.
• Comment accroître l’ILP?
 Prédictions sur les branchements conditionnels
 Réordonnancer les instructions (Out of Order Execution)
• Recherche
 Domaines de l’Architecture-compilation
Processeur SuperScalaire

Processus 1 Changement de contexte Processus 2

…
4 Unités fonctionnelles
Ordonnanceur Temps
Interruption, exception, appel système Retour d’interruption

◆ Réduire le temps des changements de contexte (cases grisées-

bleues)

◆ Accroître l’utilisation des unités d’exécution (cases blanches)

Processus Légers/Threads

• Objectifs
 Mener plusieurs activités indépendantes au sein d’un
processus
 Exploitation des architectures SMP
 Améliorer l’utilisation du processeurs (context-switch)
• Exemples
 Simulations
 Serveurs de fichiers
 Systèmes d’exploitation (!)
• Solution sans l’aide du multithreading
 Automate à états finis implanté « à la main »
(sauvegardes d’états)
Les processus légers

• Principe
 Détacher flot d’exécution et ressources

thread

ressources

• Introduits dans divers langages & systèmes

 Programmation concurrente
 Recouvrement des E/S
Multithreading et Processeur SS

Processeur SuperScalaire

Thread 1 Context Switch Thread 2

…
Scheduler
Interruption, exception, appel système Retour d’interruption
Temps
Hyperthreading
Evolution des architectures de
processeurs
Phase 1: Processeurs Multithreadés

• Modification de l’architecture du processeur

 Incorporer au processeur deux (ou plus) jeux de registres pour les
contextes des threads
 Registres généraux
 Program Counter (PC), registre d’instruction
 Process Status Word (PSW), registre d’état
 A tout instant, un thread et son contexte sont actifs
 Changement du contexte courant instantané
 Appel système, IT
 Défaut de cache

• Processeur IBM PowerPC RS 64

 Recherche, non commercialisé
• Processeur Intel Xeon Hyperthreading
 Serveur Bi-processeur Xeon Hyperthreadé
 Vue de Linux ou Windows, 4 processeurs
Phase 1: Processeurs Multithreadés (2)

Multithread à Gros Grain (Coarse-Grained Multi-threaded)

Thread 1 Thread 2 Thread 3 Thread 1

Temps
Défaut de cache Défaut de cache Appel Système
Phase 2: Processeurs Multithreads (1)

• Modification de l’architecture du processeur

 A tout instant, un thread et son contexte sont actifs

 Changement de contexte à chaque cycle

 Chaque thread dispose de son ratio du processeur (1/N)

• Processeur TERA
Phase 2: Processeurs Multithreadés (2)

Multithread à Grain Fin (Fine-Grained Multi-threaded)

4 registres de threads : ¼ temps processeur par thread

Temps

Thread 1 Thread 2 Thread 3 Thread 4

Processeurs HyperThreadés (1)

• Modification de l’architecture du processeur

 Incorporer au processeur N jeux de registres pour les
contextes des threads
 Registres généraux
 Program Counter (PC), registre d’instruction
 Process Status Word (PSW), registre d’état
 A un instant donné, les unités du processeurs
peuvent être partagées entre plusieurs threads
• Eviter de stresser les mêmes ressources
 Conflit d’accès à certaines unités d’exécution
• Processeur ALPHA EV8
Processeurs Hyper-Threadés (2)

Thread 1 Thread 2 Thread 3 Thread 4

Temps
Architecture processeur Cray-TERA
Applications
1 2 3 4

i=1 i=2 F (a) j=1 j=2 G(A)

Threads concurrents Programme

i=3 … i=n
F (b)
j=3 … j=m séquentiel

Streams

Pool d’instructions prêtes

Pipeline d’instructions en
cours d’exécution
Résumé
What is Alpha?
1. A microprocessor, a chip, a cpu: EV4, EV5, EV6, EV7, EV8 . . .

2. A 64-bit RISC architecture introduced by Digital in ’92

3. Acquired by Compaq in ’98; continued investment

TANDEM
4. CPU for future Non-Stop Himalaya systems (EV7) NSK
Cancelled in Sept 2001
5. Designed and engineered by Compaq;
outsourced manufacturing (fabrication); Microelectronics

licensed to API, sold to other system vendors

50
50 SPECint95 Alpha chip
Source: Standard Performance Evaluation Corporation
EV68
45 SPEC - November, 2000

“Alpha has nearly continuously 40.1

40 excelled all comers since 1992,
an eternity in this industry.”
Illuminata, Inc. March 1999

35
EV67

30.3 .18μm
30
EV6
25
.25μm

20 18.8

15.0
15 13.6

10.1
10
7.43
.35μm
5.18
5 2.95

.75 .50μm 1997 2002

1992 1995 1999 2000 2001
0
166 266 300 350 440 500 600/625 525 667 833 MHz 1250
1.5M 1.5M 9.3M 9.3M 15 MEV67
EV6 transistors
EV68
EV4 EV45 EV5 EV56
EV4 Chip Overview

• 0.75µm 3LM CMOS, 3.3V

• 200MHz @30W
• 233 mm2 ,1.7M, 431-PGA
• Dual in-order issue
• Fully pipelined
• 8kB I-Cache, 8kB D-Cache
• 32 64b I-Regs, 32 64b FP-Regs
• 1-bit branch prediction
• Shared L2, system interface
EV5 Chip Overview

• 0.50µm 4LM CMOS, 3.3V

• 350MHz @60W
• 298 mm2, 9.3M, 499-PGA
• Quad in-order issue
• FP latencies reduced 2 cycles
• 8kB I-Cache, 8kB D-Cache
• 96kB unified on-chip L2 cache
• 2-bit branch prediction
• Non-blocking cache scheme
EV7 – The System is the Silicon…
.
SMP CPU interconnect was external logic..
Now it’s on the chip !

I/O
• 21264 (EV68) core with enhancements
• Integrated L2 cache Mem0 Router Mem1
– 1.75 MB (ECC)
– 20 GB/s bandwidth
• Integrated memory controllers
N L2 Tag E
– Direct RAMbus (ECC)
– 12 GB/s bandwidth

L2 S
– Optional RAID in memory
• Integrated network interface WL2
– Direct processor-processor interconnects
– 4 links - 25.6 GB/s aggregate bandwidth
Data Data
– ECC (single error correct, double error detect) P EV68 Core P
– 3.2 GB/s I/O interface per processor 0 4
1 5
2 6
3 7
Alpha systems family
servers and
workstations
AlphaServer sc
Series
1000s
processor
s
gs320
32-way
gs160
AlphaServer gs80 16-way
AlphaServer es40, es45 8-wayAlphaServer gs series
ds10, ds10L, 1- 4 Processors
ds20E, ds20L
1- 2 Processors
Processeur Itanium2 ® Intel ®

◆Architecture Itanium2 :
4ème génération de processeurs 64 bits Intel : Itanium2
(Madison9M)
EPIC: Explicit Parallel Instruction Computing
Fréquence : 1.5 Ghz
Puissance crête : 6 Gflops/s
➙ 1500 MHz * 2 madd/cycle → 6 GFLOPS

◆Intel Itanium2 :
L1I : 16ko; 64o/line ; 4 way
L1D : write through; 16ko; 1/- cycle; 64o/line ; 4 way ;
(2ld&2st)/cycle
L2U : write back; 256ko; 5/6cycle; 128o/line; 8 way; (4ldf) |
(2ldf[p]&2stf)
L3U : write back; 4Mo; 12/13cycle; 128o/line ; 24 way ; 48Go/s
Memory Front Side Bus (FSB) : 128o/line ; 6.4 Go/s
Processeur Itanium2 ®
Intel ®

Débits et latences dans le processeur Itanium

2 cycles 5 cycles 12 cycles

256 ko
1 ko 16 ko 4 Mo
L1D cache
Registers

16 Go/s 32 Go/s
Integer
128

32 Go/s 6.4 Go/s

L2U cache

L3U cache
16 Go/s

1 ko
Registers

32 Go/s
128 FP

16
Go/s Altix™:
5+1 cycles 145+ ns
12+1cycles
Processeur Itanium2 ® Intel ® : Roadmap

4Gflops >5Gflops 6.4Gflops >16Gflops

Max. Max.
2002 2003 Fin 04 2005
Itanium 2® Itanium 2
®
Itanium® 2 Montecito
(Madison) (Madison 9M)
(McKinley) (Dual Core on a Die)
1.5 GHz, 6Gflops, Each Core
900 Mhz, 3.6 Gflops, 1.6 GHz, 6.4Gflops,
1.5 Mo L3 cache 6 Mo L3 Cache (>=2 GHz, >=8Gflops,
6/9 Mo L3 Cache
1 GHz, 4Gflops, 3 Mo
L3 Cache)
1.3 Ghz, 5.2 Gflops,
3 Mo L3 cache
1.5 Ghz, 6 Gflops,
4 Mo L3 cache
12Mo L3 Cache)
…
Low Power
Itanium® 2 Low Power Low Power
(Deerfield) Itanium® 2 Montecito
1.0 GHz, 4Gflops, Deerfield+ Processor Dual Core Processor
1.5Mo L3 Cache 62 Followon Followon
Watts
1.4 Ghz, 4.6 Gflops,
1.5/3 Mo L3 cache

Silicon Process
180 nm 130 nm 90 nm
Single CPU Performance
Comparison
1600
1380 Alpha EV68
1400 1266 1.25GHz ES45
1173
1200 Alpha EV68 1 GHz
1000 960 ES45
850 839
790 Itanium 2 1GHz
800 679
rx5670
600
PA-RISC 8700 750
400 MHz
200 Sun Spac III
1.05Ghz
0
IBM Power4 1.3
SPECint2000 SPECfp2000
Ghz
peak peak
Problèmes des architectures UMA
Accès à la mémoire:
des niveaux de caches efficaces permettent d’économiser des références à la mémoire
pour les autres (non cachés), les accès concourants des processeurs à la mémoire partag
un goulot d’étranglement

Register Register
File Functio File Functio
nal nal
Unit Unit
mémoire (mult,
add)
(mult,
add)
Cache Cache Cache Cache
Coherenc Coherenc
y y
Unit Unit
Processor Processor

Cette difficulté peut être levée avec les architectures à mémoire distr
Mémoire distribuée

Technologie de masse
la bande passante globale mémoire-processeur
est proportionnelle au nombre de processeurs
modèles d’exécution : SIMD, MIMD, SPMD
2 paradigmes de communications :
➙ Mémoire partagée : OpenMP (si adressage global), POSIX
Threads
➙ Mémoire distribuée : MPI, PVM, …

P P P P
M E/S M E/S M E/S M E/S Les noeuds individuels
Réseau d’interconnexion peuvent contenir plusieurs
M E/S M E/S M E/S M E/S processeurs connectés
P P P P entre eux par la même
technologie que le réseau.
Architecture à mémoire partagée distribuée

Pour chaque processeur,les accès à la mémoire locale sont

indépendants
La mémoire totale est globalement adressable (point de
vue du programmeur )
Non-uniform memory access (NUMA):
— Les accès locaux sont plus rapides que les accès lointains (peu
sensible sur SGI3000/SGIAltix)
— Les modèles de programmation en mémoire partagée sont
utilisables
— la distribution des données est conseillée pour améliorer les
performances (prise en compte de l ’architecture à mémoire
distribuée)

Register Register OS
File Function File Function
m al m al
émoi Unit émoi Unit
re (mult, re (mult,
Cache add) Cache add)
Cache Cache
Coherenc Coherenc
y y
Unit
Processor Unit
Processor

noeud noeud

interconnect
SGI ALTIX™ 350 : module de base

Mémoire
Mémoire
10.2Go/sec
Itanium® 2
S
H
FSB
U NUMAlink™ 4
Itanium 2 B 6.4Go/sec

• 2 processeurs Intel® Itanium® 2

• 2 processeurs par frontside bus (6.4Go/sec)
• jusqu ’a 24 Go de mémoire par module
• contrôleur mémoire : SHUB
8.51–10.2Go/sec bande passante
mémoire
• 6.4GB/sec bande passante
d ’interconnexion agrégé
• 4.8GB/sec bande passante I/O agrégé
SGI ALTIX™ 350 : Topologies
•Une Altix 350 (sans routeur):
– jusqu ’a 16 cpu en SSI
– Topologie : anneau
Altix350 4 cpu Altix350 16 cpu

Altix350 8 cpu
SGI ALTIX™ 350 : Topologies

•Une Altix 350 (avec routeur):

– Jusqu’à 32 cpu en SSI
– Topologie : simple/double plan
Configuration simple plan Configuration double plan

A A A A
350
A 350
A 350 350
A A
350
A 350
A 350 350
A A
350
A 350
A 350 350
Route Route A A Route
350
A 350
A r r 350 350 r
A A
350 350 NL4 NL4 350 350 NL4
A A A A
350
A 350
A 350 350
A A
350
A 350
A 350 350
A A
350 350 350 350
NASA Ames Background
Origin 2000 256p Origin 2000 512p

Premier client SGI

« Record extreme computing » :

• Avec un seul OS IRIX :

• 1er système Origin 2000 128cpu Origin 3000

512p et 1024p
• 1er système Origin 2000 256 cpu

• 1er système Origin 2000/3000 512 cpu

• 1er système Origin 3000 1024 cpu Altix 512p

Avec un seul OS Linux :

• 1er système Altix 512 cpu

Projet Columbia

◆Utilisateurs de la NASA et d’autres agences

gouvernementales, de la recherche et de l’industrie
◆ 10 240 processeurs Intel Itanium® 2
20 x 512 cpu SGI Altix
2 x 64 cpu SGI Altix ⇒ frontal d’accès
◆20 téraoctets de mémoire totale total mémoire
1 téraoctets de mémoire par 512 cpu
◆Réseau infiniband, 1 / 10 gigabit Ethernet
6 Infiniband HCAs / système
◆~500 To stockage gérés par CXFS/DMF
◆128 x pipes Silicon Graphics Prism
◆TOP500 (Novembre 2004, www.top500.org) :
Classé numéro 2
Rpeak (GFlops):60960
Rmax (GFlops):51870
Configuration Columbia
Torus Grid: HP EV7 16P System

Note that
ends are
looped back
(closed)
EV7 64P Latency

319 283 247 211 247 283 319

283 247 211 175 211 247 283
247 211 175 140 175 211 247
211 175 140 75 140 175 211
247 211 175 140 175 211 247
283 247 211 175 211 247 283
319 283 247 211 247 283 319
355 319 283 247 283 319 355
250ns average memory latency
Processor Sets

• A processor set is a collection of zero or more processors

• Every thread on the system belongs to a processor set

• A thread may only be scheduled on a processor within its

processor set

• At bootup, a default processor set is created and this

“default_pset” contains all processors on the system
Processor sets

• Psets can be created or destroyed

 default processor set is the exception

• processors can be added or removed

from processor sets
Processor sets

• Processors sets allow you to run jobs on a specific

group of processor(s).
 If there is only one process running on a processor, there
can be a performance boost because of cache &
scheduling efficiencies.

 good for real-time applications because a processor can

be guaranteed to be instantly available to run a time
critical task.

 Another way to guarantee cpu resource availability

Processor Sets
• By default, all threads are assigned to the default_pset

• new pset can be created with the pset_create command.

This pset will have no processors.

• Processors can be added to a pset with the

pset_assign_cpu command.

• If a created pset is destroyed (pset_destroy command), all

processors from that pset are returned to the default_pset
(V4.X)
Processor Sets : example
default_pset
cpu 0 cpu 1 cpu 2
cpu 3

pset_create

default_pset
cpu 0 cpu 1 cpu 2 cpu 3 pset 2

pset_assign_cpu 2 1

default_pset pset 2
cpu 0 cpu 2 cpu 3 cpu 1
Processor Sets : example
default_pset
cpu 0 cpu 1 cpu 2
cpu 3

pset_create

default_pset
cpu 0 cpu 1 cpu 2 cpu 3 pset 2

pset_assign_cpu 2 1

default_pset pset 2
cpu 0 cpu 2 cpu 3 cpu 1
Using Processor sets

• Runon (1) command

 generally binds a job to a processor within its processor set
 runon 1 ls runs the ls command on processor 1

 runon -p binds a job to another processor set

 runon -p 2 csh runs a c-shell on processor set 2
 now all commands issued from that shell will be bound to processor
set 2

 runon -p 2 -x csh gives exclusive use of the processor set

Cluster Components…2 OS

◆ Systèmes traditionnels
Linux
Microsoft Windows
MacOS
SUN Solaris
IBM AIX
◆ Single System Image
Virtualisation de l'architecture
Une seule image système pour gérer la grappe
What Next ??

Clusters of Clusters (HyperClusters)

Computational Grid
Internet Computing
Clusters of Clusters
(HyperClusters)

Cluster 1
Scheduler

Master
Daemon

LAN/WAN
Submit
Graphical Cluster 3
Control
Execution
Daemon Scheduler
Clients
Master
Daemon

Cluster 2
Scheduler Submit
Graphical
Master Control
Execution
Daemon Daemon
Clients

Submit
Graphical
Control
Execution
Daemon
Clients
Introduction aux grilles
Globalisation des ressources
informatiques et des données

Contenu de la présentation
 Grille informatique
 Les types de grilles informatiques et leur déploiement
 Quelques grands défis
 ACI Globalisation des Ressources Informatiques et des Données (GRID)
Le concept de Grille

le réseau électrique :
Approche pour la distribution de la puissance électrique et la haute-tension
Le concept de Grille informatique
(GRID)

Approche pour la distribution de la puissance informatique

le réseau Internet et la haute-performance
(parallélisme et distribution)
Et ses différentes
incarnations…
Une tentative de
classification
• Grille d’informations
 Faire partager la connaissance

• Grille de données
 Stockage distribué à grande échelle

• Grille de calcul
 Agréger la puissance de calcul

* «A distributed system is a collection of independent computers that appear to the users of the
system as a single computer » Distributed Operating System. A. Tanenbaum, Prentice Hall, 1994
Modèles de déploiement
• Client-serveur Client Internet
Client
 Centralisé ou Distribué Client Cache
Proxy
Client

 Utilisation de caches pour éviter Client

la congestion serveur serveur Client

 Information centralisée Zone de congestion

Client
Client
Client
Client

• Pair-à-Pair (P2P)
 Chaque pair est à la fois client et Client/ Internet
Client/ Serveur
serveur Client/
Serveur
Client/
Serveur
 Distribution de la charge dans le Serveur

réseau Client/
serveur serveur
Client/
 Information distribuée Serveur
Zone de congestion
Serveur

Client/
Serveur Client/
Client/ Serveur
Serveur
Modèle client/serveur pour les Grilles
d’information : Le cas des sites WEB

Moteur de
• Sans doute la première Recherche

incarnation du concept de Serveur Web Serveur Web

grille
Serveur Web Serveur Web
• Accès à l’information
 A partir d’une adresse http
 A partir d’un moteur de recherche

• Transparence lors de l’accès

à l’information
 On ne sait pas toujours d’où vient
l’information

Client
Modèle client/serveur pour les Grilles de
données : Le cas NAPSTER

• Entre le client/serveur et le P2P

 Accès à des données via un site
unique contenant un index
• Stockage de données
• Partage des données
 Données « inaltérables »
 Copies multiples sans aucun
Serveur Napster
contrôle Association musique-IP
• Limites de l’approche
 Plutôt du client/serveur que
réellement P2P Utilisateur A Napster Utilisateur B Napster
 Serveur « attaquable » (Client + Serveur) (Client + Serveur)
 Par les tribunaux…
 Ou par d’autres…
Modèle client/serveur pour les Grilles de
calcul: l’Internet Computing

• Principe
 Des millions de PC en attente…
 Utilisation des cycles processeurs inutilisés
(environ 47% en moyenne dans une
entreprise *) via un économiseur d’écran

• Exemples
 SETI@HOME (ce n’est pas du P2P!)
 Recherche de signaux extra-terrestres
 33.79 Teraflop/s (à comparer aux 12.3
Teraflop/s de l’ordinateur le plus puissant au
monde au LLNL !)
 DECRYPTHON
 Etablir la carte des 500 000 protéines du vivant
 RSA-155
 Casser des codes cryptographiques

* d’après une enquête d’Omni Consulting Group

Modèle client/serveur pour les Grilles de
calcul: Le metacomputing

• Principe Client

 Acheter du service de calcul sur Requête

l’Internet
 Service = applications préinstallées S2 ! AGENT(s)
+ calculateurs
A,
B,

Ré
C
• Exemples

po
ns
e
 Netsolve (Univ. Tennessee)

(C
)
 NINF (Univ. Tsukuba) Op(C, A, B)
S1 S3 S4
 DIET (ENS-Lyon/INRIA) S2

Serveur Serveur Serveur Serveur

Modèle client/serveur pour les Grilles de
calcul: Le grid computing

• Principe  Exemples
 Utiliser un supercalculateur  Globus
parallèle virtuel  Légion
 Faire exécuter ses applications sur
des ressources distantes  Unicore

“10 GFlops, EOS data, “Quels ordinateurs ?” Service d’information :

20 Mb/sec -- pour 20 minutes” “Quelle vitesse ?” localisation + sélection
“Disponibilité ?”
Metacomputing
Courtier de Directory
“20 Mb/sec” ressource Service

GRAM Allocateurs de
ressources “50 processeurs + stockage
de GLOBUS de 10:20 à 10:40 pm”

GRAM GRAM GRAM

Fork
LSF
EASYLL
Condor
etc.
Modèles de déploiement des grilles:
le modèle distribué Pair-à-Pair

• Grille de données
 Gnutella, Freenet

• Grille d’information:
 Recherche décentralisée à la google

• Grille de calcul: CG2P

En résumé

Déploiement Client/serveur P2P

Grilles /
Grilles de données Napster Gnutella, Kazaa,
Datagrid Freenet, JXTA

Grilles d’information Sites Web Web ?

Moteurs de recherche
(Altavista, Google, …)

Grilles de calcul SETI-HOME, Decrypthon CGP2P ?

Netsolve, Ninf, DIET
GLOBUS, Legion, Unicore
Quelques grands défis…

• Middleware et systèmes
 Internet computing
 Metacomputing
 Vers un Grid-aware OS ?

• La programmation des grilles

 Algorithmique
 Génie logiciel
Les défis du « Internet computing »

• Cela marche bien pour un spectre étroit Distribution Maître

du calcul
d’applications
 Parallélisme embarrassant Calculs
…
Indépendants Calcul Calcul Calcul Calcul

• Usage exclusivement « non-

commercial »
 Casser des codes cryptographiques (défi
RSA-155)
 Recherche de signaux extra-terrestre
(SETI@HOME)
 Décryptage du génome (Decrypton)

• Cette approche est-elle généralisable ?

Quels sont les problèmes?
Distribution
• Elargir le spectre d’applications du calcul

 De vraies applications parallèles

…
 Autoriser la communication
• Sécurité
 Etes vous prêt à laisser exécuter n’importe quoi sur votre PC ?
 Technique du sandbox (isolation du code de calcul)
 Comment communiquer avec le monde lorsqu’on est isolé ?
• Parité
 cela marche si tout le monde joue le même jeux…
• Modèle de déploiement rudimentaire Calcul
 Essentiellement client/serveur Sandbox
 A terme, nécessité du P2P Système
Les défis du metacomputing
Client

• Quels sont les Requête

problèmes et défis ? AGENT(s)

S2 !

 Stockage des données A,

pour éviter les transferts B,

Ré
C
multiples entre client et

po
ns
serveurs

e
Op2(C, A, B)

(C
)
Op1(C, A, B)
 Sécurité dans les
transferts S1 S2 S3 S4

 Modèle de déploiement
P2P

Serveur Serveur Serveur Serveur

Service de gestion des données distribuées

persistantes
Vers de nouveaux systèmes
d’exploitation Grid-aware ?

• Conception de systèmes d’exploitation GRID-

aware

 Actuellement: essentiellement middleware

 Gestion des ressources = rôle de l’OS !
Programmer les grilles de
calcul
• Un champ applicatif vaste
avec des besoins variés… SPMD SPMD SPMD
Proc.
SPMD Proc. Proc.
Proc.
SPMD

• Codes parallèles
Proc.

Application parallèle
 Une grille de calcul est vue
comme un calculateur parallèle
virtuel (la genèse du Grid)
Mécanique des structures

• Couplages de codes Optique

 Une application est un
Conception
assemblage de plusieurs de
codes de calcul Satellite

Thermique Dynamique

Application de couplage
Vers une algorithmique des
grilles de calcul
• Programmer une grille de calcul comme un calculateur
parallèle virtuel
• Repenser l’algorithmique parallèle
 Essentiellement conçu pour des architectures parallèles régulières
et à configuration statique
• Caractéristiques des grilles informatiques
 Unité de calcul hétérogène
 Non-prédictibilité des performances des réseaux
 Aspect dynamique des ressources de calcul
• Problèmes et défis
 Politique d’ordonnancement des calculs
 Equilibrage dynamique par redistribution intensive des données
 Recouvrement calcul/communication
Couplage de codes
• Utilisation des exécutifs conçus pour la programmation parallèle
 Une grille de calcul est un calculateur parallèle virtuel,Mécanique
la des structures
programmation par échange de message s’impose…
Optique

Thermique

Dynamique
SAN LAN
process
process

process
process

Code 1 process Grappe de PC

process
WAN
process SAN

process process
process

process Visualisation
Grappe de PC Supercomputer
process
Code 2
Code 3
Une approche plus moderne

• Objets distribués / composants

 Structuration de l’application
Mécanique des structures
 Encapsulation des codes
• Couplage de codes parallèles Optique
 Interconnexion des objets / composants -> un réel défi !
Thermique

Dynamique
Composant SAN LAN
Composant parallèle
séquentiel

process
processus
processus
process processus
processus
Grappe de PC

WAN
SAN
middleware

process process
processus
processus
processus
processus Visualisation
Composant Grappe de PC Supercalculateur
séquentiel
Composant
parallèle
ACI GRID

• dynamiser et rendre opérationnelle la contribution des

équipes de recherche françaises
• déploiement d’outils logiciels pour la mise en œuvre de
“ grilles expérimentales ” pour des applications diverses
• systèmes et environnements pour le calcul distribué ou
pour l’exploitation d’ensembles de données de très grande
taille
• modélisation, algorithmique, couplage de codes,
visualisation, pré et post-traitements
L’ACI GRID et
les défis…
• Grilles de calcul
 Internet Computing
 CGP2P (F. Cappello, LRI/CNRS)
 Metacomputing
 ASP (F. Desprez, ENS-Lyon/INRIA)
• Programmation des Grilles
 Algorithmique:
 GRID2 - Thème 3 (J-L. Pazat, IRISA/INSA)
 TAG (S. Genaud, LSIIT)
 ANCG (N. Emad, PRISM)
 Composants:
 RMI (C. Perez, IRISA/INRIA)
 CONCERTO (Y. Maheo, VALORIA)
En conclusion
• Une grande variété dans les grilles informatiques
 Pas de nouvelle thématique
 Mais plutôt une adaptation de l’existant
 Une « combinaison » de technologies du parallélisme et du distribué pour les grilles
de calcul
 Une approche nécessairement pluridisciplinaire
 Système, réseaux, sécurité, applications, …
 Ne pas seulement encourager les aspects purement calcul…
• Bien identifier ce qui est technologique
 Les effets de mode...
De ce qui est plus fondamental
 Les nouveaux concepts...
• Encourager toutes recherches visant à utiliser des réseaux à grande
échelle pour des applications innovantes…
 Ne pas se concentrer sur une seule approche
Quelques remarques

• Il existe d’autres programmes du MR pour l’utilisation

des grilles en milieu industriel
• Importance de la coopération européenne et
internationale dans ce domaine
• Importance des standards
• Renforcer la recherche dans les domaines du logiciel et
dans les nouvelles applications
• http://www-sop.inria.fr/aci/grid
Cluster of Clusters (Netherlands)
What is Grid ?

◆An infrastructure that couples

Computers (PCs, workstations, clusters, traditional
supercomputers, and even laptops, notebooks, mobile
computers, PDA, and so on)
Software
Databases (e.g., transparent access to human genome
database)
Special Instruments (e.g., radio telescope--SETI@Home
Searching for Life in galaxy, Austrophysics@Swinburne for
pulsars)
People (may be even animals who knows ?;-)

◆across the local/wide-area networks

(enterprise, organisations, or Internet) and
presents them as an unified integrated
(single) resource.
Production Grids & Testbeds

NASA’s Information Power Grid The Alliance National Technology Grid

GUSTO Testbed
Why “The Grid”?

◆New applications based on high-speed coupling

of people, computers, databases, instruments,
etc.
Online instruments
Collaborative engineering
Parameter studies
Browsing of remote datasets
Use of remote software
Data-intensive computing
Very large-scale simulation
Online Instruments

Advanced Photon Source

wide-area
dissemination

desktop & VR clients

real-time archival with shared controls
collection storage

tomographic reconstruction
DOE X-ray source grand challenge: ANL, USC/ISI, NIST, U.Chicago
Collaborative Engineering
◆ Manipulate shared virtual
space, with
Simulation components
Multiple flows: Control,
Text, Video, Audio,
Database, Simulation,
Tracking, Haptics,
Rendering
◆ Issues:
(un)reliable uni/multicast
Security
Reservation & QoS

CAVERNsoft: UIC, Electronic Visualization Laboratory

Distributed
Supercomputing

Caltech
NCSA Exemplar
Origin ◆ Issues:
Maui
Resource discovery, scheduling
Argonne
SP
SP Configuration
Multiple comm methods
Message passing (MPI)
Scalability
Fault tolerance

SF-Express Distributed Interactive Simulation: Caltech, USC/ISI

Technical Challenges

◆ Complex application structures, combining aspects of

parallel, multimedia, distributed, collaborative
computing

◆ Dynamic varying resource characteristics, in time and

space

◆ Need for high & guaranteed “end-to-end”

performance, despite heterogeneity and lack of global
control
◆ Inter-domain issues of security, policy, payment
Issues
•Authenticate once
•Specify simulation
(code, resources, etc.)
•Locate resources
•Negotiate authorization, Domain 1
acceptable use, etc.
•Acquire resources Domain 2
•Initiate computation
•Steer computation
•Access remote datasets
•Collaborate on results
•Account for usage
Resource Management Architecture

Info service:
“10 GFlops, EOS data, location + selection
20 Mb/sec -- for 20 mins”
Metacomputing
Resource “What computers?” Directory
Broker “What speed?” Service
“20 Mb/sec” “When available?”

GRAM
Globus Resource
Allocation Managers “50 processors + storage
from 10:20 to 10:40 pm”

GRAM GRAM GRAM

Fork
LSF
EASYLL
Condor
etc.
Architectural Approaches

◆ Distributed systems: DCE, CORBA, Jini, etc.

Rich functionality eases app development
Complexity hinders deployment
➙especially in absence of global control
Performance difficulties

◆ Internet/Web Protocols and Tools

Simple protocols facilitate deployment
Missing functionality hinders app development
Performance difficulties
The Globus Project

◆ Basic research in grid-related technologies

Resource & data management, security, QoS, policy,
communication, adaptation, etc.
◆ Development of Globus Toolkit
Core services for grid-enabled tools & apps
◆ Construction of production grids & testbeds
Multiple deployments to distributed organizations for
production & prototyping
◆ Application experiments
Distributed applications, tele-immersion, etc.
Globus Project Participants

◆ Globus Project is a large community effort

Globus Toolkit core development
➙Argonne, USC/ISI, NCSA, SDSC
Globus Toolkit contributors
➙NASA, DOE ASCI DRM (SNL, LBNL, LLNL), Raytheon, and
numerous others
Collaborators
➙University, lab, industrial, and international partners spanning many
scientific and engineering disciplines
◆ Active in Grid Forum
http://www.gridforum.org
Globus Approach

◆ A toolkit and collection of services addressing key

technical problems
Modular “bag of services” model
Not a vertically integrated solution
General infrastructure tools (aka middleware) that can be
applied to many application domains

◆ Inter-domain issues, rather than clustering

Integration of intra-domain solutions

◆ Distinguish between local and global services

Globus Toolkit Grid Services

◆Security (GSI)

◆Resource management (GRAM)

◆Information services (MDS)

◆Remote file management (GASS)

◆Communication (I/O, Nexus)
◆Process monitoring (HBM)
Layered Architecture

Applications

GlobusView Application Toolkits Testbed Status

DUROC MPI Condor-G HPC++ Nimrod/G globusrun

Grid Services
Nexus GRAM

I/O MDS GSI GSI-FTP HBM GASS

Condor MPI Grid Fabric TCP UDP

LSF PBS NQE Linux NT Solaris DiffServ

Metacomputing directory service
MDS
c=US
Representation
Ethernet
o=globus
sunny IBM
WAN SP
Switch
LAN
o=USC o=ANL nn=WAN
hot LAN
dark cold … …
ou=ISI ou=MCS
nn=MCS-lan
Carl Steve Ian Gregor SteveWarren
cn=Carl nn=SP-switch
USC/ISI ANL/MCS …
cn=Steve nn=SP-ether

cn=Ian
cn=Gregor
Physical Structure cn=Steve
cn=Warren hn=sp1.mcs.anl.gov
…
hn=spN.mcs.anl.gov

Parallel Programming For Modern High Performance Computing Systems (Czarnul, Pawel)
No ratings yet
Parallel Programming For Modern High Performance Computing Systems (Czarnul, Pawel)
330 pages
Cluster Computing
No ratings yet
Cluster Computing
57 pages
Cluster Computing at A Glance Chapter 1: by M. Baker and R. Buyya
No ratings yet
Cluster Computing at A Glance Chapter 1: by M. Baker and R. Buyya
15 pages
Cluster and Grid Computing
No ratings yet
Cluster and Grid Computing
37 pages
High Performance Cluster Computing:: Architectures and Systems
No ratings yet
High Performance Cluster Computing:: Architectures and Systems
70 pages
Parallel and Cluster Computing
No ratings yet
Parallel and Cluster Computing
31 pages
CAQA5e ch1
No ratings yet
CAQA5e ch1
42 pages
Intro - HPC Cluster Computing v2 PDF
No ratings yet
Intro - HPC Cluster Computing v2 PDF
73 pages
Cluster
No ratings yet
Cluster
55 pages
Unit-Ii PPT
No ratings yet
Unit-Ii PPT
43 pages
Khaitan PSERC Webinar HPC Mar 2013 Slides
No ratings yet
Khaitan PSERC Webinar HPC Mar 2013 Slides
52 pages
L1.1 HPC Environment
No ratings yet
L1.1 HPC Environment
27 pages
Module 1-Topic 1
No ratings yet
Module 1-Topic 1
36 pages
Cluster Computing4
No ratings yet
Cluster Computing4
43 pages
Parallel Computing
No ratings yet
Parallel Computing
57 pages
High Performance Cluster Computing:: Architectures and Systems
No ratings yet
High Performance Cluster Computing:: Architectures and Systems
70 pages
1 Intro To HPC Compressed 1 Part 1
No ratings yet
1 Intro To HPC Compressed 1 Part 1
22 pages
HPC Lecture 2 Points
No ratings yet
HPC Lecture 2 Points
7 pages
2-INTRODUCTION TO PDC - MOTIVATION - KEY CONCEPTS-03-Dec-2019Material - I - 03-Dec-2019 - Module - 1 PDF
No ratings yet
2-INTRODUCTION TO PDC - MOTIVATION - KEY CONCEPTS-03-Dec-2019Material - I - 03-Dec-2019 - Module - 1 PDF
63 pages
Parallel Comp Point Main
No ratings yet
Parallel Comp Point Main
18 pages
Advance Computing Technology (170704)
No ratings yet
Advance Computing Technology (170704)
106 pages
Clusterguide-V3 0
No ratings yet
Clusterguide-V3 0
80 pages
High Performance Computing For Computational Mechanics: ISCM-10
No ratings yet
High Performance Computing For Computational Mechanics: ISCM-10
63 pages
HPCfirstlecture
No ratings yet
HPCfirstlecture
4 pages
Theory of Distributed Computing and Parallel Processing With Its Applications, Advantages and Disadvantages
No ratings yet
Theory of Distributed Computing and Parallel Processing With Its Applications, Advantages and Disadvantages
11 pages
FALLSEM2021-22 CSE4001 ETH VL2021220104078 Reference Material I 03-Aug-2021 Lecture1-Course Introduction
No ratings yet
FALLSEM2021-22 CSE4001 ETH VL2021220104078 Reference Material I 03-Aug-2021 Lecture1-Course Introduction
39 pages
Introduction To High Performance Computing: Shaohao Chen Research Computing Services (RCS) Boston University
No ratings yet
Introduction To High Performance Computing: Shaohao Chen Research Computing Services (RCS) Boston University
29 pages
Lecture Week - 1 Introduction 1 - SP-24
No ratings yet
Lecture Week - 1 Introduction 1 - SP-24
51 pages
Cluster Computing: The Promise of Supercomputing To The Average PC User ?
No ratings yet
Cluster Computing: The Promise of Supercomputing To The Average PC User ?
57 pages
Preview-9781482211191 A37870511
No ratings yet
Preview-9781482211191 A37870511
50 pages
Lec 44 Multicore
No ratings yet
Lec 44 Multicore
23 pages
Unit-1 Part-1
No ratings yet
Unit-1 Part-1
14 pages
Technical Seminar Report On: "High Performance Computing"
No ratings yet
Technical Seminar Report On: "High Performance Computing"
14 pages
CC 1
No ratings yet
CC 1
11 pages
04 - Computer Clusters
No ratings yet
04 - Computer Clusters
66 pages
Unit IV Cluster Computing
No ratings yet
Unit IV Cluster Computing
70 pages
Cost-Effective HPC Clustering For Computer Vision Applications
No ratings yet
Cost-Effective HPC Clustering For Computer Vision Applications
6 pages
CICS 504 Computer Organization
No ratings yet
CICS 504 Computer Organization
35 pages
Intro Parallel Computing PDF
No ratings yet
Intro Parallel Computing PDF
58 pages
BDS Session 2
No ratings yet
BDS Session 2
56 pages
Cluster Computing
No ratings yet
Cluster Computing
23 pages
Unit 1 - Part 1
No ratings yet
Unit 1 - Part 1
51 pages
Unit 1
No ratings yet
Unit 1
31 pages
Jamshed 2015
No ratings yet
Jamshed 2015
17 pages
Week1 - Parallel and Distributed Computing
100% (1)
Week1 - Parallel and Distributed Computing
46 pages
Digital Assignment-1
No ratings yet
Digital Assignment-1
6 pages
CS621 Cheatsheet
No ratings yet
CS621 Cheatsheet
11 pages
CC UNIT - 1 Question Bank Answers
No ratings yet
CC UNIT - 1 Question Bank Answers
25 pages
HPC Lecture 3
No ratings yet
HPC Lecture 3
139 pages
Unit-1 (Cloud Computing) 1. (Accessible) Scalable Computing Over The Internet
100% (1)
Unit-1 (Cloud Computing) 1. (Accessible) Scalable Computing Over The Internet
17 pages
Cloud Computing
No ratings yet
Cloud Computing
27 pages
Quad Core
No ratings yet
Quad Core
31 pages
Lecture 1 Introduction
No ratings yet
Lecture 1 Introduction
34 pages
Cloud Computing Unit - 1
No ratings yet
Cloud Computing Unit - 1
41 pages
Basics of Parallel Programming: Unit-1
No ratings yet
Basics of Parallel Programming: Unit-1
79 pages
Synopsis On "Massive Parallel Processing (MPP) "
No ratings yet
Synopsis On "Massive Parallel Processing (MPP) "
4 pages
High Performance Computing
100% (2)
High Performance Computing
61 pages
Barbara Chapman Using OpenMP
No ratings yet
Barbara Chapman Using OpenMP
378 pages
Env Variables
No ratings yet
Env Variables
18 pages
Computers in Pharmaceutical Research and Development:: A General Overview
No ratings yet
Computers in Pharmaceutical Research and Development:: A General Overview
21 pages
Skyline Software Systems, Inc. v. Keyhole, Inc Et Al - Document No. 34
No ratings yet
Skyline Software Systems, Inc. v. Keyhole, Inc Et Al - Document No. 34
10 pages
John Carmack Archive - Slashdot Posts
100% (1)
John Carmack Archive - Slashdot Posts
128 pages
About C-MOLD Releases
No ratings yet
About C-MOLD Releases
122 pages
Maya Mel
No ratings yet
Maya Mel
146 pages
Chapter 1 Computer Graphics
No ratings yet
Chapter 1 Computer Graphics
13 pages
1.1 Opengl: Rain Water Harvesting
No ratings yet
1.1 Opengl: Rain Water Harvesting
22 pages
Publicidad Silicon Graphics
No ratings yet
Publicidad Silicon Graphics
4 pages
Casi DMT H S D E: Ardware AND Oftware Evelopment Ffort
No ratings yet
Casi DMT H S D E: Ardware AND Oftware Evelopment Ffort
22 pages
CSCE569 Parallel Computing: TTH 03:30AM-04:45PM Dr. Jianjun Hu
No ratings yet
CSCE569 Parallel Computing: TTH 03:30AM-04:45PM Dr. Jianjun Hu
37 pages
Ethernet MACs
No ratings yet
Ethernet MACs
331 pages
Crimson Field Service Handbook
No ratings yet
Crimson Field Service Handbook
122 pages
HPE - A00127292en - Us - HPE Performance Cluster Manager Administration Guide
No ratings yet
HPE - A00127292en - Us - HPE Performance Cluster Manager Administration Guide
319 pages
MIPS Processor
No ratings yet
MIPS Processor
14 pages
Using Molecular Modeling To Enhance Visualization in The Organic Chemistry Classroom
No ratings yet
Using Molecular Modeling To Enhance Visualization in The Organic Chemistry Classroom
9 pages
T H G D: HE Istory of Raphic Esign
No ratings yet
T H G D: HE Istory of Raphic Esign
22 pages
Jorge Titinger - Leadership, Governance, and The Erosion of Trust-Transcript
No ratings yet
Jorge Titinger - Leadership, Governance, and The Erosion of Trust-Transcript
23 pages
Super Computers
No ratings yet
Super Computers
4 pages
Ansys 8.1 Installation Guide
No ratings yet
Ansys 8.1 Installation Guide
40 pages
1 Mission & Foundations: Hardware
No ratings yet
1 Mission & Foundations: Hardware
7 pages
Hoja de Datos SGI-250
No ratings yet
Hoja de Datos SGI-250
2 pages
ASG Hardware Compatibility Guide: Updated March 4, 2013
No ratings yet
ASG Hardware Compatibility Guide: Updated March 4, 2013
19 pages
0118 Designing Real Time 3d Graphics For Entertainment
No ratings yet
0118 Designing Real Time 3d Graphics For Entertainment
272 pages
007-3778-002 Sgi O2 Memory Install
No ratings yet
007-3778-002 Sgi O2 Memory Install
12 pages
Eclipse Instal Guide
No ratings yet
Eclipse Instal Guide
98 pages
Tutorial Notes: WRF Software: John Michalakes, Dave Gill Ncar WRF Software Architecture Working Group
No ratings yet
Tutorial Notes: WRF Software: John Michalakes, Dave Gill Ncar WRF Software Architecture Working Group
81 pages
Iris Unix PDF
No ratings yet
Iris Unix PDF
79 pages
Sgi O2 Sales Flyer
No ratings yet
Sgi O2 Sales Flyer
4 pages