Cluster
Cluster
Cluster
Solutions
manuel d'utilisation
ALINEOS SA - Société Anonyme au capital de 45 734,70 € - RCS Montereau B 430 100 628 - APE 725 Z
14 bis, rue du Maréchal Foch - 77780 BOURRON MARLOTTE
Téléphone : 01 64 78 57 65 - Télécopie : 01 64 78 57 66 - E-mail : [email protected] - Web : www.alineos.com
INDEX
3 – EXPLOITATION DU CLUSTER
4 – EXPLOITATION LOGICIELLE
5 – MONITEOS v2.6
eth0 192.168.1.15$n
netmask 255.255.255.0
réseau 192.168.1.0
diffusion 192.168.1.255
eth1
netmask
réseau
diffusion
MPI-CH-1.2.4 /usr/local/mpich-1.2.4
LamMPI-6.5.7 /usr/local/lam-mpi
OpenPBS-2.3.16 /usr/local/OpenPBS_2_3_16
ATLAS-3.4.1 /usr/local/ATLAS
LAPACK-3.0 /usr/local/LAPACK
MPIBLACS-1.1 /usr/local/BLACS
PVMBLACS-1.1 /usr/local/BLACS
PVM-3.4.4 /usr/local/pvm3
SCALAPACK-1.7 /usr/local/SCALAPACK
1.2 – CONFIGURATION LOGICIELLE DU CLUSTER : NŒUDS DE CALCUL
eth0 192.168.1.1(0)$i
netmask 255.255.255.0
réseau 192.168.1.0
diffusion 192.168.1.255
floppy /dev/fd0
IP 192.168.1.98
login login constructeur
mot de passe mot de passe constructeur
interface web http://192.168.1.98/
2 – PROCEDURE DE DEMARRAGE ET ARRET DU CLUSTER
6. travailler
2. sélectionner les nœuds noden du cluster qui doivent être arrêtées (ne pas sélectionner
le serveur)
Pour remonter les systèmes de fichiers exportés nfs par le serveur, passer su sur le nœud
de calcul et lancer : bash# mount -a
Si le serveur n'est pas démarré, le montage nfs de /home n'est pas réalisé et les comptes
utilisateurs NIS ne sont pas opérationnels. S'il s'avère nécessaire de travailler sur un nœud
en station isolée avec des comptes utilisateurs sans pour autant perdre la configuration
cluster, procéder de la manière suivante :
- brancher un écran et un clavier (minimum requis)
- se connecter en tant que root ou admin puis su
1) arrêter le démon ypbind
2) éditer /etc/fstab
- commenter les lignes (insérer # en début de ligne)
master0:/home
master0:/usr/local
Il est alors possible de travailler avec une station pleinement opérationnelle.
nb : le compte admin est créé sur chaque nœud.
4 – EXPLOITATION LOGICIELLE
4.1 MPICH
version 1.2.4
compilation dans /usr/local/mpich-1.2.4
installation dans /usr/local/mpich si un seul compilateur
installation dans /usr/local/mpich-gcc et mpich-autre-compilateur si nécessaire
paramétrage des machines du cluster
/usr/local/mpich-1.2.4/util/machines/machines.LINUX et /usr/local/mpich-
compilateur/share/machines.LINUX
renseigner avec les nœuds de calcul (important : hostname) ; sur machine SMP :
compilation avec l'option --with-comm=shared
4.2 ATLAS
version 3.4.1
installation dans /usr/local/ATLAS
librairies BLAS optimisées dans /usr/local/ATLAS/lib/Linux_P4SSE2_2 pour la
configuration nœud.
4.3 LAPACK
version 3.0
installation dans /usr/local/LAPACK
librairie LAPACK optimisée dans /usr/local/LAPACK
4.4 BLACS
4.5 SCALAPACK
version 1.7
installation dans /usr/local/SCALAPACK
librairies SCALAPACK (MPI, PVM) dans /usr/local/SCALAPACK
4.6 OPEN PBS
version 2.3.16
installation dans /usr/local/OpenPBS_2_3_16
paramétrage des machines du cluster dans /usr/spool/PBS/server_priv/nodes
version 6.5.7
compilation dans /usr/local/lam-6.5.7
installation dans /usr/local/lam-mpi
paramétrage des machines du cluster dans
/usr/local/lam-6.5.7/etc/lam-bhost.def et /usr/local/lam-mpi/etc/lam-bhost.def
4.8 PVM
version 3.4.4
installation dans /usr/local/pvm3
paramétrage des machines du cluster dans /home/admin/pvmhostfile
5 – MONITEOS v2.6
5.1 Introduction
5.2 Accessing Moniteos
5.3 Graphic "Monitoring"
5.4 "bMoniteos" Textual monitoring
5.5 The "Parallel Command" tool
5.6 The "PBalineoS" batch system tool
Moniteos is a complete cluster administration tool. It allows you to watch in real-time the
cluster load, as a graphic or textual report ; you can also obtain statistics on the utilization of
the cluster, node by node. You can, always through the same web interface, execute
instructions that will be treated by the nodes you selected. There is no limitation on the
number of nodes.
The Moniteos interface is accessed by a web browser : you have to connect to the master node
of the cluster, and then, assuming its name is master0, browse to http://master0/moniteos/.
This will lead you to Moniteos main page.
Note : Only the help icon is available without log in.
This first application is launched automatically by Moniteos at startup. You can access it later
by clicking on the first icon, at the bottom of the page. This monitoring applet gives you a
synthetic view of the cluster, node by node. Each node has four indicators :
CPU, Memory, Swap, and Network state. If you select one or more nodes by clicking on the
screen icon, and
then right-clicking on one of them, you can access statistics of their utilization, from one hour
to one month. Note
that if N/A is displayed, the considered nodes could have problems ; verify these nodes' state.
The textual monitoring application is accessed by clicking on the icon "bMoniteos". This
application allows you to control the cluster state as a table : each column describes a
particular state of the cluster.
We precise here what mean the columns' labels.
CPUx: the mean rate of utilization of the cpu (as a %)
LA1: mean number of processes in running state per minute
LA5: mean number of processes in running state for five minutes
LA10: mean number of processes in running state for ten minutes
LATOT: total number of processes in running state on the system
MEMUSED: amount of used memory on the system
MEMFREE: amount of free memory on the system
MEMSHAR: amount of shared memory on the system (included in MEMUSED)
MEMBUF: amount of buffered memory on the system (included in MEMUSED)
MEMCACH: amount of cache memory used on the system (included in MEMUSED)
SWAPUSED: amount of swap used
SWAPSIZE: amount of swap space on the system
IFxNAME: name of the x network interface
IFxSEND: number of bytes sent by this interface per second
IFxRECV: number of bytes received by this interface per second
IFxCOLL: number of bytes per second which collided
Note : Qstat button and PBS Nodes button are also available from the access page of
Pbalineos.
To use the full features of mpi-ch implementation to OpenPBS via PBalineoS, you only need
to give following arguements to your command line :
for mpi-ch over IP :
-machinefile $confile -np $nnodes
and for mpi-ch over GM :
--gm-f $confile –np $nnodes
You, as a Licensee under this Agreement, are hereby granted a limited, irrevocable,
nontransferable and nonexclusive license to use the Software subject to the restrictions and
other terms within. That use must be only by the Licensee. Any (complete or partial)
reproduction or distribution of the software or its source code is strictly prohibited. Licensee
may not rent, lease, loan, electronically transfer the Software and its source code to others.
The Licensee may modify the source code for his own use.
ALINEOS
14 bis rue du Marechal Foch
77780 Bourron-Marlotte
France
http://www.alineos.com
6 – CHECK LIST D’INSTALLATION CLUSTER
• Vérification des partitions :
_ Sur le frontal :
df –k
_ Vérifier le swap :
free | grep Swap
• Vérification de la configuration IP :
_ Vérifier la configuration IP cluster.
_ Paramétrer l’IP externe, DNS, Gateway et nom de machine (/etc/hosts).
• Moniteos
_ Verification version (Logo High Performance Linux Solutions)
_ Monitoring :
Vérifier que tous les noeuds sont bien en ligne.
_ BMoniteos :
Vérifier que les données sont bien renseignées pour tous les noeuds.
_ Parallel Command :
Lancer une commande sur plusieurs noeuds : exemple echo $$.
_ Pbalineos :
qstat, PBS nodes, lancement du calcul de pi depuis le script
/home/admin/mpicpi-pbalineos.sh.
• OPEN PBS
_ Lancer trois fenêtres xterm.
_ Dans le premier taper qsub –I –l nodes=2 :ppn=2
_ Dans le second taper qsub –I –l nodes=<X> :ppn=2 avec X de sorte que
X+2=Nombre total de nœud du cluster+1
_ Dans le troisième taper qstat –n et vérifier l’état des jobs ( le second doit être
mis en attente ).
• ATLAS
_ Librairies disponibles dans /usr/local/ATLAS/lib/<ARCH>
_ Installation de gcc 2.95.3 permettant une meilleure optimisation. Utilisable
par : source /home/admin/.gcc-2.95.3
• LAPACK
_ Librairie dans /usr/local/LAPACK
• BLACS
_ Librairies MPI et PVM dans /usr/local/BLACS/LIB
• SCALAPACK
_ Librairies MPI et PVM dans /usr/local/SCALAPACK
• PVM
_ Configuration de nouveaux comptes : 4 lignes à rajouter au fichier .bashrc ( Cf.
/home/admin/.bashrc ) :
_ Test depuis le node0 dans /home/admin :
pvm pvmhostfile
puis au promt :
pvm> conf -- renvoie la configuration du cluster
pvm> spawn -> hello
pvm> halt
• LAM
_ Configuration de nouveaux comptes : 3 lignes à rajouter au fichier .bashrc ( Cf.
/home/admin/.bashrc )
_ Test depuis le node0 dans /home/admin
recon -- test la configuration pour LAM
lamboot –s lamhostfile -- lance LAM avec la configuration du fichier
lamnodes -- affiche la configuration
/home/admin/TestLam.sh -- script qui lance deux programmes d’exemples
-- LAM : ring et cpi ( calcul de pi )
lamhalt