L’IRIC possède une grappe de calcul dédiée et emploie le logiciel Torque/PBS pour distribuer les tâches sur ces ressources.  Pour y accéder, vous devez posséder un compte Linux sur nos serveurs et utiliser un client SSH afin de rejoindre le noeud maître de la grappe à l’adresse suivante:

cluster.iric.ca

Tous les répertoires usagers sont exportés sur cette grappe de calcul par NFS et vous aurez donc accès à vos données de n’importe quel noeud en utilisant le même répertoire (e.g. /u/usager).

Lancer une tâche

La soumission d’une tâche se fait en utilisant la commande qsub et en spécifiant les ressources requise pour cette tâche. Dans sa forme la plus simple, il est possible de se connecter de façon interactive sur un noeud de calcul en utilisant les commandes suivantes:

module load torque
qsub -I -l nodes=1:ppn=2,mem=8gb,walltime=4:00:00

Cette commande vous connectera sur le prochain noeud de calcul disponible en réservant 2 coeurs de CPU et 8GB de mémoire et ce, pour une durée maximale de 4 heures après laquelle vous serez automatiquement déconnecté. Durant cette période, vous pourrez exécuter votre programme sur ce noeud de calcul en mode interactif, ce qui est particulièrement utile pour tester vos analyses. Une fois que vous êtes confiant de votre analyse, il est plus efficace de lancer les tâches en mode batch en créant un script qui définit les commandes à être exécutées, par exemple:

#!/bin/bash
#PBS -V -l nodes=1:ppn=2,mem=8gb,walltime=4:00:00
tophat …
samtools …

et de soumettre ce script à la grappe de calcul ainsi:

qsub -d $HOME/work_folder test.pbs

Les sorties stdout et stderr de vos programmes seront redirigés dans des fichiers du répertoire de travail.  Pour plus de détails sur les paramètres de qsub, vous pouvez consulter la documentation officielle de Torque.

Monitorer une tâche

Vous pouvez afficher l’état de vos tâches en utilisant la commande qstat et supprimer l’une d’elle avec la commande qdel:

qstat
qdel

L’état général de la grappe de calcul peut aussi être affiché à l’aide de la commande:

pbs_free

et en consultant l’outil de monitoring ganglia: http://intranet.iric.ca/ganglia.

Documentation avancée

Pour la documentation complète sur le système de gestion des ressources, vous pouvez consulter la documentation officielle de Torque:

http://docs.adaptivecomputing.com/torque/6-0-1/help.htm