Après un mois de production

Reconfiguration du T3D et de son frontal Pascal

par Jean-Michel Chenais, SIC-Exploitation, e-mail: chenais@sic.adm.epfl.ch

Après les 30 premiers jours de production du T3D, qui se sont déroulés sans accident majeur, une reconfiguration de son frontal Pascal et de l'ensemble des ressources liées au T3D s'avèrent nécessaires. En effet, l'observation des conditions de passage des travaux à destination du T3D a montré que certains paramètres de configuration pouvaient être affinés, afin de garantir le meilleur service possible pour l'ensemble des usagers. Alors qu'au niveau de la configuration matérielle des équipements les deux machines restent connectées, la reconfiguration en voie d'être mise en place instaure, au niveau de l'organisation de la production, une plus grande indépendance entre ces deux machines.

Reconfiguration des classes batch NQS

Cette partie de la reconfiguration est essentiellement motivée par le fait que les conditions de charge du Pascal peuvent ralentir, voire complètement bloquer l'accès au T3D, alors que ce dernier n'est pas utilisé. En conséquence, les classes NQS à destination du Pascal et du T3D sont regroupées dans des ensembles distincts, dénommés complex selon la terminologie NQS. Il y a donc 2 complex : PASCAL et T3D. Les anciennes limites globales, s'appliquant à l'ensemble de toutes les classes, ont donc été remplacées par des limites indépendantes s'appliquant à chacun de ces complex (entre autres nombre total de jobs autorisés, nombre maximum soumis par un même utilisateur, etc.). Ainsi, l'accès au T3D demeure possible, même si l'une quelconque des limites d'utilisation du Pascal est atteinte.

Les classes propres au Pascal ont également subi quelques modifications. Le cpu_time_limit des classes express et small a été respectivement relevé à 200 et 600 secondes. A noter que la classe express ne fait pas partie du complex PASCAL. En conséquence, l'accès à cette classe n'est limité que par le taux d'occupation de cette classe, et non par les conditions de charge des autres classes du complex PASCAL. Les petits travaux bénéficient ainsi des meilleures conditions de passage sur Pascal.

Pour le complex T3D, 3 classes sont actuellement configurées. La classe t3d-init a été récemment introduite. Cette nouvelle classe, (8 PEs et 600 secondes) est prévue pour les comptes initiation, dont la procédure d'ouverture est simplifiée (cf. article «Ouverture de compte sur T3D», FI du 17 mai 94). Les 2 autres classes (t3d, t3d-128) respectivement limitées à 64 et 128 PEs, sont à disposition des comptes projets. Selon l'évolution de la charge du T3D, la classe à 128 processeurs pourrait n'être ouverte que la nuit ou limitée de jour (par exemple, un seul passage dans t3d-128 toutes les demi-heures). Les commandes suivantes fournissent des renseignements plus détaillés sur la structure des classes:

Nouveaux file-systems /t0, /t1, /t2, /t3

Dans le même esprit visant à séparer le management du T3D de celui du Pascal, les home directory des usagers du T3D sont regroupés sur un ensemble de disques dédiés. Les comptes actuels T3D localisés sur les /u0, /u1, /u2, /u3 sont donc déplacés vers les partitions /t[0123] respectives. Les nouveaux comptes seront dorénavant créés sur ces nouveaux disques. Chaque partition offre 2,5 Gbytes. Les usagers reçoivent d'office 7200 blocs, soit l'équivalent de 30 MBytes. Des dérogations, dans les limites disponibles, sont possibles.

Nouveau file-system /mpp/tmp

Selon le même principe, un nouvel espace de travail temporaire, de 10 Gbytes, est à disposition exclusive des usagers du T3D. Tous ces nouveaux file-systems (/t0 à /t3, /mpp/tmp) sont assignés à un sous-système de disques particulier DD301 de 20 Gbytes, prévu pour être étendu en 1995. Ce sous-système DD301 est connecté à une interface matérielle (IOC pour «Input-Output Cluster») qui lui est propre, séparant ainsi au niveau des disques les flux de données en provenance du T3D de ceux générés par le frontal Pascal lui-même. Une meilleure performance au niveau des entrées-sorties est ainsi attendue, surtout lors des périodes de forte charge du Pascal.

Afin de faciliter l'utilisation de ces nouveaux espaces disque, de nouvelles variables d'environnement sont prévues pour les usagers du T3D:

Les file-systems /t0 à /t3 suivent les mêmes règles de prise de copies de sauvegarde que pour les /u0 à /u3: full dump une fois par semaine, dans la nuit du dimanche à lundi, et un dump incrémental les autres jours. En cas de perte accidentelle de fichier, une recharge est possible. Le cas échéant, contacter le service des Opérations (2204).

Conclusion

Les conditions de charge des serveurs centraux du SIC sont en général très évolutives. Afin d'assurer à tout instant la meilleure adéquation entre la disponibilité des ressources et leur demande, les opérations de reconfiguration sont toujours sujettes à révision. Nous espérons toutefois avoir, ne serait-ce que pour un certain temps, amélioré les conditions d'utilisation des serveurs Pascal et T3D.
article paru dans le Flash informatique no 6 du 21 juin 1994