FI/2/00

Arrivée et mise en service de Swiss-T1

Michel.Jaunin@epfl.ch, SIC

Bref historique

Dès 1997, l'EPFL a pris l'initiative de démarrer un projet de développement d'un système parallèle basé sur des composants (matériel et logiciel) du marché, et complétés par un système d'interconnexion spécifique (TNet). Ce projet, qui a reçu le soutien de la CTI (Commission pour la Technologie et l'Innovation), implique plusieurs partenaires:

D'autres institutions, en particulier des laboratoires nationaux de recherche aux Etats-Unis, participent également à ce projet dans un cadre plus général de comparaison avec des solutions similaires qu'ils développent.

Différentes étapes se sont déroulées depuis lors, devant, par l'installation de prototypes, permettre la validation du concept; chaque phase réussie permettant le passage à l'étape suivante:

De nombreux articles parus au cours de ces années, soit dans Flash informatique, soit dans EPFL Supercomputing Review, donnent des informations complémentaires sur ce projet et sur les résultats obtenus par diverses applications. La description générale du projet est disponible à l'adresse suivante: http://capawww.epfl.ch/swiss-tx/index.html.

Swiss-T1

Le système commandé, similaire à T1 baby, est de taille beaucoup plus importante:

L'ensemble est conçu de manière à garantir une disponibilité et une fiabilité optimale. Il est néanmoins important de rappeler que l'architecture proposée par T1 est unique par la présence de TNet et par le nombre de stations indépendantes qui le constituent. Même si de nombreux tests ont été réalisés dans les phases précédentes, le système complet doit encore être testé; il n'est donc pas exclu que des problèmes apparaissent au début de la mise en production. La gestion d'un tel système est aussi beaucoup plus complexe que celle des autres systèmes présents sur le site. Il faut donc être conscient que des interruptions, des mises à jour et corrections pourront intervenir pendant les premiers mois de production. Le plan ci-dessous donne l'image de la configuration.

Planification

La mise en place, et en particulier les procédures contractuelles d'acceptation du système se font de manière séparée, pour les parties Compaq d'abord, puis pour SCS.

Le matériel, provenant des 2 fournisseurs Compaq et SCS, est arrivé sur le site le 17 janvier. Dès le 24 janvier, Compaq, avec la collaboration du SIC, a procédé à l'installation du logiciel de base (Compaq Tru64 Unix) sur l'ensemble des stations, à la définition de la configuration générale, puis à l'installation des extensions de logiciel et de l'environnement de travail.

Lorsque le système sera totalement configuré pour la production, il sera procédé aux tests d'acceptation qui consistent en la répétition d'un benchmark et surtout en la mise en production avec les utilisateurs sur une période de 2 semaines; pendant cette période, la partie SCS (MPI, FCI) n'est pas disponible, et seuls les codes parallèles utilisant MPICH peuvent être soumis.

Dès l'acceptation de la partie Compaq, l'intégration de la partie TNet (crossbars, cartes d'interface, logiciel) sera terminée, ce qui impliquera l'indisponibilité de l'installation pour quelques jours; lorsque tout sera prêt, une deuxième phase d'acceptation sera démarrée lors de laquelle des programmes tests seront vérifiés, et la machine sera mise en production pour les utilisateurs, avec contrôle de la qualité de l'ensemble sur une période de deux fois deux semaines.

Les dates précises de ces différentes phases ne sont évidemment pas connues. Nous informerons les utilisateurs au fur et à mesure par les moyens habituels.

Le mode de fonctionnement et les outils disponibles sur T1 sont similaires si ce n'est identiques à ceux que l'on trouve sur T1 baby. En particulier, les compilateurs, librairies et outils suivants sont accessibles:

Le gestionnaire de travaux n'est pas encore défini à ce jour. Différents tests et comparaisons entre LSF (utilisé sur T1 baby) et GRD-Codine sont en cours. Une décision sur le choix est imminente.

Contact pour des informations complémentaires: Istvan Nadas, X-2218, Istvan.Nadas@epfl.ch.


retour au sommaire du Flash informatique du mois de février 2000
retour à la page principale des Flash informatique
Vos commentaires
© FI-2-00 du 29 février 2000