FI/8/98

Utilisation des serveurs centraux Origin2000

Jean-Michel Chenais, e-mail: Jean-Michel.Chenais@epfl.ch , EPFL-SIC

Les serveurs centraux du SIC de marque Silicon Graphics sont actuellement constitués de deux machines Origin2000, dénommées Orion et Eridan.

La première arrivée, Orion, a été mise en service en janvier 97. Ses principales caractéristiques: 8 Gigabytes de mémoire vive, 32 processeurs Mips R10000 (195 Mhz), 2caches pour la mémoire et les données de 32 Kbytes de 1er niveau, et un cache unifié de 4 Mbytes de 2ème niveau.

La deuxième machine a été installée début 98, et a été dénommée Eridan. Elle ne diffère d'Orion que par le nombre de processeurs (38 processeurs au lieu de 32). Chaque serveur dispose de 256 Mbytes par processeur.

La première version du système d'exploitation installée a été Irix 6.4.

Cette version du système d'exploitation installé sur Orion s'est avérée en janvier 97 très insuffisante en possibilité d'administration et de contrôle des ressources, et n'offrait pas du tout les mêmes possibilités de service que les systèmes Unicos de Cray Research. Raison pour laquelle le mode d'exploitation d'Orion est reste purement interactif, sans possibilité aucune de contrôle sur le déroulement des processus dans la machine. En particulier, le système traditionnel batch des travaux des utilisateurs n'a pu être mis en place, car il n'offrait pas la fiabilité nécessaire.

Cette situation a perduré même jusqu'après l'arrivée de Eridan, les derniers gros bugs du système batch n'ayant pu être corrigés qu'au courant du printemps 98.

Maintenant, le système batch NQE/NQS sur Eridan est fonctionnellement satisfaisant.

Reste donc à reconfigurer le serveur Orion, donc re-installer le système batch, afin de garantir au mieux une bonne répartition des ressources disponibles (CPUs, mémoire vive, swap, entrées-sorties).

Génériquement, les deux modes d'exploitation multi-utilisateurs d'un serveur de calcul sont l'interactif (accès immédiat aux ressources), et le batch (accès en différé). Le mode interactif doit être limité quant au volume de ces ressources, pour éviter une accumulation accrue des demandes de ressources. Les travaux batch par contre peuvent individuellement accéder à davantage de ressources (voire toutes celles de la machine) étant donné que leur volume, spécifié par l'usager, est connu à l'avance, ce qui permet d'organiser leur passage en machine.

L'une des tâches majeures de l'administrateur est de trouver et de mettre en place les stratégies adéquates pour réaliser le bon équilibre entre les deux modes, tout en respectant le cahier des charges des serveurs.

Les modes d'utilisation prévus pour les deux serveurs Origin2000 sont décrits succintement dans les pages Web relatives a ces serveurs :

http://sewww.epfl.ch/SIC/SE/serveurscentraux/origin.html

ainsi que dans le Flash Informatique

http://dit-archives.epfl.ch/FI98/fi-1-98/1 -98-page3.html.

Concrètement, Eridan doit être à disposition des travaux de production d'applications parallèles pour des projets prioritaires, en mode batch, l'interactif étant fortement limité.

Orion, pour sa part, est plus largement ouvert, et doit permettre la production de travaux parallèles en batch, l'usage interactif étant destiné aux travaux de développement. Afin d'assurer une bonne répartition entre les deux modes, le volume global des ressources dédié à l'interactif doit rester inférieur à celui du batch.

Actuellement, la configuration batch sur Eridan est fonctionnellement satisfaisante, mais devra être réaménagée au fur et à mesure que sa charge augmentera.

Pour les mois à venir sur Orion, la transition à un passage de production plus contrôlé se fera en douceur. Le système batch sera mis en place progressivement, et coexistera avec l'accès interactif tel qu'il fonctionne actuellement (ressources illimitées). Afin de réaliser le but fixé, les limites interactives seront instaurées plus tard avec annonce préalable. Les usagers seront alors priés de passer par le batch pour tourner leurs applications, et de n'utiliser l'interactif que pour les travaux courants demandant en général peu de ressources.

Le calendrier reste conditionné à la mise en place des versions les plus récentes du logiciel d'exploitation (Irix 6.5.1), et l'installation des produits d'accès aux cartouches robot STK (TMF, pour Tape Management Facility), et d'archivage (DMF, pour Data Migration Facility).


retour au sommaire du Flash informatique du mois d'octobre 98
retour à la page principale des Flash informatique
Vos commentaires
© FI-8-98 du 20 octobre 1998