le stockage numérique de masse
Françoise Kaestli, Revue de l'IAS (Ingénieurs et architectes suisses)
Ndr: cet article, mis à notre disposition par l'auteur, est paru dans le numéro 24 du 18.11.98 de la Revue de l'IAS.
Le 29 octobre dernier, le CAST a choisi d'aborder l'épineuse question de l'archivage des données et du stockage numérique de masse. Cette conférence a soulevé beaucoup de questions sur la manière dont nous gérons, et allons gérer, les masses toujours plus grandes d'informations que nous générons. Le problème ne se pose pas en termes de capacité de stockage: la quantité d'information circulant sur les réseaux mondiaux triple tous les deux ans (nous en sommes à près de 90 petaoctets, soit 1016 octets estimés pour cette année d'information envoyée) et, en parallèle, la masse des données stockées double presque chaque année. Il s'agit plutôt de maîtriser le transfert obligé des données sur de nouveaux supports, ainsi que les technologies successives qui s'imposent, et de définir les nouvelles normes permettant l'identification de contenus multimédia, à la fois texte, son, image, séquence vidéo.

La statue «footballers» de Niki de Saint-Phalle - photo Marcel Imsand - collections Musée Olympique
Stockholm 1912 - l'équipe britannique, médaille d'or - collections Musée Olympique
Chamonix 1924 - Arrivée en traineau de Gaston Vidal - collections Musée Olympique
Saint-Mortz 1928 - Concurrentes exécutant un «French-cancan» - collections Musée Olympique
La Radio suisse romande a, par exemple, connu les disques analogiques, puis les rubans en acier, les pellicules acétate, la bande magnétique, pour arriver maintenant au disque compact enregistrable. «Les techniques numériques ne nous offriraient-elles pas les moyens d'échapper à la spirale infernale, de gérer non plus des supports, mais de l'information, dont l'intégrité pourrait être vérifiée en permanence, et dont des systèmes piloteraient automatiquement la recopie chaque fois que le besoin s'en fait sentir?» se demande dès lors M. Jean-François Cosandier, responsable du service documentation et archives de la RSR, qui mise effectivement sur le numérique. Le projet SIRANAU (Système Intégré Radiophonique pour l'Archivage Audio) a donc été lancé, avec le soutien de la CTI (Commission pour la technologie et l'innovation), et un groupe de partenaires: la Radio suisse romande, le Laboratoire de bases de données de l'EPFL, la Phonothèque nationale, relayée par Memoriav, et la société Hewlett Packard Suisse. Le prototype d'archivage déjà réalisé contient plusieurs modules: la base de données (avec des archives traditionnelles et numériques, à la fois audio et textuelles), le dispositif de stockage en ligne par robot, les logiciels de pilotage des périphériques de stockage, les logiciels de codage générant les diverses versions de fichiers sonores, les stations d'acquisition des sons, celles d'écoute ou de montage. Il servira à la transition de la RSR au tout numérique (y compris la diffusion numérique ou Digital Audio Broad-casting) et à l'ouverture sur le monde, par Internet interposé.
Quant au projet de gestion intégrée multimédia des archives et collections du Musée Olympique, il est encore plus complexe puisqu'il s'agit, comme l'a montré Mme Catherine Chapuis, d'intégrer des données, des textes et des images, des collections d'oeuvres d'art, les archives photographiques (32 000 photos), audiovisuelles (7000 heures de bandes), les collections philatélique, numismatique, etc. Un tel système d'information permet de gérer le suivi permanent des inventaires et les mouvements, prêts ou acquisitions, ainsi que les affaires administratives courantes du musée.
Le projet de la Radio suisse romande, comme celui du Musée olympique sont des développements sur mesure, longs et coûteux. L'évolution des normes, la norme MPEG-7 en particulier, dont la sortie est prévue en 2001, devrait permettre un traitement facilité des données multimédia. MPEG-7 créera un ensemble de normes dédiées à la description de contenus multimédia dans des applications telles que le divertissement, l'éducation, les applications médicales, etc. Nous avons l'habitude de rechercher une information textuelle à partir d'un nom de fichier, d'un titre, d'un résumé, de mots clés ou même d'une recherche en texte intégral, mais la recherche d'une séquence sonore ou audio, ou l'identification d'un visage sur une photo posent des défis autrement plus complexes. Le résultat principal de MPEG-7 sera de rendre le matériel audiovisuel aussi accessible et maniable que l'information textuelle; Touradj Ebrahimi, professeur au Laboratoire de traitement des signaux- LTS de l'EPFL, en est convaincu.
En ce qui concerne les solutions techniques, il s'agit de définir ce qu'il faut stocker, dans quel environnement informatique, à quel coût, avec quelle fréquence de migration technologique. Sur ce point, le Prof. Spaccapietra du Laboratoire de bases de données - LBD de l'EPFL, fait surtout appel au bon sens de l'humain, à sa capacité de gérer le complexe et de s'adapter aux changements rapides, car les données du problème se déplacent au rythme de l'évolution technologique. Une certitude s'impose cependant: les systèmes informatiques les plus lourds et les plus chers ne sont pas toujours les plus performants, ce qui a été illustré par le Prof. Roger Hersch, du Laboratoire de systèmes périphériques - LSP de l'EPFL, qui a montré en direct, comment on pouvait gérer des masses de données importantes, en temps réel, avec de simples PC, dotés de disques supplémentaires. Après avoir accédé, via Internet, à une image tridimensionnelle du corps humain, il a découpé les 13 gigaoctets qui la composent en sous-ensembles qu'il a répartis sur les soixante disques de cinq ordinateurs, puis, avec un programme de parallélisation efficace, le public présent a pu voir que la recherche et la reconstitution de ces éléments s'effectuent de manière tout à fait transparente pour l'utilisateur.
Reste que les défis posés par la masse exponentielle d'informations accumulées, qui constituent notre patrimoine, soulèvent de gigantesques problèmes sur lesquels nombre d'organismes commencent à se pencher.
| retour au sommaire du Flash informatique du mois de février 1999 |
| retour à la page principale des Flash informatique |
| Vos commentaires |
| © FI-1-99 du 2 février 1999 |