FI/2/00

Audio et Web: la révolu-son

Jean-Jacques.Dumont@epfl.ch, SIC

Finalement, bien plus que l'image, le son est porteur de messages et d'inspirations, car l'oreille elle-même est un outil de perception délicatement complexe, sans parler de l'organisation neuronale capable d'interpréter les ondes sonores jusque dans leurs plus fines modulations. Bref, l'ouïe est à l'homme ce que l'odorat est au chien: un outil de communication avec le milieu extérieur poussé à la perfection par l'évolution darwinienne.

Ne nous étonnons donc pas de la frénésie déployée par les inventeurs de tout poil pour perfectionner les moyens de diffusion de messages sonores sur de grandes distances, et pour toucher un public de plus en plus étendu. De Graham Bell et Elisha Gray ( http://www.privateline.com/TelephoneHistory/History1.htm ), qui longtemps se disputèrent la paternité du téléphone, en passant par Guglielmo Marconi (http://www.alpcom.it/hamradio/), qui le premier s'affranchit du fil de cuivre pour transporter à distance un signal analogique reproduisant une voix humaine, l'histoire de la radio est jalonnée de découvertes technologiques ingénieuses et de luttes économiques intenses.

Au contraire du téléphone, qui est essentiellement une liaison point à point (unicast) dépendant de la médiation de centraux (switch), la radio correspond à la diffusion d'un signal audio depuis un point d'émission unique vers de nombreux points de réception banalisés (broadcast). Si les premières applications de diffusion de concerts ou d'informations parlées utilisaient l'infrastructure naissante du téléphone, les progrès foudroyants de l'appareillage de Marconi ne tardèrent pas à imposer la TSF (Télégraphie Sans Fil) et ses ondes hertziennes (ondes radio) comme moyen de diffusion standardisé pour la voix et la musique. Grand avantage de cette solution: le poste de réception (à transistors dès la fin des années 50) est mobile, car il ne dépend d'aucun raccordement.

Après bientôt un siècle de domination hertzienne, l'avènement du numérique et l'explosion d'Internet sont à l'origine de l'étonnant renversement de situation auquel nous assistons en ce moment: l'utilisation pour la diffusion de documents audio, voix et musique, de l'infrastructure de télécommunication engendrée par la téléphonie est à nouveau au centre des enjeux techniques et économiques. En point de mire, les radios et l'industrie du disque, bien que ces termes perdent rapidement leur sens étymologique. Alors qu'inversement le téléphone, pour se rendre mobile, a rapidement peuplé les campagnes d'antennes et rempli l'atmosphère d'ondes électromagnétiques. Tout est sens dessus dessous, ma bonne dame...Sans parler des satellites...D'ailleurs vous verrez qu'on utilisera bientôt le Natel pour écouter la radio, sans blague...

Résultat spectaculaire de cette révolu-son: la constitution de gigantesques consortiums multinationaux regroupant des opérateurs d'Internet, des producteurs d'images animées et l'industrie musicale: on parle aujourd'hui de AOL/TimeWarner/EMI, mais d'autres regroupements s'effectueront certainement demain, peut-être même dès avant la parution de cet article.

L'audio sur IP et l'évolu-son de la radio

Qu'entend-on aujourd'hui par radio, à part le fait qu'il s'agit d'un moyen de communication de type audio? Une station d'émission mérite ce nom si elle fournit des informations en continu (journal parlé), des informations de fond, de type culturel (livre parlé), souvent sous forme d'interview et de débats, et de la musique soit enregistrée, soit en direct, sous l'égide des sociétés (Swisa, SACEM...) chargées de défendre les intérêts des auteurs/compositeurs/musiciens, mais aussi et surtout ceux des autres propriétaires de droits (éditeurs et autres intermédiaires parasites). Soulignons aussi l'importance des archives, qui constituent un peu la mémoire culturelle d'une communauté.

Mais l'arrivée soudaine d'outils électroniques de production et d'édition de sons financièrement abordables, et techniquement maîtrisables par n'importe quel adolescent un tantinet doué est en train de secouer un establishment que l'on croyait inébranlable: MIDI ( http://www.epfl.ch/SIC/SA/publications/FI97/fi-sp-97/sp-97-page44.html ), RealAudio (http://www.real.com/) et MP3 (http://www.mp3.com/ ) sont probablement les trois éléments essentiels d'une nouvelle Renaissance. A côté des majors qui ont fait la loi jusqu'à présent dans le monde féroce de la production musicale, il faudra désormais tenir compte d'une production marginale disposant des mêmes outils de production et de diffusion que les géants industriels et donc capable de les concurrencer efficacement sur ce média quasiment gratuit qu'est Internet.

L'évolution inéluctable des radios traditionnelles vers de nouvelles formules hybrides, où à la fois les ondes et le câble sont mis à contribution pour atteindre un plus large public et assurer une meilleure interactivité, avait été tracée à l'EPFL dès 1994 par le groupe GIRAF (Groupe d'Intérêt pour la Radio A-la-carte du Futur - http://www.epfl.ch/SIC/SA/publications/FI95/fi-1-95/1-95-page5.html ). Celui-ci, se basant sur l'expérience de la radio des étudiants Fréquence Banane (http://fbwww.epfl.ch/ ), avait analysé les divers composants techniques à mettre en place pour la réalisation d'une radio interactive sur le Web. Un premier prototype avait même été réalisé, avant d'être stoppé par un diktat brutal de la Direction Générale de la Société Suisse de Radiodiffusion à Zurich, qui n'appréciait guère ce genre d'initiative à l'époque.

Depuis ces temps héroïques, le nouveau modèle de radio hybride est devenu presque banal. Pour mémoire, les diverses techniques à mettre en oeuvre sont:

Tout cela semblait être musique d'avenir J jusque très récemment, lorsque:

Cette conjonction de facteurs est à l'origine de l'explosion inattendue du format MPEG Layer 3 (MP3 - http://www.iis.fhg.de/amm/techinf/layer3/index.html ), recommandé pourtant depuis plus de dix ans par l'ISO et l'ITU. Avec, comme conséquence, la floraison d'une multitude de serveurs Web représentant déjà un gigantesque juke-box planétaire. Bref, ce qui semblait encore il y a quelques mois être un rêve surréaliste est en train de se matérialiser sous nos yeux.

Si ce tournant de l'histoire vous passionne, vous aurez l'occasion début mai, lors de l'expo Computer 2000 à Beaulieu, de vous rendre compte par vous même de ce que représente la nouvelle radio: un atelier de production du Journal Multimédia de Computer produit par la Radio Suisse Romande sera en effet actif et ouvert au public en permanence dans le stand Internet in Action. Le soussigné espère fermement vous y rencontrer.

Quelques données techniques

Sans compression, la représentation numérique d'un signal audio est composée d'échantillons de 16 bits enregistrés avec une fréquence double de la bande passante souhaitée, soit typiquement 44.1kHz pour la qualité Compact Disk, soit plus de 1.4 Mbit par seconde de musique.

L'utilisation du code MPEG permet de réduire la quantité de données d'un facteur 12 sans perte de qualité. Une réduction MPEG par un facteur de 24 permet de conserver encore une qualité de son bien meilleure que celle obtenue en divisant par deux la fréquence d'échantillonnage ou la résolution d'un échantillon.

Ce miracle est rendu possible par l'utilisation de techniques d'encodage perceptuelles, c'est-à-dire tenant compte des phénomènes biologiques de perception inégale par l'oreille humaine.

Quelques taux de compression typiques obtenus par l'encodage MPEG sans perte de qualité par rapport à la norme CD:


1:4 pour Layer 1 (soit 384 kbps pour un signal stéréo),
1:6...1:8 pour Layer 2 (soit 256..192 kbps pour un signal stéréo),
1:10...1:12 pour Layer 3 (soit 128..112 kbps pour un signal stéréo)

C'est ce fameux Layer 3 qui est utilisé pour la production de documents en format MP3, qui est en train de devenir la norme universelle de facto.
Quelques chiffres permettant de se rendre compte des performances de MPEG Layer 3:

Qualité sonBande passanteModeQuantité bitscompression
téléphone2.5 kHzmono8 kbps 96:1
Radio AM7.5 kHz mono32 kbps24:1
Radio FM11 kHzstéréo64 kbps24:1
CD >15 kHzstéréo112-128 kbps14-12:1


retour au sommaire du Flash informatique du mois de février 2000
retour à la page principale des Flash informatique
Vos commentaires
© FI-2-00 du 29 février 2000