FI-24.4.1

Compression d'images en télédétection et systèmes d'information géographique

&

Marc.Riedo@epfl.ch & Abram.Pointet@epfl.ch,
Laboratoire de Système d'Information à Référence Spatiale - DGR- EPFL, http://dgrwww.epfl.ch/SIRS

Introduction

Figure 1: les composantes informatiques d'un SIG

La valeur stratégique des informations relatives au territoire a été reconnue depuis très longtemps mais la globalisation des phénomènes à prendre en compte aujourd'hui, que ce soit pour l'environnement, l'économie ou la politique, ne la rend que plus précieuse et indispensable. Il y a quelque temps, l'ex vice-président américain Al Gore faisait un discours présentant une vision The Digital Earth1, une représentation tridimensionnelle, multi-résolution de notre planète dans laquelle on peut intégrer de grandes quantités de données géoréférencées2. Cette vision est un challenge fantastique qui nécessite d'avoir recours aux technologies existantes ou émergentes les plus sophistiquées pour pouvoir traiter une quantité gigantesque de données géoréférencées. Cette représentation numérique de notre planète est indispensable pour comprendre son fonctionnement et pour prendre les décisions appropriées dans les domaines les plus variés: aménagement du territoire, agriculture, militaire, météorologie, gestion de ressources naturelles, gestion de catastrophes, ... et cela depuis l'échelle planétaire jusqu'à l'échelle parcellaire.

C'est dans ce contexte que s'inscrivent les systèmes d'information géographique (SIG) et la télédétection (TD). Les SIG et la télédétection sont un ensemble d'outils, de techniques et de méthodologies qui permettent de numériser, de structurer, de stocker, d'analyser et représenter des données ou des images géoréférencées. La figure 1 (adaptée de Eastman) présente les principaux modules de traitements proposés par ces disciplines, avec au coeur du système la base de données géographiques.

Dans le domaine de l'acquisition de données, la télédétection a franchi un pas important en permettant d'avoir des images de 1m de résolution (bientôt 50 cm) pour des applications non militaires. Les technologies radar et laser nous amènent des représentations tridimensionnelles très précises de notre territoire. La mission SRTM (Shuttle Radar Topographic Mission: http://www.dfd.dlr.de/srtm ) réalisée en 2000 devrait nous donner un modèle numérique de 30 m de résolution pour la planète à quelques mètres de précision pour l'altitude, dès que les scientifiques auront traités les 15 000 CD ROMs de données issus du vol. Les vols lasers aéroportés nous permettent d'avoir des modèles numériques avec plusieurs points par m2 à des précisions de 10 cm. Les images aériennes numériques se démocratisent et on commence à disposer de couvertures de plus en plus étendues. La Suisse est par exemple entièrement couverte par des orthophotos numériques de 50 cm de résolution (http://www.swisstopo.ch, http://www.swissphoto.ch). Pour gérer, analyser et diffuser les très importants volumes générés par ces technologies, il faut avoir recours aux techniques de compression.

Pour donner des ordres de grandeur des volumes concernés, donnons l'exemple suivant:

Pour prendre un exemple plus local:

Heureusement, les progrès informatiques sont impressionnants dans ce domaine: nouvelles méthodes de compression, réseaux à haut débit, nouveaux supports de stockage,... Pour se convaincre de la puissance de ces nouvelles techniques de compression, on peut tester le serveur d'images à l'adresse suivante http://www.earthetc.com, qui permet de naviguer dans une photo aérienne de 190 Gigabytes en utilisant un simple navigateur internet, résolvant ainsi le fameux problème: comment faire passer un éléphant à travers une paille? L'objectif de cet article est de parler des techniques de compression d'images en prenant le point de vue du spécialiste en système d'information géographique (SIG) et télédétection. Il s'agit donc de parler des besoins spécifiques de ces disciplines et de comparer quelques formats actuellement utilisés et d'autres en devenir.

Caractéristiques des images utilisées dans le domaine des SIG et de la télédétection

Les volumes de données croissants engendrés par les images à très haute résolution (inférieure à 10 m pour les images satellites et inférieure à 1 m pour les images aériennes) mises à disposition par les techniques de saisie actuelles sont un défi permanent pour les algorithmes de compression de l'information en mode image. La compression à pour objectif de diminuer la taille des données à gérer, maximiser les performances et minimiser la perte d'information qui peut en découler. L'objectif général est donc la maîtrise des gros volumes.

Cartes nationales 1:25000
(copyright du S+T, CN25, CH-3084 Wabern)
Les cartes nationales sont une représentation cartographique du territoire à des échelles 1:25000 à 1:1000000 en Suisse.
Taille:
une carte nationale numérique au 1:25000 est fournie à une résolution de 500dpi et couvre une zone de 17 sur 12 km. Pour couvrir la Suisse, il faut 260 images de 14000 x 9600 pixels. Actuellement ces images sont livrées en 8 couleurs (sans ombrages), en format Tiff compression LZW, soit environ 4 Gigabytes pour toute la Suisse.
Caractéristiques:
ces images sont souvent dans un nombre réduit de couleurs (8 pour les cartes numériques au 1:25 000) mais peuvent être en 24 bits si on inclut l'estompage du relief, comme cela a été fait dans l'image de gauche).
Utilisation:
les cartes nationales numériques sont utilisées comme fond de plan permettant la localisation et l'analyse du contexte, comme base de numérisation de nouveaux jeux de données, ... Il s'agit d'une base essentielle à un très grand nombre d'applications SIG.

Modèles numériques d'altitude MNA 25 m (copyright du S+T, MNA25, CH-3084 Wabern)

Modèle numérique laser à 1m

Les modèles numériques d'altitude (MNA) sont une représentation simplifiée du relief. Ils existent sous différentes formes, réseaux triangulés, courbes de niveaux ou le plus souvent sous forme d'images.
Taille:
le modèle numérique MNA25 de l'Office Fédéral de Topographie est formé d'une maille rédulière de 25 m, soit 64 millions de points pour la Suisse représente environ 300 MB de données. Le modèle numérique de terrain de la planète réalisé lors de la mission SRTM (Shuttle Radar Topography Mission) à une résolution de 30 m représente environ 10'000 gigabytes de données.
L'image à gauche présente un modèle numérique réalisé par un vol laser aéroporté dans la région de Genève à 1m de résolution. On distingue les bâtiments et la végétation. Un projet est en cours pour générer un modèle de 2m de résolution pour l'ensemble du territoire suisse, ce qui correspond à 10 milliards de points
Caractéristiques:
l'image ne contient qu'une bande et les valeurs peuvent être des nombres réels.
Utilisation:
les MNA sont utilisés pour la quasi-totalité des fonctions d'analyse spatiale. On peut citer les corrections de photos aériennes et images satellites, le calcul de pente et autres caractéristiques géomorphologiques, dans les modèles pour définir la couverture des réseaux en téléphonie mobile, la cartographie des inondations, la création de modèles de villes en 3D, ...

Images satellites (résolution 30 m)

résolution 1m pour analyser les effets d'une tornade

La télédétection satellitaire fournit des images de la terre caractérisées par une couverture globale de la planète et une fréquence élevée de passage au dessus d'un même lieu. La constellation actuelle de satellites offre une large gamme d'images aux caractéristiques spectrales (intervalle de longueur d'onde considéré) et spatiale (taille de la tache au sol) diverses.
Taille:
les images satellites traditionnelles, telles que fournies par les programmes LANDSAT ou SPOT, présentent une résolution spatiale de respectivement 30 et 20mètres. Pour cette résolution, on obtient des fichiers d'environ 600 MB. Les dernières technologies en matière de capteurs montés sur les satellites (IKONOS, EROS A1) permettent d'acquérir des images à très haute résolution spatiale, de l'ordre du mètre. Le gain thématique indéniable de telles images, par l'augmentation du niveau de détail qui en découle, va de pair avec l'augmentation de taille des fichiers. Par exemple, le passage d'une image satellite traditionnelle de 180 km par 180 km à 30mètres de résolution à une image à très haute résolution (1 m) pour la même surface implique une augmentation de 900 fois de la taille des fichiers, ce qui pour de grandes surfaces d'étude peut devenir difficilement gérable.
Caractéristiques:
les images satellites sont des images multispectrales, proposant un ensemble complet de bandes spectrales aussi bien dans le domaine du visible (bleu, vert, rouge) que des infrarouges (proche, moyen, thermique). Cette richesse d'information est à la base de l'ensemble des applications que l'on peut en faire.
Utilisation:
les images satellites sont les données de base pour de très nombreuses applications: météorologie, climatologie, gestion de ressources environnementales, agriculture, suivi de catastrophes naturelles, ...

Images aériennes de 50 cm de résolution (copyright du S+T, produit Swissimage, CH-3084 Wabern)
Les photos aériennes numériques sont obtenues par scannérisation à partir de films analogiques grand format (généralement 23x23 cm). Elles sont prises par avion ou par hélicoptère. On utilise un modèle numérique d'altitude pour les orthorectifier.
Taille:
les volumes de données peuvent être considérables. La couverture du canton de Vaud en orthophotos couleurs de 20 cm de résolution représente environ 200gigabytes de données (sans compression). En utilisant une technique de compression par ondelettes (voir plus loin), on a pu créer un CD ROM unique contenant tout le canton de Vaud à une résolution de 50 cm.
Caractéristiques:
les images sont généralement en trois bandes, vraies ou fausses couleurs.
Utilisation:
les photos aériennes sont de plus en plus souvent utilisées comme fond de plan dans des applications SIG. Elles sont utilisées pour se localiser, pour numériser des données et pour de la photo-interprétation.

Images aériennes de projet de 10 cm de résolution
L'image ci-contre montre la résolution maximale actuellement utilisée pour des photos aériennes, soit une résolution de 10 cm. La taille de l'image est de 300 MB pour couvrir une zone de 1 km2. Les scanners de haute précision utilisés dans le domaine de l'imagerie aérienne ont des résolutions d'environ de 10 microns.
Il y a aujourd'hui de nouveaux moyens de prendre des images aériennes avec des caméras numériques. On se passe donc du film et du post-traitement nécessaire. Pour l'instant, ces systèmes ne peuvent pas produire la même qualité que des photos aériennes traditionnelles. Les problèmes de gestion de volumes sont importants.

Tableau 1 - caractéristiques des images utilisées en SIG et télédétection

Les tableaux 1 et 2 présente les caractéristiques de quelques données utilisées dans le domaine des SIG et de la télédétection qui posent des problèmes de volumes.

Une des caractéristiques essentielles des images utilisées dans le domaine des SIG et de la télédétection est donc la taille importante, ce qui justifie l'intérêt pour les techniques de compression. Une seconde particularité pour les images satellite est qu'elles sont multibandes, soit plus que trois bandes usuelles pour des images couleurs. Les images du satellite LANDSAT ont par exemple 7 bandes. Les capteurs peuvent mesurer des énergies dans d'autres parties du spectre électromagnétique, dans le proche infrarouge, l'infrarouge thermique et les ondes radio.

Une autre spécificité de toutes ces images est qu'elles doivent être géoréférencées. Pour qu'elles puissent être utilisées, il faut que les images soient corrigées géométriquement afin de pouvoir leur attribuer une géoréférence (projection, datum, système de coordonnées), ce qui permet de rendre toute extraction de distances ou de surfaces cohérente et de superposer les images à des données cartographiques. Les différentes sources de distorsions sont: la rotondité de la terre, le relief, l'altitude du point visé au sol, l'angle de visée latérale. Dès que cette transformation est faite, on stocke dans l'en-tête de l'image les informations concernant la géoréférence. Le format d'image GeoTIFF, basé sur le format TIF, représente un effort de plus de 160 organismes et compagnies dans le domaine des SIG, de la télédétection et de cartographie pour établir un standard d'échange d'images géoréférencées (www.geotiff.org). Ceci n'empêche pas qu'il existe aujourd'hui une multitude de formats, ce qui ne facilite pas l'échange de données et l'interopérabilité.

Tableau 2: gains de volumes possibles pour des images utilisées en SIG et TD

Techniques de compression et comparaison visuelle de différents formats

On distingue deux types globaux de compression à savoir la compression sans perte ou avec perte d'information. Le premier type de compression mentionné a pour objectif de générer un réplicat exact de l'image originale. Pour cela, les algorithmes se basent sur les répétitions et la redondance d'information rencontrées au sein du jeu de données pour procéder à la compression. Parmi ces techniques de compression, on peut citer le RLE (run length encoding), le codage Lempel-Ziv-Welch (LZW) utilisé dans le format Gif ou le codage selon Huffman. Les taux de compression sont limités à des facteurs de 2-3:1 et l'efficacité est meilleure pour des images ayant peu de couleurs.

Pour certaines applications dans le domaine de la télédétection, telles que la classification multispectrale et les indices spectraux, on a recourt à ces techniques parce qu'elles ne supportent aucune perte d'information. Le second type a pour objectif de compresser l'image tout en acceptant une légère perte d'information. Pour cela, les algorithmes se basent sur la redondance psycho-visuelle inhérente à l'image afin de comprimer l'information contenue dans l'image. Ce genre de compression est idéal pour toutes les applications pour lesquelles on utilise l'information visuelle de l'image. Le format JPEG, notamment rendu populaire par son utilisation dans les navigateurs, utilise une méthode compression avec perte. La compression utilisée avec JPEG est basée sur le principe suivant: l'oeil humain étant plus sensible aux variations de luminosité qu'aux variations de couleurs, on transforme l'image selon la luminance et la chrominance. On peut ainsi perdre de l'information concernant la chrominance sans que cela soit visible. Le format JPEG qui est un standard largement répandu a cependant vieilli et présente un certain nombre de lacunes importantes pour le domaine de la télédétection et des SIG: la vitesse de compression/décompression n'est pas bonne (donc pas adapté e aux très grandes images), les taux de compression permis sont insuffisants et les artefacts liées à la transformation DCT (Discrete Cosine Transform) par blocs sont gênants. Ce format devrait être bientôt remplacé par le format JP2 proposé dans la norme JPEG2000 présentée dans l'article du FI 3/01 ( flashinformatique.epfl.ch/spip.php?rubrique1033-1-page1.html, jpeg2000.epfl.ch, www.jpeg2000info.com). La norme JPEG2000 est basée sur les techniques de compression par ondelettes qui résoud les problèmes évoqués: les performances sont excellentes même sur des supports lents. La compression par ondelettes est même une petite révolution dans le domaine de l'imagerie et on peut s'en convaincre en citant quelques titres d'articles parus récemment dans les magazines consacrés au SIG et à la télédétection:

La norme JPEG2000 devrait aussi intégrer d'autres principes intéressants pour les SIG et la télédétection. Elle permettra une compression par régions d'intérêts, une transmission progressive pour une reconstitution à résolution croissante, idéal pour la consultation d'images volumineuses sur un support physique lent ou sur internet et l'incorporation de filigrane numérique et le cryptage, important pour des images aériennes et satellites dont les droits de rediffusion peuvent être limités.

L'objectif ici n'est pas de faire une description détaillée de la compression par ondelettes, le lecteur intéressé pourra se référer à d'autres articles notamment celui du FI cité plus haut ou se reporter sur le chapitre intitulé Wavelet image compression de l'ouvrage de référence Handbook of Image and Video Processing de l'éditeur Al Bovik ou sur les sites internet suivants: jpeg2000.epfl.ch, www.jpeg2000.com.

Les taux de compression conseillés pour une compression par ondelettes varient en fonction du type d'application et du type d'images4. Pour une photo aérienne en 24bits, on utilise généralement un taux de compression de 25:1 pour une impression de très haute qualité, et un taux de 50:1 (voire 100:1) pour de la visualisation dans un logiciel de SIG ou avec un navigateur. Avec ces taux de compression, la perte de qualité visuelle est imperceptible et le gain de volume et de performance extrêmement intéressants.

En attendant que la norme JPEG2000 soit largement adoptée et intégrée dans les logiciels, la méthode de compression basée sur la théorie des ondelettes est actuellement sujette à de nombreux développements tant dans les domaines du multimédia, de l'imagerie médicale et de l'imagerie aérienne et satellitaire. Plusieurs algorithmes et formats basés sur cette technologie sont proposés à ce jour et font, pour certains, place à un commerce et une concurrence acharnée5. Dans le domaine de l'imagerie aérienne et satellitaire, deux sociétés Lizardtech (format MrSid: MultiResolution Seamless image Database) et ErMapper (format ECW: Enhanced Compression Wavelets) proposent actuellement des outils de compression basés sur cette technologie ainsi qu'un ensemble de plug-ins gratuits pour des logiciels de SIG et de télédétection courants (ArcView, ArcInfo, MapInfo, Imagine, Ermapper, Geomedia,...), pour des outils de CAO (Microstation, Autocad), des logiciels de traitement d'image (Photoshop, Paint Shop Pro) et pour les navigateurs internet permettant la visualisation de données comprimées avec cette technique. Ces deux sociétés proposent des logiciels de compression gratuits pour des images de taille réduite (<500 MB) et une version payante pour des images de taille illimitée. Les résultats sont impressionnants. Pour s'en convaincre, le lecteur peut tester le serveur d'image de la société ErMapper qui permet de zoomer dynamiquement sur internet sur des orthophotos ou des images satellites de très haute résolution (http://www.earthetc.com cf. figure 2).

Figure 2: exemple de serveur internet d'images aériennes et satellite basé sur la technique de compression par ondelettes

Les résultats de comparaison de perte de qualité visuelle des images soumises à diverses méthodes de compression citées plus hauts sont présentées à la page 8. L'image aérienne utilisée a été comprimée avec un taux de compression volontairement exagéré de 75:1 afin de mettre en évidence les différences de qualité. Il est possible que la perte liée à l'impression des images rende la comparaison plus difficile 6.

Orthophoto fausse couleur de 20 cm dans la région de Villeneuve
Image originale 1
Image comprimée 1a 75:1 en JPEG standard. On voit apparaître les artefacts liés à la compression par blocs
Image comprimée 1b 75:1 en format ECW. L'image est passablement bruitée
Image comprimée 1c 75:1 en format MrSID. Moins de bruit dans l'image mais perte sensible de netteté dans les contours
Image comprimée 1d 75:1 en format JPEG2000. La qualité de l'image est excellente pour ce taux de compression
Image originale 2 TIF (2937KB) (copyright du S+T, produit Swissimage, CH-3084 Wabern)
Image 2a - Compression JPEG Standard (37KB). Les défauts de la compression JPEG standard sont nettement visible par l'effet de damier correspondant au fenêtrage utilisé par l'algorithme de compression.
Image 2b - ECW (37 KB) de la société Ermapper. La compression de la solution commerciale ECW lisse cet effet de damier mais on observe une perte totale de géométrie inhérente à l'image.
Image 2c - MrSID (37 KB) de la société Lizardtech. La compression par l'algorithme commercial de LizardTech, MrSID, présente également un relativement bon rendu visuel mais on observe un déplacement latéral (de l'ordre de trois pixels vers la droite) de l'information ce qui parait non négligeable lorsque l'on désire conserver la géoréférence des images aériennes ou satellitales.
Image 2d - Compression JPEG2000 (37KB). La compression par JPEG2000 présente un résultat qui allie un bon rendu visuel de l'image et la conservation de la géométrie des objets que l'on distingue dans l'image
Image 2e - Human Vision S (strong CSF filtering & synthetic texture) (37KB). La compression par les algorithmes prenant en compte la perception humaine de la couleur (Human Vision S) présente les meilleurs résultats de conservation de l'aspect visuel de l'image et de la géométrie des objets présents.

La perte visuelle pour les images ayant subi une compression par ondelettes se traduit, à des facteurs de compression élevés, par un léger flou et une délimitation moins nette du contour des objets.

En plus de la participation à l'élaboration de la norme JPEG2000, des recherches sont en cours au département d'électricité de l'EPFL chez les professeurs Murat Kunt et Touradj Ebrahimi du laboratoire de Traitement des Signaux (LTS) pour amener plus loin les techniques de compression en introduisant la perception humaine de la couleur et de la texture de l'image dans les nouveaux algorithmes. Les images 2a à 2e de la page 8 présentent une autre comparaison de tous ces formats, avec en plus, les résultats d'un algorithme en cours de développement au laboratoire de Traitement des Signaux (Human Vision S, image 2e). Pour rendre la comparaison possible entre les différentes images résultantes, le taux de compression de 75:1 a de nouveau été respecté pour chaque image. La dégradation de l'aspect visuel que fait subir chacun des algorithmes à l'image originale se distingue nettement.

Conclusions

Les systèmes d'information géographique et la télédétection sont des domaines qui doivent gérer, analyser et visualiser des images de très grande taille, en complément des autres types de données (données en mode vecteur ou objet, données thématiques alphanumériques, réseaux triangulés, ...). Il s'agit d'un véritable défi scientifique et technologique pour intégrer ces images dans une variété croissante de thématiques intégrant la composante spatiale et pour les transformer en information pertinente pour la prise de décision. Ces deux domaines ont un avenir certain dans un contexte internet et il faudra trouver des solutions intelligentes pour pouvoir faire passer ces gros volumes de données sur des lignes téléphoniques et sur toute sorte de petits appareils électroniques portables à capacité réduite (ordinateur de terrain, PC de poche, téléphones mobiles). Un des objectifs sera d'apporter au grand public des services exploitant la composante spatiale. Pour cela, toutes les découvertes scientifiques dans le domaine de la compression de données sont extrêmement intéressantes. On peut parler de révolution pour la compression d'images par ondelettes parce qu'elle permet d'envisager des choses jusque là totalement irréalistes. Elles permettront par exemple de concevoir sur des serveurs internet des services à haute valeur ajoutée, qu'il serait très difficile de porter sur des machines individuelles, pour des raisons aussi bien techniques, économiques que juridiques.

Dans l'article, plusieurs formats ont été comparés en ne prenant en compte que le seul critère de la qualité visuelle des images comprimées. Cette comparaison montre une supériorité du format proposé dans la norme JPEG2000 par rapport aux autres formats, que ce soit le format JPEG standard basé sur une ancienne technologie ou les formats ECW et MrSID basés sur une compression par ondelettes. Les algorithmes en cours de développement au LTS semblent être encore plus prometteurs. Une comparaison plus poussée faisant intervenir d'autres critères comme le temps de codage, la quantité de mémoire nécessaire, le prix des outils de compression pourrait s'avérer intéressante. Le lecteur intéressé trouvera dans les références plusieurs comparaisons des deux formats (MrSID et ECW) actuellement utilisés dans le domaine des SIG et de la télédétection.

Cet article avait aussi pour objectif de présenter les spécificités des images utilisées dans ces domaines. En plus des problèmes liés aux volumes croissants des images, il y a la notion de géoréférence qui est importante et le fait que certaines images sont multibandes (plus que les traditionnelles images couleurs). Les modèles numériques d'altitude, en mode image, ont la particularité d'être monobande mais avec des valeurs réelles v (valeur du pixel=altitude). A l'heure actuelle, les formats proposés pour la compression par ondelettes ne permettent pas de gérer ces images qui sont généralement codées en monobande 16 bits.

La norme JPEG2000 est très prometteuse et a le potentiel de s'imposer sur le marché. Espérons qu'il en soit ainsi et qu'elle soit rapidement intégrée dans tous les systèmes que nous utilisons aujourd'hui. Dans le domaine des SIG et de la télédétection, la demande était telle que des éditeurs de logiciels ont proposé des formats qui ont rapidement inondé le marché. Sans remettre en cause la qualité de ces formats, il est évident qu'un seul format, sous forme d'un standard international largement adopté, est plus intéressant que plusieurs formats propriétaires.

Remerciements

Nous tenons à remercier nos collègues du LTS qui ont comprimé notre travail, grâce à leur excellent article du mois de mars, en nous soulageant de l'explication de l'algorithme de codage. Nous les avons aussi mis à contribution pour coder nos images avec leurs algorithmes les plus récents et utilisé le logiciel JJ2000 développé en collaboration avec Canon et Ericsson.

Quelques références


  1. http://opengis.org/info/pubaffairs/ALGORE.htm
  2. données qui se réfèrent à un endroit spécifique de la planète
  3. Surface = 4 r2 soit environ 4 1014 m2, avec 1 m2 = 1 Pixel soit 3 bytes, donc environ 1015 bytes
  4. Il est important de savoir que la compression par ondelettes n'est pas adaptée pour des images ayant moins de 256 couleurs comme par exemple des cartes nationales en 8 couleurs ou un plan d'ensemble en noir-blanc. Pour ce type d'images, on utilise une compression sans perte de type LZW par exemple.
  5. Les sociétés Lizardtech et ErMapper sont en procès pour un problème de violation de brevet pour la technique de compression par ondelettes.
  6. N'hésitez pas à contacter les auteurs si vous désirez une copie numérique de l'article.


retour au sommaire du Flash informatique du mois d'avril 1
retour à la page principale des Flash informatique
Vos commentaires
© FI-4-1 du 24 avril 1