Tp traitement d'images digitales -Traitement d'image - Téléc
Télécharger PDFImages Numériques
Une image numérique est un ensemble fini de pixels issus d’un échantillonnage spatial. Généralement, chaque pixel est codé sur 8 bits (0 à 255) pour les images N&B (noir et blanc). Pour les images couleurs, chaque pixel possède trois composantes (RVB) sur 8 bits, ce vecteur caractérise l’intensité de chaque couleur dans l’ensemble RVB (rouge, vert, bleu). L’image est alors une matrice de nombres.
Niveau de Gris et Table de Correspondance des Couleurs (LUT)
À chaque valeur d’un pixel, il sera associé une couleur selon le tableau de correspondance des couleurs pour former l’image numérique.
Coupe d'Image (Profil de Niveaux de Gris)
Ceci est une coupe de l’image sur une ligne horizontale. Elle indique le niveau de gris en fonction de la position sur la ligne.
Exemple d’utilisation : Il est possible d’appliquer la Transformée de Fourier (TF) à cette coupe pour chercher un motif se répétant sur une tranche de l’image. Ainsi, une fréquence spécifique apparaît dans la TF, révélant la périodicité du motif.
La Quantification
La quantification est une opération qui transforme des valeurs continues (issues de l'ensemble des nombres réels) en un ensemble fini de valeurs discrètes. Elle transforme un point de l'ensemble continu en son plus proche voisin dans l'ensemble discret.
Par exemple : Visage : 8 bits, 4 bits, 2 bits. Cellules musculaires : 8 bits, 3 bits.
Comme on l’observe dans l’exemple du visage, une quantification avec un nombre de bits insuffisant peut entraîner la formation de paliers de couleurs. Les contours restent assez nets et ne sont pas déformés, cependant le dégradé de couleurs est grossier. Il ne faut pas perdre de vue que la qualité de l’image dépend de ce que l’on veut en faire. En effet, une quantification faible, avec une forte dégradation de l’image, peut parfois suffire, comme l’illustre l’exemple des cellules musculaires. S'il faut dénombrer les cellules noires, une quantification sur 3 bits est suffisante. La qualité de l’image est donc un critère tout à fait subjectif car il dépend de l’utilisation de l’image.
La Pixellisation (Échantillonnage)
Contrairement à la quantification qui peut produire des paliers de couleur, un mauvais échantillonnage peut engendrer une pixellisation de l’image avec des contours informes.
Zoom et Interpolation
Le but d’un zoom est d’agrandir l’image. Cependant, si l’image n'a pas une résolution suffisante, une pixellisation peut devenir visible. Un zoom basique duplique simplement les informations, ce qui peut rendre l'image grossière.
Ici, l’interpolation consiste à insérer des zéros entre les pixels existants, puis à remplacer ces zéros par une moyenne des valeurs des pixels voisins. Cette opération peut s'effectuer grâce à la convolution, ce qui a pour effet de lisser l’image. Le filtrage est équivalent à un filtre passe-bas analogique.
Repliement de Spectre et Sous-échantillonnage
Lorsque l’échantillonnage n’est pas suffisant (fréquence d'échantillonnage Fe inférieure à deux fois la fréquence maximale Fmax, d’après le théorème de Shannon), il y a repliement de spectre (aliasing). Des nouvelles fréquences, non présentes dans le signal original, peuvent alors apparaître. C’est un effet responsable de la détérioration d’un fond d’image, par exemple. Si le fond d’une image n’est pas parfait et que l’on sous-échantillonne, alors des imperfections peuvent apparaître à une nouvelle fréquence. C’est typiquement ce qui arrivait lorsque l’on enlevait des lignes et des colonnes pour réduire la résolution (nombre de pixels) de l’image. Pour éviter cela, il faut appliquer un filtre passe-bas avant le ré-échantillonnage, afin d'éliminer les fréquences supérieures à la moitié de la nouvelle fréquence d'échantillonnage.
Mesure de la Détérioration entre Deux Images
La mesure de la dégradation de l’image se fait par comparaison (par exemple, la distance de Hamming) entre l’image d’origine et l’image traitée.
Les normes grand public considèrent qu’une image est assez bonne si le Rapport Signal/Bruit (SNR) est supérieur à 30 dB. En deçà, l’image est trop dégradée.
Remarque 1 : Si le bruit augmente, le Rapport Signal/Bruit (SNR) diminue. Remarque 2 : Si l'on perd un bit lors de la quantification, le SNR diminue d'environ 6 dB.
Modification d'Histogramme
Transformation des Niveaux de Gris
Une transformation courante est l'inversion des niveaux de gris pour obtenir l'image négative, où chaque valeur de pixel est soustraite de la valeur maximale (par exemple, 255 pour une image sur 8 bits).
Une autre transformation possible est la sous-quantification, où le nombre de paliers de couleurs disponibles est réduit. Ceci a pour effet de diminuer le nombre de bits codant un pixel après la transformation.
Transformation de Seuil
La transformation de seuil est une forme particulière de sous-quantification, où les pixels sont classés en deux catégories (par exemple, noir ou blanc) selon qu'ils sont au-dessus ou en dessous d'une certaine valeur de seuil.
L'Histogramme
L’histogramme donne le nombre de pixels en fonction du niveau de gris. Un histogramme peut révéler la répartition des niveaux de gris, par exemple, trois zones distinctes : une sombre, une intermédiaire et une claire.
Dans un autre cas, on peut observer une répartition presque uniforme des niveaux de gris en dehors d'un pic central. Ce pic central indiquerait alors que la plupart des pixels se situent dans des niveaux de gris intermédiaires (par exemple, fond et peau). Bien que l'image puisse sembler globalement sombre, l'histogramme révèle la présence de plusieurs nuances de gris.
Remarque 1 : L’œil humain est plus sensible aux faibles contrastes dans les zones claires que dans les zones sombres. Il peut donc être utile d’inverser les niveaux de gris (passer au négatif) pour mieux percevoir certains détails.
Remarque 2 : Pour améliorer le contraste, il est souvent intéressant de dilater l’échelle des niveaux de gris, une technique appelée recadrage ou étirement de contraste.
Remarque 3 : Une image (ou une donnée informatique) contient un maximum d’informations lorsque son histogramme est plat, c'est-à-dire lorsque la distribution des niveaux de gris est uniforme. Ceci est une notion liée à la théorie de l'information (Shannon).
Recadrage Linéaire de la Dynamique
Le recadrage consiste à dilater l’échelle des gris. Cette technique redistribue les niveaux de gris, en maintenant un écart constant entre les valeurs d'origine, d'où le terme "linéaire".
Égalisation d'Histogramme
Dans l'égalisation, l'écart entre les niveaux de gris est ajusté de manière non linéaire, proportionnellement à la fréquence d'occurrence de chaque niveau. Le résultat est souvent une image avec un contraste nettement amélioré.
Convolution
La convolution est une opération mathématique fondamentale en traitement d'images, permettant de modifier une image en appliquant un masque ou un noyau.
Elle possède plusieurs propriétés importantes :
- Commutativité : L'ordre des opérandes n'affecte pas le résultat.
- Associativité : L'opération peut être groupée différemment sans changer le résultat.
- Distributivité : La convolution se distribue sur l'addition.
Réduction du Bruit
La méthode de réduction de bruit consiste à identifier le type de bruit présent dans une image, puis à appliquer le filtre le plus adapté pour l'atténuer. Cela implique souvent d'expérimenter différents types de filtres pour trouver la meilleure correspondance.
Modèles de Bruit d'Image
Les bruits d'image peuvent être modélisés de différentes manières :
- Bruit à Distribution Uniforme : Les valeurs de bruit sont réparties uniformément sur une plage donnée.
- Bruit Gaussien : Souvent associé au bruit électronique, il est l'effet macroscopique d'une somme d'effets microscopiques aléatoires. Sa distribution suit une courbe de Gauss.
- Bruit Poivre et Sel (Salt & Pepper noise) : Ce bruit correspond typiquement à des problèmes d'acquisition (capteurs CCD défectueux, par exemple), où certains pixels apparaissent très sombres (noir) ou très clairs (blanc). Contrairement au bruit gaussien, il n'est pas additif.
Remarque 1 : L’histogramme d’une image bruitée est le résultat de la convolution des histogrammes de l’image originale et du bruit, et non leur simple somme.
Remarque 2 : D’autres types de bruits sont couramment rencontrés en imagerie, tels que le bruit photonique, le bruit d’amplification ou le bruit de quantification.
Fenêtre de Filtrage Glissante
Une fenêtre de filtrage (ou masque) est un petit voisinage de pixels que l'on déplace sur l'image pour effectuer une opération locale sur chaque pixel. Il existe différents types de fenêtres de filtrage.
Lissage avec une Fenêtre de Filtrage
Filtre Linéaire : Convolution
Le filtre moyenneur (Mean filter) est un filtre linéaire qui remplace chaque pixel par la moyenne arithmétique de ses voisins et de lui-même. Son masque est généralement constitué de valeurs égales, reflétant une moyenne simple sur la fenêtre. Ce filtre est efficace pour réduire le bruit gaussien, mais il a tendance à introduire un flou dans l'image, transformant les contours nets en dégradés.
Filtres Non Linéaires : Filtres d'Ordre
Le filtre médian (Median filter) est un filtre non linéaire qui remplace la valeur d'un pixel par la médiane des valeurs de ses voisins (et de lui-même) dans la fenêtre de filtrage. Il est particulièrement efficace contre le bruit de type poivre et sel, car il préserve mieux les contours que le filtre moyenneur, bien qu'il puisse légèrement arrondir les angles.
Le filtre milieu (Middle filter) est un filtre non linéaire qui calcule la moyenne du minimum et du maximum des valeurs de pixels présents dans la fenêtre de filtrage. Ce filtre convient particulièrement au bruit uniforme et peut créer un effet de "cadre" autour des contours.
En résumé, le filtre moyenneur excelle avec le bruit gaussien mais floute les contours. Le filtre médian est très efficace contre le bruit poivre et sel, en arrondissant légèrement les coins. Le filtre milieu est adapté au bruit uniforme, mais peut accentuer un effet de cadre autour des contours.
Réhaussement de Contraste
Le réhaussement de contraste vise à augmenter la différence entre les valeurs de pixels adjacents. Bien qu'il accentue les contours, il a aussi l'inconvénient d'amplifier le bruit présent dans l'image.
Images Réelles
Dans le cas d’images réelles où aucune image de référence non bruitée n'est disponible, l'approche consiste à identifier le type de bruit. Pour ce faire, on peut sélectionner une région de l'image supposée uniforme et sans bruit, puis analyser son histogramme. Sur la base de cet histogramme, des tests statistiques (comme le test du Khi-deux, Χ²) peuvent être réalisés pour déterminer la distribution du bruit et, par conséquent, choisir le filtre le plus approprié.
Détection de Contours
La détection de contours a pour but d'isoler des objets en identifiant leurs limites. Un contour est caractérisé par un changement rapide d’intensité lumineuse ou de couleur entre les pixels.
Gradient
Le gradient est un opérateur qui mesure la variation d'intensité des pixels. Il est équivalent à un dérivateur analogique et est très sensible au bruit.
Détection de Sobel : Pour pallier la sensibilité du gradient au bruit, la détection de Sobel est fréquemment utilisée (il existe aussi une variante de Prewitt). Cette méthode filtre l'image selon une direction et différencie selon une autre direction pour mieux faire ressortir les contours. Un défi demeure : les contours détectés peuvent ne pas être fermés, nécessitant des algorithmes de post-traitement pour les compléter.
Le Laplacien
L’opérateur laplacien est une dérivation de second ordre qui permet de détecter les maxima et minima locaux de la dérivée première d'une fonction, notamment lorsque le laplacien passe par zéro. Ce passage par zéro est un indicateur précis des contours.
Le masque utilisé pour simuler le laplacien est isotrope, ce qui signifie qu'il détecte les contours dans toutes les directions. Cependant, le laplacien est très sensible au bruit, et la détection précise de son passage par zéro peut être difficile.
Réhaussement
Une technique de réhaussement des contours consiste à soustraire le laplacien de l'image originale. Cette opération accentue les détails, mais, comme d'autres méthodes de réhaussement, elle est très sensible au bruit.
Mise en Relief ("Emboss")
L’effet de mise en relief est créé en combinant l'image originale avec une version décalée de son négatif, donnant l'impression que les objets sont en relief.
Analyse d'Orientation
L'analyse d'orientation peut être utilisée pour caractériser la direction des contours détectés.
Transformée de Fourier 2D : Traitement d'Images Synthétiques
Définition
La Transformée de Fourier (TF) est un outil mathématique qui décompose une image en ses différentes fréquences spatiales. Pour une image continue, elle permet de passer du domaine spatial (représenté par x,y) au domaine fréquentiel (représenté par les fréquences spatiales u,v).
Généralement, le module de la TF est plus fréquemment utilisé que sa phase, car l'interprétation de cette dernière reste complexe.
Module ou Phase de la TF ?
Des expériences d'échange de phase et de module entre les Transformées de Fourier de différentes images ont montré que la phase contient généralement plus d'informations visuelles reconnaissables que le module.
Physiquement, le module de la TF renseigne sur la quantité de chaque fréquence présente dans l'image (par exemple, la fréquence d'un motif sinusoïdal), tandis que la phase indique la position ou le décalage spatial de ces fréquences.
Analyse de Formes Géométriques Simples
Des images synthétiques, comme un carré (produit de fonctions "porte"), sont souvent utilisées pour illustrer la Transformée de Fourier. Une image est dite séparable si sa fonction peut être décomposée en un produit de fonctions selon les axes x et y. La TF d'une fonction porte est un sinc.
Dans le domaine fréquentiel, la TF d’une telle image (après recentrage et échelonnage logarithmique) présente un pic central qui représente la valeur moyenne de l'image.
Visualisation Dynamique et Périodicité
Pour une image périodique, sa Transformée de Fourier révèle distinctement cette périodicité dans le domaine fréquentiel. L'histogramme de la TF d'une image périodique montre des pics discrets (la valeur moyenne, les fondamentaux et les harmoniques), confirmant la nature périodique du signal.
Effet de Translation
Si une image initialement périodique est modifiée de sorte que sa périodicité est rompue (par exemple, la dernière bande n'est plus entière), son spectre de Fourier devient continu plutôt que discret.
Dualité Espace-Fréquence
Il existe une dualité fondamentale entre le domaine spatial et le domaine fréquentiel dans la Transformée de Fourier : une compression dans un domaine entraîne une dilatation dans l'autre, et inversement. Par exemple, si la période d'un motif augmente dans l'image, l'écart entre les fréquences correspondantes dans le spectre diminue.
Périodisation 2D
La périodisation d'une image en deux dimensions se traduit logiquement par une périodicité correspondante en deux dimensions dans sa Transformée de Fourier.
Repliement Spectral (Aliasing) et Disques
Lorsqu'un objet continu (comme un disque parfait) est échantillonné pour créer une image numérique discrète, cela peut entraîner une périodisation du spectre de Fourier, connue sous le nom de repliement spectral ou aliasing. Les superpositions de ces spectres périodiques peuvent provoquer des interférences.
Remarque 1 : La période entre deux motifs du spectre est inversement proportionnelle à la moitié du pas d’échantillonnage de l’image originale.
Équivalence Convolution-Filtrage Fréquentiel
Un principe fondamental en traitement d'images est l'équivalence entre la convolution dans le domaine spatial et la multiplication dans le domaine fréquentiel.
Formellement, si g est le résultat de la convolution d'une image f avec un masque h (g = f * h), alors la Transformée de Fourier de g est égale au produit des Transformées de Fourier de f et h (TF(g) = TF(f) . TF(h)).
FAQ - Foire Aux Questions
- Qu'est-ce qu'un pixel et comment ses couleurs sont-elles représentées ?
- Un pixel est le plus petit élément d'une image numérique. Pour les images en noir et blanc, il est généralement codé sur 8 bits, permettant 256 niveaux de gris. Pour les images en couleur, chaque pixel est souvent représenté par trois composantes (Rouge, Vert, Bleu - RVB), chacune codée sur 8 bits, formant un vecteur qui caractérise l'intensité de chaque couleur.
- Quelle est la distinction entre la quantification et l'échantillonnage en imagerie numérique ?
- L'échantillonnage se réfère à la résolution spatiale de l'image, c'est-à-dire le nombre de pixels par unité de surface, déterminant la finesse des détails. La quantification, quant à elle, concerne la résolution des couleurs ou des niveaux de gris, définissant le nombre de valeurs distinctes que chaque pixel peut prendre (par exemple, le nombre de bits par pixel).
- En quoi la Transformée de Fourier est-elle un outil clé pour l'analyse d'images ?
- La Transformée de Fourier permet de décomposer une image du domaine spatial (pixels) vers le domaine fréquentiel. Elle révèle les fréquences spatiales présentes dans l'image, ce qui est utile pour détecter des motifs, analyser des textures, filtrer le bruit, ou encore comprendre la périodicité de certains éléments visuels.