Examen d'outils fondamentaux en traitement d'images -Traitem

Examen d'outils fondamentaux en traitement d'images -Traitem

Examen d'outils fondamentaux en traitement d'images -Traitem

Télécharger PDF

Les Fondamentaux du Traitement d'Images : Concepts et Applications

Cet article explore des concepts clés et des applications pratiques en traitement d'images, adaptés pour une meilleure compréhension des techniques fondamentales et avancées.

1. Taille des images numériques

Une image numérique est composée de pixels. Pour une image RVB (Rouge, Vert, Bleu), chaque pixel est décrit par trois valeurs, une pour chaque couleur primaire. Si chaque valeur (composante rouge, verte ou bleue) est codée sur un octet, cela signifie qu'elle peut prendre 256 niveaux d'intensité différents (de 0 à 255).

Pour calculer la taille d'une image RVB de 800 × 600 pixels où chaque valeur est codée sur un octet :

  • Nombre total de pixels : 800 × 600 = 480 000 pixels.
  • Taille par pixel : Chaque pixel a 3 composantes (R, V, B) et chaque composante est codée sur 1 octet. Donc, 3 octets par pixel.
  • Taille totale de l'image : 480 000 pixels × 3 octets/pixel = 1 440 000 octets.

La taille de l'image est donc de 1 440 000 octets, soit environ 1,44 Mo (mégaoctets).

2. Relation entre image et spectre de Fourier

Le spectre de Fourier d'une image révèle les fréquences spatiales qu'elle contient. Les basses fréquences correspondent aux variations lentes de l'intensité (grandes structures, informations globales), tandis que les hautes fréquences correspondent aux variations rapides (détails fins, textures, contours).

  • Un spectre avec une forte concentration d'énergie au centre indique une image avec des variations douces et peu de détails (basses fréquences dominantes).
  • Un spectre avec des lignes ou des motifs orientés indique la présence de structures répétitives ou de bords orientés dans l'image. Plus les motifs sont loin du centre, plus les fréquences sont élevées, correspondant à des détails fins.
  • Un spectre diffus et sans structure particulière peut indiquer une image bruitée ou très aléatoire.

Par exemple, une image avec des lignes horizontales aura un spectre avec des points ou des lignes verticales, et vice-versa. Une image avec une texture fine et répétitive aura des points distincts dans le spectre, dont la position et l'intensité dépendent de la fréquence et de l'amplitude de la texture.

3. Filtrage d'image : Domaine spatial et fréquentiel

Le filtrage est une opération fondamentale en traitement d'images, utilisée pour modifier l'apparence d'une image, comme l'adoucir, la renforcer ou en extraire des caractéristiques.

  • Dans le domaine spatial : L'opération mathématique correspondante est la convolution. Elle consiste à appliquer un petit noyau (ou masque, ou filtre) à chaque pixel de l'image en effectuant une somme pondérée des pixels voisins.
  • Dans le domaine fréquentiel : L'opération mathématique correspondante est une multiplication point par point entre la Transformée de Fourier de l'image et la Transformée de Fourier du filtre.

L'intérêt d'effectuer le filtrage dans le domaine fréquentiel plutôt que dans le domaine spatial réside dans plusieurs aspects :

  • Efficacité : Pour les grands filtres (noyaux de convolution de grande taille), la convolution spatiale est coûteuse en calcul. La Transformée de Fourier Rapide (FFT) permet de convertir l'image et le filtre dans le domaine fréquentiel, d'effectuer une simple multiplication, puis de revenir au domaine spatial via la Transformée de Fourier Inverse (IFFT). Cette approche est souvent plus rapide pour les filtres de grande taille.
  • Conception de filtres : Il est parfois plus intuitif de concevoir des filtres (passe-bas, passe-haut, bande passante) directement dans le domaine fréquentiel en spécifiant quelles fréquences doivent être atténuées ou amplifiées.

4. Détection de droites avec la transformée de Hough

La transformée de Hough est une technique utilisée pour détecter des formes paramétriques, comme les droites, les cercles ou les ellipses, dans une image. Pour la détection de droites, chaque point (x, y) de l'image est transformé en une courbe dans un espace paramétrique (appelé espace de Hough), où les paramètres peuvent être la pente (a) et l'ordonnée à l'origine (b) d'une droite (y = ax + b), ou le rayon (ρ) et l'angle (θ) d'une droite (x cos θ + y sin θ = ρ).

Dans l'espace (a,b), chaque pixel (x,y) de l'image est mappé à une droite dans l'espace de Hough (b = -xa + y). Les droites qui sont colinéaires dans l'image originale se croisent en un même point dans l'espace de Hough. Ce point d'intersection représente les paramètres de la droite détectée.

Exemple de détection de droite :

Si l'on considère des pixels non nuls aux coordonnées (3, 6), (6, 4) et (9, 3) :

  • Pour (3, 6) : b = -3a + 6
  • Pour (6, 4) : b = -6a + 4
  • Pour (9, 3) : b = -9a + 3

Dans l'espace de Hough (a, b), ces trois équations représentent trois droites. Le point d'intersection de ces trois droites (s'il existe) correspond aux paramètres (a, b) de la droite qui relie ces trois points. En résolvant le système (par exemple avec les deux premières équations : -3a + 6 = -6a + 4 => 3a = -2 => a = -2/3, puis b = -3(-2/3) + 6 = 2 + 6 = 8), on trouve a = -2/3 et b = 8.

L'équation de la droite détectée est donc : y = (-2/3)x + 8.

5. Convolution et propriétés des filtres

La convolution est l'opération fondamentale du filtrage spatial. Elle applique un noyau (matrice de petites dimensions) à une image pour en modifier les pixels en fonction de leurs voisins.

Exemple de convolution :

Image I :

0 0 0 1 1 1
0 0 0 1 1 1
0 0 0 1 1 1
0 0 0 1 1 1
0 0 0 1 1 1

Filtre H :

0 0 0
0 1 0
0 1 1

Pour la convolution, une hypothèse doit être faite sur les bords de l'image, car le filtre déborderait. Une hypothèse courante est le remplissage par des zéros (zero-padding), où les pixels en dehors de l'image sont considérés comme nuls.

Le calcul de la convolution consiste à "glisser" le filtre H sur chaque pixel de I, multiplier les valeurs du filtre par les valeurs correspondantes de l'image sous le filtre, et additionner les produits pour obtenir la nouvelle valeur du pixel central. (Le filtre H ici est un filtre 3x3. Le pixel central est le (2,2) si on indexe à partir de (1,1) ou (1,1) si on indexe de 0, et l'ancre du filtre est généralement son centre).

Le résultat de la convolution produit une image où, par exemple, le coin supérieur gauche de la matrice de convolution (0,0,0,0,1,0,0,1,1) est appliqué sur le coin supérieur gauche de l'image I. Le résultat dépend de la position de l'ancre du filtre.

H est-il un filtre passe-bas ou passe-haut ?

Le filtre H est un filtre passe-haut. La somme des coefficients du filtre H est (0+0+0 + 0+1+0 + 0+1+1) = 3. Un filtre passe-bas typique (comme un filtre moyenneur ou gaussien) a des coefficients positifs dont la somme est généralement 1, et il adoucit l'image en réduisant les détails. Le filtre H, avec des zéros et des uns, et une forte concentration vers le bas et la droite, est conçu pour détecter des variations ou des bords. La présence de valeurs négatives ou une somme de coefficients égale à zéro est souvent caractéristique des filtres passe-haut (détection de bords). Ici, bien que tous les coefficients soient non négatifs, sa structure favorise le renforcement des variations locales (passant les hautes fréquences).

H est-il séparable ?

Un filtre est séparable si il peut être exprimé comme le produit extérieur de deux vecteurs, un vecteur colonne et un vecteur ligne (H = V * LT). Cela permet d'effectuer la convolution en deux étapes successives de convolution 1D, ce qui est plus rapide pour les filtres de grande taille.

Pour vérifier si H est séparable :

H = 0 0 0
    0 1 0
    0 1 1

Si H était séparable, chaque colonne (ou ligne) devrait être un multiple de la première colonne (ou ligne). Ce n'est pas le cas ici (par exemple, la première colonne [0;0;0] ne peut pas générer la seconde [0;1;1] par simple multiplication scalaire). Donc, le filtre H n'est pas séparable.

6. Traitement d'images pour la vision nocturne

Lorsqu'une webcam observe un lieu public mal éclairé la nuit, il est essentiel d'améliorer la qualité des images pour une meilleure analyse.

  • Augmenter la luminosité :

    Le traitement le plus préconisé est l'égalisation d'histogramme, ou plus spécifiquement, l'égalisation adaptative d'histogramme (CLAHE - Contrast Limited Adaptive Histogram Equalization). L'égalisation d'histogramme répartit les intensités de pixels sur toute la plage dynamique disponible, augmentant ainsi le contraste global et la luminosité dans les zones sombres. La CLAHE est préférée car elle opère localement, évitant ainsi une surexposition des zones déjà lumineuses et améliorant le contraste dans les régions sombres sans amplifier excessivement le bruit.

  • Mettre en évidence les changements (passage de piétons) :

    Pour détecter les mouvements et les changements, des techniques de soustraction de fond (background subtraction) ou de différence d'images consécutives sont idéales. La soustraction de fond consiste à créer un modèle du fond statique de la scène, puis à soustraire ce fond de chaque nouvelle image. Les pixels qui ne correspondent pas au fond sont alors identifiés comme des objets en mouvement (les piétons). La différence d'images consécutives compare simplement deux images successives pour détecter les pixels qui ont changé, ce qui est efficace pour des mouvements rapides. Ces méthodes mettent en évidence les zones d'activité et ignorent les parties statiques de la scène.

7. Déconvolution et filtrage inverse

La déconvolution vise à annuler les effets d'une convolution qui a dégradé une image, typiquement un flou ou une défocalisation, souvent modélisée par un noyau de flou (PSF - Point Spread Function).

  • Objectif : Restaurer une image dégradée (floue et/ou bruitée) pour obtenir une image plus nette et plus proche de l'originale.
  • Modèle supposé : L'image dégradée G est le résultat de la convolution de l'image originale F avec une fonction de dégradation H (le noyau de flou), à laquelle s'ajoute un bruit N.

    G = F * H + N (dans le domaine spatial)

    Dans le domaine fréquentiel, cela devient : G(u,v) = F(u,v) * H(u,v) + N(u,v)

  • Expression du filtre inverse : Le filtrage inverse tente de récupérer F en divisant la Transformée de Fourier de l'image dégradée par la Transformée de Fourier du noyau de flou :

    F_estimé(u,v) = G(u,v) / H(u,v)

Cette méthode n'est pas applicable dans le cas d'une image réelle en raison de plusieurs limitations :

  • Sensibilité au bruit : Le modèle suppose la présence d'un bruit N. Si H(u,v) est proche de zéro pour certaines fréquences, la division par H(u,v) va fortement amplifier le bruit N(u,v) à ces fréquences, rendant l'image restaurée inexploitable. C'est le problème majeur du filtrage inverse.
  • Connaissance précise de H : La méthode requiert une connaissance parfaite du noyau de flou H, ce qui est rarement le cas dans des scénarios réels. Toute imprécision dans H conduit à une restauration imparfaite.
  • Problèmes de division par zéro : Si H(u,v) est exactement zéro pour certaines fréquences, la division devient impossible.

Pour ces raisons, des méthodes plus robustes comme le filtre de Wiener sont préférées, car elles prennent en compte le rapport signal/bruit.

8. Opérations de morphologie mathématique : Érosion et Dilatation

L'érosion et la dilatation sont deux opérations fondamentales de la morphologie mathématique, utilisées principalement sur des images binaires (mais aussi sur des images en niveaux de gris) pour modifier la forme et la taille des objets.

  • Érosion : L'érosion "rétrécit" les objets dans une image. Un pixel de l'objet reste un pixel de l'objet seulement si l'élément structurant (un petit masque) est entièrement contenu dans l'objet lorsque son centre est positionné sur ce pixel. Sinon, le pixel est mis à zéro. L'érosion permet de supprimer les petits objets, de séparer les objets connectés et de nettoyer les bords.
  • Dilatation : La dilatation "agrandit" les objets. Un pixel devient un pixel de l'objet si l'élément structurant intersecte l'objet lorsqu'il est positionné sur ce pixel. La dilatation permet de remplir les petits trous, de joindre des objets fragmentés et d'épaissir les objets.

Ces opérations sont souvent utilisées en combinaison (par exemple, ouverture = érosion suivie de dilatation, fermeture = dilatation suivie d'érosion) pour des traitements plus complexes de nettoyage et de remplissage.

9. Détection de contours sur image bruitée

La détection de contours est une étape cruciale pour l'analyse d'images. Sur une image fortement bruitée, le choix du filtre est déterminant pour obtenir des contours précis sans trop d'artefacts.

Parmi les filtres proposés :

  • Filtre passe-bas, gaussien, moyenneur : Ce sont des filtres de lissage qui réduisent le bruit en estompant l'image. Ils ne sont pas directement des détecteurs de contours mais peuvent être utilisés en pré-traitement pour réduire le bruit avant une détection de contours. Un filtre gaussien est souvent préféré pour le lissage car il préserve mieux les bords que le moyenneur.
  • Filtre de Prewitt, filtre de Sobel : Ce sont des opérateurs de gradient qui calculent une approximation de la dérivée de l'intensité de l'image. Ils sont sensibles aux changements d'intensité et donc aux contours. Cependant, ils sont également très sensibles au bruit, ce qui les rend moins adaptés pour des images fortement bruitées, car ils risquent de détecter du bruit comme des contours.
  • Filtre de Canny : C'est le filtre le plus pertinent pour détecter les contours sur une image fortement bruitée. Le détecteur de Canny est réputé pour être optimal selon trois critères : bonne détection (tous les vrais contours sont trouvés), bonne localisation (les contours sont proches de leur vraie position), et réponse unique (un seul contour pour chaque bord). Il intègre plusieurs étapes :
    1. Lissage gaussien pour réduire le bruit.
    2. Calcul du gradient de l'image (magnitude et direction).
    3. Suppression des non-maximaux pour affiner les contours.
    4. Seuillage par hystérésis pour connecter les segments de contours et éliminer les faux positifs de bruit.
    Grâce à son étape de lissage initiale et son seuillage intelligent, le filtre de Canny est robuste au bruit et produit des contours nets et continus.

Le filtre de Canny est donc le plus pertinent.

10. Méthode de segmentation de cellules

L'objectif est de déterminer le nombre de cellules sur des images biologiques. Une méthode robuste pourrait inclure les étapes suivantes :

  1. Pré-traitement :
    • Réduction du bruit : Appliquer un filtre de lissage (par exemple, un filtre gaussien) pour réduire le bruit tout en préservant les bords des cellules.
    • Correction d'illumination : Si l'éclairage n'est pas uniforme, utiliser une correction d'illumination (par exemple, soustraction de fond local ou aplatissement du fond) pour normaliser l'intensité.
  2. Amélioration du contraste :
    • Appliquer une égalisation d'histogramme ou un étirement de contraste pour rendre les cellules plus distinctes du fond.
  3. Segmentation :
    • Seuillage : Puisque les cellules sont généralement plus lumineuses ou plus sombres que le fond, un seuillage adaptatif (par exemple, Otsu, Bernsen, Niblack) peut être utilisé pour binariser l'image, séparant les cellules du fond. Le seuillage global d'Otsu est souvent un bon point de départ pour des images avec un histogramme bimodal clair (comme celui représenté, suggérant un fond et des objets).
    • Morphologie mathématique : Après le seuillage, des opérations morphologiques peuvent être appliquées :
      • Fermeture (dilatation puis érosion) : Pour fermer les petits trous à l'intérieur des cellules et relier les parties des cellules qui auraient pu être fragmentées.
      • Ouverture (érosion puis dilatation) : Pour supprimer les petits objets qui ne sont pas des cellules (bruit) et lisser les contours des cellules.
    • Séparation des cellules connectées : Si les cellules sont regroupées ou se touchent, l'algorithme de segmentation par ligne de partage des eaux (watershed) peut être très efficace. Il nécessite souvent des "marqueurs" (seeds) pour chaque cellule, qui peuvent être obtenus par une érosion des objets segmentés, suivie d'une analyse des composantes connectées.
  4. Analyse des objets :
    • Analyse des composantes connectées : Une fois les cellules isolées, chaque région connectée est identifiée comme une cellule individuelle. Cela permet de compter les cellules et d'extraire des propriétés comme la taille, la forme, etc.

Cette méthode, combinant pré-traitement, seuillage adaptatif, morphologie mathématique et segmentation par ligne de partage des eaux, offre une solution robuste pour le comptage de cellules, surtout lorsque celles-ci sont potentiellement connectées ou soumises à du bruit.

11. Analyse et Segmentation d'Images en Niveaux de Gris

Cette section aborde divers aspects du traitement d'une image en niveaux de gris, de l'évaluation du bruit à la segmentation.

Image I (bruitée) :

6 3 5 4 6 4 7
6 5 5 9 5 4 5
6 5 9 7 8 6 4
5 8 9 10 9 8 4
5 4 5 4 6 4 6

Image Iorig (originale) :

5 5 5 5 5 5 5
5 5 5 9 5 5 5
5 5 9 9 9 5 5
5 9 9 9 9 9 5
5 5 5 5 5 5 5

11.1 Calcul du rapport signal-à-bruit (SNR)

Le rapport signal-à-bruit (SNR) mesure la qualité d'une image en comparant la puissance du signal (l'image originale) à celle du bruit. Une valeur de SNR élevée indique moins de bruit.

La formule générale du SNR est :

SNR (en dB) = 10 * log10 ( P_signal / P_bruit )

où P_signal est la puissance du signal original (par exemple, la variance de Iorig) et P_bruit est la puissance du bruit (par exemple, la variance de (I - Iorig)).

Une autre définition courante pour les images est :

SNR = (Moyenne des pixels de Iorig) / (Écart-type du bruit)

Ou pour un calcul basé sur l'erreur quadratique moyenne (MSE) :

SNR = 10 * log10 ( (Somme (Iorig(x,y)^2)) / (Somme (I(x,y) - Iorig(x,y))^2) )

Le calcul exact nécessiterait d'effectuer les sommes et les moyennes sur toutes les matrices. Ce calcul fournit une mesure quantitative de la dégradation due au bruit.

11.2 Histogramme de l'image I

L'histogramme d'une image représente la distribution des intensités de ses pixels. Pour l'image I, il faudrait compter le nombre d'occurrences de chaque niveau de gris (de 3 à 10 dans cet exemple).

En observant les valeurs de I, on peut anticiper un histogramme avec des pics à 4, 5, 6 et 9, et des valeurs moins fréquentes à 3, 7, 8 et 10. La représentation graphique de ceci montrerait les niveaux d'intensité sur l'axe des x et le nombre de pixels sur l'axe des y.

11.3 Binarisation de l'image I par seuillage empirique

La binarisation consiste à transformer une image en niveaux de gris en une image binaire (noir et blanc) en définissant un seuil. Tous les pixels dont l'intensité est supérieure ou égale au seuil sont mis à une valeur (par exemple, 1 ou blanc), et les autres à une autre valeur (par exemple, 0 ou noir).

En observant l'histogramme (ou les valeurs brutes de l'image I et Iorig), on remarque que l'image Iorig contient des "objets" de valeur 9 et des "fonds" de valeur 5. Dans l'image I bruitée, les valeurs varient entre 3 et 10. Un seuil empirique pourrait être choisi pour séparer les valeurs basses (majoritairement le fond) des valeurs hautes (majoritairement les objets).

Un bon seuil empirique pourrait être 6.5 (ou 7 si on travaille avec des entiers, considérant que 6 est plus proche du fond et 7 de l'objet). Les pixels avec une intensité supérieure à ce seuil représenteraient les objets. Par exemple, si le seuil est 6, tous les pixels >= 6 deviennent blancs et les autres noirs. Cela séparerait les objets clairs (valeurs 9, 10, 8, 7, 6) du fond (valeurs 3, 4, 5).

11.4 Segmentation par croissance de région

La croissance de région est une méthode de segmentation qui agrège les pixels voisins si un critère de similarité est satisfait. On part d'un point "germe" (seed point) et on étend la région en ajoutant les pixels voisins similaires.

  • Point germe : Le point central de l'image I.
  • Voisinage : 4-connexité (les voisins directs : haut, bas, gauche, droite).
  • Critère d'agrégation : Un pixel ptest est ajouté à la région si la différence absolue de son intensité avec celle du pixel pcourant (déjà dans la région) est inférieure ou égale à 1 : |I(pcourant) - I(ptest)| ≤ 1.

En partant du pixel central et en appliquant ce critère, la région va s'étendre progressivement, regroupant les pixels qui ont des intensités très similaires, formant ainsi des segments homogènes.

11.5 Coefficient Dice

Le coefficient Dice est une métrique de similarité utilisée pour évaluer l'exactitude de la segmentation d'images. Il mesure le chevauchement entre deux ensembles d'objets segmentés, ici les résultats du seuillage et de la croissance de région.

Formule : Dice = (2 * |A ∩ B|) / (|A| + |B|)

Où :

  • A est l'ensemble des pixels segmentés par la première méthode (ex: seuillage).
  • B est l'ensemble des pixels segmentés par la seconde méthode (ex: croissance de région).
  • |A ∩ B| est le nombre de pixels communs aux deux ensembles.
  • |A| et |B| sont les nombres de pixels dans chaque ensemble respectif.

Le coefficient Dice varie de 0 (aucune similarité) à 1 (segmentation parfaite et identique). Il est calculé en comparant pixel par pixel les images binaires résultantes de chaque méthode de segmentation.

11.6 Méthode pour une segmentation parfaite de I

Pour segmenter parfaitement I (c'est-à-dire retrouver Iorig de manière binaire), la meilleure approche serait d'utiliser les propriétés connues de Iorig. Si l'on sait que les objets ont une valeur de 9 et le fond une valeur de 5 (ou similaire) dans l'image originale, on peut appliquer un seuil très spécifique à l'image bruitée I après un bon filtrage pour réduire le bruit.

Une série d'opérations pourrait être :

  1. Filtrage de débruitage : Appliquer un filtre médian ou un filtre bilatéral à l'image I pour réduire le bruit tout en préservant les bords. Ces filtres sont efficaces pour éliminer le bruit impulsif ou le bruit de type sel et poivre, qui peut être présent.
  2. Seuillage : Une fois le bruit réduit, appliquer un seuillage global. En observant les valeurs de Iorig, les objets sont à 9 et le fond à 5. Même avec du bruit, un seuil autour de 7 ou 8 (par exemple, pixel > 7) devrait bien séparer les régions correspondant aux objets des régions correspondant au fond, surtout si le bruit a été atténué.
  3. Opérations morphologiques (optionnel) : Si des petits trous ou des discontinuités subsistent dans les objets après seuillage, une opération de fermeture pourrait les remplir. Si de petits artefacts de bruit résiduels sont présents, une ouverture pourrait les supprimer.

En connaissant la structure de l'image originale (Iorig), il est possible d'optimiser les paramètres du filtre et du seuil pour s'approcher d'une segmentation "parfaite".

12. Éléments pour la conception d'une méthode de recalage

Le recalage d'images est le processus d'alignement de deux ou plusieurs images d'une même scène ou d'un même objet, prises à des moments différents, depuis des points de vue différents ou par des capteurs différents. Les quatre éléments essentiels à définir sont :

  1. Type de transformation : Décrit comment les pixels d'une image sont mappés à l'autre.
    • Exemple de choix : Transformation rigide (translation et rotation), transformation affine (translation, rotation, mise à l'échelle, cisaillement), ou transformation non-rigide (déformable) pour les images médicales.
  2. Mesure de similarité (ou de dissimilarité) : Quantifie la correspondance entre les images après transformation.
    • Exemple de choix : Corrélation croisée normalisée (NCC), information mutuelle (particulièrement utile pour le recalage multi-modal), somme des différences absolues (SAD), ou somme des carrés des différences (SSD).
  3. Stratégie d'optimisation : Méthode utilisée pour trouver les paramètres de transformation qui maximisent la similarité (ou minimisent la dissimilarité).
    • Exemple de choix : Algorithmes itératifs (par exemple, descente de gradient, Levenberg-Marquardt), méthodes d'échantillonnage aléatoire (par exemple, RANSAC), ou recherche exhaustive (pour des espaces de paramètres réduits).
  4. Interpolation : Méthode pour estimer les valeurs des pixels de l'image transformée qui ne correspondent pas exactement à des positions de pixels entiers dans l'image originale.
    • Exemple de choix : Interpolation au plus proche voisin (rapide mais peut introduire des artéfacts), interpolation bilinéaire (plus lisse), ou interpolation bicubique (la plus lisse mais la plus coûteuse).

13. Exemples de classifieurs en apprentissage automatique

Un classifieur est un algorithme qui attribue une étiquette de classe à un ensemble de données d'entrée. Il existe de nombreux types de classifieurs, chacun avec ses propres principes de fonctionnement.

Trois exemples de classifieurs :

  1. K plus proches voisins (K-NN)
  2. Machines à vecteurs de support (SVM)
  3. Forêts aléatoires (Random Forest)

Détaillons le principe de fonctionnement des K plus proches voisins (K-NN) :

K-NN est un algorithme d'apprentissage supervisé non-paramétrique et lazy (paresseux). Cela signifie qu'il n'y a pas de phase d'apprentissage explicite pour construire un modèle général à partir des données d'entraînement. Au lieu de cela, toutes les données d'entraînement sont simplement stockées.

Pour classer une nouvelle donnée (un nouveau point) :

  1. L'algorithme calcule la distance (par exemple, la distance euclidienne) entre cette nouvelle donnée et toutes les données d'entraînement stockées.
  2. Il identifie les K données d'entraînement les plus proches de la nouvelle donnée (les "K plus proches voisins").
  3. La nouvelle donnée est alors classée dans la catégorie de la majorité de ces K voisins. Par exemple, si K=3 et que deux voisins sont de classe A et un de classe B, la nouvelle donnée sera classée A.

Le choix de K est crucial ; un K trop petit peut rendre l'algorithme sensible au bruit, tandis qu'un K trop grand peut estomper les frontières entre les classes. K-NN est simple à comprendre et à implémenter, mais peut être coûteux en calcul pour de grands ensembles de données lors de la phase de classification, car il doit calculer des distances pour chaque nouvelle instance.

FAQ sur le Traitement d'Images

Qu'est-ce qu'une image RVB et comment calcule-t-on sa taille ?

Une image RVB (Rouge, Vert, Bleu) est composée de pixels, où chaque pixel est défini par l'intensité de ses trois composantes de couleur. La taille est calculée en multipliant le nombre total de pixels par le nombre d'octets par pixel (généralement 3 octets pour le RVB, soit 1 octet par composante).

Pourquoi utiliser le filtrage dans le domaine fréquentiel ?

Le filtrage dans le domaine fréquentiel, via la Transformée de Fourier, permet de manipuler les fréquences spatiales de l'image (détails, textures) par simple multiplication. C'est souvent plus efficace pour les grands filtres et plus intuitif pour la conception de certains types de filtres (passe-bas, passe-haut) comparé à la convolution directe dans le domaine spatial.

Quel filtre est le plus efficace pour la détection de contours sur des images bruitées ?

Le filtre de Canny est considéré comme le plus efficace pour la détection de contours sur des images bruitées. Il intègre un lissage gaussien initial pour réduire le bruit, suivi d'une détection de gradient, d'une suppression des non-maximaux pour affiner les contours, et d'un seuillage par hystérésis pour produire des contours nets et continus.

Cela peut vous intéresser :

Partagez vos remarques, questions , propositions d'amélioration ou d'autres cours à ajouter dans notre site

Enregistrer un commentaire (0)
Plus récente Plus ancienne