2 - Chapitre 2 - Cours TI
2 - Chapitre 2 - Cours TI
2 - Chapitre 2 - Cours TI
Un certain nombre d'outils fondamentaux se sont révélés au cours du temps plus ou moins
incontournables en traitement d’images numériques, que ce soit d'un point de vue pratique ou
théorique. Citons : la convolution, la transformée de Fourier, la corrélation, l'histogramme,
la transformée en ondelettes ... Nous donnons dans ce chapitre une introduction à ces outils.
Pour des raisons didactiques, la présentation est organisée selon les principaux modèles
mathématiques regroupant ainsi les outils. Ces différents modèles ne sont cependant ni exclusifs
ni cloisonnés.
Soit I une image numérique et soit h une fonction de [x1, x2] ×[y1, y2] à valeurs réelles. La
convolution de I par h est définie par :
𝑥2 𝑦2
Dans cette expression on peut reconnaitre, h(x−i,y−j) qui comporte une opération de translation
par le vecteur (x,y) et une symétrie centrale (inversion des coordonnées i et j) : il s’agit du
déplacement de l’image h à la position (x,y), (h joue donc le rôle de fenêtre glissante). La
symétrie centrale est présente pour une raison technique.
Propriétés de la convolution :
Commutativité :
Associativité :
Distributivité :
Exemple de calcul
La figure 2 donne un exemple de calcul du produit de convolution d’une image I de taille
5x5 par un noyau de convolution h de taille 3x3.
1 2 3 4
5 6 7 8
9 0 3 2
1 2 3 5
Image ‘I’
44 92 120 115
2 4 5
93 167 159 166
h 3 6 8 , I * h
107 159 125 150
0 9 1
93 38 76 75
Après avoir retourné h, le premier élément est alors : 6x1+3x2+4x5+2x6=44.
(a) (b)
Figure 3 : Exemple de convolution d’une image par un noyau (a) image originale
(b) image convoluée avec une matrice identité de 9x9 normalisée par (9x9)
2. Le modèle fréquentiel
2.1. La Transformée de Fourier Discrète
Le Transformée de Fourier Discrète tend à décrire l'image en termes de structures périodiques,
en la décomposant dans une base de fonctions périodiques simples, comme des sinusoïdes.
C’est un outil fondamental d'analyse en traitement du signal, sa version discrète peut être
appliquée avec profit aux images numériques. Si son utilisation en tant qu'outil analytique et
algorithmique s'est estompée en traitement d'images au profit d'approches mieux adaptées à la
localisation spatiale des fréquences (ondelettes), elle reste un outil théorique et pédagogique
important.
La transformée de Fourier permet la décomposition d'un signal f(x,y) en combinaison linéaire
de sinusoïdes complexes, dont les coefficients F[u, v] dit coefficients de Fourier, fournissent
des informations sur les fréquences (u, v) et permettent des manipulations dans le domaine
fréquentiel.
La Transformée de Fourier Discrète Bidimensionnelle Directe est donnée par :
Périodicité :
Linéarité :
Correspondance convolution/produit :
Translation spatiale/fréquentielle :
Dérivation :
Théorème de PARSEVAL :
(a) (b)
Figure 5 : Exemple de la TFD (a) Image originale naturelle
(b) sa Transformée de Fourier Discrète Bidimensionnelle
Pour des raisons de symétries, on représente habituellement les valeurs de ||F[u, v]||
(respectivement [u, v]) dans une image appelée spectre d’amplitude (respectivement spectre
de phase), montrant (en niveaux de gris) les valeurs sur la période -w/2, w/2 [ x -h/2, h/2[. La
figure 6 montre les spectres d’amplitudes et de phase associés à une image exemple. Les valeurs
d’amplitude présente en général une très grande dynamique (les basses fréquences plusieurs
ordre de grandeur fois plus importantes que les hautes fréquences), le spectre d’amplitude
représente log (||F[u,v]||).
(b) (c)
Figure 6 : Exemple de la TFD (a) image originale « House » (b) son spectre d’amplitude
représentant (sur 255 niveaux de gris) le logarithme de ||F[u,v]|| (c) son spectre de phase
représentant (sur 255 niveaux de gris) [u, v]
LIGNES COLONNE
S
Figure 8: Schéma de décomposition
La transformée en ondelettes est réversible ; la figure 9 donne le schéma de reconstruction.
COLONNE LIGNES
S
Figure 9: Schéma de reconstruction
Image initiale
Image initiale
(b)
(c)
Pr. Ahmed HAMMOUCH, ENSAM, UM5, Rabat Page 10
Figure 13 : Exemple de décomposition en ondelettes d’une image synthétique «carré blanc sur
fond noir » (a) image originale (b) décomposition au niveau 1 (c) décomposition au niveau 2
(a)
(b)
(c)
Figure 14 : Exemple de décomposition en ondelettes d’une image naturelle : "woman"
(a) image originale (b) décomposition au niveau 1 (c) décomposition au niveau 2
(b)
(c)
Figure 15 : Exemple de la transformée en ondelettes d’un signal 1D « signal carré »
(a) signal original (b) sa transformée en ondelettes continue
(c) sa transformée en ondelettes discrète
3.1. L’histogramme
C’est un outil de base pour l'étude de la dynamique d'une scène, il est utilisé par certains
opérateurs d'analyse. On retiendra cependant qu'il ne faut pas considérer l'histogramme comme
une caractéristique fondamentale de l'image dans la mesure où on peut le transformer
radicalement sans changer significativement l'image.
L'histogramme représente la répartition des pixels en fonction de leur niveau de gris. Il fournit
diverses informations comme les statistiques d'ordre, l'entropie, et peut permettre d'isoler des
objets. La figure 17 montre un exemple d’histogramme et Histogramme cumulatif normalisé.
(a)
Retenons que certains de ces traitements sont souvent calculés au niveau des capteurs, et qu'en
général leur pertinence est très intimement liée aux conditions d'acquisition.
- Normalisation
La normalisation d'histogramme, ou expansion de dynamique, est une transformation affine du
niveau de gris des pixels de telle sorte que l'image utilise toute la dynamique de représentation.
avec D la dynamique, Nmin la plus petite valeur dans l'image et Nmax la plus grande valeur
dans l'image. La figure 18 montre un exemple de normalisation d’histogramme.
(a) (b)
(c) (d)
Figure 18 : Exemple de normalisation d'histogramme (a) image d'origine f[x,y]
(b) histogramme d'origine (c) Expansion de dynamique fnew[x,y]
(d) histogramme normalisé
- Egalisation
L'égalisation d'histogramme est une transformation des niveaux de gris dont le principe est
d'équilibrer le mieux possible la distribution des pixels dans la dynamique (Idéalement, on
cherche à obtenir un histogramme plat).
(a)
(b)
Figure 19 : Exemple d’égalisation d’histogramme
(a) image f[x,y], histogramme et histogramme cumulé d'origines
(b) histogramme, histogramme cumulé et image fnew[x,y] après égalisation
La figure 20, montre un exemple de méthode qui calcule un certain nombre de quantiles à partir
de l'histogramme cumulé, les regroupe par classes en fonction d'un critère de distance, puis
attribut la même étiquette aux pixels dont la valeur est la plus proche d'une classe donnée.
a) b) c)
Figure 20 : Exemple de méthode de segmentation (a) image originale
(b) histogramme cumulé avec agrégation des quantiles (c) image segmentée
La figure 21 montre un exemple de calcul des P°,d à partir d’une image 4x4 composée de quatre
niveaux de gris (0, 1, 2, 3). Cet exemple se limite au cas d=1. L’élément (2,3) de P0°,1 est égale
à 4, cela signifie qu’il existe 4 configurations dans l’image où un pixel de niveau de gris 2 est
séparé horizontalement d’un autre pixel de niveau de gris 3 par une distance 1. Les éléments de
cet exemple apparaissent en souligné sur l’image et sur la matrice P0°,1.
0 0 1 2
0 1 3 2
0 2 3 2
1 2 3 0
Image
3
2 2 1 1 2 10 0 4 2 0 1 0 1 2 2
P0,1
2 0 2 1 P 1 21 0
P 2 0 1 1 P 1 0 1 1
2 1 2 0 4 45,1 0 10 5 90,1 0 1 6 0 135,1 2 1 0 2
1 1 4 0 0 05 0 1 1 0 4 2 1 2 0
Figure 21 : Exemple de calcul des matrices de cooccurrence
De chacune de ces matrices, plusieurs paramètres caractéristiques de la texture peuvent être
extraits dont voici quelques-uns.
Le second moment angulaire (ASM : Angular Second Moment) (ou l’énergie):
Ng 1Ng 1
ASM P(i, j)2
i 0 j 0
Ce paramètre mesure l’homogénéité (ou l’uniformité) de l’image ; il est d’autant plus grand que
l’image a de fortes transitions de niveaux de gris.
Le contraste (CON) :
Ng 1Ng 1
Ng 1
CON n2 P(i, j)
n 0 i 0 j 0
i j n
Ng 1Ng 1
ijP(i, j) x y
COR
i 0 j 0
x y
Ng 1 Ng 1 Ng 1 Ng 1 Ng 1 Ng 1
x i P(i, j) y j P(i, j) x
2
(imx P(i, j)
)2
où i 0 j 0 , j 0 i 0 , i 0 j 0 et
Ng 1 Ng 1
y
2
j 0
(j my P(i, j)
)2
i 0 .
COR décrit la corrélation des niveaux de gris d’un pixel avec un autre distant de d dans la
direction .
La variance (VAR):
Ng 1Ng 1 Ng 1Ng 1
VAR (i)2 P(i, j) 12 P(i, j)
i 0 j 0 Ng i 0 j 0
avec .
Cet indicateur décrit la dispersion des transitions entre niveaux de gris. Il augmente lorsque les
niveaux de gris diffèrent de leur moyenne.
Le moment de différence inverses (IDM : Inverse Difference Moment) (ou inertie):
Ng 1Ng 1
P(i, j)
IDM
j 0 1(i j)
2
i 0
Ce paramètre renseigne sur l’importance des transitions entre niveaux de gris proches.
L’entropie (ENT):
Ng 1Ng 1
ENT P(i, j)log(P(i, j))
i 0 j 0
Applications
Les applications de la méthode des matrices cooccurrence sont nombreuses : classification de
texture, reconnaissance de formes, …. On présente dans la suite un exemple d’application en
Pr. Ahmed HAMMOUCH, ENSAM, UM5, Rabat Page 19
classification de texture. Le principe consiste à calculer, sur une fenêtre glissante sur l’image
centrée sur le pixel à classifier, les matrices de cooccurrence et delà l’ensemble de paramètres
cités ci-dessus. Le vecteur ainsi obtenu constitue le vecteur d’entrée à un classifieur. Ce dernier
détermine la classe du pixel.
La figure 22 visualise l’image à classifier, la carte de la réalité de terrain et les résultats de
classification obtenus (le taux global de bonne classification est de 53,4%). Pour faciliter
l’interprétation des résultats, on a introduit un post-traitement qui consiste à affecter à chaque
classe de texture, à l’issue de la phase de classification, un niveau de gris spécifique.
(a) (b)
E. en taillis Acacia
Eucalyptus Mer
Chêne-liège Sol nu
Pin Z. urbaines
(c)
Figure 22 : Classification d’image (a) image à classifier - image HRV XS de SPOT de la
forêt de la région de Rabat au Maroc- (b) carte de la réalité de terrain
c) résultats de classification obtenus
La figure 23 montre un exemple de calcul des P à partir d’une image 4x4 composée de quatre
niveaux de gris (0, 1, 2, 3). L’élément (3,1) de P0° est égal à 3, cela signifie qu’il existe, dans
l’image, 3 segments de longueur 1 (pixels) dont le niveau de gris est 2. Les éléments de cet
exemple apparaissent en souligné sur l’image et sur la matrice P0°.
0 1 2 3
0 2 3 3
2 1 1 1
3 0 3 0
Image
1
4 0 0 0 4 0 0 0 2 1 0 0 4 0 0 0
1 0 1 0 4 0 0 0 4 0 0 0 4 0 0 0
P0 P45 P P 3
2 300 0 0 0 1 0 90 3 0 0 0 135
0 0 0
3 1 0 0 3 1 0 0 3 1 0 0 5 0 0 0
Figure 23 : Exemple de calcul des matrices de longueur de plages
De chacune des matrices obtenues, sont extraits les cinq paramètres caractéristiques ci-dessous,
définis par Galloway. Dans ces expressions, P représente la matrice des isosegments, Ng le
nombre de niveau de gris dans l’image, Nr la longueur maximale des isosegments et M le
nombre de pixels de la fenêtre d’analyse.
Importance des courtes plages ( SRE : Short Runs Emphasis) :
Ng Nr
p(i, j)
( j
2
)
i 1 j 1
SRE Ng Nr
p(i, j)
i 1 j 1
Le paramètre SRE est révélateur de la présence de texture fine. Il est d’autant plus élevé que la
probabilité de rencontrer de plages courtes est élevée.
Le paramètre LRE est caractéristique de la présence de texture grossière. Il est d’autant plus
élevé que la probabilité de rencontrer des longues plages est élevée.
Hétérogénéité des niveaux de gris (GLN : Gray Level Non-uniformity) :
Ng Nr 2
[
j 1
p(i, j)]
GLN i Ng
1
Nr
p(i, j)
i 1 j 1
Ce paramètre mesure la non-uniformité de la dispersion des plages entre les niveaux de gris. Il
est minimal lorsque les plages sont également distribuées entre les niveaux de gris.
Hétérogénéité des longueurs de plages (RLN : Run length Non-uniformity) :
Nr Ng 2
Cet attribut mesure la non-uniformité de la répartition des plages entre les longueurs. Il est
minimal lorsque les plages sont également distribuées entre les longueurs.
Pourcentage de plages ( RP : Run Percentage):
Ng Nr
j 1
p(i, j)
RP i 1
M
Ce paramètre exprime le rapport entre le nombre total de plages et le nombre de pixels de
l’image. Il s’agit d’une mesure de nombre de plages par unité de surface (pixel).
Applications
Les applications des matrices de longueur de plages sont la classification de texture, la
reconnaissance de formes, etc. A titre comparatif, le taux global de bonne classification obtenu
pour la même image de la figure 22 est de 33,3% (à comparer avec celui obtenu avec les
matrices de cooccurrence qui est de 53,4%).
Pr. Ahmed HAMMOUCH, ENSAM, UM5, Rabat Page 22