LES RESEAUX DE NEURONES ARTIFICIELS (RNA) ET LES ҅ ҅ SUPPORTS VECTOR MACHINES ҆ ҆ (SVM) POUR LA PREDICTION DE LA RESISTIVITE ELECTRIQUE DU SOL
LES RESEAUX DE NEURONES ARTIFICIELS (RNA) ET LES ҅ ҅ SUPPORTS VECTOR MACHINES ҆ ҆ (SVM) POUR LA PREDICTION DE LA RESISTIVITE ELECTRIQUE DU SOL
LES RESEAUX DE NEURONES ARTIFICIELS (RNA) ET LES ҅ ҅ SUPPORTS VECTOR MACHINES ҆ ҆ (SVM) POUR LA PREDICTION DE LA RESISTIVITE ELECTRIQUE DU SOL
UNIVERSITE DE LOME
ECOLE NATIONALE SUPERIEURE D’INGENIEURS
(E.N.S.I)
Présenté et soutenu par : AHOVI Kokouvi Seyram & DJANDJA Sangué Oraléou
Jury:
Président : M. KODJO Koffi Mawugno, Maître de Conférences, Enseignant Chercheur à
l’ENSI
Directeur : M. SALAMI Adekunlé Akim, Maître de Conférences, Enseignant Chercheur à
l’ENSI
Co-Directeur : M. APALOO BARA Komla Kpomonè, Ingénieur Génie Electrique,
Enseignant Chercheur à l’ENSI.
Membre : M. GUENOUKPATI Agbassou, Ingénieur Génie Electrique, Enseignant
Chercheur à l’ENSI.
© août 2018
DEDICACES
DEDICACES
à nos parents;
à celles qui seront nos côtes, que l’Eternel nous donnera selon Sa Volonté ;
REMERCIEMENTS
Dans le petit espace de liberté des remerciements, Nous voudrions remercier toutes les
personnes qui ont émaillé ces années de formation pour en faire des années riches en belles
rencontres. Nos remerciements vont tout d’abord au Dieu Tout Puissant qui nous a toujours
couverts de Sa Grâce, de Sa Miséricorde, et à nos parents qui ont toujours fait de leur mieux
pour assurer nos parcours.
Ensuite, Nous voudrions exprimer nos profondes gratitudes et nos sincères remerciements :
à tous les enseignants qui nous ont procurés du savoir durant toutes nos formations
scolaires;
à tous nos amis qui nous ont soutenus d’une manière ou d’une autre ;
Nous voudrions que tous ceux qui, de près ou de loin, ont contribué à notre formation et à
l’aboutissement de ce travail, trouvent ici l’expression de notre profonde gratitude.
Merci ! Que Dieu vous bénisse et vous rende au centuple chacun de vos bienfaits !!!
RESUME
La connaissance de la résistivité électrique du sol s’avère indispensable pour une meilleure
mise à la terre afin d’assurer la protection des réseaux de télécommunications et d’énergie
électrique. La littérature montre que cette résistivité varie de façon aléatoire en fonction de
plusieurs paramètres (la teneur en eau, la température, la pluviométrie…). Par conséquent,
sa valeur doit être surveillée sur une base de temps, une tâche longue et coûteuse, et donc
sa prédiction s’avère importante.
L’objectif de cette étude est l’application des Réseaux de Neurones Artificiels (RNA) et
des Supports Vectors Machines (SVM) pour la prédiction de la résistivité électrique du sol
pour des sites de l’Université de Lomé (UL) après une caractérisation des données de
résistivité recueillies sur ces sites.
Ainsi, deux modèles de chacune des deux approches (RNA et SVM) ont été développés
dans ce projet. Pour les RNA, le premier modèle est de type perceptron multicouche (MLP)
et le second est un réseau à fonction radiale de base (RBF). Pour les SVM, le premier est
à noyau linéaire et le second est à noyau gaussien. Plusieurs configurations de ces modèles
ont été développées et testées. Toutes les configurations ont été implémentées pour chacun
des modèles dans le logiciel MATLAB. Les indicateurs statistiques RRMSE (Relative Root
Mean Square Error) et R2 (Coefficient de corrélation linéaire) ont été utilisés pour évaluer
les performances des modèles. Ainsi, avec RRMSE [Min = 11,72% ; Max = 11,99%] et
𝑅2 [Min = 78,62% ; Max = 79,54%], la configuration [ABCD] du modèle MLP de
l’approche par RNA, est la plus performante; A désignant l’état de la nature le moment de
mesure (moins ensoleillé = 1 ; Très Ensoleillé= 2 ; Ensoleillé = 3 ; Nuageux = 4 ; Pluvieux
= 5 ; Partiellement couvert = 6), B l’état générale de la nature la veille du jour de
mesure(Très Ensoleillé=1 ; Ensoleillé = 2 ; Nuageux = 3 ; Pluvieux = 4 ;), C la température
ambiante et D les coordonnés géo référencées. Ce modèle peut être utilisé pour la prédiction
de la résistivité électrique du sol de ces sites.
ABSTRACT
The knowledge of the electrical resistivity of the ground proves essential for a better
grounding in order to ensure the protection of the networks of telecommunications and
electrical energy. The literature shows that this resistivity varies randomly depending on
several parameters (water content, temperature, rainfall ...). Therefore, its value must be
monitored on a time basis, a long and expensive task, and therefore its prediction is
important.
The objective of this study is the application of Artificial Neural Networks (ANN) and
Support Vectors Machines (SVM) for the prediction of the electrical resistivity of soil for
sites of the University of Lomé (UL) after a characterization resistivity data collected on
these sites.
Thus, two models of each of the two approaches (RNA and SVM) were developed in this
project. For the RNA, the first model is of multilayer perceptron (MLP) type and the second
is a basic radial function network (RBF). For SVMs, the first is linear and the second is
Gaussian kernel. Several configurations of these models have been developed and tested.
All configurations have been implemented for each model in the MATLAB software.
Relative Root Mean Square Error (RRMSE) and R2 (Linear Correlation Coefficient) have
been used to evaluate model performance. Thus, with RRMSE [Min = 11.72%; Max =
11.99%] and R2 [Min = 78.62%; Max = 79.54%], the [ABCD] configuration of the MLP
model of the RNA approach, is the best performing; A designating the state of nature as the
measuring moment (less sunny = 1, Very Sunny = 2, Sunny = 3, Cloudy = 4, Rainy = 5,
Partially covered = 6), B the general state of nature eve of the measurement day (Very
Sunny = 1; Sunny = 2; Cloudy = 3; Rainy = 4;); C ambient temperature and D georeferenced
coordinates. This model can be used for the prediction of the electrical resistivity of the soil
of these sites.
DEDICACES ........................................................................................................................ i
REMERCIEMENTS ............................................................................................................ ii
RESUME ............................................................................................................................. v
ABSTRACT ........................................................................................................................ vi
TABLE DES MATIERES ................................................................................................. vii
LISTE DES FIGURES ...................................................................................................... xii
LISTE DES TABLEAUX................................................................................................. xiv
LISTE DES ABREVIATIONS ET ACRONYMES ........................................................ xvi
INTRODUCTION GENERALE ...................................................................................... 1
CHAPITRE 1 : GENERALITES SUR LA MODELISATION D’UN SYSTEME DE
PREDICTION DE LA RESISTIVITE ELECTRIQUE DU SOL ..... 4
1.1- Introduction .................................................................................................................. 5
1.2- L'électricité et le développement .................................................................................. 5
1.3- Mise à la terre pour un réseau électrique ...................................................................... 6
1.3.1- Définition d’un système de mise à la terre ............................................................. 6
1.3.2- Rôle des systèmes de mise à la terre ...................................................................... 7
1.3.2.1- Sécurité des personnes et des animaux ............................................................ 7
1.3.2.2- Protection des installations de puissance ......................................................... 7
1.3.2.3- Protection des équipements sensibles .............................................................. 8
1.3.2.4- Maintien d’un potentiel de référence ............................................................... 8
1.3.3- Différents types de prise de terre ........................................................................... 8
1.3.3.1- Systèmes simples ............................................................................................. 8
1.3.3.2- Systèmes complexes ........................................................................................ 9
1.3.4- Quelques Configurations des systèmes de mise à la terre ....................................... 9
1.3.4.1- Mise à la terre des postes .................................................................................. 9
1.3.4.2- Configurations des prises de terre des pylônes de RTE ................................... 10
Pages
CHAPITRE 1:
Figure 1.1: Systèmes de prises de terre ................................................................................ 9
Figure 1.2 : Mise à la terre d’un poste ............................................................................... 10
Figure 1.3: Prise de terre d’un pylône HTB, du type “4×3 boucles“................................. 11
Figure 1.4: Schématisation de la méthode de Wenner en sol à N couches ....................... 20
Figure 1.5: La résistance de contact entre l’électrode enfoncée dans la terre est quasi nulle
sur sa surface inférieure, alors qu’elle est très élevée sur les côtés ................ 21
CHAPITRE 2:
Figure 2.1: Schéma représentatif de la structure du neurone biologique .......................... 37
Figure 2.2: Structure d'un neurone formel ......................................................................... 38
Figure 2.3: Topologies principales des réseaux de neurones artificiels ............................ 41
Figure 2.4: Structure réseau de neurones monocouche ..................................................... 43
Figure 2.5: Réseau de neurones multicouches ................................................................... 44
Figure 2.6: Quelques types de fonction de transfert pour le neurone artificiel ................. 45
Figure 2.7: L’hyperplan H qui sépare les deux ensembles de points ............................... 55
Figure 2.8: L’hyperplan H optimal, vecteurs supports et marge maximale ...................... 56
Figure 2.9: Définition du séparateur et de la notion de marge .......................................... 58
Figure 2.10: Exemples de corpus séparé par un séparateur ............................................... 59
Figure 2.11: Classification de distribution non linéaire. .................................................... 62
Figure 2.12: Exemple de régression d’une distribution. .................................................... 63
Figure 2.13: Nuage de points à 3 classes : l’approche un contre Tous. ............................. 65
Figure 2.14: Nuage de points à 3 classes : l’approche un contre un. ................................. 66
CHAPITRE 3:
Figure 3.1: Présentation des données de résistivité des sites de l’UL .............................. 72
Figure 3.2: Présentation des données de résistivité des sites de l’UL prétraitées dans
EXCEL ............................................................................................................ 73
Figure 3.3: Ajustement de l’histogramme par la loi N pour l’état “Nuageux“ pour le site
de bloc pédagogique ....................................................................................... 82
Figure 3.4: Ajustement de l’histogramme par la loi N pour l’état “Pluvieux la veille“ pour
le site du bloc pédagogique ............................................................................. 83
Figure 3.5: Ajustement de l’histogramme par la loi N pour la température “31°C“ pour le
site du bloc pédagogique ................................................................................. 83
Figure 3.6: Méthodologie adoptée pour la prédiction de la résistivité électrique du sol ... 86
Figure 3.7: Page d’accueil de MATLAB version R2017a................................................. 88
Figure 3.8: Interface principal de la nntool de MATLAB ................................................. 89
Figure 3.9: Interface principal de la nftool de MATLAB.................................................. 90
Figure 3.10: Classification avec SVM dans MATLAB ..................................................... 91
Figure 3.11: Script pour la modélisation avec les SVM .................................................. 105
Figure 3.12: Architecture du modèle choisi dans la fenêtre nftool de MATLAB ........... 108
Figure 3.13: Architecture complète du modèle de prédiction choisi ............................... 109
Figure 3.14: MLP Config. “11” ([ABDC]) en apprentissage .......................................... 110
Figure 3.15: Corrélation entre les valeurs mesurées et prédites de la résistivité électrique
du sol ........................................................................................................... 111
Figure 3.16: Erreur de Validation du modèle MLP configuration "11" ([ABCD]) ......... 112
CHAPITRE 1:
Tableau 1.1: Exemple de forage disponible dans la “banque des sous-sols“ ................... 13
Tableau 1.2: La résistivité de divers types de sol .............................................................. 22
CHAPITRE 2:
Tableau 2.1: Analogie entre le neurone biologique et le neurone formel. ........................ 37
Tableau 2.2: Correspondance type de RNA -Domaine d'application ................................ 49
Tableau 2.3: Principaux paramètres du modèle MLP choisi pour la modélisation de la
résistivité ....................................................................................................... 52
CHAPITRE 3:
Tableau 3.1: Caractéristiques statistiques des données de résistivité du site “BP1“ ........ 77
Tableau 3.2: Caractéristiques statistiques des données de résistivité du site “BP2“ ......... 77
Tableau 3.3: Caractéristiques statistiques des données de résistivité du site “BP3“ ......... 78
Tableau 3.4: Caractéristiques statistiques des données de résistivité du site “CN1“ ........ 78
Tableau 3.5: Caractéristiques statistiques des données de résistivité du site “CN2“ ........ 79
Tableau 3.6: Caractéristiques statistiques des données de résistivité du site “CN3“ ........ 79
Tableau 3.7: Caractéristiques statistiques des données de résistivité du site “CO1“ ........ 80
Tableau 3.8: Caractéristiques statistiques des données de résistivité du site “CO2“ ........ 80
Tableau 3.9: Caractéristiques statistiques des données de résistivité du site “CO3“ ........ 81
Tableau 3.10: Liste des variables explicatives, leur explication mathématique et leur
codification ................................................................................................. 92
Tableau 3.11: Liste des Configurations possibles ............................................................. 93
Tableau 3.12: Performances du modèle MLP- configuration “1“ ([AB]) ......................... 95
Tableau 3.13: Performances du modèle MLP- configuration “2“ ([AC]) ......................... 95
Tableau 3.14: Performances du modèle MLP- configuration “3“ ([AD]) ......................... 95
Tableau 3.15: Performances du modèle MLP- configuration “4“ ([BC]) ......................... 96
Tableau 3.16: Performances du modèle MLP- configuration “5“ ([BD]) ......................... 96
Tableau 3.17: Performances du modèle MLP- configuration “6“ ([CD]) ......................... 96
Tableau 3.18: Performances du modèle MLP- configuration “7“ ([ABC]) ...................... 97
Tableau 3.19: Performances du modèle MLP- configuration “8“ ([ABD]) ...................... 97
Tableau 3.20: Performances du modèle MLP- configuration “9“ ([ACD]) ...................... 97
Tableau 3.21: Performances du modèle MLP- configuration “10“ ([BCD]) .................... 98
Σ : opérateur de sommation
: opérateur de produit scalaire
∆ : opérateur de différenciation
𝜌 : la résistivité électrique du sol
Σ : la conductivité électrique du sol
A : l’écartement entre les électrodes de Wenner
F : fonction ou modèle d’apprentissage
K : fonction noyau
W : poids synaptique
xi : les entrées du réseau de neurones
Ok : sortie du kième nœud de la couche de sortie ;
Un système de mise à la terre pour être efficace, doit avoir une résistance au sol qui doit
être maintenu à des niveaux bas pendant toute l'année [46], [62]. Cependant, la plupart des
cas d'installations électriques sont caractérisées soit par le manque d'espace pour
l'installation des systèmes de mise à la terre, ou le coût énorme qui souvent peut-être
prohibitif pour la construction. Le type de sol doit être pris en compte sérieusement dans la
conception d'un tel système à cause de, soit sa résistivité élevée, ou son environnement
particulièrement corrosif.
Nous retenons donc que l’un des principaux paramètres du sol pour la mise à la terre
électrique est sa résistivité. Celle-ci varie en fonction de plusieurs variables de façon
aléatoire à savoir : la composition chimique du sol, sa granulométrie, sa teneur en eau, la
nature de l’environnement et la température du sol... Comme tous ces paramètres listés
varient tout au long de l'année, le système de mise à la terre ne peut pas être caractérisé par
une seule valeur de la résistivité du sol. Par conséquent, ces valeurs doivent être surveillées
sur une base annuelle, une tâche longue et coûteuse. Ainsi une méthode adéquate pour la
modélisation de la résistivité du sol s’avère indispensable et c’est dans l’optique de
répondre à cette indispensabilité tout en aboutissant à une conclusion la plus optimale
possible en termes d’erreur-qualité-coût que, dans le cadre de notre mémoire de fin d’étude
en vue de l’obtention du diplôme de Master Professionnel/Ingénieur de conception en génie
électrique, nous avons opté pour faire une étude analytique suivie d’une modélisation dont
le thème s’intitule : « LES RESEAUX DE NEURONES ARTIFICIELS (RNA) ET LES
“ SUPPORTS VECTOR MACHINES ’’ (SVM) POUR LA PREDICTION DE LA
RESISTIVITE ELECTRIQUE DU SOL».
Afin de mener à bien notre projet, nous allons structurer notre travail en trois chapitres
passant par une introduction générale et une conclusion générale et des perspectives.
Le troisième et dernier chapitre est consacré à l’application des approches par RNA et SVM
pour la prédiction de la résistivité électrique des sols du Togo. Une analyse des
performances des différents modèles et des résultats sera faite.
1.1- Introduction
L’énergie et l’économie sont depuis toujours étroitement liées. Sans les fonctions primaires
de l’énergie, l’industrie n’existerait pas. Un survol de l’histoire met ces liens en évidence.
Il va de soi donc que l’énergie électrique est un facteur primordial du développement. Les
pays en voie de développement, souvent situés dans les régions tropicales, ont encore à ce
jour un déficit en taux d’électrification et, en plus, les réseaux électriques existants
connaissent de nombreuses perturbations, dues notamment aux problèmes de mise à la terre
[15].
Nous présentons ici ce que nous entendons désigner par l’expression « système de mise à
la terre » et son rôle. Certains points de présence des mises à la terre dans le processus
électrique seront présentés. Nous nous intéresserons aussi aux types de mise à la terre.
Un système de mise à la terre est défini comme une connexion conductrice intentionnelle
ou non intentionnelle entre un circuit électrique ou un équipement doté d’une terre et un
corps conducteur servant de terre. Il constitue en outre un moyen de dérivation efficace des
courants de défaut, des coups de foudre, des décharges électriques, des perturbations
électromagnétiques et des interférences hautes fréquence [46]. Une mise à la terre est
caractérisée par sa résistance ou son impédance.
Pour une installation ou une structure de faible étendue, on emploie l’expression « prise de
terre », en réservant celle de « réseau de terre » aux installations importantes telles que
celles des postes.
Le rôle d’une mise à la terre d’une installation électrique [20] est de permettre l’écoulement
rapide à l’intérieur du sol les courants de défaut de toute origine, qu’il s’agisse, par exemple,
des causes dû aux surtensions ou encore d’autres défauts à 50 Hz.
Lors de l’écoulement de tels courants par une prise ou un réseau de terre, des différences
de potentiel peuvent apparaître entre certains points ou entre deux masses métalliques, par
exemple entre la prise de terre et le sol qui l’entoure, ou entre deux points de sol. Les
schémas de liaison à la terre seront abordés sous l’aspect de leurs relations avec les réseaux
de terre. La conception des prises et des réseaux de terre doit permettre, même dans ces
conditions [36], d’assurer :
la sécurité des personnes et des animaux ;
la protection des installations de puissance ;
la protection des équipements sensibles ;
le maintien d’un potentiel de référence.
1.3.2.1- Sécurité des personnes et des animaux
Lors de l’écoulement dans le sol de courants élevés, la sécurité doit être assurée à l’intérieur
de l’installation électrique et à ses bords immédiats par une limitation de la tension de pas
et de la tension de toucher à des valeurs non dangereuses pour l’homme ou les animaux.
Cette limitation, obtenue grâce à la connaissance et au contrôle de la répartition idéale dont
on doit chercher à se rapprocher, est l’équipotentialité de l’ensemble des prises de terre.
Le réseau de terre des installations électriques, la prise de terre des supports de lignes,
limitent les effets des surtensions provoquées par :
les défauts à 50 Hz ;
les manœuvres d’appareillages dans les postes ;
Dans les postes, à proximité des installations de puissance, on trouve des équipements
fonctionnant à des niveaux de tension beaucoup plus faibles, équipements électroniques ou
électromécaniques. Ces équipements sont également exposés aux effets liés par couplage
galvanique, inductif, capacitif ou plus généralement, électromagnétique.
Les différents équipements placés dans une même installation doivent, lorsqu’ils sont reliés
électriquement, rester fixes à un potentiel identique même pendant la durée des
perturbations mentionnées plus haut.
Il y’a deux types de systèmes de prise de terre [33], les systèmes simples et les systèmes
complexes.
Ils sont constitués, comme montré sur la figure 1.1 (a) de piquets ou tubes métalliques
verticaux, rubans ou câbles enfoncés dans le sol à une profondeur supérieure à 1m, et
couramment de 3 à 30 m ou plus. Les terres individuelles représentent le type de mise à la
terre le plus utilisé.
Ils se composent de prises de terre multiples reliées entre elles, de systèmes maillés ou de
réseau de grilles placée horizontalement à faible profondeur, comme présenté sur la figure
1.1 (b).
La figure 1.1 présente les systèmes de mises à la terre.
La mise à la terre des postes de transformation est cruciale, tout d’abord parce qu’ils
constituent chacun un point clé du réseau sur lequel les incidents doivent rester exceptionnels,
et ensuite parce qu’ils sont munis d’équipements onéreux et fréquentés par des opérateurs dont
il faut assurer la sécurité.
Une mise à la terre de poste classique est constituée d’une grille dont les dimensions (L et H
sur la figure 1.2) approchent la centaine de mètres et dont le maillage est resserré autour des
installations, [32].
La prise de terre d’un pylône est dimensionnée en fonction du type de ses fondations et de la
valeur de la résistivité du sol, pour obtenir une résistance de terre R50Hz inférieure à 10 Ω pour
les niveaux de tension HTB 225/400 kV et 63/90 kV.
Ces valeurs ont été choisies de manière à limiter le nombre de défaillances des ouvrages HT
par amorçage en retour à un niveau globalement acceptable sur le réseau, [32] et à permettre
un fonctionnement correct des protections de distance (détection des défauts).
La figure 1.3 présente la configuration la plus fréquemment utilisée pour les pylônes
tétrapodes du réseau HTB français (la mise à la terre est réalisée à chaque pied à l’aide de
conducteurs disposés en boucles à la périphérie du béton des fondations).
En pratique, la résistivité du sol est mesurée avant la mise en place des pylônes. Si sa valeur
est trop élevée pour permettre d’obtenir avec les boucles une résistance de terre inférieure à
10 Ω, la prise de terre est complétée par des conducteurs enterrés horizontalement (antennes)
ou verticalement (pieux), [32].
Un sol contenant de l'argile sera influencé par la teneur en eau, c'est une question centrale
en géotechnique.
l’agriculteur voudra savoir s’il peut faire pousser telle ou telle variété de blé, s’il
doit labourer ou plutôt faire du semis direct, s’il peut rentrer dans sa parcelle dès
février ;
le gestionnaire d’espaces naturels voudra comprendre pourquoi sur un
substratum supposé carbonaté il y a des groupements végétaux acidiphiles et qu’on
ne retrouve que telle plante sur des sols bien précis ;
le BTP voudra connaitre précisément la structure et la texture du sol sur lequel il va
travailler pour savoir quel type d’infrastructure il va pouvoir mettre en place et quel
matériel utiliser.
Ainsi, chaque corps de métier aura un besoin différent lors de l’analyse du sol avec un
niveau de précision différent.
La nature des sols est très variée. Pour connaître précisément de façon locale la topologie
d’un terrain et la nature des différentes couches, on effectue des forages. Pour certains pays
comme la France, il existe une base de données ‘banque des sous-sols’, du BRGM [32] qui
regroupe un nombre important de résultats de forage, dont un exemple est donné dans le
tableau 1.1.
Tableau 1.1: Exemple de forage disponible dans la “banque des sous-sols“ [32]
Ces données ne sont valides que très localement (la nature du sol dépend beaucoup de la
position géographique) et sont en pratique difficilement exploitables dans le domaine qui
nous intéresse. De plus, pour des raisons financières, il n’est pas raisonnable d’envisager
de réaliser un forage avant chaque installation ou réhabilitation d’un ouvrage. Pour le
dimensionnement d’un système de mise à la terre, on se contente donc en pratique de
mesurer localement les paramètres électriques du sol.
Parlant de texture du sol, elle est définie par la grosseur des particules qui le composent
(graviers, sable, limon, argile).
Les particules d'un sol sableux sont relativement espacées, ce qui permet à l'eau de s'écouler
rapidement. Les sols sableux ont une structure instable, ce qui les rend très sensibles à
l'érosion éolienne, de plus comme l’eau s’écoule rapidement, ils sèchent rapidement ce qui
favorise l’érosion aérienne.
Bien que tous les sols soient sujets à une éventuelle érosion par l'eau, le limon, le loam
limoneux et le loam sont les plus menacés. Sur les pentes longues ou abruptes, l'érosion par
l'eau s'intensifie et le ruissellement peut atteindre une vitesse impressionnante.
Les sols renfermant une forte proportion d'argile sont propices à l'agriculture en zone aride.
La structure superficielle des sols argileux peut se dégrader, formant une croûte.
L'encroûtement limite l'infiltration et accroît le ruissellement. Un sol argileux mouillé a
tendance à se compacter, ce qui favorise également le ruissellement. Les sols argileux
peuvent également être très sensibles à l'érosion éolienne. La sécheresse peut causer la
pulvérisation de la couche superficielle des argiles lourdes, au point de réduire les mottes
en particules de la taille de gros grains de sable, très sensibles à l'érosion éolienne. Le
compactage du sol, qui touche surtout les sols argileux, est dû au passage de véhicules
lourds ou à une circulation fréquente au même endroit. Le compactage peut avoir des effets
néfastes sur le drainage, [45].
Comme pour tout milieu conducteur, la conduction électrique dans le sol dépend fortement
de la capacité de ce dernier de conduire le courant électrique. Cette capacité se traduit par
trois paramètres électromagnétiques macroscopiques, [45], qui sont la résistivité électrique,
la permittivité électrique et la perméabilité magnétique.
l
R (1.1)
S
Où :
R est la résistance ;
ρ la résistivité ;
S la section du matériau.
La résistivité du sol est localement déterminée par la capacité du matériau qui le compose
à conduire le courant électrique. La circulation des électrons se fait principalement par
conduction électrolytique, et donc ce n’est pas la terre elle-même qui conduit le courant
mais bien les ions dissous dans l’eau présente dans les espaces interstitiels. Comme dit, la
résistivité est normalement notée ρ, et son inverse, la conductivité, est généralement notée
σ, [45].
De nombreux travaux ont montré la forte dépendance entre la mesure de résistivité du sol
et différentes variables intrinsèques des sols aussi bien physiques que chimiques. Si
l’humidité, la salinité et la saturation sont considérées comme les principales sources
d’influence pour certains auteurs, d’autres montrent de fortes corrélations avec la texture,
la structure, la teneur en CaCO3 ou encore la profondeur et le type de substrat, [9].
La résistivité électrique du sol dépend soit d’une variable intrinsèque si elle est
prédominante dans le milieu prospecté, soit d’un groupe de variables au sein duquel des
interactions très complexes existent. Ces paramètres qui influent sur les caractéristiques du
sol, ont tous la particularité d’interférer sur le mode de conductivité électrolytique du
courant.
1.4.2.1- La salinité
Comme le montre [13], la conduction électrique dans le sol se fait par l’intermédiaire des
ions dissous dans l’eau qui y est présente. Cette dernière est, à son tour, stockée dans des
interstices présentent dans les matériaux qui composent le sol. Les ions dissous dans l’eau
proviennent de la dissociation des minéraux qui y sont présents. Plus il y a de minéraux
dissous, plus il y a d’ions présents dans les interstices des matériaux et donc plus faible sera
la valeur de la résistivité de terre, [29].
1.4.2.2- La porosité
Le degré de porosité d’un matériau mesure le pourcentage du volume de vide par rapport
au volume total d’un échantillon donné. Le volume de vide est défini comme étant le
volume des espaces occupés par de l’air ou de l’eau. Une plus grande porosité permet de
stocker potentiellement une plus grande quantité d’eau dans le matériau. Par conséquent, il
y aura, en gardant une concentration ionique constante, une plus grande quantité d’ions
dissous. L’effet est alors une conductivité du sol plus élevée.
Le taux d’eau s’exprime comme étant le volume occupé par l’eau par rapport au volume
total des vides du matériau. Plus il y a de l’eau dans le matériau, plus il y a un support pour
le mouvement ionique et donc plus grande sera sa conductivité. Des études ont été réalisées
dans le but d’associer le taux d’eau aux paramètres électriques macroscopiques, comme par
exemple les travaux de Tabbagh et al., [50].
En appui de ces concepts, il a été développée en 1942 par Archie, [3], une loi empirique
qui met en relation la résistivité électrique d’un matériau avec sa porosité, la résistivité
électrique de l’eau interstitielle et le taux d’eau dans les pores, qui est donnée par la relation
(1.2).
eau a m
(1.2)
S wn
où :
eau est la résistivité moyenne de l’eau interstitielle (en prenant en compte l’effet de
la dissolution ionique);
L’argile est un matériau colloïdal très particulier. Elle se présente sous la forme de cristaux
de taille micrométrique, les colloïdes. Chaque cristal est constitué par un empilement de
quelques dizaines ou bien quelques centaines de feuillets. La composition de ces feuillets
est multiple, cela dépend surtout des caractéristiques géologiques du milieu. Ils sont, pour
la plupart, composés de silicium et d’aluminium, mais peuvent aussi contenir, entre autres,
du fer, du magnésium, du calcium, du manganèse et du titane, [54].
La surface des feuillets qui composent l’argile est généralement chargée négativement.
Cette structure présente des imperfections naturelles, et donc des ions sont susceptibles
d’être adsorbés sur les faces des feuillets de l’argile. Lorsque l’argile se retrouve en
présence d’eau, la conduction est donc fortement facilitée par des échanges ioniques entre
l’eau et la surface des colloïdes. Pour un matériau quelconque, la présence d’argile
augmente sa conductivité électrique.
1.4.2.5- La température
l’eau est très pauvre en minéral, et donc elle est pratiquement congelée. La
conductivité du milieu devient presque nulle;
l’eau est minéralisée, et donc bien que la température soit passée en-dessous de la
température de fusion, ce n’est pas toute l’eau qui passe en phase solide.
Cela a pour conséquence une forte diminution de la porosité effective du sol, ce qui
engendre une baisse très importante de la conductivité.
On peut alors distinguer parmi les paramètres de terre ceux qui contribuent à l’augmentation
de la conductivité du sol (salinité, porosité, température, taux d’eau) de ceux qui
augmentent sa résistivité (viscosité de l’eau, présence de gel).
En ce qui concerne les mesures de résistivité du sol, la littérature fait apparaitre deux types
de méthodes : celles pour lesquelles il est nécessaire de creuser le sol et celles où les mesures
s’effectuent depuis sa surface, [45].
Les méthodes où il est nécessaire de creuser le sol sont en général plus difficiles et plus
couteuses à mettre en œuvre. On effectue, par exemple, un carottage, ce qui permet
d’extraire un échantillon du sol en profondeur. Cet échantillon est alors envoyé en
laboratoire pour que ses caractéristiques soient analysées. Cependant, creuser le sol
interfère avec sa composition et donc change sa résistivité. De même, l’échantillon extrait
du sol ne conserve pas toutes ses propriétés après qu’il soit retiré du sol, ce qui fausse les
analyses, [34]. Pour caractériser le sol dans la globalité, en prenant en compte aussi les
solutions dissoutes et non pas seulement le solide qui le compose, il est essentiel de réaliser
des méthodes non invasives, et donc des méthodes de surface.
Dans la classe des méthodes de surface, les plus utilisées sont la méthode de Wenner et la
méthode de Schlumberger, [47]. Ce sont deux méthodes similaires et qui peuvent être
exploitées séparément ou bien en complémentarité l’une de l’autre.
Dans le cadre de notre travail, nous avons opté pour l’utilisation des résultats obtenus par
la méthode de Wenner au détriment de la méthode de Schlumberger. Nous l’avons fait pour
une question de simplicité puisque pour les deux (02) méthodes, les résultats sont presque
les mêmes.
La méthode de Wenner est l’une des méthodes les plus courantes pour mesurer la résistivité
du sol. C’est une méthode qui combine simplicité de mesure et précision des résultats, [58].
Un schéma de la disposition des électrodes est présenté sur la figure 1.4 pour un sol à N
couches. Pour illustrer le parcours du courant dans le sol, des lignes de courant, en noir, et
des équipotentielles, en couleurs, ont été ajoutées sur l’image.
Pour les construire, le sol a été considéré homogène, et donc ρ1 = ρ2 = ... = ρN.
On suppose que l’injection de courant par les électrodes de Wenner se fait de façon
ponctuelle. Cette approximation est justifiée par le fait que, lorsque que l’on enterre
l’électrode dans le sol, on compacte le sol qui est en contact direct avec sa base (partie
inférieure), [45]. La résistance de contact y est alors quasi nulle, alors qu’elle est très élevée
sur les côtés de l’électrode à cause d’un espace vide laissé lors de l’enfoncement de
l’électrode dans le sol, [45]. Sur la figure 1.5, on peut voir comment le sol est modifié par
la présence de l’électrode.
Figure 1.5: La résistance de contact entre l’électrode enfoncée dans la terre est quasi nulle sur sa
surface inférieure, alors qu’elle est très élevée sur les côtés [45].
On peut déterminer une relation entre le potentiel mesuré, le courant injecté et la résistivité
du sol. La différence de potentiel mesurée entre les deux électrodes centrales de Wenner
est exprimée par la relation (1.3) :
I ( I ) I ( I ) I
V V2 V1 ( )( ) V
2 a 2 (2a) 2 (2a) 2 a 2 a (1.3)
V
R (1.4)
I
2 aR (1.5)
Avec la méthode de Wenner il n’est pourtant pas possible de retrouver les vraies résistivités
de couches de sol. Les mesures de Wenner ne fournissent qu’une sorte de moyenne de la
résistivité du sol, que l’on appelle résistivité apparente. Cela est dû à la composition
hétérogène du sol et au fait que les mesures sont réalisées depuis la surface. A chaque
mesure de Wenner, le courant électrique injecté par l’électrode injectrice se distribue dans
le sol avant de converger au niveau de l’électrode collectrice. Entre les points d’arrivée et
de départ, le courant électrique parcourt le sol en profondeur, en traversant plusieurs
couches composées de matériaux différents.
Le tableau 1.2 illustre un récapitulatif des valeurs de résistivité mesurées en 50 Hz pour les
principaux sols.
Quelques auteurs et chercheurs de par le monde ont déjà effectué des études qui
renseignent, d’une manière ou d’une autre, sur l’estimation de la résistivité électrique d’un
sol.
Dans ce sens, Ioannis F. Gonos a développé une approche méthodologique pour estimer la
résistance du sol en utilisant les RNA. D’après son travail, la valeur de la résistance du sol
dépend fortement du système de mise à la terre et des propriétés du sol où le système est
intégré. En prenant en compte les mesures des données de résistivité et de précipitations
accumulées pour les jours précédents, la résistance au sol est estimée.
I.T. Dharmadasa et al., [16], ont publié les résultats d’une étude intitulée « détermination
du profil de résistivité de la terre dans un sol multicouche ». L'objectif de cette étude était
de développer un outil logiciel convenable à faible coût, pour répondre aux exigences du
thème, en utilisant les concepts de l'intelligence artificielle.
Jugeant les instabilités clés affectant la variation de la résistance du sol (la composition du
sol, la teneur en eau, la température, électrodes de masse et espacement des électrodes),
Anbazhagan a développé une Régression Généralisée de Réseau Neuronal (GRNN) pour
prédire la résistance du sol d’Athènes, [2].
Jean-Pierre Montoroi et al., [39], ont proposé une étude selon laquelle une expérience de
laboratoire est réalisée afin de déterminer la relation entre Résistivité électrique (R) et la
teneur en eau (Hp) pour 13 sols échantillonnés dans un bassin versant de la Tunisie centrale.
Selon cette étude, lorsque la teneur en eau augmente, la résistivité électrique diminue suite
𝑏
à une loi exponentielle R = 𝛼. 𝑒 𝐻𝑝 . Le paramètre de régression « α» est corrélé avec la
distribution granulométrique permettant de classer les échantillons de sol. Ce paramètre
diminue avec la teneur en argile et limon et augmente avec la teneur en sable. Ils ont
mentionné que lors d'une étude de terrain, les sols auraient des teneurs en eau différentes et
cette variabilité devrait être prise en compte.
Les travaux de John Tarilanyo Afa et C.M. Anaele ont montrés que la variation saisonnière
et la nature du sol ont une influence considérable sur les caractéristiques électriques du sol
et affectent donc la performance des systèmes de mise à la terre. Se basant sur des
résistivités du sol et des températures prises à des profondeurs données au niveau de dix-
huit sites de l’Etat de Bayelsa au Nigeria, ils ont trouvé comme résultat que le coefficient
de variation saisonnière à la profondeur de 0,5 m était élevé et est réduit drastiquement à
1,2 m de profondeur. La température du sol était plus élevée que la température ambiante à
la profondeur de 0,2 m pendant les mois de Décembre à Mars. De 0,8 m profondeur et en
dessous, la température est réduite même pendant les saisons sèches. Ils ont conclu donc
que le coefficient de la variation saisonnière du sol à 0,8 et 1,2 m de profondeur était faible
(1,8-3,0) tout au long de l'année pour tous les types de sol. Cela indique le niveau d'eau
élevé et/ou la table d'humidité permanente qui donne un avantage à une faible résistivité du
sol pour les conducteurs enterrés et les électrodes dans la zone.
Il ressort de ce qui précède que le principal paramètre du sol pour la mise à la terre électrique
est sa résistivité électrique. Celle-ci varie en fonction de plusieurs variables aléatoires à
savoir : la composition chimique du sol, sa granulométrie, sa teneur en eau, la nature de
l’environnement et la température du sol... Comme tous ces paramètres listés varient tout
au long de l'année, le système de mise à la terre ne peut pas être caractérisé par une seule
valeur de la résistivité du sol. Par conséquent, ces valeurs doivent être surveillées sur une
base annuelle, ce qui revient chère. Ainsi une méthode adéquate pour la modélisation de la
résistivité du sol s’avère indispensable.
La conception d'un modèle prédictif de comportement repose sur l'hypothèse selon laquelle,
pour le processus que l’on considère, il existe une description analytique de la relation entre
les entrées et les sorties du processus. Cette description est généralement inconnue, et on
l’exprime de façon formelle. Cette représentation formelle, appelée modèle hypothèse,
prend en considération les connaissances a priori et les hypothèses concernant le
comportement du processus. Elle constitue la base de départ de toute procédure de
modélisation, [55].
L’élaboration d’un modèle hypothèse consiste à effectuer des hypothèses concernant la
nature et les caractéristiques du processus : caractère statique ou dynamique du processus ;
présence de perturbations (leur nature, leur mode d’action); caractère linéaire ou non
linéaire du processus. Il faut en général fixer ou estimer un certain nombre de
caractéristiques numériques du modèle, [55].
Une fois le modèle hypothèse choisi, il faut déterminer ou estimer, à partir de séquences
d’entrées {u(t)} et de sortie {yp(t)} du processus, l’ensemble de ses caractéristiques
inconnues. Pour cela, on définit, d’une part, une fonction de coût théorique, et, d’autre part,
une forme prédicteur théorique associée au modèle hypothèse. La fonction de coût
théorique est une mesure de l’erreur de prédiction faite par un système de prédiction de la
sortie du processus. On choisit généralement comme fonction de coût théorique la variance
de l’erreur de prédiction. La forme prédicteur théorique est un système qui permet de
calculer, à l’instant t, une prédiction y(t+d) de la sortie yp(t+d) du processus telle que, si
l’on suppose le processus parfaitement décrit par le modèle hypothèse, la fonction de coût
théorique soit minimale. Comme le modèle hypothèse, la forme prédicteur théorique est un
système formel, qui s’exprime à l’aide des mêmes caractéristiques que le modèle
hypothèse.
Lorsque la structure du modèle et de sa forme prédicteur théorique (par exemple entrées et
ordre du modèle, nombre de neurones et architecture d’un modèle neuronal, etc.) sont
définies, il faut déterminer la fonction coût 𝜑(. ), ou en trouver la meilleure approximation
possible. Pour cela, on met en œuvre un système d’apprentissage, constitué d’un prédicteur
et d’un algorithme d’apprentissage. Ce prédicteur est un système dont la structure est
identique à celle de la forme prédicteur théorique, et qui réalise une fonction
paramétrée ∅(. ; 𝜃). Les arguments de 𝜑(. ) qui sont des variables aléatoires sont
remplacés dans l’expression de ∅(. ; 𝜃) par leurs réalisations lorsque ces réalisations
sont mesurables, et par des estimations lorsqu’elles ne sont pas mesurables. On définit alors
une fonction de coût empirique à partir des écarts entre les sorties mesurées du processus
et les valeurs calculées par le prédicteur, qui est une estimation de la fonction de coût
théorique. A l’aide de l’algorithme d’apprentissage, on calcule la valeur de 𝜃 qui minimise
cette fonction de coût empirique.
Si la structure du modèle n’est pas parfaitement définie, on considère alors un ensemble de
modèles hypothèses, qui sont des cas particuliers du modèle hypothèse dont la structure est
fixée, et l’on met en œuvre, pour chacun d’entre eux, un système d’apprentissage. Une
procédure de sélection est alors utilisée pour choisir le “meilleur” de ces modèles, au sens
d’un critère que l’on doit définir, [55].
La revue de littérature sur les différentes méthodes de prédiction nous a permis de constater
que les approches par les RNA et les SVM sont de nos jours les méthodes les plus utilisées
car offrant de meilleurs résultats. En effet leur succès est dû, non seulement à la simplicité
d’implémentation des modèles, mais aussi à la qualité de prédiction de ces modèles. Nous
avons estimé donc qu’il serait avantageux et logique que ces approches fassent l’objet de
notre modélisation. Ainsi les RNA et les SVM seront donc utilisés dans ce travail pour
prédire la résistivité électrique du sol. Une présentation détaillée de ces approches sera faite
au chapitre 2. Par ailleurs il s’avère important de connaitre les critères d’évaluation des
performances des différentes approches afin d’en ressortir quelques-uns pour évaluer nos
approches.
Le critère MAPE (en anglais : Mean Absolute Percent Error) montre la différence moyenne
de pourcentage entre les valeurs estimées et celles mesurées [40]. La MAPE est calculée
selon la relation (1.6).
1 N Y j , p Y j ,r
MAPE 100 (1.6)
N j 1 Y j ,r
Le critère RMSE (en anglais : Root Mean Square Error) identifie la précision comparant
l’écart entre les valeurs obtenues lors de l’estimation et celles des données mesurées. Le
RMSE a toujours une valeur positive [40] et est calculée selon la relation (1.7).
1 N
RMSE
N j 1
(Yj , p Yj ,r )2 (1.7)
L’erreur quadratique moyenne est très utile pour comparer les modèles des différentes
approches. Elle mesure la performance des méthodes en fonction de la moyenne des carrées
des erreurs.
Le RRMSE (en anglais : Relative Root Mean Square Error) est obtenu en divisant le RMSE
par la moyenne de la résistivité et de l'écart-type obtenu par les valeurs mesurées comme le
montre la relation (1.8).
N
1
N
(Y
i 1
j ,r Yj , p ) 2
RRMSE N (1.8)
1
N
Y j ,r
i 1
Différentes plages pour RRMSE peuvent être définies pour évaluer la précision du modèle:
Le coefficient R² indique la force de la relation linéaire entre les valeurs prédites et celles
observées. R² est donné par la rélation (1.9).
(Y
j 1
j, p Yp ,avg ) (Y j , r Yr , avg )
R
2
(1.9)
N 2 N 2
(Y j , p Yp ,avg ) (Y j , r Yr , avg )
j 1 j 1
Yp ,avg étant la valeur moyenne prédite et Yr ,avg est la valeur moyenne mesurée.
Il est donc clair qu’il existe plusieurs critères permettant d’évaluer la performance des
modèles de prédiction. Le choix d’un critère principal dépend du domaine et des donnés
traitées. Le défi majeur actuel des chercheurs réside dans le fait de choisir le modèle de
prédiction le mieux adapté et le plus précis en utilisant le critère d’évaluation le plus
convenable. Ainsi, dans le cadre de notre travail, nous avons fait plus usage du critère RRMSE
car étant donné un critère rélatif, il donne une vue globale en fonction de la population étudiée.
L’appréciation est confirmée par le 𝑅2
La résistivité électrique du sol est influencée par plusieurs paramètres. Ceux-ci varient de
manière continue et aléatoire. Il est donc presque impossible de dire avec exactitude la
valeur future de cette résistivité avant d’effectuer une mesure concrète. Plusieurs méthodes
dans la littérature essayent de fournir des outils de prédiction plus ou moins efficaces.
Cependant, à notre connaissance, peu de travaux dans la littérature se sont intéressés à la
prédiction de cette résistivité. Ainsi ce travail se donne comme objectif de faire usage de
deux (02) de ces méthodes de prédiction les plus performantes que sont l’approche par les
RNA et les SVM pour modéliser le comportement de la résistivité du sol de certains points
de l’université de Lomé avec comme variables explicatives la température, l’état de la
nature, les coordonnées géo référencées. Divers modèles des RNA et SVM seront donc
abordées en jouant sur les différentes variables explicatives. En synthèse, le modèle qui,
sur la base des indicateurs statistiques, offrira une meilleure précision sera donc adopté pour
la prédiction de la résistivité électrique du sol.
1.11- Conclusion
Ce présent chapitre a eu pour objectif d’exposer les généralités et les enjeux sur la
prédiction de la résistivité électrique du sol. Ainsi plusieurs aspects de la prédiction ont été
abordés de même que les différentes techniques de prédiction et les différents critères
permettant d’évaluer ces techniques. Ensuite, une Revue bibliographique des méthodes
existantes en rapport avec la prédiction de la résistivité électrique du sol est faite. Il s’agira
principalement dans le chapitre suivant d’exposer en détails les méthodes de prédictions
retenues pour la modélisation dans le cadre de notre travail à savoir les RNA et les SVM.
Dans ce chapitre, nous entendons faire une revue de la littérature sur l’apprentissage
automatique (Machine Learning), ensuite présenter les Réseaux de Neurones Artificiels
(RNA) et les Machines à Vecteurs de Support (SVM).
Il existe de nombreux types de règles d’apprentissage qui peuvent être regroupées en trois
catégories : les règles d’apprentissage supervisé, non supervisé et renforcé. Mais l’objectif
fondamental de l’apprentissage reste le même [53].
2.2.2.1.2- Régression
Y f (X) (2.1)
L’objectif est de construire à partir de cet échantillon un modèle qui va nous permettre de
prévoir la sortie y associée à une nouvelle entrée (ou prédicteur) x. Lorsque la sortie est
Les neurones artificiels sont souvent utilisés sous forme de réseaux qui diffèrent selon le
type de connections entre les neurones, une cinquantaine de types peut être dénombrée,
[11].
Un réseau de neurone artificiel est un modèle de calcul dont l'inspiration originelle est un
modèle biologique, c'est-à-dire le modèle du cerveau humain. On pense que le système
nerveux compte plus de 1000 milliards de neurones interconnectés [52]. Bien que les
neurones ne soient pas tous identiques, leur forme et certaines caractéristiques permettent
de les répartir en quelques grandes classes. En effet, il est aussi important de savoir, que les
neurones n'ont pas tous un comportement similaire en fonction de leurs positions dans le
cerveau.
Le point de contact entre l’axone d’un neurone et la dendrite d’un autre neurone s’appelle la
synapse. Il semble que c’est l’arrangement spatial des neurones et de leur axone, ainsi que la qualité
des connexions synaptiques individuelles qui détermine la fonction précise d’un réseau de neurones
biologique [31].
Un neurone artificiel est présenté graphiquement comme indiqué sur la figure 2.2. Cette
représentation est à l’origine de la première vague d’intérêt pour les neurones formels, dans
les années 1940 à 1970, [1].
Un neurone formel est constitué d’un noyau, d’une liaison synaptique de sortie et des
liaisons synaptiques d’entrées. A chaque liaison d’entrées est attachée un poids appelé «
poids synaptique », [7].
Un neurone artificiel reçoit des entrées sous forme vectorielle puis calcule une somme
pondérée « n » de ses entrées pour que le résultat passe ensuite par la fonction d'activation
« F » afin de créer une sortie, [35].
Pour pouvoir simuler un réseau de neurones, on doit supposer que tous les neurones sont
synchrones, c’est-à-dire qu’à chaque temps t, ils vont simultanément calculer leur somme
pondérée et produire une sortie S(t) = F(n(t)). Dans les réseaux biologiques, tous les
neurones sont en fait asynchrones, [31].
Les RNA sont considérés comme des simulateurs du système biologique et doivent prendre
en considération les points suivants :
Nous présentons dans cette section les types de RNA et précisément une présentation
détaillée des réseaux à couches ainsi que leurs structures.
Pour concevoir un réseau de neurones, nous devons établir des connexions entre les
neurones. Nous avons quatre types principaux de connexion : directe, récurrente, latérale et
à délais. Tous les réseaux de neurones utilisent la connexion directe pour acheminer
l'information de l'entrée vers la sortie. La connexion récurrente permet d'acheminer
l'information de la sortie des neurones des couches supérieures vers les entrées des neurones
précédents. Les réseaux de neurones qui doivent choisir un neurone gagnant utilisent la
connexion latérale pour établir une relation entre les neurones de sortie et la maintenir.
Finalement, les problèmes temporels sont résolus par les modèles de réseaux dynamiques
avec des connexions à délais, [25]. Les connexions entre les neurones peuvent être
complètes ou partiellement complètes, [25].
Une couche est définie comme un ensemble de neurones situé au niveau d'un réseau de
neurones. Nous avons, par exemple, une couche de neurones de sortie avec des couches
situées entre les entrées-sorties appelées couches cachées. Les réseaux de neurones
possèdent une ou plusieurs couches de neurones et leur dimension dépend du nombre de
couches et du nombre de neurones par couche.
Dans notre travail, nous ferons usage des réseaux à couches, ainsi nous allons essayer de
faire une brève présentation de ce type de réseaux.
2.3.4.1.1- Perceptron
Le perceptron est la forme la plus simple d'un réseau de neurones, il modélise la perception
visuelle. Il comprend trois principaux éléments : la rétine, les cellules d’association et les
cellules de décision. La fonction d'activation utilisée dans ce réseau est de type tout ou rien
(0 ou 1). L'apprentissage du perceptron peut se faire avec plusieurs méthodes déjà utilisées,
il n'y a qu'une seule couche de poids modifiables entre les cellules d'association et les
cellules de décision. Le perceptron est limité dans ses applications. Premièrement, il ne peut
être applicable que dans la classification dont les variables sont linéairement séparables et
deuxièmement la sortie ne peut être que 0 ou 1, [25].
Cette classe est la plus importante des réseaux de neurones car elle représente la
généralisation du perceptron monocouche avec une fonction d'activation de type sigmoïde
et une ou plusieurs couches cachées. Le vecteur d'entrée se propage dans le réseau de
couche en couche jusqu’à la sortie, l’entraînement de celui-ci se fait avec l’algorithme par
la rétropropagation de l'erreur, [25]. Ce réseau est caractérisé par son modèle du neurone
Les réseaux RBF ("Radial Basis Function") sont des réseaux à couches qui ont comme
origine une technique d'interpolation nommée la méthode d'interpolation RBF. Ce réseau
comporte une seule couche cachée dont la fonction d'activation est appelée fonction-noyau
ou gaussienne et une couche de sortie avec une fonction d'activation linéaire. La méthode
RBF est particulière par ses réponses utiles pour un domaine de valeurs restreint. Les
réseaux RBF sont capables de calculs puissants. L'apprentissage est plus rapide et plus
simple mais demande beaucoup de neurones par rapport aux réseaux multicouches. De plus,
ils s'avèrent davantage insensibles à la destruction de leurs poids, [25].
Le neurone formel (Figure 2.4) est la cellule fondamentale d'un réseau de neurones
artificiels. Par analogie avec le neurone biologique, le neurone formel doit être apte à
accomplir les tâches suivantes : collecter, traiter les données qui viennent des neurones
émetteurs et transmettre les messages aux autres neurones. La relation entre l'entrée et la
sortie du neurone peut être donnée par les relations (2.3) et (2.4), [25].
Si F (a) (2.3)
N
a W (i, j). x(j) (2.4)
j 0
N
y(j) W (i, j) x(i) (2.5)
i 0
où :
Les réseaux multicouches sont caractérisés par une ou plusieurs couches. À chaque
couche correspond une matrice de poids W et un vecteur de seuils b, et on peut avoir aussi
des fonctions d'activation différentes pour chaque couche, [25]. La fonction des couches
Les réseaux de neurones utilisant un apprentissage par rétropropagation [25] sont constitués
de plusieurs couches (multicouches) qui comportent chacune plusieurs neurones.
Ces derniers sont reliés entre eux par des matrices de poids qui caractérisent le réseau. Les
équations d'un tel réseau peuvent être données par les relations (2.6), (2.7) et (2.8).la
structure de ce type de réseau est illustrée à la figure 2.5.
S (z) F2 ( ys ( z )) (2.6)
j
ys (z) W2 (i, z).F1 (y(i)) (2.7)
i 0
n
y(s) W1 (i,s).x(i) (2.8)
i 0
les modèles linéaires et sigmoïdaux : ces modèles sont très adaptés aux algorithmes
d’apprentissage comme celui de rétro propagation du gradient car leur fonction de
transition est différentiable ;
le modèle à seuil : ce modèle est très proche et conforme à la réalité biologique mais
il pose des problèmes d’apprentissage ;
le modèle stochastique : ce type de modèle est utilisé pour les problèmes
d’optimisation globale des fonctions perturbées ou encore pour les analogies avec
les systèmes de particules.
La référence [24] présente un tableau qui illustre quelques importantes fonctions
d’activation.
La figure 2.6 donne un aperçu des courbes de trois fonctions d’activation [60].
a) fonction binaire à seuil b) fonction linéaire par morceaux c) fonction de type sigmoïde
Figure 2.6: Quelques types de fonction de transfert pour le neurone artificiel
Le point crucial du développement d’un réseau de neurones est son apprentissage, [60]. Il
s’agit d’une procédure adaptative par laquelle les connexions des neurones sont ajustées
Il arrive qu’à faire apprendre un réseau de neurones toujours sur le même échantillon, celui-
ci devient inapte à reconnaître autre chose que les éléments présents dans l’échantillon. Le
réseau ne cherche plus l’allure générale de la relation entre les entrées et les sorties du
système, mais cherche à reproduire les allures de l’échantillon. On parle alors de
Surapprentissage. Le réseau est devenu trop spécialisé et ne généralise plus correctement.
Ce phénomène apparaît aussi lorsqu’on utilise trop d’unités cachées (de connexions), la
phase d’apprentissage devient alors trop longue (trop de paramètres réglables dans le
système) et les performances du réseau en général deviennent médiocres.
Afin d’éviter les problèmes de sur apprentissage, la base d’exemples est divisée en deux
parties : la base d’apprentissage et la base de test. L’optimisation des poids se fait sur la
base d’apprentissage, mais les poids retenus sont ceux pour lesquels l’erreur obtenue sur la
base de test est la plus faible. En effet, si les poids sont optimisés sur tous les exemples de
l’apprentissage, on obtient une précision très satisfaisante sur ces exemples mais on risque
de ne pas pouvoir généraliser le modèle à des données nouvelles. A partir d’un certain
nombre d’itérations, le réseau ne cherche plus l’allure générale de la relation entre les
entrées et les sorties du système, mais s’approche trop près des points et « apprend » le
bruit.
Pendant les années 90 et le début des années 2000, certains chercheurs ont trouvés que les
réseaux de neurones avaient des limites, et donc les recherches sont mises en veilleuse dans
ce domaine.
Le renouveau de la recherche dans ce domaine est dû à Yoshua Bengio et Yan le Cun qui
ont tenu à jour un célèbre site dédié à la reconnaissance des caractères manuscrits de la base
MNIST.
Depuis leur apparition, les réseaux de neurones ont été largement utilisés dans plusieurs
domaines, [52].
Nous pouvons lister quelques applications dans des domaines précis, [42] :
Dans ce projet, nous appliquons les Réseaux de Neurones Artificiels pour deux approches
de modélisations (MLP et RBF). Pour les deux cas, on utilise des paramètres similaires. On
parle du type de réseau, de la fonction d'activation et de la règle d'apprentissage.
Le premier modèle développé dans ce projet est un Perceptron à deux couches (une couche
cachée et une couche de sortie). Ce type de réseau est un outil fiable pour les problèmes
d'approximation de fonctions, [52]. Le choix des entrées se fait à l'aide de la corrélation qui
existe entre les données. La fonction d’activation utilisée pour activer les neurones de la
couche cachée est la fonction sigmoïde. La fonction fournit des valeurs de sortie
appartenant à l’intervalle [0,1]. Pour les neurones de la couche de sortie, la fonction
d'activation est de type linéaire. La procédure utilisée pour la phase d’apprentissage est la
procédure de correction de l’erreur (Rétro Propagation de l’erreur). Le principe est facile,
on procède à la propagation de l’erreur calculée par le réseau de la couche de sortie vers la
couche d’entrée. L'algorithme utilisé pour la mise à jour des poids est celui de Levenberg-
Marquardt. Son principe se base sur une minimisation de fonction. Il calcule une fonction
de coût, sur laquelle il décide si la mise à jour sera acceptée ou non. Il continue le calcul
jusqu'à la stabilité du réseau. Le calcul se fait à l'aide de la jacobienne des poids et des biais.
où :
0 le biais ;
Le deuxième modèle développé est un réseau à fonction radiale de base (en anglais « Radial
Basis Function RBF). En principe c’est un MLP mais avec la fonction gaussienne comme
fonction d’activation des neurones de la couche cachée.
Le réseau à fonction radiale de base est un réseau non bouclé avec de bonnes performances
et adapté aux problèmes à minima locaux, [52]. Durant la phase d’apprentissage, chaque
neurone de la couche cachée effectue une transformation non linéaire. La sortie passe par
les neurones de la couche cachée aux niveaux des quelles la transformation est purement
linéaire.
Ainsi la sortie d’un neurone RBF à non-linéarité gaussienne a pour équation la relation
(2.10).
(x )i j
2
b j (x) exp[ i 1
] (2.10)
2 2j
q
Ok Wkj b j ( x) k (2.11)
j 1
où :
Wkj est le poids de la connexion entre le jième neurone de la couche cachée et le kième
Tableau 2.3: Principaux paramètres du modèle MLP choisi pour la modélisation de la résistivité
Nombre de couches 2
Dans tous les cas, l’algorithme de mise en œuvre des deux modèles est le même et constitue
ce que l’on appelle l’algorithme du Perceptron, [52]. C’est donc en se basant sur cet
algorithme que nous avons implémenté nos différents programmes de prédiction. Les
résultats issus de ce travail seront donc exposés au chapitre 3.
Cette technique initiée par Vapnik tente de séparer linéairement les exemples positifs des
exemples négatifs dans l'ensemble des exemples. Chaque exemple doit être représenté par
un vecteur de dimension n. La méthode cherche alors l'hyperplan qui sépare les exemples
positifs des exemples négatifs, en garantissant que la marge entre le plus proche des positifs
et des négatifs soit maximale, [37]. Les exemples utilisés lors de la recherche de l'hyperplan
Les SVM ou machine à support vecteur font partie des algorithmes de l’apprentissage
statistique qui ont été introduits en 1995 par Vladimir VAPNIK. Développées au premier
abord pour la résolution des problèmes de classification, elles ont trouvé des applications
dans d’autres domaines, notamment celui de la régression. Les SVM impliquent plusieurs
notions mathématiques, dont la théorie de la généralisation, la théorie de l’optimisation et
les méthodes d’apprentissage basées sur les fonctions « noyau ».
La compréhension des SVM passe par l’assimilation de certains termes tels que les
séparateurs, la séparabilité, la marge, [12]. Dans cette section, nous définirons ces notions
de base, nous présenterons un problème de classification avec un séparateur linéaire. Cela
permettra de généraliser le problème d’optimisation des SVM.
2.4.2- Historique
Le principe est le même pour le cas de la régression sauf que dans ce cas, une valeur
numérique constitue l’étiquette des vecteurs de l’ensemble étudié. Il ne s’agit plus de savoir
à quel groupe un vecteur appartient mais de savoir « combien vaut » le vecteur.
L’idée sous-jacente des SVM est qu’à partir des vecteurs dont on connait la classe, on pose
un problème d’optimisation du style « optimiser tel grandeur en s’assurant que … ». Le
problème intervenant dans cette démarche est de poser le « bon » problème ; se référant à
la théorie mathématique de généralisation. Un second problème découlant du premier
Dans cette section, nous allons voir les notions de base telles que l’hyperplan, le vecteur
support et la marge.
2.4.3.1.1- Hyperplan
Plaçons-nous dans le cas d’une classification binaire (i.e. les exemples à classifier réparties
en 2 classes). On appelle hyperplan séparateur un hyperplan qui sépare les deux classes
(figure 2.7), en particulier il sépare leurs points d’apprentissage. Comme il n’est en général
pas possible d’en trouver un, on se contentera donc de chercher un hyperplan discriminant
qui est une approximation au sens d’un critère à fixer (maximiser la distance entre ces deux
classes), [38], [30].
Figure 2.7: L’hyperplan H qui sépare les deux ensembles de points [38].
La détermination de l’hyperplan séparable des SVM est d’utiliser seulement les points les
plus proches (les points de la frontière entre les deux classes des données) parmi l’ensemble
total d’apprentissage, ces points sont appelés vecteurs supports comme le présente la figure
2.8, [38].
Il est bien vrai que les SVM fournissent des séparateurs bien plus puissants que les
séparateurs linéaires. Néanmoins la méthode du séparateur linéaire constitue la base de
l’algorithme des SVM.
x désigne un nombre réel, 𝑥⃗ désigne quant à lui un vecteur de 𝑅𝑛 . L’ensemble d’étude noté
S (relation 2.12) contient p-éléments.
L’appartenance d’un vecteur à une classe ou à l’autre est matérialisée par la valeur 1 ou -1
de l’étiquette y pour faciliter les calculs.
pas des valeurs exclusivement égales à 1 ou -1 mais, on s’accorde à dire que lorsque le
résultat f w,b (x) est positif le vecteur 𝑥⃗ appartient à la même classe que les exemples
d’étiquette 1 et lorsque f w,b (x) est négatif le vecteur 𝑥⃗ appartient à la même classe que les
exemples d’étiquette -1. L’équation f w,b (x) = 0 définit la frontière de séparation entre les
deux classes et représente l’hyperplan affine dans le cas du séparateur linéaire, [19].
2.4.3.3- Séparabilité
S x : ( x , y ) S , y 1
(2.14)
S x : ( x , y ) S , y 1
f w,b (x) 0; x S
(2.15)
f w,b (x) 0; x S
Autrement dit, dire qu’une distribution d’exemple dans le plan est linéairement séparable
veut dire qu’on peut tracer une droite telle que les exemples de la classe 1 et de la classe –
1 se retrouvent de part et d’autre de cette frontière.
2.4.3.4- Marge
Le paragraphe précédent décrit le principe des SVM dans le cas où les données sont
linéairement séparables. Néanmoins, un grand nombre de jeux de données sont non
linéairement séparables.
Pour classer ce genre de données on pourrait utiliser une fonction de décision non linéaire.
Géométriquement, cela reviendrait à avoir une (hyper)courbe qui marquerait la frontière
entre les exemples positifs et négatifs. L'idée retenue dans SVM va dans un autre sens : on
va tenter de trouver une transformation (mapping) de l'espace d'entrée vers un autre espace
appelé « espace de redescription » (feature space) dans lequel les données sont linéairement
séparables. Cette transformation non linéaire est réalisée via une fonction noyau.
Le noyau 𝐾 (𝑥, 𝑥′) est une fonction de deux variables, symétrique et positive.
le noyau RBF : (Radial Basis Function), noyau très utilisé dans la pratique qui
s’évalue selon la relation (2.17).
xz
2
K ( x, z) exp( ) (2.17)
2 2
où 𝜎 est un réel positif qui représente la largeur de bande du noyau. En prenant un 𝜎 grand,
la similarité d’un exemple par rapport à ceux qui l’entourent sera assez élevée, alors qu’on
prenant un σ tendant vers 0, l’exemple ne sera similaire à aucun autre.
2.4.4- Problème d’optimisation
les vecteurs supports au plan de séparation est 1⁄‖ ‖. Dans ce cas la bande constituée par
𝑤
⃗⃗⃗
les courbes de niveaux –1 et 1 est 2⁄‖ ‖.
𝑤
⃗⃗⃗
Jouer sur 𝑤
⃗⃗⃗ et 𝑏 pour minimiser la relation (2.18).
1
w.w (2.18)
2
En respectant yl ( w.xl b) 1; ( xl , yl ) S
1
w.w C l l (2.19)
2
yl ( w.xl b) 1 l ; ( xl , yl ) S
en respectant
l 0
Dans le cas de la régression, où l’objectif n’est plus la séparation du corpus en deux classes
suivants leur étiquette +1 ou –1, mais plutôt d’essayer d’inférer la fonction qui au vecteur
associe son étiquette qui peut être une valeur réelle, le problème est défini de la manière
suivante :
1
w.w C l ( l l) (2.20)
2
yl w.xl b l , ( xl , yl ) S
en respectant w.xl b yl l, ( xl , yl ) S
, 0, l
l l
La résolution de ces types de problème d’optimisation passe souvent par l’utilisation des
fonctions de Lagrange. Ces fonctions permettent de passer d’un problème direct sous
contrainte à un problème dual qui facilite leur résolution, [26]. Il est possible de se trouver
en face des exemples qui ne sont pas linéairement séparable. Dans ces cas, l’on a recouru
aux fonctions « noyau ». En effet les fonctions noyaux permettent de projeter les exemples
dans un espace différent de celui de base. Ceci afin de ramener le problème non
linéairement séparable de la dimension de base en un problème linéairement séparable dans
une autre dimension. L’application des fonctions de Lagrange dans cette nouvelle
dimension permet alors de trouver des séparateurs adéquats. Les figures 2.11 et 2.12
montrent respectivement un exemple de classification sur une distribution non linéairement
séparable et un exemple de régression utilisant un séparateur à base des fonctions noyaux.
Figure 2.12: Exemple de régression d’une distribution: a) utilisation d’un séparateur linéaire; b)
utilisation d’un séparateur à base du noyau polynomial de degré 3; c) utilisation d’un séparateur à
base du noyau gaussien, [26].
Les machines à vecteur supports sont dans leurs origines binaires. Cependant, les problèmes
du monde réel sont dans la plupart des cas multi classe. Dans de tels cas, on ne cherche pas
à affecter un nouvel exemple à l’une de deux classes mais à l’une parmi plusieurs, c’est-à-
dire que la décision n’est plus binaire et un seul hyperplan ne suffit plus.
Les méthodes des machines à vecteur support multi-classe, réduisent le problème multi-
classe à une composition de plusieurs hyperplans biclasses permettant de tracer les
frontières de décision entre les différentes classes, [21]. Ces méthodes décomposent
l’ensemble d’exemples en plusieurs sous-ensembles représentant chacun un problème de
classification binaire. Pour chaque problème un hyperplan de séparation est déterminé par
la méthode SVM binaire.
On construit lors de la classification une hiérarchie des hyperplans binaires qui est
parcourue de la racine jusqu’à une feuille pour décider de la classe d’un nouvel exemple.
On trouve dans la littérature plusieurs méthodes de décomposition :
L’idée de cette stratégie est de construire autant de classificateurs que de classes. Ainsi,
durant l’apprentissage, tous les exemples appartenant à la classe considérée sont étiquetés
positivement (+1) et tous les exemples n’appartenant pas à la classe sont étiquetés
négativement (-1). Un hyperplan 𝐻𝑘 est défini pour chaque classe k par la fonction de
décision exprimée par la relation (2.21).
H k ( x) sign( wk , x bk ) (2.21)
H k ( x) 1, si f k ( x) 0
avec
H k ( x) 0, si non
Si une seule valeur 𝐻𝑘 (x) est égale à 1 et toutes les autres sont égales à 0, on conclut que 𝑥
appartient à la classe 𝑘.
Or, il est possible que plusieurs sorties soient positives pour un exemple de test donné. Ceci
est particulièrement le cas des données ambiguës situées près des frontières de séparation
des classes. On utilise dans ce cas un vote majoritaire pour attribuer l’exemple x à la classe
k selon la relation (2.22).
Souvent, la méthode un contre tous est critiquée à cause de son asymétrie, [49], puisque
chaque hyperplan est entrainé sur un nombre d’exemples négatifs beaucoup plus important
que le nombre d’exemples positifs. La méthode ‘une contre une’ suivante est une méthode
symétrique qui corrige ce problème.
L’approche Un-Contre-Un est un cas spécial des méthodes de décomposition proposées par
Dietterich et al., [58] pour résoudre des problèmes à plusieurs classes. Cette approche
requiert la construction de K(K − 1)/2 SVM chacun séparant un couple de classes (i, j)
parmi ceux existants. Pendant la classification, un vecteur d’entrée x est présenté à
l’ensemble des classificateurs construits. La sortie de chaque SVM fournit un vote partiel
concernant uniquement le couple de classes (𝑤𝑖, 𝑤𝑗), [6].
Pij P( x wi \ x, x wi wj ) (2.22)
Cette combinaison considère que les sorties des SVM sont des valeurs binaires de 1 ou 0.
La figure 2.14 montre un exemple de nuage de points à 3 classes avec l’approche un contre
un, [17].
2.4.7- Modélisation de la résistivité électrique du sol par les supports vectors machines.
Un algorithme résolvant les SVM identifie parmi les exemples d’apprentissage quels sont
les vecteurs supports et construit la frontière (ou fonction de décision) avec une
combinaison linéaire de cette sélection. Résoudre ce problème équivaut à résoudre un
programme quadratique sous contraintes de boîtes.
C’est cet algorithme qui nous servira à faire les prédictions en utilisant le noyau linéaire et
le noyau gaussien.
Les supports vecteurs machines possèdent un grand nombre d’avantages mais aussi des
inconvénients. En voici quelques avantages :
SVM est une méthode de classification qui montre de bonnes performances dans la
résolution de problèmes variés. Cette méthode a montré son efficacité dans de
nombreux domaines d’applications tels que le traitement d’image, la catégorisation
de textes ou le diagnostic médical et ce même sur des ensembles de données de très
grandes dimensions ;
les SVM possèdent des fondements mathématiques solides ;
2.5- conclusion
Ce deuxième chapitre nous a permis de présenter de manière détaillée les RNA et les SVM
qui sont les approches retenues pour la modélisation de la résistivité électrique du sol. Les
deux modèles de réseaux neuronaux devant servir pour la modélisation de la résistivité
électrique du sol ont été présentés et leurs fonctionnements décrits.
La méthode des SVM est applicable pour des tâches de classification à deux classes, mais
il existe des extensions pour la classification multi classe. Les SVM peuvent également
s’utiliser pour des tâches de régression, c’est-à-dire de prédiction d’une variable continue
en fonction d’autres variables, comme c’est le cas par exemple dans de la prédiction de la
résistivité électrique du sol en fonction des paramètres tels que la température, du taux
d’humidité de la granulométrie etc…
3.1- Introduction
Après la présentation des algorithmes de prédiction choisis, nous passons dans ce chapitre
à la prédiction. Nous débuterons par une brève caractérisation des données de résistivité
relevées sur les sites choisis. Etant donné un nombre peu important de données relevées,
Nous poursuivrons par une génération de données pour compléter notre base de données.
Ensuite nous présenterons les résultats de la prédiction. Nous terminerons ce chapitre par
une évaluation financière du projet.
Dans cette section, par une présentation de l’origine des données utilisées et quelques
rappels statistiques, nous allons caractériser la résistivité électrique du sol pour les sites
étudiés.
Cette étude concerne trois (03) sites de l’UL de la République du Togo qui se diffèrent par
leurs coordonnées géo référencées. Il s’agit du site de Confucius (06°10.179’ Nord, 001°
12.735’ Est, 9), celui du Bloc pédagogique (06°10397’ Nord, 001°12701’ Est, 11) et celui
du Campus Numérique (06° 10.427’ Nord, 001° 12.850’ Est, 11). Les essais de laboratoire
révèlent que le sol de ces trois sites est de type argileux.
Le Togo est un pays d’Afrique de l’Ouest, limité au nord par le Burkina-Faso, à l’est par
le Bénin, à l’ouest par le Ghana et au Sud par le Golfe de Guinée. Il s’étire sur 600 km du
nord au sud pour une largeur variant de 50 à 150 km et une superficie de 56600km². C’est
un pays au climat tropical, de moins en moins humide du sud au nord.
Ces trois sites se situent dans la ville de Lomé, capitale du Togo, qui se situe à l’extrême
sud-ouest du pays, et s’étend le long du littoral du Golfe de Guinée. Officiellement,
l’agglomération comptait une population de 1 477 660 habitants au recensement de 2010,
tandis que celle de la ville était estimée à 837437 habitants [27]. Son agglomération se
Etant une ville côtière, Lomé est largement influencé par l’océan. Ainsi, on a l’usage de
dire que le climat est un climat subéquatorial tempéré par l’océan. La chaleur est ainsi
stable, sans pointes excessives, et le souffle qui vient de la mer, la rend assez agréable.
Ces mesures ont été effectuées par des étudiants dans le cadre de leurs mémoires de Licence
Professionnelle à l’ENSI. Lors de ces mesures, les paramètres explicatifs pris en compte
sont l’état général de la nature la veille du jour de la mesure, l’état de la nature lors de la
mesure et la température ambiante au point de mesure lors de la mesure. Nous pouvions au
préalable penser que ces paramètres ne sont pas directement significatifs dans l’évolution
de la résistivité mais une analyse statistique nous permettra de confirmer ou d’infirmer.
Les mesures ont été effectuées sur les trois sites et pour chacun de ces sites nous notons
trois points de mesure, ce qui nous donne au total neuf (09) points de mesure qui diffèrent
par leurs coordonnées géo référencées. Lors des mesures, le mesureur prenait soin de
mentionner, en plus des variables explicatives précitées, la résistance mesurée. Ainsi,
d’après la relation (1.5), on calcul la valeur de la résistivité à partir de la résistance mesurée.
La figure (3.1) présente un aperçu des résultats de mesure dans un fichier Excel.
Pour être conforme aux spécificités de MATLAB (qui est le logiciel que nous avons utilisé
tout au long du travail), les données ont été prétraitées dans EXCEL comme le montre la
figure 3.2. Ce prétraitement est d’autant plus nécessaire. Etant donné que nous avons
besoin des données, des codes ont été attribués aux variables d’entrée qui sont des chaines
de caractères.
Figure 3.2: Présentation des données de résistivité des sites de l’UL prétraitées dans EXCEL
3.2.2- Caractérisation statistique des données de résistivité du sol des sites de l’UL
Les données de résistivité collectées sont filtrées dans un premier temps afin d’éliminer les
erreurs, les omissions et autres valeurs non-exploitables. Ensuite, elles sont réparties
suivant différents états de la nature et température et enfin des calculs de paramètres
caractérisant la variation de la résistivité sont effectués pour chaque état et température.
Pour chacun des états de la nature et températures, l’information est mise sous forme
d’histogramme qui représente la variation de la fréquence relative des résistivités. La
modélisation de la distribution de la résistivité consiste d’abord à ajuster l’histogramme des
fréquences par la fonction de distribution normale.
Avant de se lancer dans l’analyse statistique des données dont nous disposons, il apparait
important de faire un petit rappel sur les notions statistiques qui feront l’objet de discussion.
Une variable aléatoire X est une variable qui prend ses valeurs au hasard parmi un
ensemble fini ou infini de valeurs possibles. On parle de variable aléatoire continue quand
les valeurs possibles de la variable ont une distribution continue. Ceci correspond au cas
des mesures, [56].
Elle est la loi la plus importante en statistiques. Elle s'applique à tout phénomène dans
lequel la fluctuation de la variable aléatoire continue est due à un grand nombre de petites
causes indépendantes dont les effets s'additionnent. De ce fait, les résultats de mesures
seront distribués selon une loi de Gauss si les conditions suivantes sont remplies, [56] :
( x m )2
1
f ( x) e 2 2
2 (3.1)
3.2.2.1.3- Histogramme
L’histogramme est un outil statistique facile à utiliser, donnant rapidement une image du
comportement d’un procédé industriel et l’allure globale de la distribution ; il montre
l’étalement des données et apporte ainsi des renseignements sur la dispersion et sur les
valeurs extrêmes ; il permet de déceler, éventuellement, des valeurs aberrantes, [56].
La moyenne arithmétique permet de résumer par un seul nombre la série statistique. Elle
prend en compte toutes les valeurs de la série et elle est facile à calculer.
3.2.2.1.5- Médiane
La médiane est plutôt une moyenne de position. La médiane Me est la valeur, observée ou
possible, dans la série des données classées par ordre croissant (ou décroissant) qui partage
cette série en deux parties comprenant exactement le même nombre de données de part et
d’autre de Me.
Le mode est une moyenne de fréquence. Le mode est la valeur de la variable statistique la
plus fréquente que l’on observe dans une série d’observations. Le mode n’existe pas
toujours et quand il existe, il n’est pas toujours unique.
3.2.2.1.7- Ecart-type
Une distribution est symétrique si les valeurs de la variable statistique sont également
distribuées de part et d’autre d’une valeur centrale. Ainsi, pour une distribution symétrique,
on a mode = médiane = moyenne arithmétique.
Pour s’assurer que nous pouvons utiliser ces résultats pour la prédiction sans commettre de
graves erreurs, nous allons passer à l’analyse de l’évolution de la résistivité en fonction de
chacun des états de la nature mentionnée et de chacune des valeurs de la température
ambiante apparaissant dans les données.
Les tableaux (3.1 à 3.9) présentent les indices statistiques pour chacun des états pour tous
les points de mesure (où BP1, BP2, BP3 désignent respectivement les données du 1er, 2ème
et 3ème point de mesure du site Bloc Pédagogique ; CN1, CN2, CN3 désignent les données
du 1er, 2ème, et 3ème point de mesure du site Campus Numérique et CO1, CO2, CO3
désignent les données du 1er, 2ème, et 3ème point de mesure du site Conficius).
Confucius: point 1
Etats & Températures Moyenne Ecart-type Minimum Maximum Mode Médiane Skewness Kurtosis
Moins ensoleillé 157,2228 14,01334 135,403 188,496 158,6508 158,6508 0,409104 3,952435
Très Ensoleillé 188,496 0 188,496 188,496 188,496 188,496
Ensoleillé 180,2231 13,79214 153,9384 188,496 188,496 188,496 -1,05515 2,161735
Nuageux 160,6928 23,86868 130,0622 219,912 158,3366 158,3366 0,734199 3,297262
Pluvieux 160,5358 0 160,5358 160,5358 160,5358 160,5358
Partiellement couvert 181,3601 16,55183 153,9384 219,912 188,496 188,496 -0,19317 2,943088
V.Très Ensoleill 186,9252 7,024831 157,08 188,496 188,496 188,496 -4,12948 18,05263
V. Ensoleillé 185,2552 14,31031 154,8809 219,912 188,496 188,496 -0,45494 4,613177
V. Nuageux 189,8155 19,96387 163,6774 219,912 188,496 188,496 0,330103 2,532404
V. Pluvieux 161,0105 16,72516 130,0622 188,496 188,496 158,965 0,206192 2,731936
temp. 25° 169,6464 16,32726 159,9074 188,496 159,9074 160,5358 0,705929 1,5
temp. 26° 132,7326 3,776459 130,0622 135,403 130,0622 132,7326 0 1
temp. 27° 164,2271 24,6622 130,3764 219,912 157,08 159,5933 0,818419 3,380138
temp. 28° 175,4336 21,34165 136,0313 219,912 188,496 188,496 -0,13209 2,403984
temp. 29° 178,6341 13,91901 154,8809 188,496 188,496 188,496 -0,68958 1,546046
temp. 30° 175,88 15,23712 155,195 188,496 188,496 188,496 -0,3354 1,134543
temp. 31° 171,666 22,64268 132,2614 188,496 188,496 188,496 -0,73796 2,077739
temp. 32° 172,788 22,21447 157,08 188,496 157,08 172,788 0 1
temp. 34° 188,496 0 188,496 188,496 188,496 188,496
Ensemble des données 173,6281 19,32274 130,0622 219,912 188,496 188,496 -0,33407 2,539755
Confucius: point 2
Etats & Températures Moyenne Ecart-type Minimum Maximum Mode Médiane Skewness Kurtosis
Moins ensoleillé 80,93904 10,55902 71,31432 106,5002 77,91168 77,91168 1,485274 4,243883
Très Ensoleillé 102,102 15,708 94,248 125,664 94,248 94,248 1,154701 2,333333
Ensoleillé 94,23848 15,33995 74,45592 125,664 94,248 94,248 0,975122 3,289768
Nuageux 78,05131 13,04035 66,60192 125,664 66,60192 77,7546 2,784534 11,21066
Pluvieux 77,59752 0 77,59752 77,59752 77,59752 77,59752
Partiellement couvert 98,08524 22,52554 62,832 125,664 125,664 94,248 0,032292 1,701106
V.Très Ensoleill 108,3852 16,03529 94,248 125,664 94,248 94,248 0,201008 1,040404
V. Ensoleillé 97,10851 13,89698 74,77008 125,664 94,248 94,248 1,077891 3,759983
V. Nuageux 84,50904 9,285009 74,45592 94,248 94,248 81,99576 0,169483 1,283568
V. Pluvieux 79,849 13,09189 62,832 125,664 74,45592 77,91168 2,082155 7,806058
temp. 25° 77,70224 0,18138 77,59752 77,91168 77,59752 77,59752 0,707107 1,5
temp. 26° 69,27228 2,887881 67,23024 71,31432 67,23024 69,27228 1,04E-14 1
temp. 27° 83,43566 20,72653 62,832 125,664 66,60192 78,38292 1,399598 3,604869
temp. 28° 92,75161 19,58589 71,62848 125,664 94,248 94,248 0,742843 2,20637
temp. 29° 92,02156 18,48331 62,832 125,664 94,248 94,248 0,682248 2,623222
temp. 30° 89,86629 12,37047 74,45592 125,664 94,248 94,248 1,15391 4,722325
temp. 31° 89,93952 19,1429 66,91608 125,664 94,248 94,248 0,746797 2,856821
temp. 32° 109,956 22,21447 94,248 125,664 94,248 109,956 0 1
temp. 34° 109,956 22,21447 94,248 125,664 94,248 109,956 0 1
Ensemble des données 90,20804 18,00762 62,832 125,664 94,248 90,47808 0,857835 2,794936
Confucius: point 3
Etats & Températures Moyenne Ecart-type Minimum Maximum Mode Médiane Skewness Kurtosis
Moins ensoleillé 116,7818 5,551112 106,1861 125,664 118,4383 117,4958 -0,58182 2,976114
Très Ensoleillé 144,8278 24,50448 108,071 157,08 157,08 157,08 -1,1547 2,333333
Ensoleillé 142,9333 19,32172 109,0135 157,08 157,08 157,08 -0,66837 1,582261
Nuageux 116,9722 12,91365 102,7303 157,08 125,664 116,7104 1,573388 6,166932
Pluvieux 114,0401 0 114,0401 114,0401 114,0401 114,0401
Partiellement couvert 139,8162 22,83912 107,7569 157,08 157,08 157,08 -0,55603 1,371019
V.Très Ensoleill 154,6296 10,95874 108,071 157,08 157,08 157,08 -4,12948 18,05263
V. Ensoleillé 147,9694 18,45094 107,7569 157,08 157,08 157,08 -1,53444 3,494203
V. Nuageux 135,4658 20,52213 111,841 157,08 125,664 125,664 0,16577 1,350389
V. Pluvieux 117,0909 10,8949 102,7303 157,08 125,664 116,8675 2,052833 8,810107
temp. 25° 114,459 0,725521 114,0401 115,2967 114,0401 114,0401 0,707107 1,5
temp. 26° 104,4582 2,443591 102,7303 106,1861 102,7303 104,4582 0 1
temp. 27° 119,4332 14,10501 103,6728 157,08 125,664 117,4958 1,523408 5,379999
temp. 28° 133,27 21,57272 107,7569 157,08 157,08 125,664 0,130276 1,23334
temp. 29° 142,4101 20,79925 107,7569 157,08 157,08 157,08 -0,71229 1,595224
temp. 30° 138,0651 20,91449 107,7569 157,08 157,08 157,08 -0,19922 1,167545
temp. 31° 132,6653 23,80904 103,987 157,08 157,08 125,664 0,059366 1,252826
temp. 32° 120,1662 7,775063 114,6684 125,664 114,6684 120,1662 0 1
temp. 34° 132,5755 34,65457 108,071 157,08 108,071 132,5755 -8,7E-16 1
Ensemble des données 133,1509 21,33227 102,7303 157,08 157,08 125,664 0,121399 1,223224
L’analyse de ces caractéristiques statistiques révèle d’une part que pour un même site, on
note un écart important entre les résultats d’une des mesures et les deux autres. Ceci peut
s’expliquer par le fait que le sol n’est pas homogène sur tous les angles au niveau de chaque
site. D’autre part, partant d’un site à un autre, les résultats ne sont pas les mêmes à tout
moment bien qu’on ait les mêmes états ou température, cela confirme le fait que d’autres
paramètres ont d’influence sur la résistivité.
Les cases des tableaux 3.1 à 3.9 avec une valeur nulle de l’écart-type indiquent que nous
avons une valeur identique de la résistivité pour l’état concerné.
Pour la majorité des états et température au niveau de chacun des sites, la moyenne, le mode
et la médiane sont pratiquement égaux ; ce qui traduit la symétrie de la distribution.
Les coefficients de skewness et kurtosis obtenus pour la majorité des états et température
au niveau de chacun des sites ne sont pas en général trop écartés de ceux de la loi normale
(skewness = 0 et kurtosis = 3). Ce qui permet de dire que ces distributions sont proches de
la distribution normale.
Pour confirmer ces aspects listés de ces distributions, nous avons créé un script Matlab qui
permet de représenter les ajustements des histogrammes de fréquences des états et
température par la fonction de distribution normale. Les figures 3.3 à 3.5 présentent
quelques-uns de ces ajustements pour le site du bloc pédagogique.
Figure 3.3: Ajustement de l’histogramme par la loi N pour l’état “Nuageux“ pour le site de bloc
pédagogique
Figure 3.4: Ajustement de l’histogramme par la loi N pour l’état “Pluvieux la veille“ pour le site
du bloc pédagogique
Figure 3.5: Ajustement de l’histogramme par la loi N pour la température “31°C“ pour le site du
bloc pédagogique
Sur la figure 3.5 par exemple, les figures 3.5.a, 3.5.b et 3.5.c correspondent aux mesures
autour de chacun des trois points de mesure du même site, tandis que l’objectif de la sous
figure d) est de montrer le décalage entre les trois mesures sur le même site.
Ainsi, étant donné que la majorité de ces distributions sont proches de la distribution
normale, nous allons nous servir de ces données comme base pour la prédiction de la
résistivité électrique du sol de ces sites.
Le nombre de données relevées étant peu important, nous procèderons dans la section
suivante à une génération de données pour compléter notre base de données.
Etant donné que nous n’avons pas une base importante de données, nous avons dû générer
les données sur une durée de 3 ans pour chacun des sites en se basant sur la base de données
mesurées.
La méthode de génération adoptée est celle de la fonction « randn » de Matlab qui permet
de générer des données suivant une loi normale à partir des caractéristiques statistiques
(Ecart-type et moyenne) de l’échantillon existant. Il a fallu donc choisir une des variables
explicatives et ce sont les caractéristiques statistiques de cette dernière qui devaient être
utilisées pour la génération des données de résistivité. Ainsi, la température ambiante étant
la seule variable explicative quantitative, nous l’avons considéré comme paramètre
principal pour la génération des données. Pour un site, le nombre de données à générer pour
chaque température est obtenu par proportionnalité à partir du nombre présent dans les
données mesurées. Nous avons créé un script Matlab pour accomplir cette tâche.
Les données étant générées, nous avons procédé à la répartition des autres variables
explicatives proportionnellement à la fréquence des combinaisons observées dans les
données mesurées sur les différents sites. Un autre script Matlab est mis en place pour cette
tâche aussi.
Nous avons complété notre base de données mesurées par les données générées et c’est
cette nouvelle base de données qui nous a servi à faire la prédiction.
Dans cette section, il s’agit essentiellement de présenter les résultats de prédiction obtenus
grâce aux approches par RNA et SVM présentées au deuxième chapitre. Une présentation
préalable de la méthodologie adoptée et de l’outil utilisé pour cette modélisation sera faite.
Enfin, les performances des différents modèles seront présentées.
Cette section met en évidence les étapes de l'investigation sur les performances des
algorithmes des RNA et des SVM dans l'étude. Le traitement des données et la mise en
œuvre des modèles de prévision ont été faites avec l'aide du ntstool Boîte à outils en version
Matlab R2017a.
Des données d'entrée sont utilisées pour évaluer l'influence de chaque paramètre d'entrée
sur la sortie du modèle de prédiction. La précision du modèle peut dépendre de l'adéquation
entre les paramètres d'entrée. Cela implique d'éliminer certaines variables redondantes ou
celles fournissant moins ou pas d’informations pour décrire la sortie.
Début
Choix de la méthode
RNA SVM
Fin
Le traitement des données et la réalisation des modèles de prédiction ont été effectués
intégralement avec le logiciel MATLAB.
Le logiciel MATLAB est un produit destiné à l’étude des systèmes linéaires ou non
linéaires. Son développement et son perfectionnement se font d’une façon continue et
parallèle à ceux de la technique de calcul. Le nom du logiciel MATLAB vient du groupe
de mots anglais Matrix Laboratory, il est orienté en un premier lieu sur l’élaboration des
massifs de données (des matrices et des vecteurs). C’est pour cela, malgré une évolution
rapide de la technique de calcul, MATLAB est toujours parvenu à se maintenir au plus haut
niveau de l’évolution de cette technique.
L’unique problème pour l’utilisateur de ce logiciel est de savoir où prendre les éléments
nécessaires pour la résolution d’un problème concret. Pour faciliter l’utilisation de
MATLAB aux spécialistes de différents domaines de la science et de la technique, sa
bibliothèque est divisée en différentes parties. Celles d’entre elles, qui possèdent un
caractère général font partie de la composition du noyau et celles qui font partie des
domaines spécifiques sont classées dans les lots des paquets d’extension appelés Toolboxes
(boites à outils).
Il est important de souligner que les logiciels MATLAB et ses paquets d’extension
(Toolboxes) se développent et se perfectionnent constamment. C’est pour cela, il est
possible, que la version et bibliothèques, installées sur l’ordinateur de l’utilisateur se
diffèrent de celles utilisées dans ce mémoire. Les non correspondances des versions ne joue
pas un très grand rôle et se manifestent seulement dans la forme de fenêtres, quelques
changements de l’interface, et d’autres descriptions spécifiques etc., mais elle peut rendre
impossible l’utilisation des modèles déjà élaborés dans ce manuel. Dans le cadre de ce
mémoire, Nous avons utilisé la version 9.2.0.538062 (R2017a) de MATLAB éditée en
Février 2017 dont la page d’accueil est présentée à la figure (3.7). MATLAB a été utilisé
dans l'environnement Windows, qui s’avère très efficace pour traiter les données brutes de
type tableur (Microsoft Excel).
MATLAB est une application qui permet de résoudre des problèmes de calcul très
complexes d'une façon simple et rapide comparée aux langages de programmation
traditionnels du type C ou FORTRAN. Il apporte aux Chercheurs, Scientifiques et aux
Ingénieurs notamment, un système interactif intégrant calcul numérique et visualisation.
C'est un environnement performant, ouvert et programmable qui permet de remarquables
gains de productivité et de créativité. Il dispose de plusieurs centaines (voire milliers, selon
les versions et les modules optionnels autour du noyau MATLAB) de fonctions
mathématiques, scientifiques et techniques. L’approche matricielle de MATLAB permet
de réaliser des calculs numériques et symboliques de façon fiable et rapide et de traiter les
données sans aucune limitation de taille ; ceci dans la limite du possible des performances
de la machine.
MATLAB possède son propre langage, intuitif et naturel qui permet des gains de temps de
CPU (Central Processing Unit ou Unité centrale de traitement) spectaculaires par rapport à
d’autres langages lorsque le programmeur est méticuleux dans sa manière de faire.
MATLAB comporte aussi un ensemble d'outils spécifiques à des domaines précis y compris
l’intelligence artificielle et les statistiques, appelés Toolboxes (ou Boîtes à Outils) qui outils
sont des collections de fonctions qui étendent l'environnement MATLAB pour résoudre des
catégories spécifiques de problèmes [52]. Ces nombreux avantages (multiplateforme,
traitement de données sans limitation de taille, interface graphique et langage intuitif, gains
de temps de CPU, Toolboxes…) font de MATLAB le logiciel idéal pour la réalisation de
notre projet.
Ainsi la toolboxe « nntool » (figure 3.8) permet de créer des modèles à base de réseaux
de neurones. Tandis que la toolboxe « nftool » (figure 3.9) met à la disposition de
l’utilisateur un modèle prédéfini qu’il peut personnaliser selon ses besoins.
A partir de cette interface (nntool), il est possible de créer de nouveaux réseaux et les
enregistrer. Cette fonctionnalité est assez perspicace, car on peut toutefois réentrainer le
réseau afin de le performer.
Nous allons donc nous servir de cet outil performant pour implémenter nos différents
modèles pour les RNA.
Quand à ce qui concerne les SVM, Il existe une multitude de fonctions dans MATLAB qui
traitent des problèmes de classification et de régression à base des algorithmes de SVM.
Certains utilisateurs n’hésitent cependant pas à développer des outils très intuitifs avec des
exemples assez élaborés. MATLAB ne disposant pas d’un outil graphique pour la
conception des modèles de prédiction à partir des SVM, nous nous sommes orientés vers
la programmation d’un script afin de déterminer le modèle. Pour la validation de nos
résultats à partir de ce programme, nous avons utilisé une fonction développée par un
Tableau 3.10: Liste des variables explicatives, leur explication mathématique et leur codification
Numéro configuration
1 [AB]
2 [AC]
3 [AD]
4 [BC]
5 [BD]
6 [CD]
7 [ABC]
8 [ABD]
9 [ACD]
10 [BCD]
11 [ABCD]
Les données de résistivité sont divisées en deux groupes. Le premier groupe de données
destinées pour l’apprentissage du modèle c’est-à-dire l’estimation de ses paramètres (poids
synaptiques) représente 80% des données et Le second groupe qui sert tester l’approche de
prédiction représente 20%. Les critères de performances utilisés pour évaluer les modèles
sont le RMSE le RRMSE, le MAPE, et R2 exprimés tous en pourcentage.
Dans cette section, nous allons exposer les résultats issus de nos travaux avec les RNA puis
faire sortir le modèle de RNA le plus adapté pour la prédiction de la résistivité électrique
du sol en se basant sur le RRMSE et le R2 qui sont les indicateurs principaux choisis pour
évaluer les performances de ces modèles.
Chaque modèle a été exécuté 10 fois pour la phase d’apprentissage et la phase de simulation
et ce pour un nombre donné de neurones sous la couche cachée. En effet, les poids
synaptiques changent de valeurs à chaque exécution, ce qui donne des résultats légèrement
différents des exécutions précédentes [52].
Les tableaux 3.12 à 3.22 Présentent les minima et le maxima de chacun des critères de
performances des différents cas de configurations du modèle MLP. Les meilleures
performances de chaque configuration sont mises en exergue par l’astérisque (*) et en Gras
dans les tableaux.
Les tableaux 3.23 à 3.33 présentent les minima et le maxima de chacun des critères de
performances des différents cas de configurations du modèle RBF. Les meilleures
performances de chaque configuration sont mises en exergue par l’astérisque (*) et en Gras
dans les tableaux.
3.4.4.2- Bilan des meilleures performances des configurations pour les deux modèles
des RNA
Le tableau 3.34 fait le bilan des performances des différentes configurations pour MLP et
RBF. Il présente pour chacune des configurations, le nombre de neurones de la couche
cachée qui donne de meilleurs résultats.
Nous retenons donc que pour le modèle MLP, la configuration la plus performante est la
configuration 11 [ABCD] qui donne le plus petit RRMSE (11,72%) et le plus grand 𝑅 2
(79,54%) de toutes les configurations avec 90 neurones sous la couche cachée et que pour
le modèle RBF, la configuration la plus performante est la configuration 10 [BCD] qui
donne le plus petit RRMSE (11,86%) et le plus grand 𝑅 2 (79,05%) de toutes les
configurations avec 100 neurones sous la couche cachée. Le tableau 3.35 présente les bilans
des performances pour les configurations 10 et 11.
L’analyse du tableau 3.35 montre que, non seulement la configuration 11 du modèle MLP
donne le plus petit RRMSE (11,72%) et le plus grand 𝑅2 (79,54%), mais aussi les plages
de variation des deux critères de performances sont très petites( RRMSE [Min = 11,72% ;
Max = 11,99%] et 𝑅2 [Min = 78,62% ; Max = 79,54%] ) par rapport aux plages de variation
des mêmes critères pour la configuration 10 du modèle RBF ( RRMSE [Min = 11,86% ;
Max = 23,76%] et 𝑅2 [Min = 20,41% ; Max = 79,04%]). Cette analyse révèle donc que la
configuration 11 avec le modèle MLP est l’approche par RNA la mieux adaptée pour la
prédiction de la résistivité électrique du sol dans le cadre de notre travail.
Dans la section suivante, nous allons présenter les résultats de l’approche par SVM et nous
pourrons ensuite conclure sur le choix de la meilleure approche pour la modélisation de la
résistivité électrique du sol.
L’approche par les SVM pour la prédiction de données constitue une approche rigoureuse.
Ne disposant pas d’outil graphique d’aide à la modélisation, nous avons programmé grâce
aux fonctions de MATLAB. Cette méthode passe par la rédaction d’un script qui consiste
à utiliser une proportion des données de notre base d’étude. Cette proportion a permis de
créer un modèle SVR (Support Vector Regression) qui est utilisé pour faire la prédiction
des données. La figure 3.11 montre la fenêtre dans laquelle nous avons rédigé le code
MATLAB.
Les données d’études ont été divisées en deux groupes pour l’apprentissage et la validation
des modèles (respectivement 80% et 20%). A partir des données d’apprentissage, les
modèles ont été créés. L’étape suivante est la validation du modèle. Elle consiste à faire des
prédictions avec les modèles créés. Sur la base de ces prédictions, les modèles pourront être
comparés entre eux avec les indicateurs statistiques : MAPE, RMSE, RRMSE et R2.
Les tableaux 3.36 à 3.46 donnent les valeurs des indicateurs de performances calculés pour
les différents modèles.
L’analyse des performances des différentes configurations de nos modèles a priori nous a
permis de recenser pour chaque cas les performances des différents modèles crées.
L’analyse révèle d’une part que le modèle prédit par l’algorithme des SVM à noyau linaire
ne montre pas de bonnes performances. En effet le plus grand coefficient de corrélation
relevé est celui de la configuration [BCD] avec un R2 = 5.4863%, un MAPE = 34.5033%,
un RMSE = 51.4060 et RRMSE = 33.7447%. Ce qui permet de conclure partiellement dans
le cadre de nos travaux que les SVM linéaires ne sont pas adaptés pour la prédiction de la
résistivité électrique du sol.
En outre, quant aux résultats rencontrés en utilisant les SVM a noyau gaussien, on remarque
une faible amélioration au niveau de chaque configuration par rapport aux SVM linéaire.
Ce qui nous permet de dégager la meilleure performance avec la configuration [BD]. Les
indicateurs statistiques donnent avec ce modèle la performance suivante :
Ce qui nous permet d’affirmer que les SVM à noyau gaussien sont mieux adapté pour la
prédiction de la résistivité électrique du sol que les SVM à noyau linéaire. Cependant, vu
les variables d’entrées de cette configuration [BD], il faut avoir une grande base de données
avant de pouvoir conclure de façon efficace.
Après comparaison des performances des modèles des deux approches de prédiction (RNA
et SVM), nous retenons que celle la mieux adaptée pour la prédiction de la résistivité
électrique du sol est l’approche par les RNA avec le modèle MLP et la configuration 11
[ABCD] avec 90 neurones sous la couche cachée (RRMSE [Min = 11,72% ; Max =
11,99%] et 𝑅2 [Min = 78,62% ; Max = 79,54%]). La figure 3.12 présente l’architecture de
ce modèle.
Pour le modèle retenu, la corrélation entre les valeurs prédites et les valeurs mesurées est
présentée par la figure 3.15.
Figure 3.15: Corrélation entre les valeurs mesurées et prédites de la résistivité électrique du sol
Avec ce nuage des points (figure 3.15), il est clair qu’il pourra arriver que certaines
prédictions ne donnent pas de bons résultats compte tenu du fait que certains points sont
trop écartés de la droite Y = X (de la première bissectrice). Mais le peu d’avantages est que
la majorité des points sont repartis autour de la dite droite. Un agrandissement de la base
de données et une augmentation du nombre de paramètres d’entrée permettra peut-être de
palier à cette insuffisance.
La connexion internet utilisée tout au long de ce travail est celle pour les étudiants et
personnel de l’Université de Lomé (UL-WIFI), ce qui fait que son coût a été exonéré dans
la facturation de ce projet.
L’étude du projet est facturée selon le nombre de mois de travail. La réalisation de l’étude
a nécessité au total 3 mois et nous sommes dans la catégorie C3 du tableau de la grille
salariale de la République Togolaise. Le salaire mensuel minimal est évalué à 185 000 F
CFA par mois [28].
Enfin, pour évaluer le coût total du projet, il faut ajouter au total partiel hors taxe (HT) la
taxe sur la valeur ajoutée (TVA). Le coût total du projet est présenté dans le Tableau 3.48.
Le coût total du projet est alors de trois millions neuf cent quatre-vingt-quatorze mille
quarante et sept francs CFA (3 994 047 FCFA).
3.6. Conclusion
Ce chapitre a été consacré à la caractérisation de la résistivité électrique du sol pour les sites
de l’UL et à l’utilisation des approches par RNA et SVM pour la prédiction de la résistivité
électrique du sol. L’outil qui a servi de modélisation est MATLAB, au travers de ses
ToolBox et la programmation par ses fonctions. Suivant les résultats obtenus, des critères
d’appréciations ont permis l’évaluation des différents modèles des deux approches et le
choix du meilleur modèle. Les résultats obtenus sont satisfaisants et ils pourront être
améliorés si on introduit d’autres variables plus explicatifs de la résistivité.
La mise à la terre est une partie essentielle du système de protection des installations
électriques et des systèmes d'alimentation contre la foudre et en général les courants de
défaut et pour être efficace, un système de mise doit avoir une résistance au sol qui doit être
maintenu à des niveaux bas pendant toute l'année. Le type de sol doit donc être sérieusement
pris en compte dans la conception d'un tel système à cause de, soit sa résistivité élevée, ou
son environnement particulièrement corrosif. Il ressort donc que l’un des principaux
paramètres du sol pour la mise à la terre électrique est sa résistivité. Celle-ci varie en
fonction de plusieurs variables de façon aléatoire or sa mesure est une tâche longue couteuse
et l’objet de ce travail était de proposer une approche de prédiction de cette résistivité avec
une optimisation en termes d’erreurs-coût-qualité.
Les résultats issus de la modélisation ont été présentés au troisième chapitre. Plusieurs
configurations des modèles des deux approches ont été développées et testées en faisant
varier les différentes variables explicatives. Toutes les configurations ont été implémentées
dans le logiciel MATLAB (2017). Les résultats des deux approches ont été soumis à une
comparaison. Les indicateurs RRMSE et R2 ont été utilisés pour évaluer les différentes
configurations de chaque modèle. La configuration la plus performante de toutes est la
configuration 6 [ABCD]) du modèle MLP de l’approche par RNA (avec 90 neurones dans
la couche cachée) avec un RRMSE de 11,72 % et un R2 de 79,54%. Les variables
explicatives A, B, C et D désignent respectivement l’état de la nature le jour de la mesure,
l’état général de la nature la veille du jour de la mesure, la température ambiante au point
de mesure et les coordonnées géo référencées du point de mesure. Ce modèle pourra donc
être utilisé pour la prédiction de la résistivité électrique du sol pour les sites de l’UL.
Toutefois, il convient de noter que ces résultats ne sont pas tout à fait satisfaisant et peuvent
être améliorés. Cette amélioration peut être obtenue en développant différents aspects.
Ainsi comme perspectives, nous mentionnons les recommandations suivantes :
les données utilisées dans ce projet ne sont pas suffisantes. Il est plus intéressant
de tenir compte d'autres facteurs comme la teneur en eau, l’indice du vide, la
granulométrie du sol et les utiliser dans la modélisation.
augmenter la base de données pour les sites de mesure et ceci pourra conduire à la
réalisation d’une carte de résistivité pour une zone donnée.
une fiabilisation des mesures
rendre ce travail en application ou outil facilement utilisable et même
transportable ;
utiliser d'autres types d’approches de modélisation des systèmes de prédiction.
[2] ANBAZHAGAN S., “Athens seasonal variation of ground resistance prediction using
neural networks”, ICTACT JOURNAL ON SOFT COMPUTING, OCTOBER 2015,
VOLUME: 06, ISSUE: 01.
[3] ARCHIE G. E., “The Electrical Resistivity Log as an Aid in Determining Some
Reservoir Characteristics,” Petroleum Transactions of the AIME, no. October, pp.
54–62, 1942.
[4] ARDOUIN Antoni, “Guide pratique pour la description des sols de France,
Conservatoire d’Espaces Naturels (CEN) Bourgogne“, 2012.
[5] ASIMAKOPOULOU Fani E. et al. “an artificial neural network for estimating the
ground resistance”, International Conference on Grounding and Earthing & 4th
International Conference on Lightning Physics and Effects Salvador – Brazil,
November, 2010.
[6] AYAT N., “Sélection de modèle automatique des machines à vecteurs de support,
application à la reconnaissance d’images de chiffres manuscrits“, Thèse présentée à
l’Ecole de Technologie Supérieure, Montréal, Canada, 2004.
[9] BESSON Arlène, COUSIN Isabelle, DABAS Michel, KING Dominique, “Impact de
la solution du sol sur les mesures de résistivité électrique : premiers essais
méthodologiques“, septembre 2005.
[11] BOUREK Y., “Etude de la décharge électrique par l'intelligence artificiell“, thèse de
Doctorat, Université de Batna2 ,2016.
[12] CALLUT J., “Implémentation efficace des Supports vectors Machines pour la
classification“, Mémoire présenté en vue de l’obtention du grade de Maître en
informatique. Université libre de Bruxelles, Département informatique, 2003.
[17] DJEFFAL A., “Utilisation des méthodes Support Vector Machine (SVM) dans
l’analyse des bases de données“, thèse de doctorat en science université de Biskra,
2010.
[20] GÜEMES J. A., HERNANDO F. E., “Method for Calculating the Ground Resistance
of Grounding Grids Using FEM“, IEEE Transactions on Power Delivery, Vol.19,
No.2, pp 595-600, Avril 2004.
[21] GUERMEUR Y., “SVM multi classes, théorie et applications“, Mémoire présenté
pour l’obtention de l’habilitation à diriger des recherches, Université Nancy I,
France,2007.
[23] GUNN S., “Support Vector Machines for Classification and Regression”, University
of Southampton, May 1998.
[26] HOUEDAKOR Tété Jean, “Approches neuronales et des supports vector machines
(SVM) pour la prédiction des propriétés mécaniques des roches : cas des roches
Togolaises“, Mémoire d’ingénieur génie électrique, IFTS, juillet 2017.
[30] KHELLAT KIHEL S., “Les séparateurs à vaste marge Bi- classe“, Université des
sciences et de technologie d’Oran, exposé de Master 2, 2012.
[31] KHODJA F., “Conception d'un système intelligent à base de réseaux de neurones
[32] LEGRAND Xavier, “Modélisation des systèmes de mise à la terre des lignes
électriques soumis à des transitoires de foudre“, thèse de doctorat de
l’école centrale de lyon, 2007.
[34] MACHADO P., BERNARDI A., VALENCIA L., MOLIN J., GIMENEZ L., SILVA
C., ANDRADE A., MADARI B., and MEIRELLES M., “Electrical conductivity
mapping in relation to clay of a Ferralsol under no tillage system (in Portuguese)”,
Pesquisa Agropecuária Brasileira, vol. 41, no. 6, pp. 1023–1031, Jun. 2006.
[40] MOTETSE Julien , “Approches neuronale, floue et neurofloue pour la prédiction des
propriétés mécaniques des roches gneissiques du Togo“, Mémoire
d’Ingénieur/Master Prof.-Univ. Lomé/ ENSI -Département Génie Electrique, 2017.
[41] NGUYEN Anh Quan, “Evaluation non destructive du gradient de teneur en eau dans
les structures en béton armé par résistivité électrique”, these de Doctorat de
l’Université de TOULOUSE.
[43] OSUNA E., FREUND R., and GIROSI F., “A Improved Training Algorithm for
Support Vector Machines”, Proc. 1997 IEEE Workshop on neural network for signal
Proceesing, pp 276-285, 1997
[45] PAPAIZ GARBINI Gabriel, “Contribution au calcul des élévations de potentiel de sol
en contexte ferroviaire, thèse de doctorat soutenue le 25/06/2015“, Université Paris-
Sud.
[47] RUAN W., SOUTHEY R. D., FORTIN S., DAWALIBI F. P., and MEMBER S.,
“Effective Sounding Depths for HVDC Grounding Electrode Design : Wenner versus
Schlumberger Methods,” vol. 4, pp. 1–7, 2005.
[48] SAMOUËLIAN A., COUSIN I., TABBAGH A., BRUAND A., and RICHARD
G.,“Electrical resistivity survey in soil science : a review,” Soil and Tillage Research,
vol. 83, no. 2, pp. 173–193, Sep. 2005.
[49] SCHOLKOPF B. and SMOLA A., “Leaning with Kernels”, MIT Press, 2001.
[50] TABBAGH A., GUE R., and COSENZA P., “Numerical modeling of the role ofwater
and clay content in soils ’ and rocks ’ bulk electrical conductivity,” Journal of
Geophysical Research, vol. 107, pp. 1–9, 2002.
[51] TARILANYO Afa John and C.M. Anaele, “Seasonal Variation of Soil Resistivity and
Soil Temperature in Bayelsa State” American J. of Engineering and Applied Sciences
3 (4): 704-709, 2010, ISSN 1941-7020.
[52] TCHONDA M., “Approche Neuronale pour la Prédiction de la charge Electrique sur
le réseau de la Communauté Electrique du Benin (CEB)“, Mémoire
d’Ingénieur/Master Prof.-Univ. Lomé/ ENSI -Département Génie Electrique, 2016.
[57] VINCENT P., “Modèles à noyaux à structure locale“, Thèse de Ph.D en informatique,
Université de Montréal, 2003
[58] WENNER F., “A Method of Measuring Earth Resistivity,” Bulletin of the National
Bureau of Standards, vol. 12, pp. 469–478, 1915.
[59] YESSAADI S., “Un modèle basé Template Matching/ Réseau de Neurones pour la
Reconnaissance des visages,” thèse de magistère, 2006.
[61] ZADEH A., “Fuzzy Logic, Neural Networks and Soft Computing“, Fuzzy Systems,
Vol 37 n°3, Mars 1994.
[62] ZIDANE Zine Abiddine, “Modélisation et simulation des prises de terre dans les
systèmes électrique“, Mémoire de Magister en Electrotechnique de l’Université Ferhat
Abbas-Setif (Algérie), mai 2012.
[63] ZOHDY A. A. R., “A new method for the automatic interpretation of Schlumberger
and Wenner sounding curves,” Geophysics, vol. 54, no. 2, pp. 245–253, Feb. 1989.