Cours MM Chap1 2020

Université de la Manouba
Département IM- Cycle Ing Module : MM
Chapitre I Introduction à l’apprentissage automatique
1. Introduction
1.1 Généralités sur la science des données (Data science)
LA science des données (ou data science) est le mélange entre trois domaines : La science des
mathématiques, l’expertise et la programmation.
Mathématiques
Expertise
Programmation
Expertise
Figure : La science des données
L’association entre les mathématiques et l’expertise permet de développer la recherche et l’analyse

traditionnelle. Concernant le mélange entre l’expertise et la programmation nous permet de
développer le domaine du traitement des données (data processing). La troisième association entre
la science des mathématiques et celle de la programmation résulte la constitution du domaine de
l’apprentissage automatique (machine learning). La figure suivante montre les différentes
associations et les relations entre les différents domaines qui constituent la science des données.
Mathématiques
Expertise
Analyse Apprentissage
classique auto.
SD
Expertise Traitement Programmation
données
Figure : Association des domaines de la science des données
Amamou Mohamed Ridha Page 1

Remarque
Il faut savoir que tous ces domaines reposent essentiellement sur une base de données pour pouvoir
modéliser, programmer et faire de l’expertise.
1.2 Définition de l’apprentissage automatique
L’apprentissage automatique connu sous le nom de « Machine learning » est l’application des
connaissances mathématiques dans la programmation informatique. Il appartient au champ de
l’intelligence artificielle. Son but est de donner à un algorithme la capacité d’apprendre sans
programmer des contraintes ou des règles. Ceci n’est pas comme dans le cas de la programmation
classique dans laquelle il faudrait programmer des milliers des cas possibles.
1.3 Application de l’apprentissage automatique
D’une façon générale la question classique à poser est : quand on utilise l’apprentissage
automatique ? La réponse se résume selon les points suivants :
 Quand l’expertise humaine est absente.

Exemple : Robots sur un environnement inconnu : Prospection des forêts, des surfaces, des espace
de combats militaires etc…).
 Quand l’humain ne peut pas reconnaitre et ne peut pas expliquer son expertise
Exemple : prise de décision dans les processus industriels.
 Quand les solutions changent régulièrement aux cours du temps .

Exemple : Comportement selon des situations dans les jeux vidéo, prise de décision dans les
systèmes de fabrication rapides.
1.4 Domaines d’application de l’apprentissage automatique
L’application de l’apprentissage automatique atteint différents domaines comme :
 La finance,
 La sécurité,
 L’agriculture,
 L’industrie,
 Le traitement du son,
 Le domaine médical,
 Le Marketing, etc…

2. Implémentation d’un modèle en apprentissage automatique

4.1 Structure des données
Le développement d’une structure de données ou l’élaboration d’une base de données est

nécessaire à la construction des modèles d’apprentissage automatique. Elle doit être assez
représentative des données présentées à l’entrée. Par conséquent, plus la base est importante en
nombre d’exemples, mieux est la performance du modèle. Généralement, la génération de la base
ou la collecte des données se fait à partir de notre environnement qui peut être une image médicale,
une caractéristique de qualité d’un processus de fabrication, un son de vibration, une donnée
financière etc. Cette génération se fait à partir d’un capteur image, capteur industriel, capteur sonore
ou des valeurs caractéristiques (cas de la finance). Toutefois, cette collecte donne des paramètres
hétérogènes qui peuvent être avec effet significatif ou avec un effet négligeable sur le modèle
développé d’un côté. D’un autre coté, cette collecte de données peut contenir des valeurs erronées
ou altérés dû à la prise des mesures ou à des mauvaises manipulations. C’est pour cette raison
qu’une phase de structuration et de développement des données est obligatoire et à tenir compte
pour améliorer les performances du modèle à construire. La figure ce dessous illustre ces différentes
étapes nécessaires pour la préparation de la base de données.
Structuration &
Collecte des Développement
Environnement
données brutes des données
Industrie, Capteur,
Filtrage,
Médicale, Image,
Organisation,
Réseaux sociaux, Son,
Quantification,
Finance, Textes,
etc…
etc… Valeurs,
etc..
Figure : Récupération et structuration des données

4.2 Construction d’un modèle d’apprentissage automatique
Après la collecte des données et la structuration de la base de données, il faut les unifier et les
uniformiser. Cette phase est la phase du prétraitement des données. Cette étape influe
considérablement sur les performances du modèle. En effet, les variables sont exprimées en ordre de
grandeurs différentes et en unités différentes. Pour que des données reçoivent la même attention
dans la phase de construction, elles doivent être normalisées. Il suffit que la base de données est
prête, l’étape suivante consiste à utiliser ces données pour ajuster les paramètres du modèle à
construire: c’est la phase d’apprentissage. Cette phase est évaluée par la suite avec un critère
quantifiable. Si l’objectif n’est pas atteint l’étape d’ajustement se répète pour se rapprocher de
l’objectif. Dans le cas où l’objectif d’apprentissage est atteint le modèle est fixé et utilisé pour l’aide à
la prise de décision.
Non
Evaluation
Base de Prétraitement Apprentissage Performance du
données des données du modèle acceptable Modèle
oui
Prédiction
et aide à la Modèle final
décision
Figure : Etapes de développement d’un modèle d’apprentissage automatique
3. L’apprentissage d’un modèle à apprentissage automatique

La phase d’apprentissage est la phase dans laquelle les paramètres du modèle sont ajustés. Cet
ajustement dépend de la manière ou la façon qu’on veut que le modèle apprend. Dans ce cas trois
variantes d’algorithme d’apprentissage sont généralement utilisées : l’apprentissage supervisé,
l’apprentissage non supervisé et l’apprentissage par renforcement.

3.1 L’apprentissage supervisé
C’est la technique d’apprentissage la plus courante. Elle s’inspire de l’apprentissage de l’être humain
qui se base sur l’apprentissage selon des exemples. Dans le cas pratique cette technique se base sur
une base de données formée par des caractéristiques d’entrées (‘Features’) et des caractéristiques
de sortie. Le but de cet algorithme est de faire la prédiction de la ou les sorties à partir des
caractéristiques d’entrées. En d’autre termes, c’est de trouver une relation entre la ou les sorties en
fonction des caractéristiques d’entrées. Ce qui nous ramène à appeler cette technique par la
régression.
Il faut noter que les capacités des algorithmes supervisés se concentrent principalement sur le
régression et sur la classification qui sont utilisés dans les domaines de reconnaissance des images,
de reconnaissance vocale, de prédiction des données des séries temporelles, d’aide à la décision
dans les processus industriels, etc …
Exemple 1
Soit la base de données suivante qui décrit la valeur d’une voiture en fonction de son âge.
Age [mois] 12 24 48 36 60
Valeur [DT] 40 30 21 16 14
50
40 y = -0,5083x + 42,5
R² = 0,8006
30
20
10
0
0 10 20 30 40 50 60 70
Figure : Variation de la valeur de voiture [en dt] en fonction de l’âge [en mois]
L’apprentissage supervisé permet de construire un modèle qui décrit la relation :
Par la suite on peut déterminer pour n’importe quelle âge (ou valeur de A) le prix de la voiture. A
partir de ce type de raisonnement on entre dans la logique de l’apprentissage automatique.

Exemple 2
Réellement on est dans un cas plus compliqué dans lequel la marque de la voiture, le kilométrage, la
puissance et plusieurs autres facteurs interviennent dans le prix. Par conséquent, la relation de la
sortie devient :
On remarque que le modèle devient plus complexe et par la suite plusieurs paramètres à trouver ou
à ajuster. Ceci décrit la régression multiple qu’on peut l’écrire selon l’équation suivante :
Avec xi : les caractéristiques d’entrées du modèle.
3.2 L’apprentissage non supervisé
Dans ce cas, la base de données est composée que par des caractéristiques d’entrées seulement.
C’est la principale différence avec celle de l’apprentissage supervisé. Cette technique consiste a
construire un modèle d’apprentissage automatique capable d’extraire des caractéristiques
intrinsèques des entrées du modèles. D’une façon générale, le groupement des données (ou
clustering des données) est l’utilisation la plus courante de ce type de méthode. Une deuxième
application es cette technique est la réduction de dimension. Elle est utilisée dans le cas où l’objectif
se concentre sur la réduction des données caractéristiques. En effet, dans certains cas la dimension
des données est aussi importante qu’on devrait la réduire. La détection d’anomalie fait partie des
applications de l’algorithme non supervisé. Un exemple sera présenté dans la suite pour mieux
expliquer son utilité.
Exemple 1
L’exemple suivant montre le groupement d’une base de données selon deux groupements. Cet
exemple compte 6 entrées, chacune est caractérisé par deux critères qui sont le poids et la vitesse
maximale (tableau ci-dessous).
Groupe 1 :
Animaux
Modèle de
clustering
Groupe 2 :
Machine
Base de données (Data set)

Figure : Exemple de fonctionnement d’un modèle de clustering

Tableau : Base de données
Vitesse [Km/h] 25 150 120 20 35 100

Poids [Kg] 1.2 800 3000 1.8 40 1500
10000
3000
1000 1500
800
100
40
10
1,8 1,2
1
0 50 100 150 200
Figure : Représentation du poids [en Kg] en fonction de la vitesse maximale[en Km/h]
Remarque :
Il faut tenir en compte que lorsqu’on associe la classe de chaque observation on parle alors de
classification supervisée.
Exemple 2
Dans cet exemple, La prise d’échantillons de la valeur de la température d’un four pendant des
intervalles de temps fixes. Le tableau suivant donne les différentes valeurs suivantes.
Heure de
9h 10h 11h 12h 13h 14h 15h 16h 17h
l’échantillonnage
Température [103°C] 0.38 0.32 0.31 0.25 0.36 0.61 0.78 0.96 1.75
Température [x1000°C]
2
1,5
0,5
0
6 8 10 12 14 16 18
Figure : Evolution de la température du four en fonction du temps
Dans ce cas l’anomalie est de détecter par la présence d’un point hors groupe. Ceci permet de
conclure qu’il y a un problème de mesure ou un problème de process.

3.3 L’apprentissage avec renforcement
L’apprentissage avec renforcement consiste à apprendre à un modèle comment se comporter dans

un environnement. Dans ce cas les données d’apprentissage viennent de l’environnement et non pas
d’une base de donnée. C’est la principale différence avec l’apprentissage supervisé. On a, juste,
besoin d’un modèle, on le met dans un environnement et par lui-même il va développer ses données
d’entrainement en interagissant avec son environnement.
Pratiquement, l’apprentissage par renforcement nécessite un temps très important lorsqu’on utilise
dans le monde réel. C’est pour cela le modèle est lancé dans un monde virtuel. En d’autres termes
on fait des simulations pour accélérer le temps d’apprentissage.
Le but de ce type d’algorithme n’est pas de minimiser la fonction erreur mais de maximiser le
nombre de récompenses qui sont données par l’environnement au fur et à mesure que le modèle va
inter agir avec son environnement.
Modèle Action
Observation
Récompense A(t)
O(t)
R(t)
Environnement
Figure : Fonctionnement d’un modèle à apprentissage avec renforcement

4. Implémentation d’un modèle généralisé en apprentissage automatique
Récupération et collecte
des données
Structuration et
transformation des données
Base de données pour Base de données pour Base de données pour

le test la validation l’apprentissage
Construction du Affiner les hyper

modèle paramètres du modèle
Modèle
Oui Evaluation Non

Modèle construit de l’apprentissage
Oui Evaluation Non

Modèle validé de la validation
Evaluation Non
de la généralisation
Oui
Modèle final
Figure : Méthodologie générale de développement d’un modèle d’apprentissage automatique

5. Application des approches utilisées

D’une façon générale les différentes applications des approches présentées dans ce chapitre se
résument sur la régression et la classification pour l’apprentissage supervisé. Cette approche est
largement utilisée dans les modèles d’aide à la prise de décision. Concernant la deuxième approche,
La réduction des dimensions, le groupement connu sous le nom ‘clustering’ et la détection
d’anomalie constituent les principales applications de cette deuxième approche. Dans plusieurs cas
cet apprentissage non supervisé est utilisé pour le pré traitement des bases de données. La dernière
approche qui est l’apprentissage par renforcement est une approche récente. Elle est utilisée
généralement dans les modèles qui sont injectés dans des environnements inconnus. Toutefois, les
performances de ce type d’approche restent relativement moyennes. En effet, beaucoup d’études se
suivent pour développer et améliorer ce type d’approche qui prévoit de bonnes performances dans
le futur.
Modèle d’apprentissage
automatique (ML)
Apprentissage Apprentissage Apprentissage

supervisé Non supervisé par renforcement
Régression, Réduction des dimensions, Décision à temps réel,

Classification. Groupement (clustering), Adaptation avec un
Détection des anomalies. environnement dynamique.
Figure : Application des principales approches de l’apprentissage automatique

6. Outils d’application de l’apprentissage automatique

Actuellement, les principaux outils de mise en œuvre des modèles à apprentissage automatique
sont :
 Python : utilisé généralement par les informaticiens (développement des programmes et

logiciels) et les automaticiens (traitement d’image, traitement de signal, systèmes de
commande)
 Matlab : utilisé principalement par les automaticiens et les mathématiciens (développement
des modèles théoriques et nouvelles méthodologies)
 R : utilisé particulièrement par les mathématiciens et surtout les staticiens,
 Octave : utilisé fréquemment par les automaticiens et les mathématiciens
Concernant les plateformes des outils prêts (framework), ils sont représentés principalement par
tensorflow, Caffé et CNTK.

Cours MM Chap1 2020

Transféré par

Informations du documentcliquez pour développer les informations du document

Droits d'auteur :

Formats disponibles

Cours MM Chap1 2020

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours MM Chap1 2020

Transféré par

Droits d'auteur :

Formats disponibles

Université de la Manouba

Département IM- Cycle Ing Module : MM

Chapitre I Introduction à l’apprentissage automatique

Figure : La science des données

L’association entre les mathématiques et l’expertise permet de développer la recherche et l’analyse

Figure : Association des domaines de la science des données

Amamou Mohamed Ridha Page 1

1.2 Définition de l’apprentissage automatique

1.3 Application de l’apprentissage automatique

 Quand l’expertise humaine est absente.

 Quand les solutions changent régulièrement aux cours du temps .

1.4 Domaines d’application de l’apprentissage automatique

L’application de l’apprentissage automatique atteint différents domaines comme :

Amamou Mohamed Ridha Page 2

2. Implémentation d’un modèle en apprentissage automatique

Le développement d’une structure de données ou l’élaboration d’une base de données est

Figure : Récupération et structuration des données

Amamou Mohamed Ridha Page 3

4.2 Construction d’un modèle d’apprentissage automatique

Figure : Etapes de développement d’un modèle d’apprentissage automatique

3. L’apprentissage d’un modèle à apprentissage automatique

Amamou Mohamed Ridha Page 4

3.1 L’apprentissage supervisé

L’apprentissage supervisé permet de construire un modèle qui décrit la relation :

Amamou Mohamed Ridha Page 5

Avec xi : les caractéristiques d’entrées du modèle.

3.2 L’apprentissage non supervisé

Base de données (Data set)

Amamou Mohamed Ridha Page 6

Tableau : Base de données

Vitesse [Km/h] 25 150 120 20 35 100

Figure : Représentation du poids [en Kg] en fonction de la vitesse maximale[en Km/h]

Figure : Evolution de la température du four en fonction du temps

Amamou Mohamed Ridha Page 7

3.3 L’apprentissage avec renforcement

L’apprentissage avec renforcement consiste à apprendre à un modèle comment se comporter dans

Figure : Fonctionnement d’un modèle à apprentissage avec renforcement

Amamou Mohamed Ridha Page 8

4. Implémentation d’un modèle généralisé en apprentissage automatique

Base de données pour Base de données pour Base de données pour

Construction du Affiner les hyper

Oui Evaluation Non

Oui Evaluation Non

Figure : Méthodologie générale de développement d’un modèle d’apprentissage automatique

Amamou Mohamed Ridha Page 9

5. Application des approches utilisées

Apprentissage Apprentissage Apprentissage

Régression, Réduction des dimensions, Décision à temps réel,

Figure : Application des principales approches de l’apprentissage automatique

Amamou Mohamed Ridha Page 10

6. Outils d’application de l’apprentissage automatique

 Python : utilisé généralement par les informaticiens (développement des programmes et

Amamou Mohamed Ridha Page 11

Vous aimerez peut-être aussi