Chap1 Introduction
Chap1 Introduction
1
MPDS1 3 h / semaine
Cours
Exercices
TPs
Exposés
Introduction
Apprentissage non-supervisé
Clustering
CAH
Apprentissage supervisé
Régression linéaire
Classification
Régression logistique
KNN
Perceptron
Naive Bayes
IA : dates clés
5
Les avancés de l’IA – IBM Deep Blue
6
Deep Blue était le plus puissant des ordinateurs dédiés aux échecs de l'histoire,
capable d'évaluer jusqu'à 200 millions positions possibles par seconde.
Deep Blue bat le champion du monde des jeux d’échec Garry Kasparov en 1997
Les avancés de l’IA – IBM Deep Blue
7
Source: AllTechBuzz
Pourquoi maintenant ?
22
Avancées
Big Data
technologiques
Puissance
de
traitement
Nouveaux
algorithmes
Stockage
de
données
Machine Learning vs Deep Learning
23
Machine learning
Deep learning
Machine Learning vs Deep Learning
24
Informatique traditionnelle
Fournir explicitement à la machine les instructions à
exécuter
Apprentissage machine
Fournir à la machine la capacité d’apprendre à résoudre des
problèmes à partir d’exemples d’entrées/sorties
Elle apprend pour pouvoir généraliser
Quand utiliser l’apprentissage automatique ?
26
Segmentation du marché
Segmenter (catégoriser) les consommateurs
dans une base de données d’achats dans un
supermarché
Segmentation des images
Segmentation de lésions dans un organe
Compression des images
Reconnaissance des objets dans les
images
Reconnaissance faciale
Exemples d’application
30
Données d’entrainement
Les algorithmes d’apprentissage procèdent comme suit:
On fournit à l’algorithme des données d’entrainement
Données d’entrainement
Les algorithmes d’apprentissage procèdent comme suit:
On fournit à l’algorithme des données d’entrainement
Modèle
On note le « programme » généré par l’algorithme
d’apprentissage f(x)
on va aussi appeler f(x) un modèle
Ensemble de test
On utilise un ensemble de test Dtest pour mesurer la
performance de généralisation de notre modèle f(x)
Les données
38
Variables
Variable Nom
Une valeur de
la variable Nom
Individus
Un individu
Les données – types des variables
41
Variables quantitatives :
mesurent des « quantités »
Exemples :
Le poids d’une voiture, en kg
Le temps de réalisation d’une tache en secondes
Le nombre de tâches réussites
On doit pouvoir dire :
La voiture verte a un poids supérieur ou inférieur à la voiture
rouge .
Le nombre de tâches réussites par le sujet A est inférieur au
nombre de tâches réussites par le sujet B.
Le fait que la variable soit numérique, n’implique pas nécessairement que ce
soit une variable quantitative
Les données – types des variables
42
Variables qualitatives:
mesurent juste des « états », des catégories.
Il n’y a pas d’échelle de valeurs
Exemples :
Oui ou non
Homme ou femme
Code postal
numéro de téléphone
Les données – types des variables
44
Apprentissage Supervisé
les données d’apprentissage sont accompagnées par les labels indiquant leurs
classes
D = {(x
(1) (1) (N) (N)
, y ), .. , (x , y )}
sortie désirée (cible ou « target ») est fournie explicitement par les données
il y a une cible à prédire
Exemples :
• Reconnaître les âges des personnes à
l’aide des exemples de photos
• Reconnaitre des caractères, à l’aide
d’un ensemble de paires (images, ..)
Types d’apprentissage
47
Apprentissage Supervisé
Classification: la cible est un indice de classe t (de type discret)
Exemple : reconnaissance de caractères
x : vecteur des intensités de tous les pixels de l’image
y : identité du caractère
Apprentissage Non-Supervisé
Le label de classe des données d’apprentissage n’est pas connu et le modèle doit
extraire de l’information uniquement à partir de la structure des entrées
Auto-supervisé :
Le modèle utilise des parties des données elles-mêmes comme "supervision" pour
prédire ou générer d'autres parties des données.
Exemple :
En NLP, un modèle comme BERT est entraîné à prédire un mot masqué dans une phrase (ex :
"Le chat mange un [MASK]"). Le modèle n’a pas de label externe pour cette tâche, il crée lui-
même la supervision en masquant un mot dans la phrase.
Dans le domaine de l'image, un modèle pourrait être entraîné à prédire la partie manquante
d'une image.
Types d’apprentissage
50
Apprentissage Semi-Supervisé
Types d’apprentissage
51
Transfer learning
Le transfert learning (ou apprentissage par transfert) est une technique où un
modèle préalablement entraîné sur une grande quantité de données dans une
tâche est réutilisé pour résoudre une tâche différente mais similaire.
L'idée est de réutiliser les connaissances acquises pour accélérer l'apprentissage
et améliorer les performances sur une nouvelle tâche avec moins de données.
Exercice
53
Non Supervisé