Perceptron
Le perceptron est un algorithme d'apprentissage supervisé de classifieurs binaires (c'est-à-dire séparant deux classes). Il a été inventé en 1957 par Frank Rosenblatt au laboratoire d'aéronautique de l'université Cornell. C'est un modèle inspiré des théories cognitives de Friedrich Hayek et de Donald Hebb. Il s'agit d'un neurone formel muni d'une règle d'apprentissage qui permet de déterminer automatiquement les poids synaptiques de manière à séparer un problème d'apprentissage supervisé. Si le problème est linéairement séparable, un théorème assure que la règle du perceptron permet de trouver une séparatrice entre les deux classes.
Définition
Le perceptron peut être vu comme le type de réseau de neurones le plus simple. C'est un classifieur linéaire. Ce type de réseau neuronal ne contient aucun cycle (il s'agit d'un réseau de neurones à propagation avant). Dans sa version simplifiée, le perceptron est mono-couche et n'a qu'une seule sortie à laquelle toutes les entrées sont connectées et les entrées et la sortie sont booléennes. Plus généralement, les entrées peuvent être des nombres réels.
Un perceptron à n entrées et à une seule sortie o est défini par la donnée de n poids (ou coefficients synaptiques) et un biais (ou seuil) par[1]:
La sortie o résulte alors de l'application de la fonction de Heaviside au potentiel post-synaptique , avec:
Cette fonction non linéaire est appelée fonction d'activation. Une alternative couramment employée est , la tangente hyperbolique.
Règle de Hebb
La règle de Hebb, établie par Donald Hebb[2], est une règle d'apprentissage des réseaux de neurones artificiels dans le contexte de l'étude d'assemblées de neurones.
Cette règle suggère que lorsque deux neurones sont excités conjointement, il se crée ou renforce un lien les unissant.
Dans le cas d'un neurone artificiel seul utilisant la fonction signe comme fonction d'activation cela signifie que :
où représente le poids corrigé et représente le pas d'apprentissage.
Cette règle n'est malheureusement pas applicable dans certains cas bien que la solution existe.
Règle d'apprentissage du perceptron
Le perceptron de Frank Rosenblatt est très proche de la règle de Hebb, la grande différence étant qu'il tient compte de l'erreur observée en sortie.
Cette fonction est recommandée lorsque la tangente hyperbolique (tanh) est utilisée comme fonction d'activation.
= le poids corrigé
= sortie attendue
= sortie observée
= le taux d'apprentissage
= l'entrée du poids pour la sortie attendue
= le poids actuel
Notes et références
- Le Perceptron, dans Marc Tommasi , Apprentissage automatique : les réseaux de neurones, cours à l'université de Lille 3
- Donald Olding HEBB, The Organization of Behavior, New York, Wiley & Sons, 1949
Voir aussi
Bibliographie
- F. Rosenblatt (1958), The perceptron: a probabilistic model for information storage and organization in the brain,
- - repris dans J.A. Anderson & E. Rosenfeld (1988), Neurocomputing. Foundations of Research, MIT Press