Vrai négatif
Dans un test de classification binaire, un résultat est dit vrai négatif lorsqu'un échantillon est correctement déclaré comme négatif par le test.
On l'oppose aux notions de :
- vrai positif (échantillon correctement déclaré comme positif) ;
- faux positif (échantillon déclaré positif alors qu'il ne l'était pas) ;
- faux négatif (échantillon déclaré négatif alors qu'il était en réalité positif).
Ces notions peuvent être présentées sous forme d'une matrice de confusion[1] :
Cause cherchée (virus, alarme, etc) | Test positif | Test négatif |
---|---|---|
Absence | Faux positif | Vrai négatif |
Présence | Vrai positif | Faux négatif |
Utilisation
[modifier | modifier le code]Les vrais négatifs peuvent être définis dans tout type de classification ou test binaire, où une classe (par convention la classe négative) correspond à l'absence ou la non-pertinence d'un phénomène. Correctement prédire cette absence ou non-pertinence sur un échantillon produit un vrai négatif.
Par exemple,
- un filtre de spams produit un vrai négatif en laissant passer un courriel pertinent ;
- pour une alarme de maison, un vrai négatif correspond à ne pas se déclencher sans raison ;
- dans le cadre d'un test médical de recherche d'une bactérie, le résultat est un vrai négatif s'il indique à raison l'absence de ladite bactérie.
L'importance des vrais négatifs dépend du cadre d'application. Ainsi, certaines mesures comme la précision et le rappel ignorent totalement le taux de vrais négatifs. Cela est adapté quand découvrir les négatifs n'est pas intéressant, par exemple, en recherche documentaire, il est important de trouver des documents pertinents (vrais positifs) et évitant les faux positifs qui ajoutent du bruit aux résultats. En revanche, la capacité à trouver des documents non pertinents importe peu, puisque ces documents ne sont jamais présentés aux utilisateurs et utilisatrices. Dans d'autres applications, les vrais négatifs peuvent se révéler importants. Par exemple, dans les tests diagnostiques, les vrais négatifs permettent de confirmer l'absence d'une pathologie, et donc in fine d'éviter des traitements médicaux inutiles et couteux[2].
Mesures liées
[modifier | modifier le code]Les vrais négatifs sont utilisés pour calculer la spécificité d'un modèle[1], qui elle-même permet de tracer la courbe sensibilité/spécificité[3]. Ils sont aussi utilisés pour calculer l'exactitude (accuracy) d'un classificateur ou test binaire[4].
Voir aussi
[modifier | modifier le code]Références
[modifier | modifier le code]- (en) Chong Sun Hong et Tae Gyu Oh, « TPR-TNR plot for confusion matrix », Communications for Statistical Applications and Methods, vol. 28, no 2, , p. 161–169 (ISSN 2287-7843, DOI 10.29220/CSAM.2021.28.2.161, lire en ligne, consulté le )
- Zachary C. Lipton, Charles Elkan et Balakrishnan Naryanaswamy, « Optimal Thresholding of Classifiers to Maximize F1 Measure », dans Machine Learning and Knowledge Discovery in Databases, Springer Berlin Heidelberg, (ISBN 978-3-662-44850-2, lire en ligne), p. 225–239
- (en) Wiley StatsRef: Statistics Reference Online, Wiley, (ISBN 978-1-118-44511-2, DOI 10.1002/9781118445112.stat05255, lire en ligne)
- (en) Blasé Gambino, « Reflections on Accuracy », Journal of Gambling Studies, vol. 22, no 4, , p. 393–404 (ISSN 1573-3602, DOI 10.1007/s10899-006-9025-5, lire en ligne, consulté le )