Découvrez des millions d'e-books, de livres audio et bien plus encore avec un essai gratuit

À partir de $11.99/mois après l'essai. Annulez à tout moment.

Histogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur
Histogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur
Histogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur
Livre électronique116 pages1 heure

Histogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur

Évaluation : 0 sur 5 étoiles

()

Lire l'aperçu

À propos de ce livre électronique

Qu'est-ce que l'histogramme des dégradés orientés


Dans les domaines de la vision par ordinateur et du traitement d'images, l'histogramme des gradients orientés (HOG) est un descripteur de caractéristiques utilisé à cette fin. de détection d'objets. Cette technique est utilisée pour compter le nombre d'instances d'orientation de gradient qui se produisent dans des régions spécifiques d'une image. Cette technique est comparable aux histogrammes d'orientation des bords, aux descripteurs de transformation de caractéristiques invariantes à l'échelle et aux contextes de forme ; cependant, elle diffère de ces méthodes dans la mesure où elle est calculée sur une grille dense de cellules régulièrement espacées et utilise une normalisation de contraste locale qui se chevauche dans le but d'atteindre un niveau de précision plus élevé.


Comment allez-vous procéder ? avantage


(I) Informations et validations sur les sujets suivants :


Chapitre 1 : Histogramme des gradients orientés


Chapitre 2 : Détection des contours


Chapitre 3 : Transformation de fonctionnalités invariantes à l'échelle


Chapitre 4 : Fonctionnalités robustes accélérées


Chapitre 5 : GLOH


Chapitre 6 : Modèles binaires locaux


Chapitre 7 : Orienté RAPIDEMENT et rotation BRIEF


Chapitre 8 : Boosting (apprentissage automatique)


Chapitre 9 : Segmentation d'images


Chapitre 10 : Détection d'objets


(II) Répondre aux principales questions du public sur l'histogramme des gradients orientés.


(III) Exemples concrets d'utilisation de l'histogramme des gradients orientés dans de nombreux domaines .


À qui s'adresse ce livre


Les professionnels, les étudiants du premier cycle et des cycles supérieurs, les passionnés, les amateurs et ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type d'histogramme de dégradés orientés.


 


 

LangueFrançais
Date de sortie30 avr. 2024
Histogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur

En savoir plus sur Fouad Sabry

Auteurs associés

Lié à Histogramme des dégradés orientés

Titres dans cette série (100)

Voir plus

Livres électroniques liés

Intelligence (IA) et sémantique pour vous

Voir plus

Avis sur Histogramme des dégradés orientés

Évaluation : 0 sur 5 étoiles
0 évaluation

0 notation0 avis

Qu'avez-vous pensé ?

Appuyer pour évaluer

L'avis doit comporter au moins 10 mots

    Aperçu du livre

    Histogramme des dégradés orientés - Fouad Sabry

    Histogramme des dégradés orientés

    Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés dans la vision par ordinateur

    Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.

    Un milliard de connaissances

    Histogramme des dégradés orientés

    Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés dans la vision par ordinateur

    Fouad Sabry

    Copyright

    Histogramme © des dégradés orientés 2024 par Fouad Sabry. Tous droits réservés.

    Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.

    Couverture dessinée par Fouad Sabry.

    Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.

    Table des matières

    Chapitre 1 : Histogramme des dégradés orientés

    Chapitre 2 : Détection des contours

    Chapitre 3 : Transformation d'une entité invariante à l'échelle

    Chapitre 4 : Accélération des fonctionnalités robustes

    Chapitre 5 : GLOH

    Chapitre 6 : Modèles binaires locaux

    Chapitre 7 : Orienté VITE et tourné BRIEF

    Chapitre 8 : Boosting (apprentissage automatique)

    Chapitre 9 : Segmentation d'images

    Chapitre 10 : Détection d'objets

    Appendice

    À propos de l'auteur

    Chapitre 1 : Histogramme des dégradés orientés

    En vision par ordinateur et en traitement d'image, l'histogramme des gradients orientés (HOG) est un descripteur de caractéristique utilisé pour la détection d'objets. Cette méthode utilise la direction des gradients dans des régions discrètes d'une image pour comptabiliser leurs occurrences. Par rapport aux histogrammes d'orientation des bords, aux descripteurs de transformation de caractéristiques invariants à l'échelle et aux contextes de forme, cette technique est plus précise car elle est calculée sur une grille dense de cellules uniformément espacées et utilise la normalisation du contraste local qui se chevauche.

    Les idées de HOG ont été esquissées pour la première fois en 1986 par Robert K. McConnell de Wayland Research Inc. sans le surnom de HOG. Cependant, ce n'est qu'en 2005, lorsque les chercheurs Navneet Dalal et Bill Triggs de l'Institut national de recherche en informatique et en automatique (INRIA) ont présenté leurs travaux supplémentaires sur les descripteurs HOG lors de la Conférence sur la vision par ordinateur et la reconnaissance des formes qu'ils ont été largement adoptés (CVPR). Ils se sont d'abord concentrés sur la détection des piétons dans les photos fixes, mais ont ensuite élargi leurs tests pour inclure la détection de personnes dans la vidéo ainsi que la détection d'un large éventail d'animaux et de véhicules courants dans les photographies.

    L'histogramme du descripteur de dégradés dirigés est basé sur l'idée que l'apparence et la forme des objets au niveau local à l'intérieur d'une image peuvent être représentées par la distribution des gradients d'intensité ou des directions des bords. Un histogramme de directions de dégradé est construit pour chaque pixel de l'image en le décomposant en petites sections connectées appelées cellules. La combinaison de ces histogrammes en une seule mesure sert de description. Les histogrammes locaux peuvent être normalisés par contraste pour augmenter la précision en calculant d'abord une mesure d'intensité sur une plus grande partie de l'image (un bloc), puis en utilisant cette valeur pour normaliser toutes les cellules à l'intérieur du bloc. Le résultat de cette standardisation est une résistance accrue aux taches claires et sombres.

    Plusieurs avantages significatifs distinguent la description HOG de ses concurrents. Puisqu'il n'affecte que les cellules voisines, il reste inchangé par les changements d'échelle ou d'éclairage, à l'exception de la rotation. Ce n'est que dans les grandes zones géographiques que nous verrions ce genre de changements. De plus, Dalal et Triggs ont constaté que tant que les piétons gardent leur corps dans une position presque verticale, leur mouvement peut être ignoré grâce à un échantillonnage spatial grossier, à un échantillonnage d'orientation fine et à une forte normalisation photométrique locale. C'est pourquoi le descripteur HOG excelle dans la recherche de personnes dans les images.

    Dans de nombreux détecteurs de caractéristiques, la normalisation des valeurs de couleur et de gamma est l'étape initiale du calcul du prétraitement de l'image. Dans le calcul du descripteur HOG, cependant, Dalal et Triggs soutiennent que cette étape n'est pas nécessaire car la normalisation ultérieure du descripteur atteint le même objectif. Par conséquent, le prétraitement des images n'a qu'un effet négligeable sur les performances. Au lieu de cela, le calcul des valeurs de gradient vient en premier. L'application du masque de dérivée discrète ponctuelle centrée en 1 dimension dans la direction horizontale ou verticale est la méthode la plus courante. Pour que cette technique fonctionne, les données de couleur ou d'intensité de l'image doivent être filtrées à l'aide des noyaux suivants :

    {\displaystyle [-1,0,1]{\text{ and }}[-1,0,1]^{\top }.\,}

    Bien que Dalal et Triggs aient utilisé des masques plus sophistiqués comme le masque Sobel 3x3 et les masques en diagonale, ils ont constaté qu'ils étaient moins efficaces pour identifier les personnes sur les photos. Ils ont également essayé d'utiliser un lissage gaussien avant d'appliquer le masque dérivé, mais ont constaté qu'aucun lissage ne produisait de meilleurs résultats.

    Les histogrammes de cellules sont générés en tant que deuxième étape du processus.

    Chaque pixel de la cellule utilise les valeurs de dégradé pour voter en fonction d'un groupe de l'histogramme basé sur l'orientation.

    Les cellules elles-mêmes peuvent prendre une configuration carrée ou circulaire, et les canaux de l'histogramme s'étendent sur une distance uniforme de 0 à 180 degrés ou de 0 à 360 degrés, selon que le dégradé est « non signé » ou « signé ».

    Les meilleurs résultats dans les essais de détection humaine par Dalal et Triggs ont été obtenus lorsque des gradients non signés ont été combinés avec 9 canaux d'histogramme, tout en soulignant que les gradients signés améliorent considérablement la reconnaissance des objets pour d'autres catégories, de la même manière que les automobiles et les motos.

    En ce qui concerne l'importance de chaque vote, les pixels peuvent contribuer soit à l'amplitude du dégradé, soit à une échelle ou à une fonction de la taille.

    Dans les tests, les meilleurs résultats sont généralement obtenus

    Vous aimez cet aperçu ?
    Page 1 sur 1