Histogramme des dégradés orientés: Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés en vision par ordinateur
Par Fouad Sabry
()
À propos de ce livre électronique
Qu'est-ce que l'histogramme des dégradés orientés
Dans les domaines de la vision par ordinateur et du traitement d'images, l'histogramme des gradients orientés (HOG) est un descripteur de caractéristiques utilisé à cette fin. de détection d'objets. Cette technique est utilisée pour compter le nombre d'instances d'orientation de gradient qui se produisent dans des régions spécifiques d'une image. Cette technique est comparable aux histogrammes d'orientation des bords, aux descripteurs de transformation de caractéristiques invariantes à l'échelle et aux contextes de forme ; cependant, elle diffère de ces méthodes dans la mesure où elle est calculée sur une grille dense de cellules régulièrement espacées et utilise une normalisation de contraste locale qui se chevauche dans le but d'atteindre un niveau de précision plus élevé.
Comment allez-vous procéder ? avantage
(I) Informations et validations sur les sujets suivants :
Chapitre 1 : Histogramme des gradients orientés
Chapitre 2 : Détection des contours
Chapitre 3 : Transformation de fonctionnalités invariantes à l'échelle
Chapitre 4 : Fonctionnalités robustes accélérées
Chapitre 5 : GLOH
Chapitre 6 : Modèles binaires locaux
Chapitre 7 : Orienté RAPIDEMENT et rotation BRIEF
Chapitre 8 : Boosting (apprentissage automatique)
Chapitre 9 : Segmentation d'images
Chapitre 10 : Détection d'objets
(II) Répondre aux principales questions du public sur l'histogramme des gradients orientés.
(III) Exemples concrets d'utilisation de l'histogramme des gradients orientés dans de nombreux domaines .
À qui s'adresse ce livre
Les professionnels, les étudiants du premier cycle et des cycles supérieurs, les passionnés, les amateurs et ceux qui souhaitent aller au-delà des connaissances ou des informations de base pour tout type d'histogramme de dégradés orientés.
En savoir plus sur Fouad Sabry
Technologies Émergentes En Optoélectronique [French]
Lié à Histogramme des dégradés orientés
Titres dans cette série (100)
Vision par ordinateur: Explorer les profondeurs de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationBanque de filtres: Aperçu des techniques de banque de filtres de Computer Vision Évaluation : 0 sur 5 étoiles0 évaluationPeinture: Combler les lacunes de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRétinex: Dévoiler les secrets de la vision informatique avec Retinex Évaluation : 0 sur 5 étoiles0 évaluationRéduction de bruit: Amélioration de la clarté et techniques avancées de réduction du bruit en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHistogramme d'image: Dévoilement d'informations visuelles, exploration des profondeurs des histogrammes d'images en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationConsensus sur un échantillon aléatoire: Estimation robuste en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationEspace colorimétrique: Explorer le spectre de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision par ordinateur sous-marine: Explorer les profondeurs de la vision par ordinateur sous les vagues Évaluation : 0 sur 5 étoiles0 évaluationCorrection gamma: Améliorer la clarté visuelle en vision par ordinateur : la technique de correction gamma Évaluation : 0 sur 5 étoiles0 évaluationModèle du système visuel humain: Comprendre la perception et le traitement Évaluation : 0 sur 5 étoiles0 évaluationPerception visuelle: Aperçu du traitement visuel informatique Évaluation : 0 sur 5 étoiles0 évaluationHomographie: Homographie : transformations en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCartographie des tons: Cartographie des tons : perspectives éclairantes en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation affine: Libérer des perspectives visuelles : explorer la transformation affine en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationProfil de couleur: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation de Hough: Dévoiler la magie de la transformation de Hough en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation du radon: Dévoiler des modèles cachés dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationDiffusion anisotrope: Améliorer l'analyse d'images grâce à la diffusion anisotrope Évaluation : 0 sur 5 étoiles0 évaluationMoindres carrés: Techniques d'optimisation pour la vision par ordinateur : méthodes des moindres carrés Évaluation : 0 sur 5 étoiles0 évaluationÉgalisation d'histogramme: Amélioration du contraste de l'image pour une perception visuelle améliorée Évaluation : 0 sur 5 étoiles0 évaluationCompression d'images: Techniques efficaces pour l'optimisation des données visuelles Évaluation : 0 sur 5 étoiles0 évaluationChamp aléatoire de Markov: Explorer la puissance des champs aléatoires de Markov en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationSystème de gestion des couleurs: Optimiser la perception visuelle dans les environnements numériques Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de bord Canny: Dévoiler l'art de la perception visuelle Évaluation : 0 sur 5 étoiles0 évaluationMatrice fondamentale de la vision par ordinateur: S'il vous plaît, suggérez un sous-titre pour un livre intitulé « Matrice fondamentale de la vision par ordinateur » dans le domaine de la « Vision par ordinateur ». Le sous-titre suggéré ne doit pas contenir de ':'. Évaluation : 0 sur 5 étoiles0 évaluationEstimation de la pose du corps articulé: Déverrouiller le mouvement humain dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTransformation Hadamard: Dévoilement de la puissance de la transformation Hadamard en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationGroupe mixte d'experts en photographie: Libérer la puissance des données visuelles avec la norme JPEG Évaluation : 0 sur 5 étoiles0 évaluation
Livres électroniques liés
Segmentation d'images: Libérer des informations grâce à Pixel Precision Évaluation : 0 sur 5 étoiles0 évaluationCoupes de graphiques de vision par ordinateur: Explorer les coupes graphiques en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationÉgalisation d'histogramme: Amélioration du contraste de l'image pour une perception visuelle améliorée Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de bord Canny: Dévoiler l'art de la perception visuelle Évaluation : 0 sur 5 étoiles0 évaluationDétection des bords: Explorer les limites de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationHistogramme d'image: Dévoilement d'informations visuelles, exploration des profondeurs des histogrammes d'images en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétection de gouttes: Dévoiler des modèles dans les données visuelles Évaluation : 0 sur 5 étoiles0 évaluationModèle d'apparence active: Libérer la puissance des modèles d’apparence active dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRendu de ligne de balayage: Explorer le réalisme visuel grâce aux techniques de rendu Scanline Évaluation : 0 sur 5 étoiles0 évaluationVoir la synthèse: Explorer les perspectives de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCartographie des couleurs: Explorer la perception et l'analyse visuelles en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationRendu volumique: Explorer le réalisme visuel dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationInfographie du sommet: Explorer l'intersection de l'infographie Vertex et de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationCartographie des tons: Cartographie des tons : perspectives éclairantes en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationTraitement d'image pyramidale: Explorer les profondeurs de l'analyse visuelle Évaluation : 0 sur 5 étoiles0 évaluationReconstruction tridimensionnelle multi-vues: Techniques avancées de perception spatiale en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationGraphique raster numérique: Dévoilement de la puissance des graphiques raster numériques dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationEspace à l'échelle: Explorer les dimensions en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationVision stéréo par ordinateur: Explorer la perception de la profondeur dans la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationContour actif: Faire progresser la vision par ordinateur grâce aux techniques de contour actif Évaluation : 0 sur 5 étoiles0 évaluationDétecteur de coin Harris: Dévoiler la magie de la détection des caractéristiques de l'image Évaluation : 0 sur 5 étoiles0 évaluationIllumination globale: Faire progresser la vision : aperçus de l’éclairage mondial Évaluation : 0 sur 5 étoiles0 évaluationInfographie Polygone: Explorer l'intersection de l'infographie polygonale et de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationGraphiques raster: Comprendre les fondements des graphiques raster en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationDétermination des surfaces cachées: Dévoiler les secrets de la vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationMatrice fondamentale de la vision par ordinateur: S'il vous plaît, suggérez un sous-titre pour un livre intitulé « Matrice fondamentale de la vision par ordinateur » dans le domaine de la « Vision par ordinateur ». Le sous-titre suggéré ne doit pas contenir de ':'. Évaluation : 0 sur 5 étoiles0 évaluationEstimation du mouvement: Avancées et applications en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationModèle de caméra sténopé: Comprendre la perspective grâce à l'optique informatique Évaluation : 0 sur 5 étoiles0 évaluation
Intelligence (IA) et sémantique pour vous
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux Évaluation : 5 sur 5 étoiles5/5Comment réussir sur Instagram en utilisant ChatGPT: Le guide ultime pour créer du contenu percutant avec ChatGPT Évaluation : 5 sur 5 étoiles5/5Maîtrisez ChatGPT : Du débutant à l'expert - Guide pratique pour exploiter la puissance de l'IA conversationnelle Évaluation : 5 sur 5 étoiles5/5Comment écrire des livres en utilisant ChatGPT: Votre guide ultime pour écrire des livres avec ChatGPT Évaluation : 0 sur 5 étoiles0 évaluationMaîtriser ChatGPT : Libérez la puissance de l'IA pour améliorer la communication et les relations: French Évaluation : 0 sur 5 étoiles0 évaluationMonétisation ChatGPT : Exploitez la Puissance de l'IA: ChatGPT Évaluation : 0 sur 5 étoiles0 évaluationLa spiritualité et l'intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluationMaîtrisez ChatGPT en 24 Heures: Apprenez à Utiliser ChatGPT en Seulement 24 Heures et Appliquez ses Avantages dans Tous les Aspects de Votre Vie Évaluation : 0 sur 5 étoiles0 évaluationChat GPT : Comment ça fonctionne et comment gagner avec l'utilisation de la technologie d'Intelligence Artificielle Évaluation : 0 sur 5 étoiles0 évaluationComment Réussir sur Facebook en utilisant ChatGPT: Le pouvoir de ChatGPT : découvrez comment il peut transformer votre stratégie sur Facebook Évaluation : 0 sur 5 étoiles0 évaluationGuide définitive pour créer des TikToks avec ChatGPT: Devenez le prochain influenceur sur TikTok avec l'aide de ChatGPT ! Évaluation : 0 sur 5 étoiles0 évaluationHistoire et évolution de l'Intelligence Artificielle Évaluation : 5 sur 5 étoiles5/5Travailler dans le Big Data - les 6 métiers vers lesquels s'orienter Évaluation : 5 sur 5 étoiles5/5Intelligence artificielle: la quatrième révolution industrielle Évaluation : 0 sur 5 étoiles0 évaluationDessin technique: Libérer la perception visuelle dans le dessin technique Évaluation : 0 sur 5 étoiles0 évaluationModélisation géométrique: Explorer la modélisation géométrique en vision par ordinateur Évaluation : 0 sur 5 étoiles0 évaluationIA dans les Affaires: Guide Pratique de l'Utilisation de l'Intelligence Artificielle dans Divers Secteurs Évaluation : 0 sur 5 étoiles0 évaluationLe Futur Dévoilé : Comment l’Intelligence Artificielle Réinvente notre Monde Évaluation : 0 sur 5 étoiles0 évaluationLimites, dangers et menaces de l'Intelligence Artificielle: Un outil sans maîtrises Évaluation : 0 sur 5 étoiles0 évaluationRévolution Quantique : Le Pouvoir Invisible qui Redéfinit l'Innovation Évaluation : 0 sur 5 étoiles0 évaluationHorizon Quantique : L'Odyssée des Ordinateurs Portables du Futur Évaluation : 0 sur 5 étoiles0 évaluationQuand les machines apprennent: L'IA et la transformation de la société Évaluation : 0 sur 5 étoiles0 évaluationLa guerre électronique et l'intelligence artificielle Évaluation : 0 sur 5 étoiles0 évaluationCybersécurité 2.0 : Les Failles du Futur et Comment les Déjouer Évaluation : 0 sur 5 étoiles0 évaluationÉthique des Machines : Un Voyage au Cœur de l'Intelligence Artificielle Responsable Évaluation : 0 sur 5 étoiles0 évaluationChatGPT et l'IA : Guide Pratique et Théorique Évaluation : 0 sur 5 étoiles0 évaluationCopywriting - livre à main Évaluation : 0 sur 5 étoiles0 évaluationL'art de la création d'images avec l'IA : Techniques, applications et défis éthiques Évaluation : 0 sur 5 étoiles0 évaluationRichesse Automatique : Révolutionnez Vos Revenus avec l’Intelligence Artificielle Évaluation : 0 sur 5 étoiles0 évaluation
Avis sur Histogramme des dégradés orientés
0 notation0 avis
Aperçu du livre
Histogramme des dégradés orientés - Fouad Sabry
Histogramme des dégradés orientés
Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés dans la vision par ordinateur
Fouad Sabry est l'ancien responsable régional du développement commercial pour les applications chez Hewlett Packard pour l'Europe du Sud, le Moyen-Orient et l'Afrique. Fouad est titulaire d'un baccalauréat ès sciences des systèmes informatiques et du contrôle automatique, d'une double maîtrise, d'une maîtrise en administration des affaires et d'une maîtrise en gestion des technologies de l'information, de l'Université de Melbourne en Australie. Fouad a plus de 25 ans d'expérience dans les technologies de l'information et de la communication, travaillant dans des entreprises locales, régionales et internationales, telles que Vodafone et des machines professionnelles internationales. Actuellement, Fouad est un entrepreneur, auteur, futuriste, axé sur les technologies émergentes et les solutions industrielles, et fondateur de l'initiative One Billion Knowledge.
Un milliard de connaissances
Histogramme des dégradés orientés
Dévoilement du domaine visuel : exploration de l'histogramme des dégradés orientés dans la vision par ordinateur
Fouad Sabry
Copyright
Histogramme © des dégradés orientés 2024 par Fouad Sabry. Tous droits réservés.
Aucune partie de ce livre ne peut être reproduite sous quelque forme que ce soit ou par quelque moyen électronique ou mécanique que ce soit, y compris les systèmes de stockage et de récupération d'informations, sans l'autorisation écrite de l'auteur. La seule exception est celle d'un critique, qui peut citer de courts extraits dans une critique.
Couverture dessinée par Fouad Sabry.
Bien que toutes les précautions aient été prises dans la préparation de ce livre, les auteurs et les éditeurs n'assument aucune responsabilité pour les erreurs ou omissions, ou pour les dommages résultant de l'utilisation des informations contenues dans le présent document.
Table des matières
Chapitre 1 : Histogramme des dégradés orientés
Chapitre 2 : Détection des contours
Chapitre 3 : Transformation d'une entité invariante à l'échelle
Chapitre 4 : Accélération des fonctionnalités robustes
Chapitre 5 : GLOH
Chapitre 6 : Modèles binaires locaux
Chapitre 7 : Orienté VITE et tourné BRIEF
Chapitre 8 : Boosting (apprentissage automatique)
Chapitre 9 : Segmentation d'images
Chapitre 10 : Détection d'objets
Appendice
À propos de l'auteur
Chapitre 1 : Histogramme des dégradés orientés
En vision par ordinateur et en traitement d'image, l'histogramme des gradients orientés (HOG) est un descripteur de caractéristique utilisé pour la détection d'objets. Cette méthode utilise la direction des gradients dans des régions discrètes d'une image pour comptabiliser leurs occurrences. Par rapport aux histogrammes d'orientation des bords, aux descripteurs de transformation de caractéristiques invariants à l'échelle et aux contextes de forme, cette technique est plus précise car elle est calculée sur une grille dense de cellules uniformément espacées et utilise la normalisation du contraste local qui se chevauche.
Les idées de HOG ont été esquissées pour la première fois en 1986 par Robert K. McConnell de Wayland Research Inc. sans le surnom de HOG. Cependant, ce n'est qu'en 2005, lorsque les chercheurs Navneet Dalal et Bill Triggs de l'Institut national de recherche en informatique et en automatique (INRIA) ont présenté leurs travaux supplémentaires sur les descripteurs HOG lors de la Conférence sur la vision par ordinateur et la reconnaissance des formes qu'ils ont été largement adoptés (CVPR). Ils se sont d'abord concentrés sur la détection des piétons dans les photos fixes, mais ont ensuite élargi leurs tests pour inclure la détection de personnes dans la vidéo ainsi que la détection d'un large éventail d'animaux et de véhicules courants dans les photographies.
L'histogramme du descripteur de dégradés dirigés est basé sur l'idée que l'apparence et la forme des objets au niveau local à l'intérieur d'une image peuvent être représentées par la distribution des gradients d'intensité ou des directions des bords. Un histogramme de directions de dégradé est construit pour chaque pixel de l'image en le décomposant en petites sections connectées appelées cellules. La combinaison de ces histogrammes en une seule mesure sert de description. Les histogrammes locaux peuvent être normalisés par contraste pour augmenter la précision en calculant d'abord une mesure d'intensité sur une plus grande partie de l'image (un bloc), puis en utilisant cette valeur pour normaliser toutes les cellules à l'intérieur du bloc. Le résultat de cette standardisation est une résistance accrue aux taches claires et sombres.
Plusieurs avantages significatifs distinguent la description HOG de ses concurrents. Puisqu'il n'affecte que les cellules voisines, il reste inchangé par les changements d'échelle ou d'éclairage, à l'exception de la rotation. Ce n'est que dans les grandes zones géographiques que nous verrions ce genre de changements. De plus, Dalal et Triggs ont constaté que tant que les piétons gardent leur corps dans une position presque verticale, leur mouvement peut être ignoré grâce à un échantillonnage spatial grossier, à un échantillonnage d'orientation fine et à une forte normalisation photométrique locale. C'est pourquoi le descripteur HOG excelle dans la recherche de personnes dans les images.
Dans de nombreux détecteurs de caractéristiques, la normalisation des valeurs de couleur et de gamma est l'étape initiale du calcul du prétraitement de l'image. Dans le calcul du descripteur HOG, cependant, Dalal et Triggs soutiennent que cette étape n'est pas nécessaire car la normalisation ultérieure du descripteur atteint le même objectif. Par conséquent, le prétraitement des images n'a qu'un effet négligeable sur les performances. Au lieu de cela, le calcul des valeurs de gradient vient en premier. L'application du masque de dérivée discrète ponctuelle centrée en 1 dimension dans la direction horizontale ou verticale est la méthode la plus courante. Pour que cette technique fonctionne, les données de couleur ou d'intensité de l'image doivent être filtrées à l'aide des noyaux suivants :
{\displaystyle [-1,0,1]{\text{ and }}[-1,0,1]^{\top }.\,}Bien que Dalal et Triggs aient utilisé des masques plus sophistiqués comme le masque Sobel 3x3 et les masques en diagonale, ils ont constaté qu'ils étaient moins efficaces pour identifier les personnes sur les photos. Ils ont également essayé d'utiliser un lissage gaussien avant d'appliquer le masque dérivé, mais ont constaté qu'aucun lissage ne produisait de meilleurs résultats.
Les histogrammes de cellules sont générés en tant que deuxième étape du processus.
Chaque pixel de la cellule utilise les valeurs de dégradé pour voter en fonction d'un groupe de l'histogramme basé sur l'orientation.
Les cellules elles-mêmes peuvent prendre une configuration carrée ou circulaire, et les canaux de l'histogramme s'étendent sur une distance uniforme de 0 à 180 degrés ou de 0 à 360 degrés, selon que le dégradé est « non signé » ou « signé ».
Les meilleurs résultats dans les essais de détection humaine par Dalal et Triggs ont été obtenus lorsque des gradients non signés ont été combinés avec 9 canaux d'histogramme, tout en soulignant que les gradients signés améliorent considérablement la reconnaissance des objets pour d'autres catégories, de la même manière que les automobiles et les motos.
En ce qui concerne l'importance de chaque vote, les pixels peuvent contribuer soit à l'amplitude du dégradé, soit à une échelle ou à une fonction de la taille.
Dans les tests, les meilleurs résultats sont généralement obtenus