-
Parsing Page HTML
Salut,
Je cherche � lire une page html et r�cup�rer un contenu de celle ci. Par exemple, je dois pouvoir afficher dans une message box : Salut tous le monde ! qui se trouve dans la page : dpaste.de/ho9t2/
D'apr�s ce que j'ai lu : il est possible de fetcher la page et utiliser les expressions r�guliers pour tomber sur le texte qu'on veut r�cup�rer ou bien utiliser libcurl pour �a. Ou bien une m�thode plus �l�gante est de tirer part de la DOM mais c'est plus utilis� dans les languages Web : PHP, JavaScript mais pas trop le C++. Aussi, il est possible de convertir la page en XML apr�s do some clean up et utiliser par la suite une librarie pour parser l'XML.
Merci de me guider.
PS : Je tourne sur Windows 7 x86 avec Visual C++ 2012 ( Win32API) sans MFC/ATL.
-
La page est "l�-bas sur internet", libcurl te permettra facilement de la r�cup�rer en local.
Il faut alors la lire et extraire la partie utile.
L'id�e est d'avoir un parseur d'HTML: un moteur DOM est un bon exemple.