IdentifiantMot de passe
Loading...
Mot de passe oubli� ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les r�ponses en temps r�el, voter pour les messages, poser vos propres questions et recevoir la newsletter

Boost C++ Discussion :

BOOST :: REGEX et UNICODE


Sujet :

Boost C++

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    35
    D�tails du profil
    Informations personnelles :
    �ge : 42
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 35
    Par d�faut BOOST :: REGEX et UNICODE
    Bonjour � tous,

    Alors la question du jour, je dis �a parce que je commence � �tre abonn� sur ce forum (3 questions en moins d'une semaine..), non sans d�conner, l'instant est grave.

    Ma question est la suivante :

    Comment fait-on pour faire un motif qui sera capable � la fois de trouv� des caract�res accentu�s en cp1252, utf-8 ainsi que tous les autres charset ?

    Car en fait, si l'on met les caract�res accentu�s directement dans la regex, ils ne trouverons que ceux encod�s dans le m�me charset que celui utilis� pour faire le motif (j'ai test� ).

    Donc deuxi�me question :

    Es-ce que l'emploi de <boost/regex/icu.hpp> me permettra d'utilser des motifs tels que \X ou \p{L} afin de trouv� les caract�res accentu�s dans des fichiers encod�s avec des charsets diff�rents.

    S'il vous pla�t, si quelqu'un pourrait m'�clairer un peu sur la question parce que la je crack

  2. #2
    Expert confirm�

    Inscrit en
    Novembre 2005
    Messages
    5 145
    D�tails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Par d�faut
    La technique normale est de tout transformer en un charset fixe en interne (disons Unicode), de ne manipuler que cela jusqu'a la sortie ou on utilise le charset qu'il faut.

    Une alternative est de transcoder ta regexp dans le charset qui va bien avant de l'utiliser.

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    35
    D�tails du profil
    Informations personnelles :
    �ge : 42
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 35
    Par d�faut
    C'est vraiment lourd, ces histoires de charset..

    Alors, �a a l'air vraiment fastidieux et en plus je n'ai pas beaucoup de temps
    C'est hallucinant, tout ce passait bien dans mon d�veloppement, jusqu'� ce que je doive esquiver tout les commentaires /* blabla */ des fichiers C que je parse.
    Je m'�tais dit c'est cool je vais avancer dans le fichier tant que c'est du commentaire et faire le traitement sur le code qui suit et ainsi de suite mais c'�tait sans compter sur les mecs qui mettent des �,�,�,�,ect.. dans leur commentaire.. Parce que, lorsque l'on fait une regex du style :
    les accents ne sont pas prits en compte..

    Donc, en fait ce que tu me conseil de faire c'est de d�tecter quel charset est utilis� par le fichier � parser, de convertir ma regex qui contiendra les accents en ce m�me charset, pour enfin, pouvoir effectuer une comparaison.

    Ok je vais essayer de voir comment on fait �a.

  4. #4
    R�dacteur/Mod�rateur
    Avatar de JolyLoic
    Homme Profil pro
    D�veloppeur informatique
    Inscrit en
    Ao�t 2004
    Messages
    5 463
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 51
    Localisation : France, Yvelines (�le de France)

    Informations professionnelles :
    Activit� : D�veloppeur informatique
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : Ao�t 2004
    Messages : 5 463
    Par d�faut
    J'ai d�plac� la discussion sur l'utilisation des accents dans un code source vers :
    http://www.developpez.net/forums/d68...e/#post3976813
    Ma session aux Microsoft TechDays 2013 : D�velopper en natif avec C++11.
    Celle des Microsoft TechDays 2014 : Bonnes pratiques pour apprivoiser le C++11 avec Visual C++
    Et celle des Microsoft TechDays 2015 : Visual C++ 2015 : voyage � la d�couverte d'un nouveau monde
    Je donne des formations au C++ en entreprise, n'h�sitez pas � me contacter.

Discussions similaires

  1. BOOST :: REGEX PATTERN IMPOSSIBLE ?
    Par Jah77 dans le forum Boost
    R�ponses: 2
    Dernier message: 26/01/2009, 14h50
  2. BOOST :: REGEX INSERTION
    Par Jah77 dans le forum Boost
    R�ponses: 2
    Dernier message: 20/01/2009, 10h25
  3. [boost] Regex search : trouver l'index
    Par Choupi dans le forum Boost
    R�ponses: 4
    Dernier message: 03/12/2007, 11h17
  4. Configurer boost / regex.
    Par OrthoMaker dans le forum Boost
    R�ponses: 11
    Dernier message: 06/08/2007, 09h34

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo