IdentifiantMot de passe
Loading...
Mot de passe oubli� ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les r�ponses en temps r�el, voter pour les messages, poser vos propres questions et recevoir la newsletter

MFC Discussion :

probl�me d'encoding UTF-8 via la SDK MSXML


Sujet :

MFC

Vue hybride

Message pr�c�dent Message pr�c�dent   Message suivant Message suivant
  1. #1
    Membre �clair�
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    731
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 731
    Par d�faut probl�me d'encoding UTF-8 via la SDK MSXML
    Pour sauvegarder des fichiers de type xml, j'ai une m�thode qui utilise un Writer MSXML4.0 et j'ai des pbs avec le processing instruction :

    Lorsque je code :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
     
          MSXML2::IMXWriterPtr writer(__uuidof(MXXMLWriter40));
          ...
          writer->put_encoding (L"UTF-8");
    le processing instruction de mon fichier xml est le suivant :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    <?xml version="1.0" standalone="no"?>
    Si je fais :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
     
          writer->put_encoding (L"UTF-16");
    J'ai le r�sultat :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
     
    <?xml version="1.0" encoding="UTF-16" standalone="no"?>
    Et enfin, si j'ai :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
     
          writer->put_encoding (L"UTF-32");
    J'ai le r�sultat :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
     
    <?xml version="1.0" encoding="UTF-16" standalone="no"?>
    J'ai m�me essay� d'encoder en codepage 8859-1, m�me r�sultat, j'ai en r�sultat un encoding UTF-16 dans mon fichier xml de retour.
    Assez original comme r�sultat, j'ai soit de l'UTF-16, soit rien du tout.
    J'ai fait le tour de msdn, je n'ai rien trouv� ; si quelqu'un a une id�e d'o� peut venir le pb, je l'en remercie beaucoup.

  2. #2
    Expert �minent
    Avatar de M�dinoc
    Homme Profil pro
    D�veloppeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 397
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 41
    Localisation : France

    Informations professionnelles :
    Activit� : D�veloppeur informatique
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 397
    Par d�faut
    Le XML est en UTF-8 par d�faut. Pour le UTF-32, je ne sais pas si c'est suppos� marcher.

    Edite ton fichier XML g�n�r� avec UTF-8 � l'aide d'un �diteur Hexa ou d'un vieux notepad: Si, en t�te du fichier, tu as trois caract�res/octets en plus, alors c'est bon, le fichier est bien en UTF-8 et signal� comme tel.
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parl� avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  3. #3
    Membre �clair�
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    731
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 731
    Par d�faut
    Je ne vois pas les 3 octets suppl�mentaires.
    Si j'�tais en UTF-8, un caract�re de type "�" serait encod� en cons�quent et ne paraitrait pas comme tel mais sur 2 octets ?

  4. #4
    Expert �minent
    Avatar de M�dinoc
    Homme Profil pro
    D�veloppeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 397
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 41
    Localisation : France

    Informations professionnelles :
    Activit� : D�veloppeur informatique
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 397
    Par d�faut
    En effet, en UTF-8, un � prend deux octets. (Un seul en Windows-1252")

    Si tu as un �diteur de texte moderne qui comprend l'UTF-8, tu verras le fichier directement converti en texte. C'est pourquoi je pr�conise l'�diteur hexa (ou un b�te programme C/C++ qui affiche en hexa les octets qu'il lit).
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parl� avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  5. #5
    Membre �clair�
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    731
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 731
    Par d�faut
    J'ai fait le test.
    Apr�s avoir sauvegard� mon fichier xml, j'ai fait un fonction qui le lit et j'ai bien le caract�re "�" sur un seul octet.
    Et m�me lorsque j'essaie d'ouvrir le fichier xml avec ie, il me dit qu'il est non valable � cause de ce caract�re.
    Ce qui est bizarre, c'est que le writer xml m'encode les <, >, &, ; (communs � tous les fichiers xml) mais ne m'encode pas les autres caract�res en fonction du codepage. Ce qui fait que le writer xml de MSXML permet d'enregistrer des fichiers xml non valides, ce qui est quand-m�me super-fort !!!
    Une autre suggestion stp ? Merci

  6. #6
    Expert �minent
    Avatar de M�dinoc
    Homme Profil pro
    D�veloppeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 397
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 41
    Localisation : France

    Informations professionnelles :
    Activit� : D�veloppeur informatique
    Secteur : High Tech - �diteur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 397
    Par d�faut
    Je viens de regarder dans la doc: on dirait bien que put_encoding demande une BSTR, et non juste un tableau de WCHARs...

    Tu as essay� avec une BSTR ? (SysAllocString() etc...)
    Et profites-en pour r�gler la propri�t� byteOrderMark, pour �tre s�r d'ins�rer les 3 caract�res au d�but...
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parl� avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  7. #7
    Membre �clair�
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    731
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 731
    Par d�faut
    J'ai fait le test avec un BSTR en param�tre, m�me r�sultat.
    Quant au put_byteOrderMark, je l'ai essay� � FALSE et � TRUE, toujours la m�me chose dans le fichier r�sultat. Snif !

Discussions similaires

  1. [DisplayTag] Probl�me d'encoding UTF-8 avec export
    Par Fr@ncky dans le forum Taglibs
    R�ponses: 19
    Dernier message: 04/06/2015, 08h48
  2. Probl�me Encoding UTF-8
    Par Dastiny dans le forum D�veloppement Web en Java
    R�ponses: 0
    Dernier message: 26/03/2014, 15h42
  3. XML Encoding UTF-8 probl�me de majuscule
    Par rj450 dans le forum C#
    R�ponses: 2
    Dernier message: 20/03/2013, 16h25
  4. [UTF 8] probl�me d'encoding
    Par nannous dans le forum Jasper
    R�ponses: 6
    Dernier message: 17/02/2009, 17h10
  5. R�ponses: 21
    Dernier message: 27/03/2008, 13h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo