Aller au contenu

PDF/A-1

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 3 juillet 2020 à 12:23 et modifiée en dernier par Yannick56 (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
PDF/Archive
Caractéristiques
Extension
.pdf
Type MIME
application/pdf
PUID
fmt/95 (1a), fmt/354 (1b), fmt/476 (2a), fmt/477 (2b), fmt/478 (2u), fmt/479 (3a), fmt/480 (3b), fmt/481 (3u)
Développé par
Version initiale
le 1 octobre 2005, il y a 19 ans
Type de format
Langage de description de page pour documents bureautiques
Basé sur
Norme
ISO 19005
Site web

PDF/A-1 est une version standardisée ISO du Portable Document Format, ou PDF, un format propriétaire documenté mis au point par la société Adobe Systems. Son usage est très répandu pour conserver et échanger des documents numériques.

Le principal avantage de ce format est que les fichiers au format PDF/A-1 sont fidèles aux documents originaux : les polices, les images, les objets graphiques et la mise en forme du fichier source sont préservés, quelles que soient l'application et la plate-forme utilisées pour le créer.

Standards

ISO 19005 – Gestion documentaire – format de fichier de document électronique pour la conservation à long terme (PDF/A)
ISO 19005 – Document management – Electronic document file format for long-term preservation (PDF/A)
Abbréviation Sous-titre Publié le Standard Basé sur Ref.
PDF/A-1 Partie 1 : Utilisation du PDF 1.4
Part 1: Use of PDF 1.4
2005-09-28 ISO 19005-1 PDF 1.4 (Adobe Systems, PDF Reference, third edition) [1]
PDF/A-2 Partie 2 : utilisation de l'ISO 32000-1
Part 2: Use of ISO 32000-1
2011-06-20 ISO 19005-2 PDF 1.7 (ISO 32000-1:2008) [2]
PDF/A-3 Partie 3 : utilisation de l'ISO 32000-1 avec support de fichiers incorporés
Part 3: Use of ISO 32000-1 with support for embedded files
2012-10-15 ISO 19005-3 PDF 1.7 (ISO 32000-1:2008) [3]
PDF/A-4 Partie 4 : Utilisation de ISO 32000-2 (Aperçu)
Part 4: Use of ISO 32000-2 (Preview)
? ISO 19005-4 ? [4]

Description

La spécification PDF/A-1 a été publiée par l'ISO et elle est utilisée par les organismes de normalisation du monde entier pour garantir la sécurité et la fiabilité de la diffusion et des échanges de documents électroniques. Les sphères publique et privée ont massivement adopté ce format pour simplifier les échanges de document.

Le format PDF/A-1 optimise l’indépendance matérielle et logicielle ainsi que l’auto-documentation. Le contenu de la norme ISO 19005-1 est très complet. Il comprend la définition du format PDF/A-1, mais aussi la façon de développer un outil de visualisation de fichier conforme à ce format. Cela garantit ainsi la possibilité future de toujours disposer d'un outil de visualisation. La norme ISO 19005 contient également le document « PDF - Manuel de référence », qui, à lui seul, comprend presque 1 000 pages.

Toutefois, l'intégralité du format PDF dans la version 1.7 a été normalisée par l'ISO en juillet 2008 sous la référence ISO 32000. Une révision de la norme 19005-1 a vu le jour en 2011 via la publication de la norme ISO 19005-2 (PDF/A-2). Une troisième révision a été publiée en via la publication de la norme ISO 19005-3 (PDF/A-3).

La norme PDF/A ne définit pas une stratégie d'archivage ou les objectifs d'un système d'archivage. Il identifie un "profil" pour les documents électroniques qui garantit que les documents peuvent être reproduits exactement de la même manière en utilisant divers logiciels dans les années à venir. Un élément clé de cette reproductibilité est l'exigence que les documents PDF/A soient 100% autonomes. Toutes les informations nécessaires pour afficher le document de la même manière sont intégrées dans le fichier. Cela inclut, mais sans s'y limiter, tout le contenu (texte, images tramées (raster) et graphiques vectoriels), les polices et les informations concernant la couleur. Un document PDF/A n'est pas autorisé à dépendre d'informations provenant de sources externes (par exemple, des programmes de polices et des flux de données), mais peut inclure des annotations (par exemple des liens hypertextes) qui renvoient à des documents externes.La norme PDF/A ne définit pas une stratégie d'archivage ou les objectifs d'un système d'archivage. Il identifie un "profil" pour les documents électroniques qui garantit que les documents peuvent être reproduits exactement de la même manière en utilisant divers logiciels dans les années à venir. Un élément clé de cette reproductibilité est l'exigence que les documents PDF/A soient 100% autonomes. Toutes les informations nécessaires pour afficher le document de la même manière sont intégrées dans le fichier. Cela inclut, mais sans s'y limiter, tout le contenu (texte, images tramées (raster) et graphiques vectoriels), les polices et les informations concernant la couleur. Un document PDF/A n'est pas autorisé à dépendre d'informations provenant de sources externes (par exemple, des programmes de polices et des flux de données), mais peut inclure des annotations (par exemple des liens hypertextes) qui renvoient à des documents externes.[5]

Les autres éléments clés de la conformité au PDF/A incluent: [6][7][8]

  • Les contenus audio et vidéo dans le document sont interdits.
  • Les lancements de fichiers JavaScript et d'exécutables sont interdits.
  • Toutes les polices (de caractères) doivent être intégrées au fichier du document et doivent pouvoir être intégrées légalement aussi pour un rendu universel et non limité. Cela s'applique aussi aux polices dites PostScript standard telles que Times ou Helvetica.
  • Les espaces de couleur spécifiés de manière indépendante du périphérique.
  • Le chiffrement du document est interdit.
  • L'utilisation de métadonnées normalisées est requise.
  • Les références de contenu externes au document sont interdites.
  • L’algorithme de compression de données Lempel-Ziv-Welch(LZW) est interdit en raison de contraintes de propriété intellectuelle. Les modèles de compression d'image au format JPEG 2000 ne sont pas autorisés dans la norme PDF/A-1 (basée sur PDF 1.4) parce qu'il a été introduit pour la première fois dans PDF 1.5. La compression au format JPEG 2000 est autorisée dans les normes PDF/A-2 et PDF/A-3.
  • Les objets et calques transparents (groupes de contenu facultatifs) sont interdits dans la norme PDF/A-1, mais sont autorisés dans la norme PDF/A-2.
  • Les dispositions relatives aux signatures numériques conformément à la norme PAdES (PDF Advanced Electronic Signatures) sont prises en charge à partir de PDF/A-2.
  • Les fichiers tiers (comme des documents bureautiques MS Word, MS Excel, etc ...) intégrés dans un document PDF sont interdits dans la norme PDF/A-1, mais la norme PDF/A-2 permet l'incorporation uniquement de fichiers à la norme PDF/A, facilitant l'archivage d'ensembles de documents PDF/A dans un seul fichier. PDF/ A-3 permet d'incorporer n'importe quel format de fichier tel que XML, documents de DAO/CAO et autres dans des documents à la norme PDF/A.
  • L'utilisation de formulaires basés sur XML comme XML Forms Architecture (XFA) est interdite dans la norme PDF/A. (Les données de formulaire XFA peuvent être conservées dans un fichier PDF/A-2 en passant de la clé XFA à l'arborescence Noms (Names) qui est elle-même la valeur de la clé XFAResources du dictionnaire Noms (Names) du dictionnaire de catalogue de documents.)
  • Les champs de formulaire PDF interactif doivent avoir un dictionnaire d'apparence (appearance dictionary) associé aux données du champ. Le dictionnaire d'apparence doit être utilisé lors du rendu du champ.

Niveaux de conformité et versions

PDF/A-1

La partie 1 de la norme a été publié pour la première fois le 28 September 2005, celle-ci est basée sur PDF 1.4[1] et spécifie deux niveaux de conformité pour les fichiers PDF:[9]

  • PDF/A-1a – Conformité de niveau A (niveau avec accessibilité pour mal-voyant ou aveugle (accessible))
  • PDF/A-1b – Conformité de niveau B (niveau de base (basic))

La conformité au niveau B exige uniquement que les normes nécessaires à la reproduction fiable de l'apparence visuelle d'un document soient suivies, tandis que la conformité au niveau A comprend toutes les exigences du niveau B et en plus des fonctionnalités destinées à améliorer l'accessibilité d'un document.

Exigences supplémentaires pour le niveau A:

  • Spécification de langue
  • Structure de document hiérarchique
  • Étendues de texte balisées et texte descriptif pour les images et les symboles
  • Mappages de caractères utilisant Unicode

La conformité de niveau A visait à accroître l'accessibilité des fichiers conformes pour les utilisateurs handicapés physiques en permettant aux logiciels d'assistance, tels que des lecteur d'écran, d'extraire et d'interpréter plus précisément le contenu d'un fichier.[9] Une norme ultérieure, en:PDF/UA, a été développée pour éliminer ce qui est devenu et a été considéré comme certaines des lacunes de PDF/A, en remplaçant bon nombre de ses directives générales par des spécifications techniques plus détaillées.[10]

PDF/A-2

La partie 2 de la norme, publiée le [2], traite de certaines des nouvelles fonctionnalités ajoutées avec les versions 1.5, 1.6 et 1.7 de la norme ou référence du format de fichier PDF. Les fichiers PDF/A-1 ne seront pas nécessairement conformes à la norme PDF/A-2, et les fichiers conformes PDF/A-2 ne seront pas nécessairement conformes à la norme PDF/A-1.

La partie 2 de la norme PDF/A est basée sur PDF 1.7 (ISO 32000-1), plutôt que PDF 1.4 et offre un certain nombre de nouvelles fonctionnalités:

  • compression de données pour les images au format JPEG 2000
  • prise en charge des effets de transparence et des calques (couches superposées)
  • incorporation de polices de caractères OpenType
  • dispositions relatives aux signatures numériques conformément aux signatures électroniques avancées dans PDF (PDF Advanced Electronic Signatures – norme PAdES)
  • l'option d'intégration de fichiers à la norme PDF/A pour faciliter l'archivage d'ensembles de documents avec un seul fichier[7].

La partie 2 définit trois niveaux de conformité. PDF/A-2a et PDF/A-2b correspondent aux niveaux de conformité a et b dans la norme PDF/A-1. Un nouveau niveau de conformité, PDF/A-2u, représente la conformité de niveau B (PDF/A-2b) avec l'exigence supplémentaire que tout le texte du document ait un mappage Unicode[9],[11].

PDF/A-3

La partie 3 de la norme, publiée le [3], diffère de PDF/A-2 sur un seul point: il permet l'incorporation de formats de fichiers arbitraires (tels que XML, CSV, CAD, documents de traitement de texte, documents de tableurs, et d'autres) dans des documents conformes à la norme PDF/A[12].

PDF/A-4

La partie 4 de la norme, basée sur PDF 2.0, devrait être publié vers la mi-2020.[13]

Les restrictions

C'est donc une version restreinte du format PDF, tout comme le format PDF/X.

Les restrictions comportent :

  • la non-inclusion d’objet dynamique de type audiogramme ou vidéogramme ;
  • l’interdiction du lancement de code script ou de fichiers exécutables ;
  • l’inclusion de toutes les polices de caractères et leur utilisation sans contrainte légale et d’affichage ;
  • la palette des couleurs utilisée doit être spécifiée de manière indépendante ;
  • l’interdiction du chiffrement ;
  • l’utilisation de méta-données standard est obligatoire.

Les variantes

Il y a deux variantes de PDF/A-1 :

  • PDF/A-1a représente la forme complète de la norme ISO ;
  • PDF/A-1b représente une forme allégée de la norme ISO. Cette version préserve la lisibilité du document et sa bonne présentation à l'affichage et à l'impression.

Les principales utilisations

Ce que la norme ne dit pas

La norme ISO 19005 n'indique pas comment sécuriser le document, ni comment le sauvegarder sur un support physique. Ces considérations sont en dehors du périmètre de cette norme, de même que la question de la fiabilité juridique à terme des documents produits en PDF/A-1.

L'extension d'un fichier au format PDF/A-1 est « .pdf ».

Génération et vérification de la conformité d’un fichier

Il existe plusieurs produits qui permettent de générer des fichiers conformes au format PDF/A-1, notamment, des suites bureautiques libres comme OpenOffice.org[14] ou LibreOffice. Il existe aussi des outils sous licence propriétaire qui permettent de contrôler voire de réparer les fichiers.

Il est possible de vérifier la conformité d'un fichier avec la norme PDF/A grâce à des outils en ligne[15].

Sources

Sources diverses. Cet article est extrait du volet technique du référentiel général d'interopérabilité (RGI) qui préconise l'emploi du format PDF/A-1 pour la conservation des documents bureautiques statiques.

Références

  1. a et b « ISO 19005-1:2005 », sur ISO (consulté le )
  2. a et b « ISO 19005-2:2011 », sur ISO (consulté le )
  3. a et b « ISO 19005-3:2012 », sur ISO (consulté le )
  4. « ISO 19005-3:2012 », sur ISO (consulté le )
  5. Alexandra Oettler, « The technical side of the PDF/A standard » [archive du ], sur PDF Association, (consulté le )
  6. « PDF/A – A Look at the Technical Side » [archive du ] (consulté le )
  7. a et b « PDF/A-2 Standard Published by ISO! The New Standard Includes Great Technical Enhancements. », (consulté le ) Erreur de référence : Balise <ref> incorrecte : le nom « pdfa2-press » est défini plusieurs fois avec des contenus différents.
  8. « {{{1}}} »
  9. a b et c « Improved PDF/A-1b » [archive du ], sur PDF Association, (consulté le )
  10. Alexandra Oettler, « PDF/A and the other PDF standards » [archive du ], sur PDF Association, (consulté le )
  11. (en) « PDF/A-2, PDF for Long-term Preservation, Use of ISO 32000-1 (PDF 1.7) », sur loc.gov (consulté le )
  12. « PDF Association Arranges Its First Seminar on PDF/A to Include Standards 1 to 3 » [archive du ], sur PDF Association,
  13. PDF/A-4 and the other new PDF standards (PDF Association)
  14. Depuis la version 2.4 publiée en mars 2008.
  15. « http://www.datalogics.com/products/callas/callaspdfA-onlinedemo.asp »(Archive.orgWikiwixArchive.isGoogleQue faire ?)

Voir aussi

Articles connexes

Liens externes