Portable Document Format
Portable Document Format
Disambiguazione – "PDF" rimanda qui. Se stai cercando altri significati, vedi PDF (disambigua).
Portable Document Format (abbreviato PDF) è un formato di file documentale sviluppato da Adobe.[1]
Evoluzione del Camelot Project di John Warnock, lo scopo del formato è quello di distribuire e scambiare
documenti mantenendo invariati font, immagini e layout in maniera indipendente dal software e
dall'hardware.
Storia
PDF viene sviluppato nel 1993 da Adobe come formato proprietario basato su PostScript.[2] Da allora è
oggetto di continui miglioramenti. Nel 2005 viene definito il formato derivato PDF/A, ottimizzato per
l'archiviazione e la preservazione a lungo termine dei documenti.[3]
Nel 2007 Adobe decide di trasformare PDF in un formato standard ISO,[4] intraprendendo un percorso
che porta nel luglio 2008 alla pubblicazione della norma ISO 32000,[5] basato sulla versione 1.7 della
specifica originale.[6] Il comitato ISO TC-171 ha successivamente prodotto una revisione del formato
PDF, riportata nella norma ISO 32000-2 e corrispondente a PDF 2.0.[7]
Descrizione
PDF è un formato aperto, nel senso che chiunque può creare applicazioni che leggano e scrivano file PDF
senza pagare i diritti (Royalty) ad Adobe. Adobe ha un numero elevato di brevetti relativamente al
formato PDF, ma le licenze associate non includono il pagamento di diritti per la creazione di programmi
associati.[8]
Un file PDF può descrivere documenti che contengono testo e/o immagini in qualsiasi risoluzione. Ogni
documento PDF contiene una completa descrizione del documento bidimensionale (e, con la comparsa di
Acrobat 3D, documenti 3D incorporati) composta da proprietà (Titolo, Autore, ecc.), testo, tipo di
carattere (font), immagini e oggetti di grafica vettoriale 2D che compongono il documento.
Il documento PDF non dovrebbe includere informazioni specifiche per software, hardware e sistema
operativo usato. Ciò permetterebbe al documento di venire visualizzato e renderizzato nella stessa esatta
maniera indipendentemente dalla piattaforma e/o dispositivo utilizzato per leggerlo. Anche questo fatto
ha contribuito a farlo diventare un formato standard de facto molto diffuso per la condivisione immediata
dei documenti. In realtà il PDF nella sua forma standard è un formato che non può essere considerato
compatibile con un processo di conservazione digitale (l'archiviazione digitale dei documenti al fine di
eliminare o ridurre l'uso della carta), in quanto non è in grado di garantire la riproducibilità a lungo
termine e neanche la conservazione dell'aspetto visivo. Questo aspetto dipende da vari fattori come, ad
esempio, il fatto che i file PDF standard non sono necessariamente auto-contenuti, ma possono presentare
dipendenze dai font utilizzati o da oggetti esterni al file stesso[9]. Pertanto, se si cerca di visualizzare
questi file su sistemi informatici diversi da quelli sui quali sono stati creati, non è garantita la loro
riproduzione in maniera coerente, da cui consegue che il loro utilizzo a lungo termine non è pensabile se
non associato ad uno standard preciso[10].
La stampa di documenti in formato .pdf può dare dei problemi se si usano dei caratteri locali (ad esempio
le vocali italiane accentate) e se chi stampa ha il proprio PC impostato su una lingua diversa.
Formato file
Un file PDF contiene caratteri ASCII a 7 bit, ad eccezione di alcuni elementi che possono avere contenuto
binario. Il file inizia con un'intestazione contenente un numero magico (come una stringa leggibile) e la
versione del formato, ad esempio %PDF-1.7. Il formato è un sottoinsieme di un formato COS
("Carousel" Object Structure). Un file albero COS consiste principalmente di oggetti , di cui esistono otto
tipi[11]:
Gli oggetti possono essere diretti (incorporati in un altro oggetto) o indiretti . Gli oggetti indiretti sono
numerati con un numero di oggetto e un numero di generazione e definiti tra le parole chiave obje
endobjse risiedono nella radice del documento. A partire dalla versione PDF 1.5, gli oggetti indiretti (ad
eccezione di altri flussi) possono anche essere posizionati in flussi speciali noti come flussi di oggetti
(contrassegnati /Type /ObjStm). Questa tecnica consente agli oggetti non flusso di applicare filtri di
flusso standard, riduce le dimensioni dei file che hanno un numero elevato di piccoli oggetti indiretti ed è
particolarmente utile per PDF con tag. I flussi di oggetti non supportano la specifica di un oggetto
numero di generazione (diverso da 0).
Una tabella indice, chiamata anche tabella dei riferimenti incrociati, si trova in genere vicino alla fine del
file e fornisce l'offset di byte di ogni oggetto indiretto dall'inizio del file[12]. Questo design consente un
accesso casuale efficiente agli oggetti nel file e consente anche di apportare piccole modifiche senza
riscrivere l'intero file ( aggiornamento incrementale ). Prima della versione PDF 1.5, la tabella sarebbe
sempre stata in uno speciale formato ASCII, sarebbe stata contrassegnata con la xrefparola chiave e
avrebbe seguito il corpo principale composto da oggetti indiretti. La versione 1.5 ha introdotto flussi di
riferimento incrociato opzionali, che hanno la forma di un oggetto stream standard, eventualmente con
filtri applicati. Tale flusso può essere utilizzato al posto della tabella dei riferimenti incrociati ASCII e
contiene gli offset e altre informazioni in formato binario. Il formato è flessibile in quanto consente la
specifica della larghezza intera (utilizzando /Warray), in modo che, ad esempio, un documento di
dimensioni non superiori a 64 KiB possa dedicare solo 2 byte per gli offset degli oggetti.
La parola chiave startxref seguita da un offset all'inizio della tabella dei riferimenti
incrociati (che inizia con la parola chiave xref) o l'oggetto flusso di riferimenti incrociati
L'indicatore di fine-file %%EOF .
Se non viene utilizzato un flusso di riferimenti incrociati, il piè di pagina è preceduto dalla parola chiave
trailerseguita da un dizionario contenente informazioni che altrimenti sarebbero contenute nel flusso
di riferimenti incrociati del dizionario dell'oggetto:
Un riferimento all'oggetto radice della struttura ad albero, noto anche come catalog ( /Root)
Il conteggio degli oggetti indiretti nella tabella dei riferimenti incrociati ( /Size)
Altre informazioni facoltative
Ci sono due layout per i file PDF: non lineare (non "ottimizzato") e lineare ("ottimizzato"). I file PDF non
lineari possono essere più piccoli delle loro controparti lineari, sebbene l'accesso sia più lento perché parti
dei dati necessari per assemblare le pagine del documento sono sparse in tutto il file PDF. I file PDF
lineari (chiamati anche file PDF "ottimizzati" o "ottimizzati per il Web") sono costruiti in modo da
consentirne la lettura in un plug-in del browser Web senza attendere il download dell'intero file, poiché
vengono generati in modo lineare (come nell'ordine delle pagine)[13]. I file PDF possono essere
ottimizzati utilizzando il software Adobe Acrobat o QPDF.
Il PDF eredita molte delle funzionalità del PostScript, un linguaggio di descrizione della pagina anch'esso
sviluppato da Adobe. Postscript permette di descrivere una pagina come il risultato di un'esecuzione di un
programma, che contiene istruzioni su come e dove disegnare linee, punti, lettere dell'alfabeto e altri
elementi grafici. In questo modo, ogni apparecchio capace di eseguire il programma (ossia, che abbia un
interprete Postscript), sarà in grado di riprodurre tale immagine al meglio delle sue capacità. Questo
processo, tuttavia, richiede grandi risorse da parte del terminale.
PDF, invece, è un formato, non un linguaggio di programmazione, e per questo motivo non ha bisogno di
essere interpretato (per i dettagli vedi Linguaggio compilato e Linguaggio interpretato). Per esempio, il
controllo di flusso esercitato dai comandi come if e loop è stato rimosso, mentre comandi grafici come
lineto rimangono.
Questo significa che il processo di creare o trasformare un PDF nella sua immagine grafica è
semplicemente dato dalla lettura delle descrizioni, invece che dall'esecuzione di un programma con
l'interprete PostScript. Tutte le funzionalità del PostScript come i caratteri, layout e misure rimangono
invariate.
Spesso il codice PDF è generato da un file sorgente PostScript. I comandi grafici che vengono generati
dal codice PostScript vengono raccolti così come tutti i file, risorse grafiche e riferimenti di caratteri nel
documento e, finalmente, tutto viene compresso in un singolo file.
Caratteristiche
Può contenere qualsiasi combinazione di testo, elementi multimediali come video o
audio[14], elementi ipertestuali come collegamenti e segnalibri, collegamenti e miniature di
pagine.
I file PDF non perdono la formattazione quando vengono inviati ad altri utenti, come nel
caso dell'invio di documenti di testo (pagine disordinate, paragrafi ingombranti, ecc.).
È uno dei formati più diffusi su Internet per lo scambio di documenti. Pertanto, è
ampiamente utilizzato da aziende, governi e istituzioni educative.
È una specifica aperta, per la quale sono stati adattati strumenti software commerciali come
Microsoft Office e WordPerfect Office suite e altri creati in software gratuito che consentono
di creare, visualizzare o modificare documenti in formato PDF, come Openoffice.org,
LibreOffice e Calligra Suite e il sistema di composizione del testo LaTeX.
Può essere crittografato per proteggere il suo contenuto e persino firmarlo digitalmente[15].
Un file PDF può essere creato da diverse applicazioni esportando il file, come
Openoffice.org e Microsoft Office (a partire dal 2007, se aggiornato a SP2)[16].
Può essere generato da qualsiasi applicazione installando una "stampante virtuale" nel
sistema operativo, in caso di utilizzo di applicazioni senza questa funzionalità integrata.
È lo standard ISO (ISO 19005-1: 2005) per i file del contenitore di documenti elettronici in
vista della loro conservazione a lungo termine[16].
I file PDF sono indipendenti dal dispositivo, quindi possono essere stampati su una
stampante ad aghi, a getto d'inchiostro, laser o microfilm. Per l'ottimizzazione della stampa,
durante la creazione del file PDF vengono impostate le opzioni appropriate.
È multipiattaforma, ovvero può essere presentato sui principali sistemi operativi (GNU /
Linux, MacOS, Unix, Windows ), senza modificare l'aspetto o la struttura del documento
originale.
La protezione di un documento PDF presenta una chiave di crittografia attualmente fino a 128 bit (tempo
fa era di 40 bit), e per il futuro non è escluso che possa aumentare in relazione all'aumento di potenza dei
calcolatori in grado di elaborare chiavi di accesso random a più di 128 bit.
La protezione crittografica dei PDF è molto debole, ed esistono numerosi programmi che riescono a
rompere la chiave in tempi strettissimi. La protezione password PDF è sconsigliata per salvaguardare
l'informazione al suo interno.
Metadati
I file PDF possono contenere due tipi di metadati[17]. Il primo è il Dizionario delle informazioni sul
documento, un insieme di campi chiave/valore come autore, titolo, oggetto, data di creazione e
aggiornamento. Questo è memorizzato nel trailer informativo opzionale del file. Viene definito un piccolo
insieme di campi e può essere esteso con valori di testo aggiuntivi, se necessario. Questo metodo è
deprecato in PDF 2.0.
In PDF 1.4, è stato aggiunto il supporto per Metadata Streams, utilizzando Extensible Metadata Platform
(XMP) per aggiungere metadati estensibili basati su standard XML utilizzati in altri formati di file. Ciò
consente di allegare metadati a qualsiasi flusso nel documento, come le informazioni sulle illustrazioni
incorporate, così come l'intero documento (allegando al catalogo del documento), utilizzando uno schema
estensibile.
Annotazione
Adobe Acrobat è un esempio di software proprietario che consente all'utente di annotare, evidenziare e
aggiungere note a file PDF già creati. Un'applicazione UNIX disponibile come software gratuito (sotto la
GNU General Public License) è PDFedit. Il freeware Foxit Reader, disponibile per Microsoft Windows,
macOS e Linux, consente di annotare i documenti. Il visualizzatore PDF-XChange di Tracker Software
consente annotazioni senza restrizioni nella sua alternativa freeware. PDF-XChange Viewer di Tracker
Software, visualizzatore PDF integrato, abilita anche le annotazioni così come il software open source
Skim, con quest'ultimo che supporta l'interazione con LaTeX, SyncTeX e PDFSync e l'integrazione con il
software di gestione dei riferimenti BibDesk. Il freeware Qiqqa può creare un rapporto di annotazione che
riassume tutte le annotazioni che l'utente ha fatto nella sua libreria di PDF. Lo strumento di verifica del
testo esporta le differenze nei documenti come annotazioni e markup.
Esistono anche sistemi di annotazione web che supportano l'annotazione in pdf e altri formati di
documenti. Nei casi in cui ci si aspetta che i PDF abbiano tutte le funzionalità dei documenti cartacei, è
necessaria l'annotazione dell'inchiostro.
Moduli
Moduli interattivi è un meccanismo per aggiungere moduli al formato di file PDF. Attualmente esso
supporta due diversi metodi per l'integrazione di dati e moduli PDF[19][20][21][22]. Entrambi i formati oggi
coesistono nella specifica PDF:
AcroForms può mantenere i valori dei campi del modulo in file indipendenti esterni contenenti coppie
chiave: valore. I file esterni possono utilizzare file Forms Data Format (FDF) e XML Forms Data Format
(XFDF). Le firme dei diritti di utilizzo (UR) definiscono i diritti per importare i file di dati del modulo nei
formati FDF, XFDF e di testo (CSV / TSV) e esportare i file di dati del modulo nei formati FDF e
XFDF[27].
In PDF 1.5, Adobe Systems ha introdotto un formato proprietario per i moduli; Adobe XML Forms
Architecture (XFA). I moduli Adobe XFA non sono compatibili con la funzione AcroForms di ISO 32000
e la maggior parte dei processori PDF non gestisce il contenuto XFA. La specifica XFA è referenziata da
ISO 32000-1 / PDF 1.7 come specifica proprietaria esterna ed è stata completamente deprecata da PDF
con ISO 32000-2 (PDF 2.0).
Livelli
È possibile visualizzare, navigare e stampare contenuto su
più livelli nei PDF creati da software come InDesign,
Illustrator, Photoshop, Gimp, Inkscape, AutoCAD[28].
Effetto sfoglia-pagina
L'effetto sfoglia-pagina (o "flipbook") dei PDF (online e Effetto flipbook
Utilizzi
Adobe e Microsoft hanno stretto una partnership in modo da rendere interoperabili i prodotti Acrobat e
Microsoft 365, permettendo la conversione di documenti Word in PDF.[37]
SEO
Lo stesso argomento in dettaglio: Ottimizzazione per i motori di ricerca.
L'ottimizzazione dei documenti in formato PDF prevede alcuni
interventi al momento della creazione del file. Gli elementi più
importanti da compilare correttamente ai fini del posizionamento
sulle SERP di un documento PDF sono:
Alternative
XPS
A partire da Windows Vista, Microsoft ha introdotto un formato concorrente, denominato Open XML
Paper Specification, meno popolare e diffuso anche per la mancanza di supporto in ambiente macOS e sui
dispositivi mobili.[38][39]
WWF
Nel 2010 la sezione tedesca del WWF ha promosso un formato di file alternativo
denominato WWF.[40][41] Il software per la creazione dei file WWF, disponibile per
Windows XP e Mac OS X 10.4[40], produce un file PDF con estensione .wwf a cui è
stata inibita la possibilità di stampare il documento[42], tramite DRM incorporato in
Adobe Reader[43]. Nonostante la realizzazione di un software equivalente open
source, l'iniziativa è stata criticata sia dal movimento per la diffusione del software
Icona del
libero[42][44], sia dalla stessa WWF che ha evidenziato come la campagna fosse stata
formato WWF
diffusa da una sezione locale senza previa consultazione dell'organizzazione[41].
Note
1. ^ Cos’è un PDF? Formato PDF, su Adobe Acrobat, Adobe. URL consultato il 28 agosto 2023.
2. (EN) RFC 3778 — The application/pdf Media Type, su datatracker.ietf.org, Internet
Engineering Task Force.
3. ^ (EN) ISO 19005 (PDF/A) , su pdfa.org, PDF Association. URL consultato il 13 dicembre 2023.
4. ^ Adobe vuole trasformare il PDF in uno standard ISO, su macitynet.it, 2007 (archiviato dall'url
originale l'11 marzo 2007);
PDF cerca la benedizione di ISO, su punto-informatico.it, 2007.
5. ^ (EN) ISO Ballot for PDF 1.7 Passed!, su blogs.adobe.com, dicembre 2007;
(EN) PDF format becomes ISO standard, su iso.org, 2 luglio 2008. URL consultato il 30 gennaio
2017 (archiviato dall'url originale il 3 marzo 2016).
6. ^ (EN) Bill Ray, ISO certifies Adobe's PDF, su The Register, 3 luglio 2008.
7. ^ (EN) RFC 8118 — The application/pdf Media Type, su datatracker.ietf.org, Internet
Engineering Task Force.
8. ^ (EN) Legal notices for developers, su adobe.com (archiviato dall'url originale il 27 febbraio 2016).
9. ^ (EN) How to embed fonts in a PDF document – PDF Studio Knowledge Base, su
kbpdfstudio.qoppa.com. URL consultato il 2 febbraio 2021.
10. Copia archiviata (PDF), su iter.it. URL consultato il 25 marzo 2010 (archiviato dall'url originale il 1º giugno
2010). iged.it online 02 2010 - pag. 11
11. ^ Adobe Systems, PDF Reference, p. 51.
12. ^ Adobe Systems, PDF Reference, pp. 39–40.
13. ^ Adobe Developer Connection: PDF Reference and Adobe Extensions to the PDF
Specification, su adobe.com, Adobe Systems. URL consultato il 13 dicembre 2010.
14. ^ Aggiungere audio, video e oggetti interattivi ai file PDF in Adobe Acrobat, su
helpx.adobe.com. URL consultato il 31 gennaio 2021.
15. ^ Firmare i PDF in Adobe Acrobat Reader., su helpx.adobe.com. URL consultato il 31 gennaio
2021.
16. support.microsoft.com, https://support.microsoft.com/en-us/help/953195. URL consultato il 18
maggio 2020.
17. ^ Adobe PDF reference version 1.7 (https://www.adobe.com/devnet/acrobat/pdfs/pdf_refere
nce_1-7.pdf), section 10.2
18. ^ Getting Familiar with Adobe Reader > Understanding Preferences, su adobepress.com.
URL consultato il 22 aprile 2009.
19. ^ Adobe Systems Incorporated, Document Management – Portable Document Format – Part
1: PDF 1.7, First Edition (PDF), 1º luglio 2008. URL consultato il 19 febbraio 2010.
20. ^ Gnu PDF – PDF Knowledge – Forms Data Format, su gnupdf.org. URL consultato il 19
febbraio 2010 (archiviato dall'url originale il 1º gennaio 2013).
21. ^ About PDF forms, su livedocs.adobe.com. URL consultato il 19 febbraio 2010 (archiviato dall'url
originale il 29 aprile 2011).
22. ^ Peter Demling, Convert XFA Form to AcroForm?, su forums.adobe.com, 1º luglio 2008.
URL consultato il 19 febbraio 2010.
23. ^ Migrating from Adobe Acrobat forms to XML forms, su partners.adobe.com. URL consultato il
22 febbraio 2010 (archiviato dall'url originale il 6 ottobre 2010).
24. ^ Adobe Systems Incorporated, Document Management – Portable Document Format – Part
1: PDF 1.7, First Edition (PDF), 1º luglio 2008. URL consultato il 19 febbraio 2010.
25. ^ XML Forms Data Format Specification, version 2 (PDF), September 2007. URL consultato il 19
febbraio 2010 (archiviato dall'url originale il 30 luglio 2018).
26. ^ ISO 19444-1:2019(en), su iso.org. URL consultato il 3 dicembre 2020.
27. ^ Adobe Systems Incorporated, Document Management – Portable Document Format – Part
1: PDF 1.7, First Edition (PDF), 1º luglio 2008. URL consultato il 19 febbraio 2010.
28. ^ Livelli PDF, Adobe Acrobat, su helpx.adobe.com. URL consultato il 31 gennaio 2021.
29. ^ Free Adobe Flipbook Maker for PDF Magazines and Brochures | Flipbuilder.com, su
flipbuilder.com. URL consultato il 31 gennaio 2021.
30. ^ iged.it online 02 2010 (PDF), su iter.it. URL consultato il 25 marzo 2010 (archiviato dall'url originale il
1º giugno 2010).pag. 18
31. ^ Visualizzazione di modelli 3D nei file PDF, Adobe Acrobat, su helpx.adobe.com. URL
consultato il 31 gennaio 2021.
32. ^ Misurazione di oggetti 3D nei file PDF, su helpx.adobe.com. URL consultato il 31 gennaio 2021.
33. ^ (EN) Sharing blender models as interactive 3D PDF files, su Blender Artists Community, 14
aprile 2010. URL consultato il 31 gennaio 2021.
34. ^ (EN) Adobe products, su Adobe. URL consultato il 28 agosto 2023.
35. ^ Manuale utente di Anteprima, su Supporto Apple, Apple. URL consultato il 28 agosto 2023.
36. Scarica un lettore PDF libero!, su PDFreaders.org, Free Software Foundation. URL consultato il
28 agosto 2023.
37. ^ Integrazione Microsoft con Adobe, su adobe.com, Adobe. URL consultato il 28 agosto 2023.
38. ^ (EN) What Is an XPS File and Why Does Windows Want Me to Print to One?, su How-To
Geek, 15 aprile 2013.
39. ^ (EN) Easy steps for converting an XPS file to PDF, su Adobe Acrobat, Adobe.
40. (EN) Save as WWF, Save a Tree, su saveaswwf.com (archiviato dall'url originale il 6 luglio 2014).
41. (EN) Simon Nias, WWF Germany's 'saveaswwf' PDF anti-printing campaign exposes internal
rifts, su printweek.com, 17 dicembre 2010. URL consultato il 28 dicembre 2010 (archiviato dall'url
originale il 19 dicembre 2010).
42. (EN) World Wildlife Fund .wwf format cracked!, su The Beez' speaks.., 4 dicembre 2010. URL
consultato il 28 dicembre 2010.
43. ^ (EN) Create Adobe PDF Online, su Adobe. URL consultato il 28 dicembre 2010 (archiviato dall'url
originale il 28 luglio 2009).
44. ^ (FR) Objet : demande d’entretien suite au lancement de votre campagne « Save as WWF,
Save a Tree » (PDF), su april.org, 13 dicembre 2010.
Bibliografia
(EN) Adobe Systems Incorporated, Portable Document Format Reference Manual (PDF),
Addison-Wesley, giugno 1993, ISBN 0–201–62628–4. URL consultato il 28 agosto 2023.
(EN) Adobe Systems Incorporated, PDF Reference (PDF), 3ª ed., Addison-Wesley, 2001,
ISBN 0-201-75839-3. URL consultato il 28 agosto 2023.
Voci correlate
PDFreaders.org
U3D
PDF/A
PDFCreator
PDF.js
PDF-XChange Viewer
PdfSam
Altri progetti
Wikizionario contiene il lemma di dizionario «PDF»
Wikimedia Commons (https://commons.wikimedia.org/wiki/?uselang=it) contiene
immagini o altri file sul Portable Document Format (https://commons.wikimedia.org/wik
i/Category:Portable_Document_Format?uselang=it)
Collegamenti esterni
Estratto da "https://it.wikipedia.org/w/index.php?title=Portable_Document_Format&oldid=143551035"