Erweiterungen des Deutschen Textarchivs
Digitale Forschungsdaten von Texten des späten 16. bis frühen 20. Jahrhunderts können über das Zentrum Sprache der BBAW veröffentlicht werden. Der Rahmen für die Veröffentlichung ist das Modul DTA-Erweiterungen (DTAE), d.h. die Daten werden Auf diese Weise können sie der wissenschaftlichen Nachnutzung in anderen Kontexten zur Verfügung gestellt und im Zusammenhang mit anderen Sprachkorpora des DTA auswertbar gemacht werden.
Voraussetzungen für die Aufnahme von Texten in das Modul DTAE
Aus inhaltlicher Sicht
Geeignete Ergänzungen des DTA stellen Primärquellen dar, die umfangreich rezipiert wurden, Schlüsseltexte innerhalb wichtiger Diskurse oder für einzelne Epochen darstellen oder auf andere Weise eine heutige wissenschaftliche Bearbeitung rechtfertigen.
Idealerweise sollten die Ergänzungen im Zeitraum vom späten 16. bis zum frühen 20. Jahrhunderts entstanden sein, wobei ein leichter Spielraum über diese zeitlichen Grenzen hinaus vorhanden ist.
Aus technischer Sicht:
Die den Texten zugrunde liegenden Bildquellen sollten in hoher Bildqualität und möglichst im unkomprimierten TIFF-Format verfügbar und weiterverwendbar sein. Der Annotation der Volltexte sollten das
DTA-Basisformat (DTABf) oder mit dem DTABf kompatible Richtlinien zugrunde liegen.
Das CLARIN-Zentrum der BBAW leistet Unterstützung bei der Planung und Durchführung von Digitalisierungsprojekten, insbesondere bei den folgenden Aufgaben:
- Bilddigitalisierung
Das DTA kooperiert mit verschiedenen Bibliotheken, deren Sammelschwerpunkte bei deutschen Drucken des 17. bis frühen 20. Jahrhunderts liegen. Für Digitalisierungsarbeiten kann ein Kontakt hergestellt werden.
- Erfassung der Metadaten
Sowohl bibliographische als auch spezifische Daten zum digitalen Faksimile sowie zur Texterfassung sind notwendig. Für die grundlegenden Metadaten zum Text stellt das DTA eine spezielles Formular zur komfortablen Erstellung eines basisformatkonformen TEI-Headers zur Verfügung.
- Volltextdigitalisierung
Das DTA kann die Digitalisierung von Texten entsprechend den DTA-Richtlinien übernehmen oder diesen Arbeitsschritt beratend unterstützen. Für die Texterfassung und Annotation bietet das DTA-Basisformat ausführlich beschriebene Richtlinien und Schemata. Ein Framework für den Author-Mode des oXygen-XML-Editors bietet zusätzliche Unterstützung bei der Transkriptions- und Annotationsarbeit unter Anwendung der DTA-Richtlinien.
DTAE-Checkliste
Folgende Informationen werden für die Veröffentlichung eines Textes im DTA erhoben:
Allgemeine Informationen zu den Dokumenten
- Kurzbeschreibung der Textauswahl
- Zeitraum der Texte
- Sprache
- Textsorte(n)/Genre
- Diskurs
- gedruckt/handschriftlich
- vollständig/in Auszügen
- Umfang
Allgemeines zum DTAE-Projekt
- Zeitrahmen des DTAE-Projekts
- Partner
- Webseite des Kooperationspartners
- Zeitrahmen des zugrundeliegenden Projekts
- Ansprechpartner/in
- Kontaktdaten
Volltext
- vorhanden j/n
- Ausgabe
- Metadaten vorhanden j/n
- Metadatenformat
- Erfassungsverfahren
- Digitalisierungsdienstleister
- Erfassungsqualität
- Erfassungsrichtlinien DTA-kompatibel?
- Abweichungen von den DTA-Erfassungsrichtlinien
- Textannotation mit XML?
- Regeln für die Textauszeichnung?
- Textannotation mit TEI?
- TEI-Dialekt
- Aufwand Überführung in das DTA-Basisformat
- Rechte
- Personenbezogene Daten vorhanden j/n
- Anonymisierung notwendig j/n
Bilder
- vorhanden j/n
- besitzende Bibliothek - Signatur
- Format
- Rechte
geplante Publikation
- Publikation durch den Projektpartner?
- Publikation in DTAE erwünscht & möglich?
- ggf. Unterschied zwischen beiden Publikationen
- statisches oder dynamisches Korpus?
- geplante Erweiterungsoptionen
Weiteres
- DTAE - vorgesehene Arbeiten
- Projektstatus
Aus diesen Informationen speisen sich auch die minimalen Metadaten eines digitalisierten Textes im DTA.