Hier werden alle Artikel gelistet, in denen vermutlich eine gemäß den Datumskonventionen falsch formatierte Datumsangabe vorliegt. Abgearbeitete Artikel bitte einfach aus der Liste entfernen.
Es ist leider nicht möglich, Angaben wie 03.01.1941
, 3.1.1941
oder 1941-01-03
automatisch ins Format 3. Januar 1941
zu bringen, weil es zu viele Ausnahmen gibt (zum Beispiel Versionsnummern, Titel, Datumsangaben in Zitaten, siehe Ausschlussliste).
Darüber hinaus werden Spezialseiten zum Finden falsch verlinkter Jahrzehnte angegeben.
Die Grundlage dieser Liste ist der aktuelle auf dumps.wikimedia.org bereitgestellte Dump der deutschsprachigen Wikipedia (dewiki), der etwa alle zwei Wochen aktualisiert wird.
Ein kleines Perl-Skript von Koerpertraining bestimmt darin alle Artikel, die vermutlich ein Datum der Form TT.MM.JJJJ
, TT.MM.JJ
, JJJJ-MM-TT
, 0T. Monat
oder ähnliches enthalten. Auch teilverlinkte Daten wie TT.MM.[[JJJJ]]
und [[TT. MM.]] [[JJJJ]]
werden erkannt. Dabei werden unter anderem ignoriert:
- Web-URLs; Bild- und Medien-Dateinamen (.jpg, .svg, .ogg usw.)
- Tabellenspalten und Vorlagenparameter, die mit einem Datum beginnen oder enden
- Bestimmte Parameter in einigen Vorlagen (z. B. in Vorlage:Internetquelle)
- auskommentierte Textpassagen und Einträge mit anschließendem „
<!-- sic
“ - Daten in der Nähe von Linux, Kernel, Mac OS X, DIN EN, CAS und ähnliche (vermutlich kein Datum)
- Daten in einigen konkreten Titeln, die sehr häufig auftreten wie beispielsweise Gemeinden 1994 und ihre Veränderungen seit 01.01.1948 in den neuen Ländern (in mehr als 600 Artikeln)
- sämtliche Stolpersteinlisten der Form Liste der Stolpersteine...
Wurden mehr als fünf Daten gefunden, werden nur die ersten fünf Daten ausgegeben und dahinter die Gesamtzahl der gefundenen Daten.
Neben dem Setzen auf die Ausschlussliste bietet sich manchmal auch die Verwendung von Vorlagen an, die vom Skript automatisch ignoriert werden:
- Zitat: Vorlage:Zitat, Vorlage:"
- Quellenangabe: Vorlage:Internetquelle, Vorlage:Literatur
- Allgemein: Vorlage:FormatDate
Grundlage der Liste ist der Dump vom 1. Juli 2021. Im Dump wurden 21.660 Lemmata mit falschen Datumsformaten gefunden. Nach Berücksichtigung der Ausschlussliste verblieben 14.072 Artikel.