Wikipedia:Onbereikbare externe links
Een groot probleem van externe links is dat ze niet permanent zijn. Deze pagina tracht een overzicht van mogelijke oplossingen te geven met instructies voor het oplossen van dode links.
Handmatige controle
[bewerken | brontekst bewerken]Probeer of de link het echt niet doet (daarbij een minimumtermijn van een week aanhouden ten opzichte van de vorige melding). Tijdelijke onbereikbaarheid is lastig maar is geen probleem op langere termijn. Fouten zoals 404 zijn niet van tijdelijke aard, een error 500 (of soortgelijk, zoals internal server error) kan dat wel zijn.
Als het geen tijdelijk probleem is, probeer dan niet-werkende (dode) links te herstellen (vervangen) door gebruik te maken van:
- Kijk of de pagina elders op de site te vinden is (via een zoekfunctie in de site of via Google met zoekwoord site:www.website.org). Vergelijk ook de structuur van het nieuwe adres met het oude, misschien is er regelmaat te ontdekken. Ook het overzicht van de inhoud op de website (sitemap) kan een nieuwe, werkende link opleveren.
- Zoek met Google op de titel of (een deel van de) locatie (URL) van de webpagina of het document. Dit kan mirrorsites van de oorspronkelijke site opleveren waarop het document wel beschikbaar is (archive.today-link is soms beschikbaar). Controleer of (een deel van) de tekst nergens anders te vinden is op het internet. Of zoek een andere bron die ongeveer dezelfde informatie bevat.
- Voor externe links in bronnen is het goed om te kijken of ze nog in het webarchief (https://web.archive.org), https://archive.today of het webarchief van bibalex.org (http://www.bibalex.org/isis/frontend/archive/archive_web.aspx, vaak sneller dan web.archive.org) terug te vinden zijn. Zonder meer verwijderen is in veel gevallen daardoor onnodig: er kan gelinkt worden naar de gearchiveerde versie. Het hulpmiddel Get Archive voor Firefox biedt een snelle manier om archive.org- en archive.today-links te vinden.
Kijk ook na of de link door vandalisme of slechte edits niet stukgemaakt is en in de geschiedenis een goede versie staat. Een veelvoorkomend probleem is het toevoegen van | aan het einde van de URL, terwijl die overbodig is.
Op en:Wikipedia:Dead_external_links staat er nog meer informatie.
Indien ze na een grondige zoektocht niet hersteld kunnen worden, ontlink de externe link dan. Het onderwerp van de link en de websitenaam kunnen behouden worden. Misschien werd gelinkt naar een gedrukt boek of artikel en kunt u in dat geval deze info vermelden als bron.
Archiefdiensten
[bewerken | brontekst bewerken]Archiefdiensten bewaren websites voor raadpleging nadat deze van het internet verdwenen zijn. Volgende archiefwebsites bestaan en worden aangeraden:
- The Internet Archive Wayback Machine: https://archive.org/ (biedt veel gearchiveerde pagina's)
- archive.today: https://archive.is/ (bestaat sinds 2012, biedt veel gearchiveerde pagina's)
- WebCite (of WebCitation): https://webcitation.org (biedt een beperkte set aan gearchiveerde pagina's)
Hulpmiddelen
[bewerken | brontekst bewerken]Mozilla Firefox
[bewerken | brontekst bewerken]- Link Investigator - controleer snel of (externe) links nog werken via kleurcodes
- Get Archive - links ophalen in het Internet Archive (CTRL+3) of Archive.is (CTRL+4)
- Snap Links Plus - uitbreiding voor Firefox om meerdere links tegelijk te openen (rechtermuisknop, slepen)
Google Chrome / Chromium
[bewerken | brontekst bewerken]- Linkclump - uitbreiding voor Chrome om meerdere links tegelijk te openen (shift+linkermuisknop, slepen)
Bots
[bewerken | brontekst bewerken]- Wikipedia:AutoWikiBrowser (o.a te gebruiken in combinatie met WikiList)
- Meer tools: https://www.mediawiki.org/wiki/Archived_Pages
Automatische controle: bots
[bewerken | brontekst bewerken]Gelukkig kan men tegenwoordig een bot (weblinkchecker.py) draaien om te controleren of externe links nog wel bereikbaar zijn. Links die tweemaal achtereen een foutmelding geven, zijn wellicht niet meer bereikbaar en de overlegpagina's met de botmeldingen zijn daarom opgenomen in Categorie:Wikipedia:Onbereikbare externe link. Pas echter op, niet alle foutmeldingen wijzen op onbereikbaarheid (bv. HTTP Error: HTTP/1.1 bad gateway). De derde controle moet dus handmatig gebeuren.
InternetArchiveBot heeft deze taak grotendeels overgenomen op de Nederlandstalige Wikipedia.
Handleiding bij controle van bots
[bewerken | brontekst bewerken]Regelmatig zijn er bots bezig om te kijken of er onbereikbare externe links zijn. Als een link na twee keer controleren door een bot nog steeds onbereikbaar is zal er een melding gemaakt worden op de overlegpagina van het artikel. Deze meldingen komen terecht in Categorie:Wikipedia:Onbereikbare externe link.
Om deze botmelding af te handelen, volg de stappen hierboven bij manuele controle.
Succesvol
[bewerken | brontekst bewerken]Nadat de link is gerepareerd, vervangen, verwijderd of werkend bevonden, kan de botmelding van de overlegpagina worden verwijderd, compleet met eventueel commentaar dat uitsluitend betrekking heeft tot de afhandeling, bijvoorbeeld: "link gerepareerd". Zou hierbij een lege overlegpagina ontstaan, nomineer dan de pagina voor directe verwijdering met het sjabloon {{Afgehandeld|Eventuele toelichting}}.
Onsuccesvol
[bewerken | brontekst bewerken]Als het niet gelukt is de link te repareren, dan zal deze verwijderd horen te worden. Behoud informatie die van belang is als referentie: als er een link is naar 'interview in NRC, 23 november 2006 pagina 12', dan kan de referentie blijven staan. Verwijder dan alleen de URL.
Valse meldingen?
[bewerken | brontekst bewerken]Wanneer blijkt dat hele domeinen onterecht worden gemarkeerd als onbereikbaar. Zet deze dan hier onder, dan kan de domeinen bij de volgende ronde deze op de ignore list zetten:
Ignore list
[bewerken | brontekst bewerken]- http://www.recensement.insee.fr
- http://environmentalchemistry.com/
- http://www.EHX.com
- http://infoweb.newsbank.com
- Bij .tk-domeinen gaat de bot vaak de mist in. Aangezien TK-domeinen niet vaak voorkomen bij een wiki-waardige referentie of bron, is het niet nodig deze te vermelden.
Zie ook
[bewerken | brontekst bewerken]- Speciaal:Linksearch, voor het zoeken naar externe links in artikelen.