Es gibt Bots, welche die Erreichbarkeit von Webseiten automatisiert überprüfen. Dies kann alle Links innerhalb eines Artikels betreffen oder sich nur auf bestimmte umgestellte Domains beschränken. Sie hinterlassen in unregelmäßigen Abständen Nachrichten auf den jeweiligen Artikeldiskussionsseiten. Seit einigen Jahren kommen dabei spezielle Vorlagen zur Verwendung, die Erläuterungen und Hilfestellungen geben.
Zum Reparieren defekter Weblinks gelten unverändert die Regeln und Hinweise auf Wikipedia:Defekte Weblinks.
Der GiftBot hat zwischen dem 22. November 2015 und 22. Februar 2016 Fehlermeldungen auf den Diskussionsseiten verteilt.
Der InternetArchiveBot markiert seit dem 28. August 2017 defekte Weblinks direkt in den Artikeln, seit Mitte März 2018 ohne gesonderten Hinweis auf der jeweiligen Diskussionsseite.
Voraussetzungen
Bevor externe Links von Bots gemeldet werden können, müssen die Zielseiten dreimal (besser viermal) im Abstand von jeweils zwei Wochen nicht erreichbar gewesen sein. Das entsprechende Pywikipedia-Modul soll hier nicht eingesetzt werden, da es zu viele falsch-positive Ergebnisse liefert.
Es sind aktuell folgende Bots im Einsatz:
- Benutzer:MerlLinkBot – repariert auf Anfrage externe Links zu umgezogenen Webseiten
Benutzer:GiftBot[seit Feb. 2023 abgeschaltet]- InternetArchiveBot
Beobachtungsliste
In dem Zeitraum, während ein Bot auf den Diskussionsseiten der Artikel massenhaft defekte Weblinks einträgt, kann es sinnvoll erscheinen, sich diese Bearbeitungen auf der Beobachtungsliste auszublenden.
- Hierzu konnte die „Bearbeitungen durch Bots in der Beobachtungsliste ausblenden“ vorübergehend aktiviert werden.
- externalLinkProblem@PerfektesChaos schaltet gezielt genau diese Einträge aus.
InternetArchiveBot trägt seit März 2018 keine Meldungen auf der Diskussionsseite mehr ein.
Info: DerVerwendete Vorlagen
Meldungen aus dem Jahr 2011 und ältere
Hier wurden noch keine speziellen Vorlagen verwendet. Die Meldungen können in der Regel von den Diskussionsseiten entfernt werden. Wurde eine Meldung von einem Benutzer durch Hinweise ergänzt oder kommentiert, ist für den Einzelfall zu entscheiden, ob eine Entfernung sinnvoll ist.
Meldungen aus dem Jahr 2012
Bei diesen Meldungen wurde die Vorlage {{Defekter Weblink Bot}} verwendet. Der komplette Abschnitt wird mit der aktuelleren Meldung von 2015 obsolet und kann entfernt werden. Für ergänzte oder kommentierte Meldungen ist eine Einzelfallentscheidung nötig.
Meldungen aus den Jahren 2015 und 2016
Vom Giftbot wurde die Vorlage {{Defekter Weblink}} verwendet, die neben der Auflistung der defekten Links idealerweise noch eine Reihe von Zusatzinformationen zur Reparatur der einzelnen Links liefert:
Syntaxfehler
Der Bot gibt Hinweise darauf, wenn Satzzeichen wie .
oder ,
am Ende des Links die URL nicht erreichbar machen, diese sind dann zu entfernen. Auch Sonderzeichen wie öffnende ([
) oder schließende (]
) eckige Klammern, Pipes (|
) etc. innerhalb der URL werden gemeldet: Hier kann eine Reparatur des Links durch URL-Encoding möglich sein.
Archivversionen
Wurde vom Bot ein Eintrag im Webarchiv gefunden, wird ein Archivlink angezeigt. Welche Archivversion als Beleg für die enzyklopädische Aussage geeignet ist, ist zu prüfen. Möglicherweise ist auch keine der archivierten Versionen verwendbar. Soll eine Archivversion als Ersatzlink genutzt werden, können die Vorlage {{Webarchiv}} bzw. die Vorlagen {{Internetquelle|archiv-url=|archiv-datum=}} und {{Cite web|archiveurl=|archivedate=}} mit gesetzten Archivparametern eingesetzt werden.
Protokoll-Fehler
Findet der Bot, dass ein Wechsel des Netzwerkprotokolls (http
↔https
) im Link zu einer erreichbaren Seite führt, wird dies gemeldet. Ob die erreichbare Seite dagegen auch geeignet ist, den defekten Link zu ersetzen, muss inhaltlich geprüft werden.
Weitere Seiten mit gleichem Link
Wurde die gleiche URL auch aus anderen Artikeln verlinkt, so meldet dies der Bot ebenfalls. Bitte korrigiere diese Seiten entsprechend, wenn du dich schon gerade in das Thema eingearbeitet hast. Vielleicht hat in einem anderen Artikel sogar schon jemand eine Lösung gefunden.
HTTP-Statuscode
Für Fortgeschrittene können Informationen wie HTTP-Statuscodes zur Antwort des Servers mitgegeben worden sein; wer damit nichts anfangen kann: einfach ignorieren.
Spam-Links
Wurden vom Bot im Artikel Links gefunden, die auf Seiten zielen, die auf der Spam-blacklist stehen, so werden auch diese gemeldet. Sie sind aus dem Artikel zu entfernen.
Mail-to-Einträge
Sind im Artikel E-Mail-Adressen verlinkt, werden diese aufgeführt. Auch sie sind aus Gründen des Spam-Schutzes der Postfachinhaber zu entfernen.
Meldungen seit 2017
Der InternetArchivBot schreibt keine Hinweise mehr auf die Diskussionsseite, sondern nutzt innerhalb der Vorlagen {{Internetquelle}} und {{Webarchiv}} den Parameter archiv-bot
bzw. in der Vorlage {{Toter Link}} den Parameter archivbot
zum Kennzeichnen fehlerhafter Links.
Probleme mit Bot-Meldungen
Alle auftretenden Probleme mit der Botmeldung und wieder erreichbare Links sollen mit dem in der Bot-Vorlage vorhandenen Berichts-Link, der dich auf die Seite Bot2015-Problem führt, gemeldet werden.
Bot-Meldungen hervorheben oder ausblenden
Um bei gezielter Abarbeitung das Auffinden in der Diskussionsseite zu erleichtern, können Benutzer sich die Vorlagendarstellung farblich hervorheben; beispielsweise:
.deadlink-bot-Anleitung { background-color: #7FFF00;}.deadlink-bot { background-color: #FFB6C1;}
zeigt den Anleitungsbereich hellgrün unterlegt; die Liste der URL blassrosa.
Wer hingegen den fraglichen Abschnitt auf der Diskussionsseite möglichst wenig wahrnehmen und den Inhalt ausblenden möchte, kann schreiben:
.deadlink-bot-Anleitung,.deadlink-bot { display: none;}
Die Anweisungen sind als persönliche CSS-Einstellungen abzulegen; in der Regel als common.css
.
Bot-Meldungen zu persönlichen Interessengebieten
Es gibt mehrere Möglichkeiten, um aus der Vielzahl von gemeldeten Artikeln diejenigen herauszusuchen, die einem am Herz liegen.
- Das Werkzeug CatScan kann diejenigen Artikel zeigen, die in einer thematischen Kategorie oder ihren Unterkategorien liegen; oder bestimmte Vorlagen (Infoboxen, Datenbanklinks) enthalten.
- Das Werkzeug talkcatintersect macht das Gleiche, falls CatScan einmal nicht funktioniert; allerdings nur für Kategorien.
- Wiki-Projekte, Redaktionen oder auch Portale bieten oft Wartung und Qualitätssicherung an, unter denen auch Hinweise auf die defekten Weblinks aufgelistet sein können.
- Nach Ende der Bot-Verteilungsaktion (ab 2016) wird es auch möglich sein, bestellte Wunschkategorien zu erhalten, die ausschließlich Artikel mit defekt gemeldeten URL einer bestimmten Domain enthalten, nicht aber diejenigen, die derzeit funktioniert haben (wie mit der normalen Weblinksuche).
Spezielle Wartungskategorien
- Formal
- Spam (0)
- Eckige Klammer in URL (0)
- Zeichen jenseits ASCII (0)
- URL endet auf Sonderzeichen (0)
- Pipe-Symbol in URL (0)
- Organisatorisch
- Domains (11)
- Wunsch-Domains.
- Keine URL mehr (0)
- Kann abgeräumt werden.
- Deaktiviert (0)
- URL vorhanden, aber alle deaktiviert.
- Archiviert (0)
- Abschnitt wurde archiviert.
- Lemma im Unterseitenformat (0)
- Lemma enthält Schrägstrich, ordnungsgemäß.
- Einbindung auf Unterseite (0)
- Archivierung missglückt; möglicherweise war keine Archivierung beabsichtigt.
- Möglicherweise Pseudo-Unterseite.
- Falscher Namensraum (0)
- Vermutlich BNR; Verschiebung erfordert Entfernung, da keine Zuordnung mehr zu einem Artikel im ANR
- Vorlageneinbindung
- Vorlagensyntax (0)
- Interner Fehler (0)
Die Wartungskategorien bleiben erhalten, auch wenn sie leer sind; sie gelten auch für zukünftige Bot-Läufe.
Diskussionsseite aufräumen
Wenn die problematische URL nicht mehr im Artikel vorkommt, soll auch die Botmeldung um diese URL gekürzt werden:
- Du kannst die Zeile einfach komplett entfernen.
- Du kannst hinter der vorhandenen Zeile, durch ein Leerzeichen getrennt oder auf einer neuen Zeile, einen schlichten inhaltlichen Kommentar zu deiner Abarbeitung hinterlassen, der für die Nachwelt interessant wäre. Das deaktiviert diese URL. Deine Anmerkung kann auch mit einer einfachen (!) Signatur abgeschlossen werden. Vorlagensyntax, offene Pipes oder eine URL darfst du nicht einfügen. (Siehe im Einzelnen dazu #Diskussionen über verlinkte Seiten)
- Die Reihenfolge der Parameter-Nummern am Zeilenanfang ist bedeutungslos; sie dürfen auch Lücken aufweisen. Sie sollten belassen werden wie vorgefunden. Nur Wiederholungen wären unzulässig.
- Das Ändern eines Parameternamens wie
|5=
oder des vorhandenen Textes führt zu Fehlern.
Ist der letzte gemeldete defekte Link repariert, kann der gesamte Abschnitt gemäß Wikipedia:Diskussionsseiten #Diskussionsseiten aufräumen komplett entfernt werden.
Archivierung
Falls der Abschnitt dagegen archiviert werden soll, muss in die Vorlagenparameter |Archiv=1
eingefügt werden, und es muss der Archivierungsverhinderer{{Nicht archivieren}} aus dem Abschnitt entfernt werden.
Leere Diskussionsseite
War der Abschnitt über die defekten Weblinks der einzige Inhalt einer Diskussionsseite, so soll diese (gemäß Meinungsbild) nach Stellen eines Schnelllöschantrags durch einen Administrator komplett gelöscht werden (Ausnahme: Es existiert eine Archivseite mit abgeschlossenen Diskussionen).
Diskussionen über verlinkte Seiten
Die Vorlage lässt es zwar zu, wenn hinter die URL ein kurzer inhaltlicher Bearbeitungskommentar gesetzt wird, der mindestens durch ein Leerzeichen abgetrennt oder auf eine neue Zeile platziert ist. Auch Bemerkungen und eine Signatur sind dort möglich, sofern diese keine Vorlagensyntax (offene Pipe |
oder }}
) enthält. Vollständige URL sollen hier jedoch nicht angegeben werden. Diese Möglichkeit sollte jedoch nur genutzt werden, wenn der Nachwelt Sachinformationen speziell zu dieser URL zu hinterlassen sind. Der pure Hinweis, man habe die URL ersetzt, ergibt sich bereits zur Genüge aus der Versionsgeschichte des Artikels.
Alle Anmerkungen, die hinter die URL geschrieben werden, sind nur im Quelltext sichtbar und werden in der Lese-Ansicht nicht angezeigt. Jede mit beliebigen Anmerkungen kommentierte URL wird aus der Botmeldung komplett ausgeblendet.
Es ist in jedem Fall sinnvoller, für inhaltliche Diskussionen über eine Domain einen eigenen Abschnitt zu eröffnen. Gib diesem Abschnitt einen aussagekräftigen Titel mit Bezug zur diskutierten Website.
Werkzeuge
Das nachstehende Benutzerskript kooperiert direkt mit der Vorlageneinbindung des Bots ab 2015: