.TH LINKCHECKER 1 "25. November 2004" .SH NAME linkchecker \- prüfe HTML Dokumente auf kaputte Verknüpfungen .SH SYNTAX .B linkchecker [ .I Optionen ] [ .I Datei-oder-URL ] .SH BESCHREIBUNG .LP LinkChecker bietet rekursives Prüfen, Multithreading, Ausgabe als farbigen oder normalen Text, HTML, SQL, CSV oder einen Sitemap-Graphen in GML oder XML, Unterstützung für HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Gopher, Telnet und lokale Dateiverknüpfungen, Einschränkung der Verknüpfungsüberprüfung mit URL Filtern bestehend aus regulären Ausdrücken, Proxy Unterstützung, Benutzer/Passwort Authentifizierung für HTTP und FTP, Unterstützung des robots.txt Protokolls, Mehrsprachigkeit, eine Kommandozeilenschnittstelle sowie eine CGI Webschnittstelle (benötigt einen HTTP Server). .SH BEISPIELE Der häufigste Gebrauchsfall prüft eine gegebene Domäne rekursiv, inklusive aller einzelnen nach außen zeigenden Verknüpfungen: \fBlinkchecker http://treasure.calvinsplayground.de/\fP Beachten Sie dass dies die komplette Domäne überprüft welche aus mehreren hunderttausend URLs bestehen kann. Benutzen Sie die Option -r, um die Rekursionstiefe zu beschränken. Keine Verbindungen zu mailto: Rechnern, nur die Syntax wird geprüft. Alle anderen Verknüpfungen werden wie üblich geprüft: \fBlinkchecker --intern='!^mailto:' --extern-strict-all www.mysite.org\fP Überprüfung einer lokalen HTML Datei unter Unix: \fBlinkchecker ../bla.html\fP Überprüfung einer lokalen HTML Datei unter Windows: \fBlinkchecker c:\\temp\\test.html\fP Sie können den \fBhttp://\fP URL Anteil weglassen wenn die Domäne mit \fBwww.\fP beginnt: \fBlinkchecker www.myhomepage.de\fP Sie können den \fBftp://\fP URL Anteil weglassen wenn die Domäne mit \fBftp.\fP beginnt: \fBlinkchecker -r0 ftp.linux.org\fP .SH OPTIONEN .SS Allgemeine Optionen .TP \fB-h\fP, \fB--help\fP Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus. .TP \fB-f\fP\fIKonfigurationsdatei\fP, \fB--config=\fP\fIKonfigurationsdatei\fP Benutze \fIfile\fP as configuration file. As default LinkChecker first searches /etc/linkchecker/linkcheckerrc and then ~/.linkcheckerrc. .TP \fB-I\fP, \fB--interactive\fP Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurde. .TP \fB-V\fP, \fB--version\fP Drucke die Version und beende das Programm. .TP \fB-t\fP\fInum\fP, \fB--threads=\fP\fInum\fP Generiere nicht mehr als \fInum\fP Threads. Standard Anzahl von Threads ist 10. .SS Ausgabeoptionen .TP \fB-v\fP, \fB--verbose\fP Logge alle geprüften URLs (impliziert \fB-w\fP). Standard ist es, nur fehlerhafte URLs zu loggen. .TP \fB-w\fP, \fB--warnings\fP Logge Warnungen. .TP \fB-W\fP\fIregex\fP, \fB--warning-regex=\fIregex\fP Definieren Sie einen regulären Ausdruck, der eine Warnung ausgibt falls er den Inhalt einer geprüften URL matcht. Dies gilt nur für gültige Seiten deren Inhalt wir bekommen können. .br Sie können dies verwenden, um Seiten mit Fehlermeldungen wie z.B. 'Diese Seite ist umgezogen' oder 'Oracle Server Fehler'. Diese Option impliziert \fB-w\fP. .TP \fB--warning-size-bytes=\fP\fIBytes\fP Drucke eine Warnung wenn die Inhaltsgröße bekannt ist und die angegebene Anzahl von Bytes übersteigt. Diese Option impliziert \fB-w\fP. .TP \fB-q\fP, \fB--quiet\fP Keine Ausgabe, ein Alias für \fB-o none\fP. Dies ist nur in Verbindung mit \fB-F\fP nützlich. .TP \fB-o\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP], \fB--output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP] Spezifiziere die Ausgabe als \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP. Standardausgabe ist \fBtext\fP. \fIEnkodierung\fP gibt die Ausgabekodierung an, die Standardkodierung ist \fBiso-8859-15\fP. Gültige Encodierungen sind unter \fBhttp://docs.python.org/lib/node127.html\fP aufgelistet. .TP \fB-F\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP], \fB--file-output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP] Ausgabe in eine Datei namens \fBlinkchecker-out.\fP\fITyp\fP, \fB$HOME/.linkchecker_blacklist\fP bei \fBblacklist\fP Ausgabe, oder \fIDateiname\fP falls angegeben. Der \fIDateiname\fP Teil wird beim Ausgabetyp \fBnone\fP ignoriert, ansonsten wird die Datei überschreiben falls sie existiert. Sie können diese Option mehr als einmal verwenden. Gültige Ausgabetypen sind \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP. Standard ist keine Dateiausgabe. \fIEnkodierung\fP gibt die Ausgabekodierung an, die Standardkodierung ist \fBiso-8859-15\fP. Gültige Encodierungen sind unter \fBhttp://docs.python.org/lib/node127.html\fP aufgelistet. Bemerken Sie dass die Option \fB-o none\fP jegliche Ausgaben auf der Konsole verhindert. .TP \fB--no-status\fP Gebe keine Statusmeldungen aus. .TP \fB-D\fP, \fB--debug\fP Gebe Debugmeldungen aus für den angegebenen Logger. Verfügbare Logger sind \fBcmdline\fP, \fBchecking\fP, \fBcache\fP, \fBgui\fP and \fBall\fP. Die Angabe \fBall\fP ist ein Synonym für alle verfügbaren Logger. Diese Option kann mehrmals angegeben werden, um mit mehr als einem Logger zu debuggen. .br Für exakte Resultate wird Threading während einem Debuglauf deaktiviert. .TP \fB--profile\fP Schreibe Profiling-Daten in eine Datei namens \fBlinkchecker.prof\fP im aktuellen Arbeitsverzeichnis. Siehe auch \fB--viewprof\fP. .TP \fB--viewprof\fP Gebe vorher generierte Profiling-Daten aus. Siehe auch \fB--profile\fP. .SS Optionen zum Prüfen .TP \fB-r\fP\fITiefe\fP, \fB--recursion-level=\fP\fITiefe\fP Prüfe rekursiv alle URLs bis zu der angegebenen \fITiefe\fP. Eine negative Tiefe erwirkt unendliche Rekursion. Standard Tiefe ist unendlich. .TP \fB-i\fP\fIregex\fP, \fB--intern=\fIregex\fP Behandle URLs welche den regulären Ausdruck matchen als intern. LinkChecker steigt nur in interne URLs rekursiv ab, nicht in externe. .TP \fB-e\fP\fIregex\fP, \fB--extern=\fP\fIregex\fP Behandle URLs welche diesen regulären Ausdruck matchen als extern. Nur interne HTTP Links werden rekursiv geprüft. .TP \fB--extern-strict=\fP\fIregex\fP Behandle URLs welche diesen regulären Ausdruck matchen als strikt extern. Nur interne HTTP Links werden rekursiv geprüft. .TP \fB-s\fP, \fB--extern-strict-all\fP Prüfe lediglich die Syntax von externen URLs. Es wird keine. Verbindung zu diesen Rechner aufgebaut. Bei lokalen Dateiurls sind lediglich lokale Dateien intern. Bei http und ftp URLs sind alle URLs mit demselben Domänennamen intern. .TP \fB-d\fP, \fB--denyallow\fP Tausche die Prüfreihenfolge zu extern/intern. Standardreihenfolge ist intern/extern. .TP \fB-C\fP, \fB--cookies\fP Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich Cookies die zum ursprünglichen Server zurückgesendet werden, werden akzeptiert. .br Gesendete und akzeptierte Cookies werden als zusätzliche Loginformation aufgeführt. .TP \fB-a\fP, \fB--anchors\fP Prüfe HTTP Anker Verweise. Diese Option gilt sowohl für interne als auch für externe URLs. Standard ist keine Überprüfung. Diese Option impliziert \fB-w\fP weil Ankerfehler immer Warnungen sind. .TP \fB--no-anchor-caching\fP Behandle url#anchora und url#anchorb beim Cachen als gleich. Dies ist zwar Standard bei Browsern, aber in der URI Spezifikation nicht enthalten. Benutzen Sie diese Option mit Vorsicht. .TP \fB-u\fP\fIName\fP, \fB--user=\fP\fIName\fP Verwende den angegebenen Benutzernamen für HTTP und FTP Authorisation. Für FTP ist der Standardname \fBanonymous\fP. Siehe auch \fB-p\fP. .TP \fB-p\fP\fIPasswort\fP, \fB--password=\fP\fIPasswort\fP Verwende das angegebene Passwort für HTTP und FTP Authorisation. Für FTP ist das Standardpasswort \fBanonymous@\fP. Siehe auch \fB-u\fP. .TP \fB--timeout=\fP\fISekunden\fP Setze den Timeout für TCP-Verbindungen in Sekunden. Der Standard Timeout ist 30 Sekunden. .TP \fB-P\fP\fISekunden\fP, \fB--pause=\fP\fISekunden\fP Pausiere die angegebene Zahl von Sekunden zwischen dem Prüfen jeder URL. Diese Option impliziert \fB-t0\fP. Standard ist keine Pause zwischen dem Prüfen. .TP \fB-N\fP\fIServer\fP, \fB--nntp-server=\fP\fIServer\fP Gibt ein NNTP Rechner für \fBnews:...\fP Links. Standard ist die Umgebungsvariable NNTP_SERVER. Falls kein Rechner angegeben ist, wird lediglich auf korrekte Syntax des Links geprüft. .SS Alte Optionen .TP \fB--status\fP Gebe Prüfstatus alle 5 Sekunden an stderr aus. Dies ist die Voreinstellung. .SH AUSGABETYPEN Beachten Sie dass normalerweise nur Fehler geloggt werden. .TP \fBtext\fP Standard Textausgabe in \fISchlüssel\fP\fB: \fP\fIWert\fP-Form. .TP \fBhtml\fP Gebe URLs in \fISchlüssel\fP\fB: \fP\fIWert\fP-Form als HTML formatiert aus. Besitzt zudem Verknüpfungen auf die referenzierten Seiten. Ungültige URLs haben Verknüpfungen zur HTML und CSS Syntaxprüfung angehängt. .TP \fBcsv\fP Gebe Prüfresultat in CSV-Format aus mit einer URL pro Zeile. .TP \fBgml\fP Gebe Vater-Kind Beziehungen zwischen verknüpften URLs als GML Graphen aus. Sie sollten die Option \fB--verbose\fP benutzen, um einen vollständigen Graphen zu erhalten. .TP \fBxml\fP Gebe Prüfresultat als maschinenlesbare XML-Datei aus. .TP \fBsql\fP Gebe Prüfresultat als SQL Skript mit INSERT Befehlen aus. Ein Beispielskript, um die initiale SQL Tabelle zu erstellen ist unter create.sql zu finden. .TP \fBblacklist\fP Für Cronjobs geeignet. Gibt das Prüfergebnis in eine Datei \fB~/.blacklist\fP aus welche nur Einträge mit fehlerhaften URLs und die Anzahl der Fehlversuche enthält. .TP \fBnone\fP Gibt nichts aus. Für Skripte geeignet. .SH BEMERKUNGEN Ein \fB!\fP vor einem regulären Ausdruck negiert diesen. Also matcht \fB'!^mailto:'\fP alles außer mailto Links. URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie \fBftp://ftp.\fP behandelt, URLs die mit \fBwww.\fP beginnen wie \fBhttp://www.\fP. Sie können auch lokale Dateien als Argumente angeben. Falls sich Ihr System automatisch mit dem Internet verbindet (z.B. mit diald), wird es dies tun wenn Sie Links prüfen, die nicht auf Ihren lokalen Rechner verweisen Benutzen Sie die Optionen \fB-s\fP und \fB-i\fP, um dies zu verhindern. Javascript Links werden zur Zeit ignoriert Wenn Ihr System keine Threads unterstützt, benutzt LinkChecker automatisch \fB-t0\fP.. Sie können mehrere user/password Paare in einer Konfigurationsdatei angeben Um Proxies zu benutzen, setzen Sie $http_proxy, $https_proxy unter Unix oder Windows. Auf einem Mac benutzen Sie die Internet Config. Beim Prüfen von \fBnews:\fP Links muß der angegebene NNTP Rechner nicht unbedingt derselbe wie der des Benutzers sein. .SH UMGEBUNG \fBNNTP_SERVER\fP - gibt Standard NNTP Server an \fBhttp_proxy\fP - gibt Standard HTTP Proxy an \fBftp_proxy\fP - gibt Standard FTP Proxy an \fBLC_MESSAGES\fP, \fBLANG\fP - gibt Ausgabesprache an .SH DATEIEN \fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkcheckerrc\fP - Standardkonfigurationsdateien \fB~/.blacklist\fP - Standard Dateiname der blacklist Logger Ausgabe \fBlinkchecker-out.\fP\fITyp\fP - Standard Dateiname der Logger Ausgabe \fBhttp://docs.python.org/lib/node127.html\fP - gültige Ausgabe Enkodierungen .SH AUTHOR Bastian Kleineidam