mirror of
https://github.com/Hopiu/linkchecker.git
synced 2026-03-29 04:00:34 +00:00
git-svn-id: https://linkchecker.svn.sourceforge.net/svnroot/linkchecker/trunk/linkchecker@2110 e7d03fd6-7b0d-0410-9947-9c21f3af8025
308 lines
11 KiB
Groff
308 lines
11 KiB
Groff
.TH LINKCHECKER 1 "25. November 2004"
|
|
|
|
.SH NAME
|
|
linkchecker \- prüfe HTML Dokumente auf kaputte Verknüpfungen
|
|
|
|
.SH SYNTAX
|
|
.B linkchecker
|
|
[
|
|
.I Optionen
|
|
]
|
|
[
|
|
.I Datei-oder-URL
|
|
]
|
|
|
|
.SH BESCHREIBUNG
|
|
.LP
|
|
LinkChecker bietet rekursives Prüfen, Multithreading,
|
|
Ausgabe als farbigen oder normalen Text, HTML, SQL, CSV oder einen
|
|
Sitemap-Graphen in GML oder XML,
|
|
Unterstützung für HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:,
|
|
Gopher, Telnet und lokale Dateiverknüpfungen,
|
|
Einschränkung der Verknüpfungsüberprüfung mit URL Filtern bestehend aus
|
|
regulären Ausdrücken, Proxy Unterstützung, Benutzer/Passwort
|
|
Authentifizierung für HTTP und FTP, Unterstützung des robots.txt
|
|
Protokolls, Mehrsprachigkeit, eine Kommandozeilenschnittstelle
|
|
sowie eine CGI Webschnittstelle (benötigt einen HTTP Server).
|
|
|
|
.SH BEISPIELE
|
|
Der häufigste Gebrauchsfall prüft eine gegebene Domäne rekursiv,
|
|
inklusive aller einzelnen nach außen zeigenden Verknüpfungen:
|
|
\fBlinkchecker http://treasure.calvinsplayground.de/\fP
|
|
|
|
Beachten Sie dass dies die komplette Domäne überprüft welche aus
|
|
mehreren hunderttausend URLs bestehen kann. Benutzen Sie die Option -r,
|
|
um die Rekursionstiefe zu beschränken.
|
|
|
|
Keine Verbindungen zu mailto: Rechnern, nur die Syntax wird geprüft. Alle
|
|
anderen Verknüpfungen werden wie üblich geprüft:
|
|
\fBlinkchecker --intern='!^mailto:' --extern-strict-all www.mysite.org\fP
|
|
|
|
Überprüfung einer lokalen HTML Datei unter Unix:
|
|
\fBlinkchecker ../bla.html\fP
|
|
|
|
Überprüfung einer lokalen HTML Datei unter Windows:
|
|
\fBlinkchecker c:\\temp\\test.html\fP
|
|
|
|
Sie können den \fBhttp://\fP URL Anteil weglassen wenn die Domäne mit
|
|
\fBwww.\fP beginnt:
|
|
\fBlinkchecker www.myhomepage.de\fP
|
|
|
|
Sie können den \fBftp://\fP URL Anteil weglassen wenn die Domäne mit
|
|
\fBftp.\fP beginnt:
|
|
\fBlinkchecker -r0 ftp.linux.org\fP
|
|
|
|
.SH OPTIONEN
|
|
|
|
.SS Allgemeine Optionen
|
|
.TP
|
|
\fB-h\fP, \fB--help\fP
|
|
Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus.
|
|
.TP
|
|
\fB-f\fP\fIKonfigurationsdatei\fP, \fB--config=\fP\fIKonfigurationsdatei\fP
|
|
Benutze \fIfile\fP as configuration file. As default LinkChecker first searches
|
|
/etc/linkchecker/linkcheckerrc and then ~/.linkcheckerrc.
|
|
.TP
|
|
\fB-I\fP, \fB--interactive\fP
|
|
Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurde.
|
|
.TP
|
|
\fB-V\fP, \fB--version\fP
|
|
Drucke die Version und beende das Programm.
|
|
.TP
|
|
\fB-t\fP\fInum\fP, \fB--threads=\fP\fInum\fP
|
|
Generiere nicht mehr als \fInum\fP Threads. Standard Anzahl von Threads
|
|
ist 10.
|
|
|
|
.SS Ausgabeoptionen
|
|
.TP
|
|
\fB-v\fP, \fB--verbose\fP
|
|
Logge alle geprüften URLs (impliziert \fB-w\fP). Standard ist es, nur
|
|
fehlerhafte URLs zu loggen.
|
|
.TP
|
|
\fB-w\fP, \fB--warnings\fP
|
|
Logge Warnungen.
|
|
.TP
|
|
\fB-W\fP\fIregex\fP, \fB--warning-regex=\fIregex\fP
|
|
Definieren Sie einen regulären Ausdruck, der eine Warnung ausgibt
|
|
falls er den Inhalt einer geprüften URL matcht.
|
|
Dies gilt nur für gültige Seiten deren Inhalt wir bekommen können.
|
|
.br
|
|
Sie können dies verwenden, um Seiten mit Fehlermeldungen wie z.B.
|
|
'Diese Seite ist umgezogen' oder 'Oracle Server Fehler'.
|
|
Diese Option impliziert \fB-w\fP.
|
|
.TP
|
|
\fB--warning-size-bytes=\fP\fIBytes\fP
|
|
Drucke eine Warnung wenn die Inhaltsgröße bekannt ist und die
|
|
angegebene Anzahl von Bytes übersteigt.
|
|
Diese Option impliziert \fB-w\fP.
|
|
.TP
|
|
\fB-q\fP, \fB--quiet\fP
|
|
Keine Ausgabe, ein Alias für \fB-o none\fP. Dies ist nur in Verbindung
|
|
mit \fB-F\fP nützlich.
|
|
.TP
|
|
\fB-o\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP], \fB--output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP]
|
|
Spezifiziere die Ausgabe als \fBtext\fP, \fBhtml\fP, \fBsql\fP,
|
|
\fBcsv\fP, \fBgml\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP.
|
|
Standardausgabe ist \fBtext\fP. \fIEnkodierung\fP gibt die
|
|
Ausgabekodierung an, die Standardkodierung ist \fBiso-8859-15\fP.
|
|
Gültige Encodierungen sind unter
|
|
\fBhttp://docs.python.org/lib/node127.html\fP aufgelistet.
|
|
.TP
|
|
\fB-F\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP], \fB--file-output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP]
|
|
Ausgabe in eine Datei namens \fBlinkchecker-out.\fP\fITyp\fP,
|
|
\fB$HOME/.linkchecker_blacklist\fP
|
|
bei \fBblacklist\fP Ausgabe, oder \fIDateiname\fP falls angegeben.
|
|
Der \fIDateiname\fP Teil wird beim Ausgabetyp \fBnone\fP ignoriert,
|
|
ansonsten wird die Datei überschreiben falls sie existiert.
|
|
Sie können diese Option mehr als einmal verwenden. Gültige
|
|
Ausgabetypen sind \fBtext\fP, \fBhtml\fP, \fBsql\fP,
|
|
\fBcsv\fP, \fBgml\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP.
|
|
Standard ist keine Dateiausgabe. \fIEnkodierung\fP gibt die
|
|
Ausgabekodierung an, die Standardkodierung ist \fBiso-8859-15\fP.
|
|
Gültige Encodierungen sind unter
|
|
\fBhttp://docs.python.org/lib/node127.html\fP aufgelistet.
|
|
Bemerken Sie dass die Option
|
|
\fB-o none\fP jegliche Ausgaben auf der Konsole verhindert.
|
|
.TP
|
|
\fB--no-status\fP
|
|
Gebe keine Statusmeldungen aus.
|
|
.TP
|
|
\fB-D\fP, \fB--debug\fP
|
|
Gebe Debugmeldungen aus für den angegebenen Logger.
|
|
Verfügbare Logger sind \fBcmdline\fP, \fBchecking\fP,
|
|
\fBcache\fP, \fBgui\fP and \fBall\fP.
|
|
Die Angabe \fBall\fP ist ein Synonym für alle verfügbaren Logger.
|
|
Diese Option kann mehrmals angegeben werden, um
|
|
mit mehr als einem Logger zu debuggen.
|
|
.br
|
|
Für exakte Resultate wird Threading während einem
|
|
Debuglauf deaktiviert.
|
|
.TP
|
|
\fB--profile\fP
|
|
Schreibe Profiling-Daten in eine Datei namens \fBlinkchecker.prof\fP im
|
|
aktuellen Arbeitsverzeichnis. Siehe auch \fB--viewprof\fP.
|
|
.TP
|
|
\fB--viewprof\fP
|
|
Gebe vorher generierte Profiling-Daten aus. Siehe auch \fB--profile\fP.
|
|
|
|
.SS Optionen zum Prüfen
|
|
.TP
|
|
\fB-r\fP\fITiefe\fP, \fB--recursion-level=\fP\fITiefe\fP
|
|
Prüfe rekursiv alle URLs bis zu der angegebenen \fITiefe\fP. Eine
|
|
negative Tiefe erwirkt unendliche Rekursion. Standard Tiefe ist
|
|
unendlich.
|
|
.TP
|
|
\fB-i\fP\fIregex\fP, \fB--intern=\fIregex\fP
|
|
Behandle URLs welche den regulären Ausdruck matchen als intern.
|
|
LinkChecker steigt nur in interne URLs rekursiv ab, nicht in externe.
|
|
.TP
|
|
\fB-e\fP\fIregex\fP, \fB--extern=\fP\fIregex\fP
|
|
Behandle URLs welche diesen regulären Ausdruck matchen als extern.
|
|
Nur interne HTTP Links werden rekursiv geprüft.
|
|
.TP
|
|
\fB--extern-strict=\fP\fIregex\fP
|
|
Behandle URLs welche diesen regulären Ausdruck matchen als strikt extern.
|
|
Nur interne HTTP Links werden rekursiv geprüft.
|
|
.TP
|
|
\fB-s\fP, \fB--extern-strict-all\fP
|
|
Prüfe lediglich die Syntax von externen URLs. Es wird keine.
|
|
Verbindung zu diesen Rechner aufgebaut.
|
|
Bei lokalen Dateiurls sind lediglich lokale Dateien intern. Bei http
|
|
und ftp URLs sind alle URLs mit demselben Domänennamen intern.
|
|
.TP
|
|
\fB-d\fP, \fB--denyallow\fP
|
|
Tausche die Prüfreihenfolge zu extern/intern. Standardreihenfolge
|
|
ist intern/extern.
|
|
.TP
|
|
\fB-C\fP, \fB--cookies\fP
|
|
Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich
|
|
Cookies die zum ursprünglichen Server zurückgesendet werden, werden
|
|
akzeptiert.
|
|
.br
|
|
Gesendete und akzeptierte Cookies werden als zusätzliche
|
|
Loginformation aufgeführt.
|
|
.TP
|
|
\fB-a\fP, \fB--anchors\fP
|
|
Prüfe HTTP Anker Verweise. Diese Option gilt sowohl für interne
|
|
als auch für externe URLs. Standard ist keine Überprüfung.
|
|
Diese Option impliziert \fB-w\fP weil Ankerfehler immer Warnungen sind.
|
|
.TP
|
|
\fB--no-anchor-caching\fP
|
|
Behandle url#anchora und url#anchorb beim Cachen als gleich. Dies
|
|
ist zwar Standard bei Browsern, aber in der URI Spezifikation
|
|
nicht enthalten. Benutzen Sie diese Option mit Vorsicht.
|
|
.TP
|
|
\fB-u\fP\fIName\fP, \fB--user=\fP\fIName\fP
|
|
Verwende den angegebenen Benutzernamen für HTTP und FTP
|
|
Authorisation. Für FTP ist der Standardname \fBanonymous\fP.
|
|
Siehe auch \fB-p\fP.
|
|
.TP
|
|
\fB-p\fP\fIPasswort\fP, \fB--password=\fP\fIPasswort\fP
|
|
Verwende das angegebene Passwort für HTTP und FTP Authorisation.
|
|
Für FTP ist das Standardpasswort \fBanonymous@\fP.
|
|
Siehe auch \fB-u\fP.
|
|
.TP
|
|
\fB--timeout=\fP\fISekunden\fP
|
|
Setze den Timeout für TCP-Verbindungen in Sekunden. Der Standard
|
|
Timeout ist 30 Sekunden.
|
|
.TP
|
|
\fB-P\fP\fISekunden\fP, \fB--pause=\fP\fISekunden\fP
|
|
Pausiere die angegebene Zahl von Sekunden zwischen dem Prüfen jeder URL.
|
|
Diese Option impliziert \fB-t0\fP.
|
|
Standard ist keine Pause zwischen dem Prüfen.
|
|
.TP
|
|
\fB-N\fP\fIServer\fP, \fB--nntp-server=\fP\fIServer\fP
|
|
Gibt ein NNTP Rechner für \fBnews:...\fP Links. Standard ist die
|
|
Umgebungsvariable NNTP_SERVER. Falls kein Rechner angegeben ist,
|
|
wird lediglich auf korrekte Syntax des Links geprüft.
|
|
.SS Alte Optionen
|
|
.TP
|
|
\fB--status\fP
|
|
Gebe Prüfstatus alle 5 Sekunden an stderr aus. Dies ist die Voreinstellung.
|
|
|
|
.SH AUSGABETYPEN
|
|
Beachten Sie dass normalerweise nur Fehler geloggt werden.
|
|
|
|
.TP
|
|
\fBtext\fP
|
|
Standard Textausgabe in \fISchlüssel\fP\fB: \fP\fIWert\fP-Form.
|
|
.TP
|
|
\fBhtml\fP
|
|
Gebe URLs in \fISchlüssel\fP\fB: \fP\fIWert\fP-Form als HTML
|
|
formatiert aus.
|
|
Besitzt zudem Verknüpfungen auf die referenzierten Seiten.
|
|
Ungültige URLs haben Verknüpfungen zur HTML und CSS Syntaxprüfung angehängt.
|
|
.TP
|
|
\fBcsv\fP
|
|
Gebe Prüfresultat in CSV-Format aus mit einer URL pro Zeile.
|
|
.TP
|
|
\fBgml\fP
|
|
Gebe Vater-Kind Beziehungen zwischen verknüpften URLs als GML Graphen aus.
|
|
Sie sollten die Option \fB--verbose\fP benutzen, um einen vollständigen
|
|
Graphen zu erhalten.
|
|
.TP
|
|
\fBxml\fP
|
|
Gebe Prüfresultat als maschinenlesbare XML-Datei aus.
|
|
.TP
|
|
\fBsql\fP
|
|
Gebe Prüfresultat als SQL Skript mit INSERT Befehlen aus. Ein Beispielskript,
|
|
um die initiale SQL Tabelle zu erstellen ist unter create.sql zu finden.
|
|
.TP
|
|
\fBblacklist\fP
|
|
Für Cronjobs geeignet. Gibt das Prüfergebnis in eine Datei
|
|
\fB~/.blacklist\fP aus welche nur Einträge mit fehlerhaften URLs und die
|
|
Anzahl der Fehlversuche enthält.
|
|
.TP
|
|
\fBnone\fP
|
|
Gibt nichts aus. Für Skripte geeignet.
|
|
|
|
.SH BEMERKUNGEN
|
|
Ein \fB!\fP vor einem regulären Ausdruck negiert diesen. Also matcht
|
|
\fB'!^mailto:'\fP alles außer mailto Links.
|
|
|
|
URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie
|
|
\fBftp://ftp.\fP behandelt, URLs die mit \fBwww.\fP beginnen wie
|
|
\fBhttp://www.\fP.
|
|
Sie können auch lokale Dateien als Argumente angeben.
|
|
|
|
Falls sich Ihr System automatisch mit dem Internet verbindet
|
|
(z.B. mit diald), wird es dies tun wenn Sie Links prüfen, die nicht
|
|
auf Ihren lokalen Rechner verweisen
|
|
Benutzen Sie die Optionen \fB-s\fP und \fB-i\fP, um dies zu verhindern.
|
|
|
|
Javascript Links werden zur Zeit ignoriert
|
|
|
|
Wenn Ihr System keine Threads unterstützt, benutzt LinkChecker
|
|
automatisch \fB-t0\fP..
|
|
|
|
Sie können mehrere user/password Paare in einer Konfigurationsdatei
|
|
angeben
|
|
|
|
Um Proxies zu benutzen, setzen Sie $http_proxy, $https_proxy unter
|
|
Unix oder Windows. Auf einem Mac benutzen Sie die Internet Config.
|
|
|
|
Beim Prüfen von \fBnews:\fP Links muß der angegebene NNTP Rechner nicht
|
|
unbedingt derselbe wie der des Benutzers sein.
|
|
|
|
.SH UMGEBUNG
|
|
\fBNNTP_SERVER\fP - gibt Standard NNTP Server an
|
|
|
|
\fBhttp_proxy\fP - gibt Standard HTTP Proxy an
|
|
|
|
\fBftp_proxy\fP - gibt Standard FTP Proxy an
|
|
|
|
\fBLC_MESSAGES\fP, \fBLANG\fP - gibt Ausgabesprache an
|
|
|
|
.SH DATEIEN
|
|
\fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkcheckerrc\fP -
|
|
Standardkonfigurationsdateien
|
|
|
|
\fB~/.blacklist\fP - Standard Dateiname der blacklist Logger Ausgabe
|
|
|
|
\fBlinkchecker-out.\fP\fITyp\fP - Standard Dateiname der Logger Ausgabe
|
|
|
|
\fBhttp://docs.python.org/lib/node127.html\fP - gültige Ausgabe
|
|
Enkodierungen
|
|
|
|
.SH AUTHOR
|
|
Bastian Kleineidam <calvin@users.sourceforge.net>
|