linkchecker/doc/de/linkchecker.de.1
2004-11-26 15:52:26 +00:00

308 lines
11 KiB
Groff

.TH LINKCHECKER 1 "25. November 2004"
.SH NAME
linkchecker \- prüfe HTML Dokumente auf kaputte Verknüpfungen
.SH SYNTAX
.B linkchecker
[
.I Optionen
]
[
.I Datei-oder-URL
]
.SH BESCHREIBUNG
.LP
LinkChecker bietet rekursives Prüfen, Multithreading,
Ausgabe als farbigen oder normalen Text, HTML, SQL, CSV oder einen
Sitemap-Graphen in GML oder XML,
Unterstützung für HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:,
Gopher, Telnet und lokale Dateiverknüpfungen,
Einschränkung der Verknüpfungsüberprüfung mit URL Filtern bestehend aus
regulären Ausdrücken, Proxy Unterstützung, Benutzer/Passwort
Authentifizierung für HTTP und FTP, Unterstützung des robots.txt
Protokolls, Mehrsprachigkeit, eine Kommandozeilenschnittstelle
sowie eine CGI Webschnittstelle (benötigt einen HTTP Server).
.SH BEISPIELE
Der häufigste Gebrauchsfall prüft eine gegebene Domäne rekursiv,
inklusive aller einzelnen nach außen zeigenden Verknüpfungen:
\fBlinkchecker http://treasure.calvinsplayground.de/\fP
Beachten Sie dass dies die komplette Domäne überprüft welche aus
mehreren hunderttausend URLs bestehen kann. Benutzen Sie die Option -r,
um die Rekursionstiefe zu beschränken.
Keine Verbindungen zu mailto: Rechnern, nur die Syntax wird geprüft. Alle
anderen Verknüpfungen werden wie üblich geprüft:
\fBlinkchecker --intern='!^mailto:' --extern-strict-all www.mysite.org\fP
Überprüfung einer lokalen HTML Datei unter Unix:
\fBlinkchecker ../bla.html\fP
Überprüfung einer lokalen HTML Datei unter Windows:
\fBlinkchecker c:\\temp\\test.html\fP
Sie können den \fBhttp://\fP URL Anteil weglassen wenn die Domäne mit
\fBwww.\fP beginnt:
\fBlinkchecker www.myhomepage.de\fP
Sie können den \fBftp://\fP URL Anteil weglassen wenn die Domäne mit
\fBftp.\fP beginnt:
\fBlinkchecker -r0 ftp.linux.org\fP
.SH OPTIONEN
.SS Allgemeine Optionen
.TP
\fB-h\fP, \fB--help\fP
Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus.
.TP
\fB-f\fP\fIKonfigurationsdatei\fP, \fB--config=\fP\fIKonfigurationsdatei\fP
Benutze \fIfile\fP as configuration file. As default LinkChecker first searches
/etc/linkchecker/linkcheckerrc and then ~/.linkcheckerrc.
.TP
\fB-I\fP, \fB--interactive\fP
Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurde.
.TP
\fB-V\fP, \fB--version\fP
Drucke die Version und beende das Programm.
.TP
\fB-t\fP\fInum\fP, \fB--threads=\fP\fInum\fP
Generiere nicht mehr als \fInum\fP Threads. Standard Anzahl von Threads
ist 10.
.SS Ausgabeoptionen
.TP
\fB-v\fP, \fB--verbose\fP
Logge alle geprüften URLs (impliziert \fB-w\fP). Standard ist es, nur
fehlerhafte URLs zu loggen.
.TP
\fB-w\fP, \fB--warnings\fP
Logge Warnungen.
.TP
\fB-W\fP\fIregex\fP, \fB--warning-regex=\fIregex\fP
Definieren Sie einen regulären Ausdruck, der eine Warnung ausgibt
falls er den Inhalt einer geprüften URL matcht.
Dies gilt nur für gültige Seiten deren Inhalt wir bekommen können.
.br
Sie können dies verwenden, um Seiten mit Fehlermeldungen wie z.B.
'Diese Seite ist umgezogen' oder 'Oracle Server Fehler'.
Diese Option impliziert \fB-w\fP.
.TP
\fB--warning-size-bytes=\fP\fIBytes\fP
Drucke eine Warnung wenn die Inhaltsgröße bekannt ist und die
angegebene Anzahl von Bytes übersteigt.
Diese Option impliziert \fB-w\fP.
.TP
\fB-q\fP, \fB--quiet\fP
Keine Ausgabe, ein Alias für \fB-o none\fP. Dies ist nur in Verbindung
mit \fB-F\fP nützlich.
.TP
\fB-o\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP], \fB--output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP]
Spezifiziere die Ausgabe als \fBtext\fP, \fBhtml\fP, \fBsql\fP,
\fBcsv\fP, \fBgml\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP.
Standardausgabe ist \fBtext\fP. \fIEnkodierung\fP gibt die
Ausgabekodierung an, die Standardkodierung ist \fBiso-8859-15\fP.
Gültige Encodierungen sind unter
\fBhttp://docs.python.org/lib/node127.html\fP aufgelistet.
.TP
\fB-F\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP], \fB--file-output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP]
Ausgabe in eine Datei namens \fBlinkchecker-out.\fP\fITyp\fP,
\fB$HOME/.linkchecker_blacklist\fP
bei \fBblacklist\fP Ausgabe, oder \fIDateiname\fP falls angegeben.
Der \fIDateiname\fP Teil wird beim Ausgabetyp \fBnone\fP ignoriert,
ansonsten wird die Datei überschreiben falls sie existiert.
Sie können diese Option mehr als einmal verwenden. Gültige
Ausgabetypen sind \fBtext\fP, \fBhtml\fP, \fBsql\fP,
\fBcsv\fP, \fBgml\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP.
Standard ist keine Dateiausgabe. \fIEnkodierung\fP gibt die
Ausgabekodierung an, die Standardkodierung ist \fBiso-8859-15\fP.
Gültige Encodierungen sind unter
\fBhttp://docs.python.org/lib/node127.html\fP aufgelistet.
Bemerken Sie dass die Option
\fB-o none\fP jegliche Ausgaben auf der Konsole verhindert.
.TP
\fB--no-status\fP
Gebe keine Statusmeldungen aus.
.TP
\fB-D\fP, \fB--debug\fP
Gebe Debugmeldungen aus für den angegebenen Logger.
Verfügbare Logger sind \fBcmdline\fP, \fBchecking\fP,
\fBcache\fP, \fBgui\fP and \fBall\fP.
Die Angabe \fBall\fP ist ein Synonym für alle verfügbaren Logger.
Diese Option kann mehrmals angegeben werden, um
mit mehr als einem Logger zu debuggen.
.br
Für exakte Resultate wird Threading während einem
Debuglauf deaktiviert.
.TP
\fB--profile\fP
Schreibe Profiling-Daten in eine Datei namens \fBlinkchecker.prof\fP im
aktuellen Arbeitsverzeichnis. Siehe auch \fB--viewprof\fP.
.TP
\fB--viewprof\fP
Gebe vorher generierte Profiling-Daten aus. Siehe auch \fB--profile\fP.
.SS Optionen zum Prüfen
.TP
\fB-r\fP\fITiefe\fP, \fB--recursion-level=\fP\fITiefe\fP
Prüfe rekursiv alle URLs bis zu der angegebenen \fITiefe\fP. Eine
negative Tiefe erwirkt unendliche Rekursion. Standard Tiefe ist
unendlich.
.TP
\fB-i\fP\fIregex\fP, \fB--intern=\fIregex\fP
Behandle URLs welche den regulären Ausdruck matchen als intern.
LinkChecker steigt nur in interne URLs rekursiv ab, nicht in externe.
.TP
\fB-e\fP\fIregex\fP, \fB--extern=\fP\fIregex\fP
Behandle URLs welche diesen regulären Ausdruck matchen als extern.
Nur interne HTTP Links werden rekursiv geprüft.
.TP
\fB--extern-strict=\fP\fIregex\fP
Behandle URLs welche diesen regulären Ausdruck matchen als strikt extern.
Nur interne HTTP Links werden rekursiv geprüft.
.TP
\fB-s\fP, \fB--extern-strict-all\fP
Prüfe lediglich die Syntax von externen URLs. Es wird keine.
Verbindung zu diesen Rechner aufgebaut.
Bei lokalen Dateiurls sind lediglich lokale Dateien intern. Bei http
und ftp URLs sind alle URLs mit demselben Domänennamen intern.
.TP
\fB-d\fP, \fB--denyallow\fP
Tausche die Prüfreihenfolge zu extern/intern. Standardreihenfolge
ist intern/extern.
.TP
\fB-C\fP, \fB--cookies\fP
Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich
Cookies die zum ursprünglichen Server zurückgesendet werden, werden
akzeptiert.
.br
Gesendete und akzeptierte Cookies werden als zusätzliche
Loginformation aufgeführt.
.TP
\fB-a\fP, \fB--anchors\fP
Prüfe HTTP Anker Verweise. Diese Option gilt sowohl für interne
als auch für externe URLs. Standard ist keine Überprüfung.
Diese Option impliziert \fB-w\fP weil Ankerfehler immer Warnungen sind.
.TP
\fB--no-anchor-caching\fP
Behandle url#anchora und url#anchorb beim Cachen als gleich. Dies
ist zwar Standard bei Browsern, aber in der URI Spezifikation
nicht enthalten. Benutzen Sie diese Option mit Vorsicht.
.TP
\fB-u\fP\fIName\fP, \fB--user=\fP\fIName\fP
Verwende den angegebenen Benutzernamen für HTTP und FTP
Authorisation. Für FTP ist der Standardname \fBanonymous\fP.
Siehe auch \fB-p\fP.
.TP
\fB-p\fP\fIPasswort\fP, \fB--password=\fP\fIPasswort\fP
Verwende das angegebene Passwort für HTTP und FTP Authorisation.
Für FTP ist das Standardpasswort \fBanonymous@\fP.
Siehe auch \fB-u\fP.
.TP
\fB--timeout=\fP\fISekunden\fP
Setze den Timeout für TCP-Verbindungen in Sekunden. Der Standard
Timeout ist 30 Sekunden.
.TP
\fB-P\fP\fISekunden\fP, \fB--pause=\fP\fISekunden\fP
Pausiere die angegebene Zahl von Sekunden zwischen dem Prüfen jeder URL.
Diese Option impliziert \fB-t0\fP.
Standard ist keine Pause zwischen dem Prüfen.
.TP
\fB-N\fP\fIServer\fP, \fB--nntp-server=\fP\fIServer\fP
Gibt ein NNTP Rechner für \fBnews:...\fP Links. Standard ist die
Umgebungsvariable NNTP_SERVER. Falls kein Rechner angegeben ist,
wird lediglich auf korrekte Syntax des Links geprüft.
.SS Alte Optionen
.TP
\fB--status\fP
Gebe Prüfstatus alle 5 Sekunden an stderr aus. Dies ist die Voreinstellung.
.SH AUSGABETYPEN
Beachten Sie dass normalerweise nur Fehler geloggt werden.
.TP
\fBtext\fP
Standard Textausgabe in \fISchlüssel\fP\fB: \fP\fIWert\fP-Form.
.TP
\fBhtml\fP
Gebe URLs in \fISchlüssel\fP\fB: \fP\fIWert\fP-Form als HTML
formatiert aus.
Besitzt zudem Verknüpfungen auf die referenzierten Seiten.
Ungültige URLs haben Verknüpfungen zur HTML und CSS Syntaxprüfung angehängt.
.TP
\fBcsv\fP
Gebe Prüfresultat in CSV-Format aus mit einer URL pro Zeile.
.TP
\fBgml\fP
Gebe Vater-Kind Beziehungen zwischen verknüpften URLs als GML Graphen aus.
Sie sollten die Option \fB--verbose\fP benutzen, um einen vollständigen
Graphen zu erhalten.
.TP
\fBxml\fP
Gebe Prüfresultat als maschinenlesbare XML-Datei aus.
.TP
\fBsql\fP
Gebe Prüfresultat als SQL Skript mit INSERT Befehlen aus. Ein Beispielskript,
um die initiale SQL Tabelle zu erstellen ist unter create.sql zu finden.
.TP
\fBblacklist\fP
Für Cronjobs geeignet. Gibt das Prüfergebnis in eine Datei
\fB~/.blacklist\fP aus welche nur Einträge mit fehlerhaften URLs und die
Anzahl der Fehlversuche enthält.
.TP
\fBnone\fP
Gibt nichts aus. Für Skripte geeignet.
.SH BEMERKUNGEN
Ein \fB!\fP vor einem regulären Ausdruck negiert diesen. Also matcht
\fB'!^mailto:'\fP alles außer mailto Links.
URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie
\fBftp://ftp.\fP behandelt, URLs die mit \fBwww.\fP beginnen wie
\fBhttp://www.\fP.
Sie können auch lokale Dateien als Argumente angeben.
Falls sich Ihr System automatisch mit dem Internet verbindet
(z.B. mit diald), wird es dies tun wenn Sie Links prüfen, die nicht
auf Ihren lokalen Rechner verweisen
Benutzen Sie die Optionen \fB-s\fP und \fB-i\fP, um dies zu verhindern.
Javascript Links werden zur Zeit ignoriert
Wenn Ihr System keine Threads unterstützt, benutzt LinkChecker
automatisch \fB-t0\fP..
Sie können mehrere user/password Paare in einer Konfigurationsdatei
angeben
Um Proxies zu benutzen, setzen Sie $http_proxy, $https_proxy unter
Unix oder Windows. Auf einem Mac benutzen Sie die Internet Config.
Beim Prüfen von \fBnews:\fP Links muß der angegebene NNTP Rechner nicht
unbedingt derselbe wie der des Benutzers sein.
.SH UMGEBUNG
\fBNNTP_SERVER\fP - gibt Standard NNTP Server an
\fBhttp_proxy\fP - gibt Standard HTTP Proxy an
\fBftp_proxy\fP - gibt Standard FTP Proxy an
\fBLC_MESSAGES\fP, \fBLANG\fP - gibt Ausgabesprache an
.SH DATEIEN
\fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkcheckerrc\fP -
Standardkonfigurationsdateien
\fB~/.blacklist\fP - Standard Dateiname der blacklist Logger Ausgabe
\fBlinkchecker-out.\fP\fITyp\fP - Standard Dateiname der Logger Ausgabe
\fBhttp://docs.python.org/lib/node127.html\fP - gültige Ausgabe
Enkodierungen
.SH AUTHOR
Bastian Kleineidam <calvin@users.sourceforge.net>