linkchecker/doc/de/linkchecker.1

309 lines
11 KiB
Groff
Raw Normal View History

.TH LINKCHECKER 1 "25. November 2004"
.SH NAME
linkchecker \- pr<70>fe HTML Dokumente auf kaputte Verkn<6B>pfungen
.SH SYNTAX
.B linkchecker
[
.I Optionen
]
[
.I Datei-oder-URL
]
.SH BESCHREIBUNG
.LP
LinkChecker bietet rekursives Pr<50>fen, Multithreading,
Ausgabe als farbigen oder normalen Text, HTML, SQL, CSV oder einen
Sitemap-Graphen in GML oder XML,
Unterst<EFBFBD>tzung f<>r HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:,
Gopher, Telnet und lokale Dateiverkn<6B>pfungen,
Einschr<EFBFBD>nkung der Verkn<6B>pfungs<67>berpr<70>fung mit URL Filtern bestehend aus
regul<EFBFBD>ren Ausdr<64>cken, Proxy Unterst<73>tzung, Benutzer/Passwort
Authentifizierung f<>r HTTP und FTP, Unterst<73>tzung des robots.txt
Protokolls, Mehrsprachigkeit, eine Kommandozeilenschnittstelle
sowie eine CGI Webschnittstelle (ben<65>tigt einen HTTP Server).
.SH BEISPIELE
Der h<>ufigste Gebrauchsfall pr<70>ft eine gegebene Dom<6F>ne rekursiv,
inklusive aller einzelnen nach au<61>en zeigenden Verkn<6B>pfungen:
\fBlinkchecker http://treasure.calvinsplayground.de/\fP
Beachten Sie dass dies die komplette Dom<6F>ne <20>berpr<70>ft welche aus
mehreren hunderttausend URLs bestehen kann. Benutzen Sie die Option -r,
um die Rekursionstiefe zu beschr<68>nken.
Keine Verbindungen zu mailto: Rechnern, nur die Syntax wird gepr<70>ft. Alle
anderen Verkn<6B>pfungen werden wie <20>blich gepr<70>ft:
\fBlinkchecker --intern='!^mailto:' --extern-strict-all www.mysite.org\fP
<EFBFBD>berpr<EFBFBD>fung einer lokalen HTML Datei unter Unix:
\fBlinkchecker ../bla.html\fP
<EFBFBD>berpr<EFBFBD>fung einer lokalen HTML Datei unter Windows:
\fBlinkchecker c:\\temp\\test.html\fP
Sie k<>nnen den \fBhttp://\fP URL Anteil weglassen wenn die Dom<6F>ne mit
\fBwww.\fP beginnt:
\fBlinkchecker www.myhomepage.de\fP
Sie k<>nnen den \fBftp://\fP URL Anteil weglassen wenn die Dom<6F>ne mit
\fBftp.\fP beginnt:
\fBlinkchecker -r0 ftp.linux.org\fP
.SH OPTIONEN
.SS Allgemeine Optionen
.TP
\fB-h\fP, \fB--help\fP
Hilfe! Gebe Gebrauchsanweisung f<>r dieses Programm aus.
.TP
\fB-f\fP\fIKonfigurationsdatei\fP, \fB--config=\fP\fIKonfigurationsdatei\fP
Benutze \fIfile\fP as configuration file. As default LinkChecker first searches
/etc/linkchecker/linkcheckerrc and then ~/.linkcheckerrc.
.TP
\fB-I\fP, \fB--interactive\fP
Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurde.
.TP
\fB-V\fP, \fB--version\fP
Drucke die Version und beende das Programm.
.TP
\fB-t\fP\fInum\fP, \fB--threads=\fP\fInum\fP
Generiere nicht mehr als \fInum\fP Threads. Standard Anzahl von Threads
ist 10.
.SS Ausgabeoptionen
.TP
\fB-v\fP, \fB--verbose\fP
Logge alle gepr<70>ften URLs (impliziert \fB-w\fP). Standard ist es, nur
fehlerhafte URLs zu loggen.
.TP
\fB-w\fP, \fB--warnings\fP
Logge Warnungen.
.TP
\fB-W\fP\fIregex\fP, \fB--warning-regex=\fIregex\fP
Definieren Sie einen regul<75>ren Ausdruck, der eine Warnung ausgibt
falls er den Inhalt einer gepr<70>ften URL matcht.
Dies gilt nur f<>r g<>ltige Seiten deren Inhalt wir bekommen k<>nnen.
.br
Sie k<>nnen dies verwenden, um Seiten mit Fehlermeldungen wie z.B.
'Diese Seite ist umgezogen' oder 'Oracle Server Fehler'.
Diese Option impliziert \fB-w\fP.
.TP
\fB--warning-size-bytes=\fP\fIBytes\fP
Drucke eine Warnung wenn die Inhaltsgr<67><72>e bekannt ist und die
angegebene Anzahl von Bytes <20>bersteigt.
Diese Option impliziert \fB-w\fP.
.TP
\fB-q\fP, \fB--quiet\fP
Keine Ausgabe, ein Alias f<>r \fB-o none\fP. Dies ist nur in Verbindung
mit \fB-F\fP n<>tzlich.
.TP
\fB-o\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP], \fB--output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP]
Spezifiziere die Ausgabe als \fBtext\fP, \fBhtml\fP, \fBsql\fP,
\fBcsv\fP, \fBgml\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP.
Standardausgabe ist \fBtext\fP. \fIEnkodierung\fP gibt die
Ausgabekodierung an, die Standardkodierung ist \fBiso-8859-15\fP.
G<EFBFBD>ltige Encodierungen sind unter
\fBhttp://docs.python.org/lib/node127.html\fP aufgelistet.
.TP
\fB-F\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP], \fB--file-output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP]
Ausgabe in eine Datei namens \fBlinkchecker-out.\fP\fITyp\fP,
\fB$HOME/.linkchecker_blacklist\fP
bei \fBblacklist\fP Ausgabe, oder \fIDateiname\fP falls angegeben.
Der \fIDateiname\fP Teil wird beim Ausgabetyp \fBnone\fP ignoriert,
ansonsten wird die Datei <20>berschreiben falls sie existiert.
Sie k<>nnen diese Option mehr als einmal verwenden. G<>ltige
Ausgabetypen sind \fBtext\fP, \fBhtml\fP, \fBsql\fP,
\fBcsv\fP, \fBgml\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP.
Standard ist keine Dateiausgabe. \fIEnkodierung\fP gibt die
Ausgabekodierung an, die Standardkodierung ist \fBiso-8859-15\fP.
G<EFBFBD>ltige Encodierungen sind unter
\fBhttp://docs.python.org/lib/node127.html\fP aufgelistet.
Bemerken Sie dass die Option
\fB-o none\fP jegliche Ausgaben auf der Konsole verhindert.
.TP
\fB--no-status\fP
Gebe keine Statusmeldungen aus.
.TP
\fB-D\fP, \fB--debug\fP
Gebe Debugmeldungen aus f<>r den angegebenen Logger.
Verf<EFBFBD>gbare Logger sind \fBcmdline\fP, \fBchecking\fP,
\fBcache\fP, \fBgui\fP and \fBall\fP.
Die Angabe \fBall\fP ist ein Synonym f<>r alle verf<72>gbaren Logger.
Diese Option kann mehrmals angegeben werden, um
mit mehr als einem Logger zu debuggen.
.br
F<EFBFBD>r exakte Resultate wird Threading w<>hrend einem
Debuglauf deaktiviert.
.TP
\fB--profile\fP
Schreibe Profiling-Daten in eine Datei namens \fBlinkchecker.prof\fP im
aktuellen Arbeitsverzeichnis. Siehe auch \fB--viewprof\fP.
.TP
\fB--viewprof\fP
Gebe vorher generierte Profiling-Daten aus. Siehe auch \fB--profile\fP.
.SS Optionen zum Pr<EFBFBD>fen
.TP
\fB-r\fP\fITiefe\fP, \fB--recursion-level=\fP\fITiefe\fP
Pr<EFBFBD>fe rekursiv alle URLs bis zu der angegebenen \fITiefe\fP. Eine
negative Tiefe erwirkt unendliche Rekursion. Standard Tiefe ist
unendlich.
.TP
\fB-i\fP\fIregex\fP, \fB--intern=\fIregex\fP
Behandle URLs welche den regul<75>ren Ausdruck matchen als intern.
LinkChecker steigt nur in interne URLs rekursiv ab, nicht in externe.
.TP
\fB-e\fP\fIregex\fP, \fB--extern=\fP\fIregex\fP
Behandle URLs welche diesen regul<75>ren Ausdruck matchen als extern.
Nur interne HTTP Links werden rekursiv gepr<70>ft.
.TP
\fB--extern-strict=\fP\fIregex\fP
Behandle URLs welche diesen regul<75>ren Ausdruck matchen als strikt extern.
Nur interne HTTP Links werden rekursiv gepr<70>ft.
.TP
\fB-s\fP, \fB--extern-strict-all\fP
Pr<EFBFBD>fe lediglich die Syntax von externen URLs. Es wird keine.
Verbindung zu diesen Rechner aufgebaut.
Bei lokalen Dateiurls sind lediglich lokale Dateien intern. Bei http
und ftp URLs sind alle URLs mit demselben Dom<6F>nennamen intern.
.TP
\fB-d\fP, \fB--denyallow\fP
Tausche die Pr<50>freihenfolge zu extern/intern. Standardreihenfolge
ist intern/extern.
.TP
\fB-C\fP, \fB--cookies\fP
Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich
Cookies die zum urspr<70>nglichen Server zur<75>ckgesendet werden, werden
akzeptiert.
.br
Gesendete und akzeptierte Cookies werden als zus<75>tzliche
Loginformation aufgef<65>hrt.
.TP
\fB-a\fP, \fB--anchors\fP
Pr<EFBFBD>fe HTTP Anker Verweise. Diese Option gilt sowohl f<>r interne
als auch f<>r externe URLs. Standard ist keine <20>berpr<70>fung.
Diese Option impliziert \fB-w\fP weil Ankerfehler immer Warnungen sind.
.TP
\fB--no-anchor-caching\fP
Behandle url#anchora und url#anchorb beim Cachen als gleich. Dies
ist zwar Standard bei Browsern, aber in der URI Spezifikation
nicht enthalten. Benutzen Sie diese Option mit Vorsicht.
.TP
\fB-u\fP\fIName\fP, \fB--user=\fP\fIName\fP
Verwende den angegebenen Benutzernamen f<>r HTTP und FTP
Authorisation. F<>r FTP ist der Standardname \fBanonymous\fP.
Siehe auch \fB-p\fP.
.TP
\fB-p\fP\fIPasswort\fP, \fB--password=\fP\fIPasswort\fP
Verwende das angegebene Passwort f<>r HTTP und FTP Authorisation.
F<EFBFBD>r FTP ist das Standardpasswort \fBanonymous@\fP.
Siehe auch \fB-u\fP.
.TP
\fB--timeout=\fP\fISekunden\fP
Setze den Timeout f<>r TCP-Verbindungen in Sekunden. Der Standard
Timeout ist 30 Sekunden.
.TP
\fB-P\fP\fISekunden\fP, \fB--pause=\fP\fISekunden\fP
Pausiere die angegebene Zahl von Sekunden zwischen dem Pr<50>fen jeder URL.
Diese Option impliziert \fB-t0\fP.
Standard ist keine Pause zwischen dem Pr<50>fen.
.TP
\fB-N\fP\fIServer\fP, \fB--nntp-server=\fP\fIServer\fP
Gibt ein NNTP Rechner f<>r \fBnews:...\fP Links. Standard ist die
Umgebungsvariable NNTP_SERVER. Falls kein Rechner angegeben ist,
wird lediglich auf korrekte Syntax des Links gepr<70>ft.
.SS Alte Optionen
.TP
\fB--status\fP
Gebe Pr<50>fstatus alle 5 Sekunden an stderr aus. Dies ist die Voreinstellung.
.SH AUSGABETYPEN
Beachten Sie dass normalerweise nur Fehler geloggt werden.
.TP
\fBtext\fP
Standard Textausgabe in \fISchl<EFBFBD>ssel\fP\fB: \fP\fIWert\fP-Form.
.TP
\fBhtml\fP
Gebe URLs in \fISchl<EFBFBD>ssel\fP\fB: \fP\fIWert\fP-Form als HTML
formatiert aus.
Besitzt zudem Verkn<6B>pfungen auf die referenzierten Seiten.
Ung<EFBFBD>ltige URLs haben Verkn<6B>pfungen zur HTML und CSS Syntaxpr<70>fung angeh<65>ngt.
.TP
\fBcsv\fP
Gebe Pr<50>fresultat in CSV-Format aus mit einer URL pro Zeile.
.TP
\fBgml\fP
Gebe Vater-Kind Beziehungen zwischen verkn<6B>pften URLs als GML Graphen aus.
Sie sollten die Option \fB--verbose\fP benutzen, um einen vollst<73>ndigen
Graphen zu erhalten.
.TP
\fBxml\fP
Gebe Pr<50>fresultat als maschinenlesbare XML-Datei aus.
.TP
\fBsql\fP
Gebe Pr<50>fresultat als SQL Skript mit INSERT Befehlen aus. Ein Beispielskript,
um die initiale SQL Tabelle zu erstellen ist unter create.sql zu finden.
.TP
\fBblacklist\fP
F<EFBFBD>r Cronjobs geeignet. Gibt das Pr<50>fergebnis in eine Datei
\fB~/.blacklist\fP aus welche nur Eintr<74>ge mit fehlerhaften URLs und die
Anzahl der Fehlversuche enth<74>lt.
.TP
\fBnone\fP
Gibt nichts aus. F<>r Skripte geeignet.
.SH BEMERKUNGEN
Ein \fB!\fP vor einem regul<75>ren Ausdruck negiert diesen. Also matcht
\fB'!^mailto:'\fP alles au<61>er mailto Links.
URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie
\fBftp://ftp.\fP behandelt, URLs die mit \fBwww.\fP beginnen wie
\fBhttp://www.\fP.
Sie k<>nnen auch lokale Dateien als Argumente angeben.
Falls sich Ihr System automatisch mit dem Internet verbindet
(z.B. mit diald), wird es dies tun wenn Sie Links pr<70>fen, die nicht
auf Ihren lokalen Rechner verweisen
Benutzen Sie die Optionen \fB-s\fP und \fB-i\fP, um dies zu verhindern.
Javascript Links werden zur Zeit ignoriert
Wenn Ihr System keine Threads unterst<73>tzt, benutzt LinkChecker
automatisch \fB-t0\fP..
Sie k<>nnen mehrere user/password Paare in einer Konfigurationsdatei
angeben
Um Proxies zu benutzen, setzen Sie $http_proxy, $https_proxy unter
Unix oder Windows. Auf einem Mac benutzen Sie die Internet Config.
Beim Pr<50>fen von \fBnews:\fP Links mu<6D> der angegebene NNTP Rechner nicht
unbedingt derselbe wie der des Benutzers sein.
.SH UMGEBUNG
\fBNNTP_SERVER\fP - gibt Standard NNTP Server an
\fBhttp_proxy\fP - gibt Standard HTTP Proxy an
\fBftp_proxy\fP - gibt Standard FTP Proxy an
\fBLC_MESSAGES\fP, \fBLANG\fP - gibt Ausgabesprache an
.SH DATEIEN
\fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkcheckerrc\fP -
Standardkonfigurationsdateien
\fB~/.blacklist\fP - Standard Dateiname der blacklist Logger Ausgabe
\fBlinkchecker-out.\fP\fITyp\fP - Standard Dateiname der Logger Ausgabe
\fBhttp://docs.python.org/lib/node127.html\fP - g<>ltige Ausgabe
Enkodierungen
.SH AUTHOR
Bastian Kleineidam <calvin@users.sourceforge.net>