linkchecker/doc/de/linkchecker.1

299 lines
12 KiB
Groff
Raw Normal View History

.\" This file was generated with po4a. Translate the source file.
.\"
.TH LINKCHECKER 1 "10. M<>rz 2001"
.SH NAME
linkchecker \- pr<70>fe HTML Dokumente auf kaputte Verkn<6B>pfungen
.SH SYNTAX
\fBlinkchecker\fP [ \fIOptionen\fP ] [ \fIDatei\-oder\-URL\fP ]
.SH BESCHREIBUNG
.LP
LinkChecker bietet rekursives Pr<50>fen, Multithreading,Ausgabe als farbigen
oder normalen Text, HTML, SQL, CSV oder einen Sitemap\-Graphen in GML oder
XML,Unterst<73>tzung f<>r HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Gopher,
Telnet und lokale Dateiverkn<6B>pfungen,Einschr<68>nkung der
Verkn<EFBFBD>pfungs<EFBFBD>berpr<EFBFBD>fung mit URL Filtern bestehend aus regul<75>ren
Ausdr<EFBFBD>cken, Proxy Unterst<73>tzung, Benutzer/Passwort Authentifizierung f<>r
HTTP und FTP, Unterst<73>tzung des robots.txt Protokolls, Mehrsprachigkeit,
eine Kommandozeilenschnittstelle sowie eine CGI Webschnittstelle (ben<65>tigt
einen HTTP Server).
.SH BEISPIELE
Der h<>ufigste Gebrauchsfall pr<70>ft eine gegebene Dom<6F>ne rekursiv,
inklusive aller einzelnen nach au<61>en zeigenden Verkn<6B>pfungen:
\fBlinkchecker http://treasure.calvinsplayground.de/\fP
Beachten Sie dass dies die komplette Dom<6F>ne <20>berpr<70>ft welche aus mehreren
hunderttausend URLs bestehen kann. Benutzen Sie die Option \-r,um die
Rekursionstiefe zu beschr<68>nken.
Keine Verbindungen zu mailto: Rechnern, nur die URL Syntax wird gepr<70>ft. Alle
anderen Verkn<6B>pfungen werden wie <20>blich gepr<70>ft:
\fBlinkchecker \-\-ignore\-url=^mailto: www.mysite.org\fP
<EFBFBD>berpr<EFBFBD>fung einer lokalen HTML Datei unter Unix:
\fBlinkchecker ../bla.html\fP
<EFBFBD>berpr<EFBFBD>fung einer lokalen HTML Datei unter Windows:
\fBlinkchecker c:\etemp\etest.html\fP
Sie k<>nnen den \fBhttp://\fP URL Anteil weglassen wenn die Dom<6F>ne mit \fBwww.\fP beginnt:
\fBlinkchecker www.myhomepage.de\fP
Sie k<>nnen den \fBftp://\fP URL Anteil weglassen wenn die Dom<6F>ne mit \fBftp.\fP beginnt:
\fBlinkchecker \-r0 ftp.linux.org\fP
.SH OPTIONEN
.SS "Allgemeine Optionen"
.TP
\fB\-h\fP, \fB\-\-help\fP
Hilfe! Gebe Gebrauchsanweisung f<>r dieses Programm aus.
.TP
\fB\-f\fP\fIKonfigurationsdatei\fP, \fB\-\-config=\fP\fIKonfigurationsdatei\fP
Benutze \fIKonfigurationsdatei\fP als Konfiguration. Standardm<64><6D>ig sucht
LinkChecker zuerst nach \fB/etc/linkchecker/linkcheckerrc\fP und dann
\fB~/.linkchecker/linkcheckerrc\fP.
.TP
\fB\-I\fP, \fB\-\-interactive\fP
Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurde.
.TP
\fB\-V\fP, \fB\-\-version\fP
Gebe die Version aus und beende das Programm.
.TP
\fB\-t\fP\fINummer\fP, \fB\-\-threads=\fP\fINummer\fP
Generiere nicht mehr als \fINummer\fP Threads. Standard Anzahl von Threadsist
10. Um Threads zu deaktivieren, geben Sie eine nicht positive Nummer an.
.TP
\fB\-\-priority\fP
Starte mit normaler Threadpriorit<69>t. Als Standard l<>uft LinkChecker mit
niedriger Threadpriorit<69>t, um als Hintergrundprozess geeignet zu sein.
.SS Ausgabeoptionen
.TP
\fB\-v\fP, \fB\-\-verbose\fP
Logge alle gepr<70>ften URLs (impliziert \fB\-w\fP). Standard ist es, nur
fehlerhafte URLs zu loggen.
.TP
\fB\-w\fP, \fB\-\-warnings\fP
Logge Warnungen.
.TP
\fB\-W\fP\fIregex\fP, \fB\-\-warning\-regex=\fP\fIregex\fP
Definieren Sie einen regul<75>ren Ausdruck, der eine Warnung ausgibt falls er
den Inhalt einer gepr<70>ften URL matcht. Dies gilt nur f<>r g<>ltige Seiten
deren Inhalt wir bekommen k<>nnen. Benutzen Sie dies, um nach Seiten zu
suchen welche bestimmte Fehler enthalten, zum Beispiel "Diese Seite wurde
entfernt" oder "Oracle Applikationsfehler". Diese Option impliziert \fB\-w\fP.
.TP
\fB\-\-warning\-size\-bytes=\fP\fIbytes\fP
Gebe eine Warnung aus wenn die Inhaltsgr<67><72>e bekannt ist und die angegebene
Anzahl von Bytes <20>bersteigt. Diese Option impliziert \fB\-w\fP.
.TP
\fB\-q\fP, \fB\-\-quiet\fP
Keine Ausgabe, ein Alias f<>r \fB\-o none\fP. Dies ist nur in Verbindung mit
\fB\-F\fP n<>tzlich.
.TP
\fB\-o\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP], \fB\-\-output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP]
Spezifiziere die Ausgabe als \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP,
\fBdot\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP. Standardausgabe ist
\fBtext\fP. \fIEnkodierung\fP gibt die Ausgabekodierung an, die Standardkodierung
erfolgt mit dem eingestellten Zeichensatz des Systems. G<>ltige
Enkodierungen sind unter
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP aufgelistet.
.TP
\fB\-F\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP], \fB\-\-file\-output=\fP\fITyp\fP[\fB/\fP\fIEnkodierung\fP][\fB/\fP\fIDateiname\fP]
Ausgabe in eine Datei namens \fBlinkchecker\-out.\fP\fITyp\fP,
\fB$HOME/.linkchecker/blacklist\fP bei \fBblacklist\fP Ausgabe, oder \fIDateiname\fP
falls angegeben. Der \fIDateiname\fP Teil wird beim Ausgabetyp \fBnone\fP
ignoriert, ansonsten wird die Datei <20>berschreiben falls sie existiert. Sie
k<EFBFBD>nnen diese Option mehr als einmal verwenden. G<>ltige Ausgabetypen sind
\fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBdot\fP, \fBxml\fP, \fBnone\fP oder
\fBblacklist\fP. Standard ist keine Dateiausgabe. \fIEnkodierung\fP gibt die
Ausgabekodierung an, die Standardkodierung erfolgt mit dem eingestellten
Zeichensatz des Systems. G<>ltige Enkodierungen sind unter
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP aufgelistet. Beachten
Sie dass Sie mit der Option\fB\-o none\fP jegliche Ausgaben auf der Konsole
verhindern k<>nnen.
.TP
\fB\-\-no\-status\fP
Gebe keine Statusmeldungen aus.
.TP
\fB\-D\fP\fIlogger\fP, \fB\-\-debug=\fP\fIlogger\fP
Gebe Testmeldungen aus f<>r den angegebenen Logger. Verf<72>gbare Logger sind
\fBcmdline\fP, \fBchecking\fP,\fBcache\fP, \fBgui\fP and \fBall\fP. Die Angabe \fBall\fP ist
ein Synonym f<>r alle verf<72>gbaren Logger. Diese Option kann mehrmals
angegeben werden, um mit mehr als einem Logger zu testen. Um akkurate
Ergebnisse zu erzielen werden Threads w<>hrend bei Testdurchl<68>ufen
deaktiviert.
.TP
\fB\-\-profile\fP
Schreibe Profiling\-Daten in eine Datei namens \fBlinkchecker.prof\fP im
aktuellen Arbeitsverzeichnis. Siehe auch \fB\-\-viewprof\fP.
.TP
\fB\-\-viewprof\fP
Gebe vorher generierte Profiling\-Daten aus. Siehe auch \fB\-\-profile\fP.
.SS "Optionen zum Pr<50>fen"
.TP
\fB\-r\fP\fITiefe\fP, \fB\-\-recursion\-level=\fP\fITiefe\fP
Pr<EFBFBD>fe rekursiv alle URLs bis zu der angegebenen \fITiefe\fP. Eine negative
Tiefe erwirkt unendliche Rekursion. Standard Tiefe ist unendlich.
.TP
\fB\-\-no\-follow\-url=\fP\fIregex\fP
Pr<EFBFBD>fe URLs, welche den angegebenen regul<75>ren Ausdruck entsprechen, aber
verhindere die rekursive Pr<50>fung.
.TP
\fB\-\-ignore\-url=\fP\fIregex\fP
Pr<EFBFBD>fe lediglich die Syntax von URLs welche dem angegebenen regul<75>ren
Ausdruck entsprechen.
.TP
\fB\-C\fP, \fB\-\-cookies\fP
Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich Cookies, die
zum urspr<70>nglichen Server zur<75>ckgesendet werden, werden akzeptiert.
Gesendete und akzeptierte Cookies werden als zus<75>tzlicheLoginformation
aufgef<EFBFBD>hrt.
.TP
\fB\-a\fP, \fB\-\-anchors\fP
Pr<EFBFBD>fe HTTP Anker Verweise. Standard ist keine <20>berpr<70>fung. Diese Option
impliziert \fB\-w\fP weil Ankerfehler immer Warnungen sind.
.TP
\fB\-\-no\-anchor\-caching\fP
Behandle url#anchora und url#anchorb beim Cachen als gleich. Dies ist zwar
Standard bei Browsern, aber in der URI Spezifikation nicht
enthalten. Benutzen Sie diese Option mit Vorsicht.
.TP
\fB\-u\fP\fIName\fP, \fB\-\-user=\fP\fIName\fP
Verwende den angegebenen Benutzernamen f<>r HTTP und FTP
Authorisierung. F<>r FTP ist der Standardname \fBanonymous\fP. Siehe auch
\fB\-p\fP.
.TP
\fB\-p\fP\fIPasswort\fP, \fB\-\-password=\fP\fIPasswort\fP
Verwende das angegebene Passwort f<>r HTTP und FTP Authorisierung. F<>r FTP
ist das Standardpasswort \fBanonymous@\fP. Siehe auch \fB\-u\fP.
.TP
\fB\-\-timeout=\fP\fISekunden\fP
Setze den Timeout f<>r TCP\-Verbindungen in Sekunden. Der Standard Timeout
ist 30 Sekunden.
.TP
\fB\-P\fP\fISekunden\fP, \fB\-\-pause=\fP\fISekunden\fP
Pausiere die angegebene Zahl von Sekunden zwischen dem Pr<50>fen jeder
URL.Diese Option impliziert \fB\-t0\fP. Standard ist keine Pause zwischen dem
Pr<EFBFBD>fen.
.TP
\fB\-N\fP\fIServer\fP, \fB\-\-nntp\-server=\fP\fIServer\fP
Gibt ein NNTP Rechner f<>r \fBnews:\fP Links. Standard ist die
Umgebungsvariable \fBNNTP_SERVER\fP. Falls kein Rechner angegeben ist, wird
lediglich auf korrekte Syntax des Links gepr<70>ft.
.TP
\fB\-\-no\-proxy\-for=\fP\fIregex\fP
Rechner welche den angegebenen regul<75>ren Ausdruck entsprechen sollen direkt
und nicht <20>ber einen Proxy angesprochen werden.
.SS "Alte Optionen"
.TP
\fB\-\-status\fP
Gebe Pr<50>fstatus alle 5 Sekunden an stderr aus. Dies ist die Voreinstellung.
.SH AUSGABETYPEN
Beachten Sie dass normalerweise nur Fehler geloggt werden.
.TP
\fBtext\fP
Standard Textausgabe in "Schl<68>ssel: Wert"\-Form.
.TP
\fBhtml\fP
Gebe URLs in "Schl<68>ssel: Wert"\-Form als HTML formatiert aus. Besitzt zudem
Verkn<EFBFBD>pfungen auf die referenzierten Seiten. Ung<6E>ltige URLs haben
Verkn<EFBFBD>pfungen zur HTML und CSS Syntaxpr<70>fung angeh<65>ngt.
.TP
\fBcsv\fP
Gebe Pr<50>fresultat in CSV\-Format aus mit einer URL pro Zeile.
.TP
\fBgml\fP
Gebe Vater\-Kind Beziehungen zwischen verkn<6B>pften URLs als GML Graphen
aus. Sie sollten die Option \fB\-\-verbose\fP benutzen, um einen vollst<73>ndigen
Graphen zu erhalten.
.TP
\fBdot\fP
Gebe Vater\-Kind Beziehungen zwischen verkn<6B>pften URLs als DOT Graphen
aus. Sie sollten die Option \fB\-\-verbose\fP benutzen, um einen vollst<73>ndigen
Graphen zu erhalten.
.TP
\fBxml\fP
Gebe Pr<50>fresultat als maschinenlesbare XML\-Datei aus.
.TP
\fBsql\fP
Gebe Pr<50>fresultat als SQL Skript mit INSERT Befehlen aus. Ein
Beispielskript, um die initiale SQL Tabelle zu erstellen ist unter
create.sql zu finden.
.TP
\fBblacklist\fP
F<EFBFBD>r Cronjobs geeignet. Gibt das Pr<50>fergebnis in eine Datei
\fB~/.linkchecker/blacklist\fP aus, welche nur Eintr<74>ge mit fehlerhaften URLs
und die Anzahl der Fehlversuche enth<74>lt.
.TP
\fBnone\fP
Gibt nichts aus. F<>r Skripte geeignet.
.SH BEMERKUNGEN
Ein \fB!\fP vor einem regul<75>ren Ausdruck negiert diesen. Also matcht
\fB!^mailto:\fP alles au<61>er mailto Links.
URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie \fBftp://ftp.\fP
behandelt, URLs die mit \fBwww.\fP beginnen wie \fBhttp://www.\fP. Sie k<>nnen
auch lokale Dateien als Argumente angeben.
Falls sich Ihr System automatisch mit dem Internet verbindet (z.B. mit
diald), wird es dies tun wenn Sie Links pr<70>fen, die nicht auf Ihren lokalen
Rechner verweisen Benutzen Sie die Optionen \fB\-s\fP und \fB\-i\fP, um dies zu
verhindern.
Javascript Links werden zur Zeit ignoriert.
Wenn Ihr System keine Threads unterst<73>tzt, benutzt LinkChecker automatisch
\fB\-t0\fP.
Sie k<>nnen mehrere Benutzer/Passwort Paare in einer Konfigurationsdatei
angeben.
Um Proxies zu benutzen, setzen Sie $http_proxy, $https_proxy unter Unix oder
Windows. Auf einem Mac benutzen Sie die Internet Config.
Beim Pr<50>fen von \fBnews:\fP Links mu<6D> der angegebene NNTP Rechner nicht
unbedingt derselbe wie der des Benutzers sein.
.SH UMGEBUNG
\fBNNTP_SERVER\fP \- gibt Standard NNTP Server an
\fBhttp_proxy\fP \- gibt Standard HTTP Proxy an
\fBftp_proxy\fP \- gibt Standard FTP Proxy an
\fBLC_MESSAGES\fP, \fBLANG\fP, \fBLANGUAGE\fP \- gibt Ausgabesprache an
.SH R<EFBFBD>CKGABEWERT
Der R<>ckgabewert ist nicht Null falls
.IP \(bu
ung<EFBFBD>ltige Verkn<6B>pfungen gefunden wurden oder
.IP \(bu
Warnungen gefunden wurden und die Option \-\-warnings wurde angegeben oder
.IP \(bu
ein Programmfehler aufgetreten ist.
.SH DATEIEN
\fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkchecker/linkcheckerrc\fP \-
Standardkonfigurationsdateien
\fB~/.linkchecker/blacklist\fP \- Standard Dateiname der blacklist Logger
Ausgabe
\fBlinkchecker\-out.\fP\fItype\fP \- Standard Dateiname der Logausgabe
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP \- g<>ltige Ausgabe
Enkodierungen
.SH AUTHOR
Bastian Kleineidam <calvin@users.sourceforge.net>