linkchecker/doc/de/linkchecker.1

320 lines
12 KiB
Groff
Raw Normal View History

.\" This file was generated with po4a. Translate the source file.
.\"
.TH linkchecker 1 10.3.2001 LinkChecker
.SH NAME
linkchecker \- pr<70>fe HTML Dokumente auf ung<6E>ltige Verkn<6B>pfungen
.
.SH SYNTAX
\fBlinkchecker\fP [\fIOptionen\fP] [\fIDatei\-oder\-URL\fP]...
.
.SH BESCHREIBUNG
.LP
LinkChecker bietet rekursives Pr<50>fen, Multithreading, Ausgabe als farbigen
oder normalen Text, HTML, SQL, CSV oder einen Sitemap\-Graphen in GML oder
XML, Unterst<73>tzung f<>r HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:,
Gopher, Telnet und lokale Dateiverkn<6B>pfungen, Einschr<68>nkung der
Verkn<EFBFBD>pfungs<EFBFBD>berpr<EFBFBD>fung mit URL Filtern bestehend aus regul<75>ren
Ausdr<EFBFBD>cken, Proxy Unterst<73>tzung, Benutzer/Passwort Authentifizierung f<>r
HTTP und FTP, Unterst<73>tzung des robots.txt Protokolls, Mehrsprachigkeit,
eine Kommandozeilenschnittstelle sowie eine CGI Webschnittstelle (ben<65>tigt
einen HTTP Server).
.
.SH BEISPIELE
Der h<>ufigste Gebrauchsfall pr<70>ft die angegebene Dom<6F>ne rekursiv,
inklusive aller einzelnen nach au<61>en zeigenden Verkn<6B>pfungen:
\fBlinkchecker http://treasure.calvinsplayground.de/\fP
.br
Beachten Sie dass dies die komplette Dom<6F>ne <20>berpr<70>ft, welche aus
mehreren hunderttausend URLs bestehen kann. Benutzen Sie die Option \fB\-r\fP,
um die Rekursionstiefe zu beschr<68>nken.
.br
Keine Verbindungen zu \fBmailto:\fP Rechnern, nur die URL Syntax wird gepr<70>ft. Alle
anderen Verkn<6B>pfungen werden wie <20>blich gepr<70>ft:
\fBlinkchecker \-\-ignore\-url=^mailto: www.mysite.org\fP
.br
<EFBFBD>berpr<EFBFBD>fung einer lokalen HTML Datei unter Unix:
\fBlinkchecker ../bla.html\fP
.br
<EFBFBD>berpr<EFBFBD>fung einer lokalen HTML Datei unter Windows:
\fBlinkchecker c:\etemp\etest.html\fP
.br
Sie k<>nnen den \fBhttp://\fP URL Anteil weglassen wenn die Dom<6F>ne mit \fBwww.\fP beginnt:
\fBlinkchecker www.myhomepage.de\fP
.br
Sie k<>nnen den \fBftp://\fP URL Anteil weglassen wenn die Dom<6F>ne mit \fBftp.\fP beginnt:
\fBlinkchecker \-r0 ftp.linux.org\fP
.
.SH OPTIONEN
.SS "Allgemeine Optionen"
.TP
\fB\-h\fP, \fB\-\-help\fP
Hilfe! Gebe Gebrauchsanweisung f<>r dieses Programm aus.
.TP
\fB\-f\fP\fIDATEINAME\fP, \fB\-\-config=\fP\fIDATEINAME\fP
Benutze \fIDATEINAME\fP als Konfigurationsdatei. Standardm<64><6D>ig sucht
LinkChecker zuerst nach \fB/etc/linkchecker/linkcheckerrc\fP und dann
\fB~/.linkchecker/linkcheckerrc\fP.
.TP
\fB\-I\fP, \fB\-\-interactive\fP
Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurden.
.TP
\fB\-t\fP\fINUMMER\fP, \fB\-\-threads=\fP\fINUMMER\fP
Generiere nicht mehr als die angegebene Anzahl von Threads. Standard Anzahl
von Threads ist 10. Um Threads zu deaktivieren, geben Sie eine nicht
positive Nummer an.
.TP
\fB\-\-priority\fP
Starte mit normaler Threadpriorit<69>t. Als Standard l<>uft LinkChecker mit
niedriger Threadpriorit<69>t, um als Hintergrundprozess geeignet zu sein.
.TP
\fB\-\-disable\-psyco\fP
Verwende nicht die Psyco Laufzeitoptimmierung, auch wenn diese installiert
ist.
.TP
\fB\-V\fP, \fB\-\-version\fP
Gebe die Version aus und beende das Programm.
.
.SS Ausgabeoptionen
.TP
\fB\-v\fP, \fB\-\-verbose\fP
Gebe alle gepr<70>ften URLs aus. Standard ist es, nur fehlerhafte URLs und
Warnungen auszugeben.
.TP
\fB\-\-no\-warnings\fP
Gebe keine Warnungen aus. Standard ist die Ausgabe von Warnungen.
.TP
\fB\-W\fP\fIREGEX\fP, \fB\-\-warning\-regex=\fP\fIREGEX\fP
Definieren Sie einen regul<75>ren Ausdruck der eine Warnung ausgibt falls er
auf den Inhalt einer gepr<70>ften URL zutrifft. Dies gilt nur f<>r g<>ltige
Seiten deren Inhalt wir bekommen k<>nnen.
Benutzen Sie dies, um nach Seiten zu suchen, welche bestimmte Fehler
enthalten, zum Beispiel "Diese Seite wurde entfernt" oder "Oracle
Applikationsfehler".
.TP
\fB\-\-warning\-size\-bytes=\fP\fINUMMER\fP
Gebe eine Warnung aus, wenn die Inhaltsgr<67><72>e bekannt ist und die
angegebene Anzahl von Bytes <20>bersteigt.
.TP
\fB\-q\fP, \fB\-\-quiet\fP
Keine Ausgabe, ein Alias f<>r \fB\-o none\fP. Dies ist nur in Verbindung mit
\fB\-F\fP n<>tzlich.
.TP
\fB\-o\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP], \fB\-\-output=\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP]
Spezifiziere die Ausgabe als \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP,
\fBdot\fP, \fBxml\fP, \fBnone\fP oder \fBblacklist\fP. Standardausgabe ist \fBtext\fP. Die
verschiedenen Ausgabetypen sind weiter unten erkl<6B>rt. \fIEnkodierung\fP gibt
die Ausgabekodierung an, die Standardkodierung erfolgt mit dem eingestellten
Zeichensatz des Systems. G<>ltige Enkodierungen sind unter
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP aufgelistet.
.TP
\fB\-F\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP][\fB/\fP\fIDATEINAME\fP], \fB\-\-file\-output=\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP][\fB/\fP\fIDATEINAME\fP]
Ausgabe in eine Datei namens \fBlinkchecker\-out.\fP\fITYP\fP,
\fB$HOME/.linkchecker/blacklist\fP bei \fBblacklist\fP Ausgabe, oder \fIDATEINAME\fP
falls angegeben. Der \fIDATEINAME\fP und \fIENKODIERUNG\fP Teil wird beim
Ausgabetyp \fBnone\fP ignoriert, ansonsten wird die Datei <20>berschreiben falls
sie existiert. Sie k<>nnen diese Option mehr als einmal verwenden. G<>ltige
Ausgabetypen sind \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBdot\fP, \fBxml\fP,
\fBnone\fP oder \fBblacklist\fP. Standard ist keine Dateiausgabe. \fIENKODIERUNG\fP
gibt die Ausgabekodierung an,der Standard ist die Enkodierung der
ausgew<EFBFBD>hlten Spracheinstellung. G<>ltige Enkodierungen sind unter
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP aufgelistet. Beachten
Sie, dass Sie mit der Option \fB\-o none\fP jegliche Ausgaben auf der Konsole
verhindern k<>nnen.
.TP
\fB\-\-no\-status\fP
Gebe keine Statusmeldungen aus.
.TP
\fB\-D\fP\fINAME\fP, \fB\-\-debug=\fP\fINAME\fP
Gebe Testmeldungen aus f<>r den angegebenen Logger. Verf<72>gbare Logger sind
\fBcmdline\fP, \fBchecking\fP,\fBcache\fP, \fBgui\fP, \fBdns\fP und \fBall\fP. Die Angabe
\fBall\fP ist ein Synonym f<>r alle verf<72>gbaren Logger. Diese Option kann
mehrmals angegeben werden, um mit mehr als einem Logger zu testen. Um
akkurate Ergebnisse zu erzielen, werden Threads und die psyco
Laufzeitkompilierung w<>hrend Testdurchl<68>ufen deaktiviert.
.TP
\fB\-\-trace\fP
Gebe Trace\-Information aus. Die Psyco Laufzeitoptimierung wird w<>hrung
Trace\-Durchl<EFBFBD>ufen deaktiviert.
.TP
\fB\-\-profile\fP
Schreibe Profiling\-Daten in eine Datei namens \fBlinkchecker.prof\fP im
aktuellen Arbeitsverzeichnis. Siehe auch \fB\-\-viewprof\fP.
.TP
\fB\-\-viewprof\fP
Gebe vorher generierte Profiling\-Daten aus. Siehe auch \fB\-\-profile\fP.
.
.SS "Optionen zum Pr<50>fen"
.TP
\fB\-r\fP\fINUMMER\fP, \fB\-\-recursion\-level=\fP\fINUMMER\fP
Pr<EFBFBD>fe rekursiv alle URLs bis zu der angegebenen Tiefe. Eine negative Tiefe
bewirkt unendliche Rekursion. Standard Tiefe ist unendlich.
.TP
\fB\-\-no\-follow\-url=\fP\fIREGEX\fP
Pr<EFBFBD>fe URLs, welche dem angegebenen regul<75>ren Ausdruck entsprechen, aber
verhindere die rekursive Pr<50>fung. Diese Option kann mehrmals angegeben
werden.
.TP
\fB\-\-ignore\-url=\fP\fIREGEX\fP
Pr<EFBFBD>fe lediglich die Syntax von URLs, welche dem angegebenen regul<75>ren
Ausdruck entsprechen. Diese Option kann mehrmals angegeben werden.
.TP
\fB\-C\fP, \fB\-\-cookies\fP
Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich Cookies, die
zum urspr<70>nglichen Server zur<75>ckgesendet werden, werden akzeptiert.
Gesendete und akzeptierte Cookies werden als zus<75>tzlicheLoginformation
aufgef<EFBFBD>hrt.
.TP
\fB\-a\fP, \fB\-\-anchors\fP
Pr<EFBFBD>fe HTTP Anker Verweise. Standard ist keine <20>berpr<70>fung.
.TP
\fB\-\-no\-anchor\-caching\fP
Behandle url#anchora und url#anchorb beim Cachen als gleich. Dies ist zwar
Standard bei Browsern, aber in der URI Spezifikation nicht
enthalten. Benutzen Sie diese Option mit Vorsicht.
.TP
\fB\-u\fP\fINAME\fP, \fB\-\-user=\fP\fINAME\fP
Verwende den angegebenen Benutzernamen f<>r HTTP und FTP Autorisierung. F<>r
FTP ist der Standardname \fBanonymous\fP. F<>r HTTP gibt es keinen
Standardnamen. Siehe auch \fB\-p\fP.
.TP
\fB\-p\fP\fINAME\fP, \fB\-\-password=\fP\fINAME\fP
Verwende das angegebene Passwort f<>r HTTP und FTP Autorisierung. F<>r FTP
ist das Standardpasswort \fBanonymous@\fP. F<>r HTTP gibt es kein
Standardpasswort. Siehe auch \fB\-u\fP.
.TP
\fB\-\-timeout=\fP\fINUMMER\fP
Setze den Timeout f<>r TCP\-Verbindungen in Sekunden. Der Standard Timeout
ist 30 Sekunden.
.TP
\fB\-P\fP\fINUMMER\fP, \fB\-\-pause=\fP\fINUMMER\fP
Pausiere die angegebene Anzahl von Sekunden zwischen dem Pr<50>fen jeder
URL. Diese Option deaktiviert Threads. Standard ist keine Pause zwischen dem
Pr<EFBFBD>fen.
.TP
\fB\-N\fP\fINAME\fP, \fB\-\-nntp\-server=\fP\fINAME\fP
Gibt ein NNTP Rechner f<>r \fBnews:\fP Links. Standard ist die
Umgebungsvariable \fBNNTP_SERVER\fP. Falls kein Rechner angegeben ist, wird
lediglich auf korrekte Syntax des Links gepr<70>ft.
.TP
\fB\-\-no\-proxy\-for=\fP\fIREGEX\fP
Rechner welche dem angegebenen regul<75>ren Ausdruck entsprechen sollen direkt
und nicht <20>ber einen Proxy angesprochen werden. Diese Option kann mehrmals
angegeben werden.
.
.SH AUSGABETYPEN
Beachten Sie, dass standardm<64><6D>ig nur Fehler und Warnungen protokolliert
werden. Sie sollten die \fB\-\-verbose\fP Option benutzen, um eine komplette URL
Liste zu erhalten, besonders bei Ausgabe eines Sitemap\-Graphen.
.TP
\fBtext\fP
Standard Textausgabe in "Schl<68>ssel: Wert"\-Form.
.TP
\fBhtml\fP
Gebe URLs in "Schl<68>ssel: Wert"\-Form als HTML formatiert aus. Besitzt zudem
Verkn<EFBFBD>pfungen auf die referenzierten Seiten. Ung<6E>ltige URLs haben
Verkn<EFBFBD>pfungen zur HTML und CSS Syntaxpr<70>fung angeh<65>ngt.
.TP
\fBcsv\fP
Gebe Pr<50>fresultat in CSV\-Format aus mit einer URL pro Zeile.
.TP
\fBgml\fP
Gebe Vater\-Kind Beziehungen zwischen verkn<6B>pften URLs als GML Graphen aus.
.TP
\fBdot\fP
Gebe Vater\-Kind Beziehungen zwischen verkn<6B>pften URLs als DOT Graphen aus.
.TP
\fBgxml\fP
Gebe Pr<50>fresultat als GraphXML\-Datei aus.
.TP
\fBxml\fP
Gebe Pr<50>fresultat als maschinenlesbare XML\-Datei aus.
.TP
\fBsql\fP
Gebe Pr<50>fresultat als SQL Skript mit INSERT Befehlen aus. Ein
Beispielskript, um die initiale SQL Tabelle zu erstellen ist unter
create.sql zu finden.
.TP
\fBblacklist\fP
F<EFBFBD>r Cronjobs geeignet. Gibt das Pr<50>fergebnis in eine Datei
\fB~/.linkchecker/blacklist\fP aus, welche nur Eintr<74>ge mit fehlerhaften URLs
und die Anzahl der Fehlversuche enth<74>lt.
.TP
\fBnone\fP
Gibt nichts aus. F<>r Skripte geeignet.
.
.SH "REGUL<55>RE AUSDR<44>CKE"
Lediglich Pythons regul<75>re Ausdr<64>cke werden von LinkChecker
akzeptiert. Siehe \fBhttp://www.amk.ca/python/howto/regex/\fP f<>r eine
Einf<EFBFBD>hrung in regul<75>re Ausdr<64>cke.
Die einzige Hinzuf<75>gung ist, dass ein regul<75>rer Ausdruck negiert wird
falls er mit einem Ausrufezeichen beginnt.
.
.SH "PROXY UNTERST<53>TZUNG"
Um einen Proxy zu benutzen, setzen Sie $http_proxy, $https_proxy,
$ftp_proxy, $gopher_proxy unter Unix oder Windows auf die Proxy URL (zum
Beispiel http://localhost:8080). Auf einem Mac benutzen Sie die Internet
Konfiguration.
.
.SH BEMERKUNGEN
URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie \fBftp://ftp.\fP
behandelt, URLs die mit \fBwww.\fP beginnen wie \fBhttp://www.\fP. Sie k<>nnen
auch lokale Dateien angeben.
Falls sich Ihr System automatisch mit dem Internet verbindet (z.B. mit
diald), wird es dies tun wenn Sie Links pr<70>fen, die nicht auf Ihren lokalen
Rechner verweisen Benutzen Sie die Optionen \fB\-s\fP und \fB\-i\fP, um dies zu
verhindern.
Javascript Links werden zur Zeit ignoriert.
Wenn Ihr System keine Threads unterst<73>tzt, deaktiviert diese LinkChecker
automatisch.
Sie k<>nnen mehrere Benutzer/Passwort Paare in einer Konfigurationsdatei
angeben.
Beim Pr<50>fen von \fBnews:\fP Links mu<6D> der angegebene NNTP Rechner nicht
unbedingt derselbe wie der des Benutzers sein.
.
.SH UMGEBUNG
\fBNNTP_SERVER\fP \- gibt Standard NNTP Server an
.br
\fBhttp_proxy\fP \- gibt Standard HTTP Proxy an
.br
\fBftp_proxy\fP \- gibt Standard FTP Proxy an
.br
\fBLC_MESSAGES\fP, \fBLANG\fP, \fBLANGUAGE\fP \- gibt Ausgabesprache an
.
.SH R<EFBFBD>CKGABEWERT
Der R<>ckgabewert ist nicht Null falls
.IP \(bu
ung<EFBFBD>ltige Verkn<6B>pfungen gefunden wurden oder
.IP \(bu
Warnungen gefunden wurden und Warnungen aktiviert sind
.IP \(bu
ein Programmfehler aufgetreten ist.
.
.SH DATEIEN
\fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkchecker/linkcheckerrc\fP \-
Standardkonfigurationsdateien
.br
\fB~/.linkchecker/blacklist\fP \- Standard Dateiname der blacklist Logger
Ausgabe
.br
\fBlinkchecker\-out.\fP\fITYP\fP \- Standard Dateiname der Logausgabe
.br
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP \- g<>ltige Ausgabe
Enkodierungen
.br
\fBhttp://www.amk.ca/python/howto/regex/\fP \- Dokumentation zu regul<75>ren
Ausdr<EFBFBD>cken
.
.SH AUTHOR
Bastian Kleineidam <calvin@users.sourceforge.net>
.
.SH COPYRIGHT
Copyright \(co 2000\-2005 Bastian Kleineidam