linkchecker/doc/de/linkchecker.1
2009-01-08 14:18:03 +00:00

419 lines
16 KiB
Groff

.\"*******************************************************************
.\"
.\" This file was generated with po4a. Translate the source file.
.\"
.\"*******************************************************************
.TH LINKCHECKER 1 2001\-03\-10 LinkChecker "LinkChecker auf der Kommandozeile"
.SH NAME
linkchecker \- prüfe HTML Dokumente und Webseiten auf ungültige Verknüpfungen
.
.SH SYNTAX
\fBlinkchecker\fP [\fIOptionen\fP] [\fIDatei\-oder\-URL\fP]...
.
.SH BESCHREIBUNG
.LP
LinkChecker bietet rekursives Prüfen, Multithreading, Ausgabe als farbigen
oder normalen Text, HTML, SQL, CSV oder einen Sitemap\-Graphen in GML oder
XML, Unterstützung für HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Telnet
und lokale Dateiverknüpfungen, Einschränkung der Verknüpfungsüberprüfung mit
URL Filtern bestehend aus regulären Ausdrücken, Proxy Unterstützung,
Benutzer/Passwort Authentifizierung für HTTP und FTP, Unterstützung des
robots.txt Protokolls, Mehrsprachigkeit, eine Kommandozeilenschnittstelle
sowie eine CGI Webschnittstelle (benötigt einen HTTP Server).
.
.SH BEISPIELE
Der häufigste Gebrauchsfall prüft die angegebene Domäne rekursiv,
inklusive aller einzelnen nach außen zeigenden Verknüpfungen:
\fBlinkchecker http://treasure.calvinsplayground.de/\fP
.br
Beachten Sie dass dies die komplette Domäne überprüft, welche aus mehreren
tausend URLs bestehen kann. Benutzen Sie die Option \fB\-r\fP, um die
Rekursionstiefe zu beschränken.
.br
Keine Verbindungen zu \fBmailto:\fP Rechnern, nur die URL Syntax wird geprüft. Alle
anderen Verknüpfungen werden wie üblich geprüft:
\fBlinkchecker \-\-ignore\-url=^mailto: www.mysite.org\fP
.br
Überprüfung einer lokalen HTML Datei unter Unix:
\fBlinkchecker ../bla.html\fP
.br
Prüfe von der Standardeingabe:
\fBecho "bla.html" | linkchecker \-\-stdin\fP
.br
Überprüfung einer lokalen HTML Datei unter Windows:
\fBlinkchecker c:\etemp\etest.html\fP
.br
Sie können den \fBhttp://\fP URL Anteil weglassen wenn die Domäne mit \fBwww.\fP beginnt:
\fBlinkchecker www.myhomepage.de\fP
.br
Sie können den \fBftp://\fP URL Anteil weglassen wenn die Domäne mit \fBftp.\fP beginnt:
\fBlinkchecker \-r0 ftp.linux.org\fP
.br
Erzeuge einen Sitemap Graphen und konvertiere ihn mit dem graphviz dot Programm:
\fBlinkchecker \-odot \-v www.myhomepage.de | dot \-Tps > sitemap.ps\fP
.
.SH OPTIONEN
.SS "Allgemeine Optionen"
.TP
\fB\-h\fP, \fB\-\-help\fP
Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus.
.TP
\fB\-f\fP\fIDATEINAME\fP, \fB\-\-config=\fP\fIDATEINAME\fP
Benutze \fIDATEINAME\fP als Konfigurationsdatei. Standardmäßig sucht
LinkChecker zuerst nach \fB/etc/linkchecker/linkcheckerrc\fP und dann
\fB~/.linkchecker/linkcheckerrc\fP.
.TP
\fB\-I\fP, \fB\-\-interactive\fP
Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurden.
.TP
\fB\-t\fP\fINUMMER\fP, \fB\-\-threads=\fP\fINUMMER\fP
Generiere nicht mehr als die angegebene Anzahl von Threads. Standard Anzahl
von Threads ist 10. Um Threads zu deaktivieren, geben Sie eine nicht
positive Nummer an.
.TP
\fB\-\-priority\fP
Starte mit normaler Threadpriorität. Als Standard läuft LinkChecker mit
niedriger Threadpriorität, um als Hintergrundprozess geeignet zu sein.
.TP
\fB\-V\fP, \fB\-\-version\fP
Gebe die Version aus und beende das Programm.
.TP
\fB\-\-allow\-root\fP
Keine Entziehung der Priviligien, falls das Programm unter Unix als Benutzer
root läuft.
.TP
\fB\-\-stdin\fP
Lese Liste von URLs zum Prüfen von der Standardeingabe, getrennt durch
Leerzeichen.
.
.SS Ausgabeoptionen
.TP
\fB\-v\fP, \fB\-\-verbose\fP
Gebe alle geprüften URLs einmal aus. Standard ist es, nur fehlerhafte URLs
und Warnungen auszugeben.
.TP
\fB\-\-complete\fP
Gebe alle geprüften URLs aus. Standard ist es, doppelte URLs nur einmal
auszugeben.
.TP
\fB\-\-no\-warnings\fP
Gebe keine Warnungen aus. Standard ist die Ausgabe von Warnungen.
.TP
\fB\-W\fP\fIREGEX\fP, \fB\-\-warning\-regex=\fP\fIREGEX\fP
Definieren Sie einen regulären Ausdruck der eine Warnung ausgibt falls er
auf den Inhalt einer geprüften URL zutrifft. Dies gilt nur für gültige
Seiten deren Inhalt wir bekommen können.
.br
Benutzen Sie dies, um nach Seiten zu suchen, welche bestimmte Fehler
enthalten, zum Beispiel "Diese Seite wurde entfernt" oder "Oracle
Applikationsfehler".
.TP
\fB\-\-warning\-size\-bytes=\fP\fINUMMER\fP
Gebe eine Warnung aus, wenn die Inhaltsgröße bekannt ist und die angegebene
Anzahl von Bytes übersteigt.
.TP
\fB\-\-check\-html\fP
Prüfe Syntax von HTML URLs mit lokaler Bibliothek (HTML tidy).
.TP
\fB\-\-check\-html\-w3\fP
Prüfe Syntax von HTML URLs mit dem W3C Online Validator.
.TP
\fB\-\-check\-css\fP
Prüfe Syntax von CSS URLs mit lokaler Bibliothek (cssutils).
.TP
\fB\-\-check\-css\-w3\fP
Prüfe Syntax von CSS URLs mit dem W3C Online Validator.
.TP
\fB\-\-scan\-virus\fP
Prüfe Inhalt von URLs auf Viren mit ClamAV.
.TP
\fB\-q\fP, \fB\-\-quiet\fP
Keine Ausgabe, ein Alias für \fB\-o none\fP. Dies ist nur in Verbindung mit
\fB\-F\fP nützlich.
.TP
\fB\-o\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP], \fB\-\-output=\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP]
Gib Ausgabetyp als \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBdot\fP, \fBxml\fP,
\fBnone\fP oder \fBblacklist\fP an. Stadard Typ ist \fBtext\fP. Die verschiedenen
Ausgabetypen sind unten dokumentiert.
.br
Das \fIENCODING\fP gibt die Ausgabekodierung an. Der Standard ist das der
lokalen Spracheinstellung. Gültige Enkodierungen sind unter
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP aufgelistet.
.TP
\fB\-F\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP][\fB/\fP\fIDATEINAME\fP], \fB\-\-file\-output=\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP][\fB/\fP\fIDATEINAME\fP]
Ausgabe in eine Datei namens \fBlinkchecker\-out.\fP\fITYP\fP,
\fB$HOME/.linkchecker/blacklist\fP bei \fBblacklist\fP Ausgabe, oder \fIDATEINAME\fP
falls angegeben. Der \fIDATEINAME\fP und \fIENKODIERUNG\fP Teil wird beim
Ausgabetyp \fBnone\fP ignoriert, ansonsten wird die Datei überschreiben falls
sie existiert. Sie können diese Option mehr als einmal verwenden. Gültige
Ausgabetypen sind \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBdot\fP, \fBxml\fP,
\fBnone\fP oder \fBblacklist\fP. Standard ist keine Dateiausgabe. \fIENKODIERUNG\fP
gibt die Ausgabekodierung an,der Standard ist die Enkodierung der
ausgewählten Spracheinstellung. Gültige Enkodierungen sind unter
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP aufgelistet. Beachten
Sie, dass Sie mit der Option \fB\-o none\fP jegliche Ausgaben auf der Konsole
verhindern können.
.TP
\fB\-\-no\-status\fP
Gebe keine Statusmeldungen aus.
.TP
\fB\-D\fP\fINAME\fP, \fB\-\-debug=\fP\fINAME\fP
Gebe Testmeldungen aus für den angegebenen Logger. Verfügbare Logger sind
\fBcmdline\fP, \fBchecking\fP,\fBcache\fP, \fBgui\fP, \fBdns\fP und \fBall\fP. Die Angabe
\fBall\fP ist ein Synonym für alle verfügbaren Logger. Diese Option kann
mehrmals angegeben werden, um mit mehr als einem Logger zu testen. Um
akkurate Ergebnisse zu erzielen, werden Threads deaktiviert.
.TP
\fB\-\-trace\fP
Trace\-Information ausgeben.
.TP
\fB\-\-profile\fP
Schreibe Profiling\-Daten in eine Datei namens \fBlinkchecker.prof\fP im
aktuellen Arbeitsverzeichnis. Siehe auch \fB\-\-viewprof\fP.
.TP
\fB\-\-viewprof\fP
Gebe vorher generierte Profiling\-Daten aus. Siehe auch \fB\-\-profile\fP.
.
.SS "Optionen zum Prüfen"
.TP
\fB\-r\fP\fINUMMER\fP, \fB\-\-recursion\-level=\fP\fINUMMER\fP
Prüfe rekursiv alle URLs bis zu der angegebenen Tiefe. Eine negative Tiefe
bewirkt unendliche Rekursion. Standard Tiefe ist unendlich.
.TP
\fB\-\-no\-follow\-url=\fP\fIREGEX\fP
Prüfe URLs, welche dem angegebenen regulären Ausdruck entsprechen, aber
führe keine Rekursion durch.
.br
Diese Option kann mehrmals angegeben werden.
.TP
\fB\-\-ignore\-url=\fP\fIREGEX\fP
Prüfe lediglich die Syntax von URLs, welche dem angegebenen regulären
Ausdruck entsprechen.
.br
Diese Option kann mehrmals angegeben werden.
.TP
\fB\-C\fP, \fB\-\-cookies\fP
Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich Cookies, die
zum ursprünglichen Server zurückgesendet werden, werden akzeptiert.
Gesendete und akzeptierte Cookies werden als zusätzlicheLoginformation
aufgeführt.
.TP
\fB\-\-cookiefile=\fP\fIDATEINAME\fP
Lese eine Datei mit Cookie\-Daten. Das Cookie Datenformat wird weiter unten
erklärt.
.TP
\fB\-a\fP, \fB\-\-anchors\fP
Prüfe HTTP Ankerverweise. Standard ist, Ankerverweise nicht zu prüfen. Diese
Option aktiviert die Ausgabe der Warnung \fBurl\-anchor\-not\-found\fP.
.TP
\fB\-\-no\-anchor\-caching\fP
Behandle url#anchora und url#anchorb beim Cachen als gleich. Dies ist zwar
Standard bei Browsern, aber in der URI Spezifikation nicht
enthalten. Benutzen Sie diese Option mit Vorsicht da ungültige Anker mit
dieser Option nicht unbedingt erkannt werden.
.TP
\fB\-u\fP\fINAME\fP, \fB\-\-user=\fP\fINAME\fP
Verwende den angegebenen Benutzernamen für HTTP und FTP Autorisierung. Für
FTP ist der Standardname \fBanonymous\fP. Für HTTP gibt es keinen
Standardnamen. Siehe auch \fB\-p\fP.
.TP
\fB\-p\fP\fINAME\fP, \fB\-\-password=\fP\fINAME\fP
Verwende das angegebene Passwort für HTTP und FTP Autorisierung. Für FTP ist
das Standardpasswort \fBanonymous@\fP. Für HTTP gibt es kein
Standardpasswort. Siehe auch \fB\-u\fP.
.TP
\fB\-\-timeout=\fP\fINUMMER\fP
Setze den Timeout für TCP\-Verbindungen in Sekunden. Der Standard Timeout ist
60 Sekunden.
.TP
\fB\-P\fP\fINUMMER\fP, \fB\-\-pause=\fP\fINUMMER\fP
Pausiere die angegebene Anzahl von Sekunden zwischen zwei aufeinander
folgenden Verbindungen zum demselben Rechner. Standard ist keine Pause
zwischen Verbindungen.
.TP
\fB\-N\fP\fINAME\fP, \fB\-\-nntp\-server=\fP\fINAME\fP
Gibt ein NNTP Rechner für \fBnews:\fP Links. Standard ist die Umgebungsvariable
\fBNNTP_SERVER\fP. Falls kein Rechner angegeben ist, wird lediglich auf
korrekte Syntax des Links geprüft.
.TP
\fB\-\-no\-proxy\-for=\fP\fIREGEX\fP
Rechner welche dem angegebenen regulären Ausdruck entsprechen sollen direkt
und nicht über einen Proxy angesprochen werden.
.br
Diese Option kann mehrmals angegeben werden.
.SH KONFIGURATIONSDATEIEN
Konfigurationsdateien können alle obigen Optionen enthalten. Sie können
zudem Optionen enthalten, welche nicht auf der Kommandozeile gesetzt werden
können. Siehe \fBlinkcheckerrc\fP(5) für mehr Informationen.
.SH AUSGABETYPEN
Beachten Sie, dass standardmäßig nur Fehler und Warnungen protokolliert
werden. Sie sollten die \fB\-\-verbose\fP Option benutzen, um eine komplette URL
Liste zu erhalten, besonders bei Ausgabe eines Sitemap\-Graphen.
.TP
\fBtext\fP
Standard Textausgabe in "Schlüssel: Wert"\-Form.
.TP
\fBhtml\fP
Gebe URLs in "Schlüssel: Wert"\-Form als HTML formatiert aus. Besitzt zudem
Verknüpfungen auf die referenzierten Seiten. Ungültige URLs haben
Verknüpfungen zur HTML und CSS Syntaxprüfung angehängt.
.TP
\fBcsv\fP
Gebe Prüfresultat in CSV\-Format aus mit einer URL pro Zeile.
.TP
\fBgml\fP
Gebe Vater\-Kind Beziehungen zwischen verknüpften URLs als GML Graphen aus.
.TP
\fBdot\fP
Gebe Vater\-Kind Beziehungen zwischen verknüpften URLs als DOT Graphen aus.
.TP
\fBgxml\fP
Gebe Prüfresultat als GraphXML\-Datei aus.
.TP
\fBxml\fP
Gebe Prüfresultat als maschinenlesbare XML\-Datei aus.
.TP
\fBsql\fP
Gebe Prüfresultat als SQL Skript mit INSERT Befehlen aus. Ein
Beispielskript, um die initiale SQL Tabelle zu erstellen ist unter
create.sql zu finden.
.TP
\fBblacklist\fP
Für Cronjobs geeignet. Gibt das Prüfergebnis in eine Datei
\fB~/.linkchecker/blacklist\fP aus, welche nur Einträge mit fehlerhaften URLs
und die Anzahl der Fehlversuche enthält.
.TP
\fBnone\fP
Gibt nichts aus. Für Debugging oder Prüfen des Rückgabewerts geeignet.
.
.SH "REGULÄRE AUSDRÜCKE"
Lediglich Pythons reguläre Ausdrücke werden von LinkChecker
akzeptiert. Siehe \fBhttp://www.amk.ca/python/howto/regex/\fP für eine
Einführung in reguläre Ausdrücke.
Die einzige Hinzufügung ist, dass ein regulärer Ausdruck negiert wird falls
er mit einem Ausrufezeichen beginnt.
.
.SH COOKIE\-DATEIEN
Eine Cookie\-Datei enthält Standard RFC 805 Kopfdaten mit den folgenden
möglichen Namen:
.
.TP
\fBScheme\fP (optional)
Setzt das Schema für das die Cookies gültig sind; Standardschema ist
\fBhttp\fP.
.TP
\fBHost\fP (erforderlich)
Setzt die Domäne für die die Cookies gültig sind.
.TP
\fBPath\fP (optional)
Gibt den Pfad für den die Cookies gültig sind; Standardpfad ist \fB/\fP.
.TP
\fBSet\-cookie\fP (optional)
Setzt den Cookie Name/Wert. Kann mehrmals angegeben werden.
.PP
Mehrere Einträge sind durch eine Leerzeile zu trennen.
.
Das untige Beispiel sendet zwei Cookies zu allen URLs die mit
\fBhttp://example.org/hello/\fP beginnen, und eins zu allen URLs die mit
\fBhttps://example.org\fP beginnen:
Host: example.com
Path: /hello
Set\-cookie: ID="smee"
Set\-cookie: spam="egg"
Scheme: https
Host: example.org
Set\-cookie: baggage="elitist"; comment="hologram"
.SH "PROXY UNTERSTÜTZUNG"
Um einen Proxy unter Unix oder Windows zu benutzen, setzen Sie $http_proxy,
$https_proxy oder $ftp_proxy auf die Proxy URL. Die URL sollte die Form
\fBhttp://\fP[\fIuser\fP\fB:\fP\fIpass\fP\fB@\fP]\fIhost\fP[\fB:\fP\fIport\fP] besitzen. LinkChecker
erkennt auch die Proxy\-Einstellungen des Internet Explorers auf einem
Windows\-System. Auf einem Mac benutzen Sie die Internet Konfiguration.
.
Einen HTTP\-Proxy unter Unix anzugeben sieht beispielsweise so aus:
export http_proxy="http://proxy.example.com:8080"
Proxy\-Authentifizierung wird ebenfalls unterstützt:
export http_proxy="http://user1:mypass@proxy.example.org:8081"
Setzen eines Proxies unter der Windows Befehlszeile:
set http_proxy=http://proxy.example.com:8080
.SH BEMERKUNGEN
URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie \fBftp://ftp.\fP
behandelt, URLs die mit \fBwww.\fP beginnen wie \fBhttp://www.\fP. Sie können auch
lokale Dateien angeben.
Falls sich Ihr System automatisch mit dem Internet verbindet (z.B. mit
diald), wird es dies tun wenn Sie Links prüfen, die nicht auf Ihren lokalen
Rechner verweisen Benutzen Sie die Optionen \fB\-s\fP und \fB\-i\fP, um dies zu
verhindern.
Javascript Links werden zur Zeit ignoriert.
Wenn Ihr System keine Threads unterstützt, deaktiviert diese LinkChecker
automatisch.
Sie können mehrere Benutzer/Passwort Paare in einer Konfigurationsdatei
angeben.
Beim Prüfen von \fBnews:\fP Links muß der angegebene NNTP Rechner nicht
unbedingt derselbe wie der des Benutzers sein.
.
.SH UMGEBUNG
\fBNNTP_SERVER\fP \- gibt Standard NNTP Server an
.br
\fBhttp_proxy\fP \- gibt Standard HTTP Proxy an
.br
\fBftp_proxy\fP \- gibt Standard FTP Proxy an
.br
\fBLC_MESSAGES\fP, \fBLANG\fP, \fBLANGUAGE\fP \- gibt Ausgabesprache an
.
.SH RÜCKGABEWERT
Der Rückgabewert ist nicht Null falls
.IP \(bu
ungültige Verknüpfungen gefunden wurden oder
.IP \(bu
Warnungen gefunden wurden und Warnungen aktiviert sind
.IP \(bu
ein Programmfehler aufgetreten ist.
.
.SH LIMITIERUNGEN
LinkChecker benutzt Hauptspeicher für jede zu prüfende URL, die in der
Warteschlange steht. Mit tausenden solcher URLs kann die Menge des benutzten
Hauptspeichers sehr groß werden. Dies könnte das Programm oder sogar das
gesamte System verlangsamen.
.
.SH DATEIEN
\fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkchecker/linkcheckerrc\fP \-
Standardkonfigurationsdateien
.br
\fB~/.linkchecker/blacklist\fP \- Standard Dateiname der blacklist Logger
Ausgabe
.br
\fBlinkchecker\-out.\fP\fITYP\fP \- Standard Dateiname der Logausgabe
.br
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP \- gültige Ausgabe
Enkodierungen
.br
\fBhttp://www.amk.ca/python/howto/regex/\fP \- Dokumentation zu regulären
Ausdrücken
.SH "SIEHE AUCH"
\fBlinkcheckerrc\fP(5)
.
.SH AUTHOR
Bastian Kleineidam <calvin@users.sourceforge.net>
.
.SH COPYRIGHT
Copyright \(co 2000\-2009 Bastian Kleineidam