mirror of
https://github.com/Hopiu/linkchecker.git
synced 2026-04-20 22:31:00 +00:00
542 lines
20 KiB
Groff
542 lines
20 KiB
Groff
.\"*******************************************************************
|
|
.\"
|
|
.\" This file was generated with po4a. Translate the source file.
|
|
.\"
|
|
.\"*******************************************************************
|
|
.TH LINKCHECKER 1 2001\-03\-10 LinkChecker "LinkChecker auf der Kommandozeile"
|
|
.SH NAME
|
|
linkchecker \- prüfe HTML Dokumente und Webseiten auf ungültige Verknüpfungen
|
|
.
|
|
.SH SYNTAX
|
|
\fBlinkchecker\fP [\fIOptionen\fP] [\fIDatei\-oder\-URL\fP]...
|
|
.
|
|
.SH BESCHREIBUNG
|
|
.LP
|
|
LinkChecker bietet rekursives Prüfen, Multithreading, Ausgabe als farbigen
|
|
oder normalen Text, HTML, SQL, CSV oder einen Sitemap\-Graphen in GML oder
|
|
XML, Unterstützung für HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Telnet
|
|
und lokale Dateiverknüpfungen, Einschränkung der Verknüpfungsüberprüfung mit
|
|
URL Filtern bestehend aus regulären Ausdrücken, Proxy Unterstützung,
|
|
Benutzer/Passwort Authentifizierung für HTTP und FTP, Unterstützung des
|
|
robots.txt Protokolls, Mehrsprachigkeit, eine Kommandozeilenschnittstelle
|
|
sowie eine CGI Webschnittstelle (benötigt einen HTTP Server).
|
|
.
|
|
.SH BEISPIELE
|
|
Der häufigste Gebrauchsfall prüft die angegebene Domäne rekursiv,
|
|
inklusive aller einzelnen nach außen zeigenden Verknüpfungen:
|
|
\fBlinkchecker http://treasure.calvinsplayground.de/\fP
|
|
.br
|
|
Beachten Sie dass dies die komplette Domäne überprüft, welche aus mehreren
|
|
tausend URLs bestehen kann. Benutzen Sie die Option \fB\-r\fP, um die
|
|
Rekursionstiefe zu beschränken.
|
|
.br
|
|
Keine Verbindungen zu \fBmailto:\fP Rechnern, nur die URL Syntax wird geprüft. Alle
|
|
anderen Verknüpfungen werden wie üblich geprüft:
|
|
\fBlinkchecker \-\-ignore\-url=^mailto: www.mysite.org\fP
|
|
.br
|
|
Überprüfung einer lokalen HTML Datei unter Unix:
|
|
\fBlinkchecker ../bla.html\fP
|
|
.br
|
|
Prüfe von der Standardeingabe:
|
|
\fBecho "bla.html" | linkchecker \-\-stdin\fP
|
|
.br
|
|
Überprüfung einer lokalen HTML Datei unter Windows:
|
|
\fBlinkchecker c:\etemp\etest.html\fP
|
|
.br
|
|
Sie können den \fBhttp://\fP URL Anteil weglassen wenn die Domäne mit \fBwww.\fP beginnt:
|
|
\fBlinkchecker www.myhomepage.de\fP
|
|
.br
|
|
Sie können den \fBftp://\fP URL Anteil weglassen wenn die Domäne mit \fBftp.\fP beginnt:
|
|
\fBlinkchecker \-r0 ftp.linux.org\fP
|
|
.br
|
|
Erzeuge einen Sitemap Graphen und konvertiere ihn mit dem graphviz dot Programm:
|
|
\fBlinkchecker \-odot \-v www.myhomepage.de | dot \-Tps > sitemap.ps\fP
|
|
.
|
|
.SH OPTIONEN
|
|
.SS "Allgemeine Optionen"
|
|
.TP
|
|
\fB\-h\fP, \fB\-\-help\fP
|
|
Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus.
|
|
.TP
|
|
\fB\-f\fP\fIDATEINAME\fP, \fB\-\-config=\fP\fIDATEINAME\fP
|
|
Benutze \fIDATEINAME\fP als Konfigurationsdatei. Standardmäßig sucht
|
|
LinkChecker zuerst nach \fB/etc/linkchecker/linkcheckerrc\fP und dann
|
|
\fB~/.linkchecker/linkcheckerrc\fP.
|
|
.TP
|
|
\fB\-I\fP, \fB\-\-interactive\fP
|
|
Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurden.
|
|
.TP
|
|
\fB\-t\fP\fINUMMER\fP, \fB\-\-threads=\fP\fINUMMER\fP
|
|
Generiere nicht mehr als die angegebene Anzahl von Threads. Standard Anzahl
|
|
von Threads ist 10. Um Threads zu deaktivieren, geben Sie eine nicht
|
|
positive Nummer an.
|
|
.TP
|
|
\fB\-\-priority\fP
|
|
Starte mit normaler Threadpriorität. Als Standard läuft LinkChecker mit
|
|
niedriger Threadpriorität, um als Hintergrundprozess geeignet zu sein.
|
|
.TP
|
|
\fB\-V\fP, \fB\-\-version\fP
|
|
Gebe die Version aus und beende das Programm.
|
|
.TP
|
|
\fB\-\-allow\-root\fP
|
|
Keine Entziehung der Priviligien, falls das Programm unter Unix als Benutzer
|
|
root läuft.
|
|
.TP
|
|
\fB\-\-stdin\fP
|
|
Lese Liste von URLs zum Prüfen von der Standardeingabe, getrennt durch
|
|
Leerzeichen.
|
|
.
|
|
.SS Ausgabeoptionen
|
|
.TP
|
|
\fB\-v\fP, \fB\-\-verbose\fP
|
|
Gebe alle geprüften URLs einmal aus. Standard ist es, nur fehlerhafte URLs
|
|
und Warnungen auszugeben.
|
|
.TP
|
|
\fB\-\-complete\fP
|
|
Gebe alle geprüften URLs aus. Standard ist es, doppelte URLs nur einmal
|
|
auszugeben.
|
|
.TP
|
|
\fB\-\-no\-warnings\fP
|
|
Gebe keine Warnungen aus. Standard ist die Ausgabe von Warnungen.
|
|
.TP
|
|
\fB\-W\fP\fIREGEX\fP, \fB\-\-warning\-regex=\fP\fIREGEX\fP
|
|
Definieren Sie einen regulären Ausdruck der eine Warnung ausgibt falls er
|
|
auf den Inhalt einer geprüften URL zutrifft. Dies gilt nur für gültige
|
|
Seiten deren Inhalt wir bekommen können.
|
|
.br
|
|
Benutzen Sie dies, um nach Seiten zu suchen, welche bestimmte Fehler
|
|
enthalten, zum Beispiel "Diese Seite wurde entfernt" oder "Oracle
|
|
Applikationsfehler".
|
|
.TP
|
|
\fB\-\-warning\-size\-bytes=\fP\fINUMMER\fP
|
|
Gebe eine Warnung aus, wenn die Inhaltsgröße bekannt ist und die angegebene
|
|
Anzahl von Bytes übersteigt.
|
|
.TP
|
|
\fB\-\-check\-html\fP
|
|
Prüfe Syntax von HTML URLs mit lokaler Bibliothek (HTML tidy).
|
|
.TP
|
|
\fB\-\-check\-html\-w3\fP
|
|
Prüfe Syntax von HTML URLs mit dem W3C Online Validator.
|
|
.TP
|
|
\fB\-\-check\-css\fP
|
|
Prüfe Syntax von CSS URLs mit lokaler Bibliothek (cssutils).
|
|
.TP
|
|
\fB\-\-check\-css\-w3\fP
|
|
Prüfe Syntax von CSS URLs mit dem W3C Online Validator.
|
|
.TP
|
|
\fB\-\-scan\-virus\fP
|
|
Prüfe Inhalt von URLs auf Viren mit ClamAV.
|
|
.TP
|
|
\fB\-q\fP, \fB\-\-quiet\fP
|
|
Keine Ausgabe, ein Alias für \fB\-o none\fP. Dies ist nur in Verbindung mit
|
|
\fB\-F\fP nützlich.
|
|
.TP
|
|
\fB\-o\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP], \fB\-\-output=\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP]
|
|
Gib Ausgabetyp als \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBdot\fP, \fBxml\fP,
|
|
\fBnone\fP oder \fBblacklist\fP an. Stadard Typ ist \fBtext\fP. Die verschiedenen
|
|
Ausgabetypen sind unten dokumentiert.
|
|
.br
|
|
Das \fIENCODING\fP gibt die Ausgabekodierung an. Der Standard ist das der
|
|
lokalen Spracheinstellung. Gültige Enkodierungen sind unter
|
|
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP aufgelistet.
|
|
.TP
|
|
\fB\-F\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP][\fB/\fP\fIDATEINAME\fP], \fB\-\-file\-output=\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP][\fB/\fP\fIDATEINAME\fP]
|
|
Ausgabe in eine Datei namens \fBlinkchecker\-out.\fP\fITYP\fP,
|
|
\fB$HOME/.linkchecker/blacklist\fP bei \fBblacklist\fP Ausgabe, oder \fIDATEINAME\fP
|
|
falls angegeben. Der \fIDATEINAME\fP und \fIENKODIERUNG\fP Teil wird beim
|
|
Ausgabetyp \fBnone\fP ignoriert, ansonsten wird die Datei überschreiben falls
|
|
sie existiert. Sie können diese Option mehr als einmal verwenden. Gültige
|
|
Ausgabetypen sind \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBdot\fP, \fBxml\fP,
|
|
\fBnone\fP oder \fBblacklist\fP. Standard ist keine Dateiausgabe. \fIENKODIERUNG\fP
|
|
gibt die Ausgabekodierung an,der Standard ist die Enkodierung der
|
|
ausgewählten Spracheinstellung. Gültige Enkodierungen sind unter
|
|
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP aufgelistet. Beachten
|
|
Sie, dass Sie mit der Option \fB\-o none\fP jegliche Ausgaben auf der Konsole
|
|
verhindern können.
|
|
.TP
|
|
\fB\-\-no\-status\fP
|
|
Gebe keine Statusmeldungen aus.
|
|
.TP
|
|
\fB\-D\fP\fINAME\fP, \fB\-\-debug=\fP\fINAME\fP
|
|
Gebe Testmeldungen aus für den angegebenen Logger. Verfügbare Logger sind
|
|
\fBcmdline\fP, \fBchecking\fP,\fBcache\fP, \fBgui\fP, \fBdns\fP und \fBall\fP. Die Angabe
|
|
\fBall\fP ist ein Synonym für alle verfügbaren Logger. Diese Option kann
|
|
mehrmals angegeben werden, um mit mehr als einem Logger zu testen. Um
|
|
akkurate Ergebnisse zu erzielen, werden Threads deaktiviert.
|
|
.TP
|
|
\fB\-\-trace\fP
|
|
Trace\-Information ausgeben.
|
|
.TP
|
|
\fB\-\-profile\fP
|
|
Schreibe Profiling\-Daten in eine Datei namens \fBlinkchecker.prof\fP im
|
|
aktuellen Arbeitsverzeichnis. Siehe auch \fB\-\-viewprof\fP.
|
|
.TP
|
|
\fB\-\-viewprof\fP
|
|
Gebe vorher generierte Profiling\-Daten aus. Siehe auch \fB\-\-profile\fP.
|
|
.
|
|
.SS "Optionen zum Prüfen"
|
|
.TP
|
|
\fB\-r\fP\fINUMMER\fP, \fB\-\-recursion\-level=\fP\fINUMMER\fP
|
|
Prüfe rekursiv alle URLs bis zu der angegebenen Tiefe. Eine negative Tiefe
|
|
bewirkt unendliche Rekursion. Standard Tiefe ist unendlich.
|
|
.TP
|
|
\fB\-\-no\-follow\-url=\fP\fIREGEX\fP
|
|
Prüfe URLs, welche dem angegebenen regulären Ausdruck entsprechen, aber
|
|
führe keine Rekursion durch.
|
|
.br
|
|
Diese Option kann mehrmals angegeben werden.
|
|
.TP
|
|
\fB\-\-ignore\-url=\fP\fIREGEX\fP
|
|
Prüfe lediglich die Syntax von URLs, welche dem angegebenen regulären
|
|
Ausdruck entsprechen.
|
|
.br
|
|
Diese Option kann mehrmals angegeben werden.
|
|
.TP
|
|
\fB\-C\fP, \fB\-\-cookies\fP
|
|
Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich Cookies, die
|
|
zum ursprünglichen Server zurückgesendet werden, werden akzeptiert.
|
|
Gesendete und akzeptierte Cookies werden als zusätzlicheLoginformation
|
|
aufgeführt.
|
|
.TP
|
|
\fB\-\-cookiefile=\fP\fIDATEINAME\fP
|
|
Lese eine Datei mit Cookie\-Daten. Das Cookie Datenformat wird weiter unten
|
|
erklärt.
|
|
.TP
|
|
\fB\-a\fP, \fB\-\-anchors\fP
|
|
Prüfe HTTP Ankerverweise. Standard ist, Ankerverweise nicht zu prüfen. Diese
|
|
Option aktiviert die Ausgabe der Warnung \fBurl\-anchor\-not\-found\fP.
|
|
.TP
|
|
\fB\-u\fP\fINAME\fP, \fB\-\-user=\fP\fINAME\fP
|
|
Verwende den angegebenen Benutzernamen für HTTP und FTP Autorisierung. Für
|
|
FTP ist der Standardname \fBanonymous\fP. Für HTTP gibt es keinen
|
|
Standardnamen. Siehe auch \fB\-p\fP.
|
|
.TP
|
|
\fB\-p\fP\fINAME\fP, \fB\-\-password=\fP\fINAME\fP
|
|
Verwende das angegebene Passwort für HTTP und FTP Autorisierung. Für FTP ist
|
|
das Standardpasswort \fBanonymous@\fP. Für HTTP gibt es kein
|
|
Standardpasswort. Siehe auch \fB\-u\fP.
|
|
.TP
|
|
\fB\-\-timeout=\fP\fINUMMER\fP
|
|
Setze den Timeout für TCP\-Verbindungen in Sekunden. Der Standard Timeout ist
|
|
60 Sekunden.
|
|
.TP
|
|
\fB\-P\fP\fINUMMER\fP, \fB\-\-pause=\fP\fINUMMER\fP
|
|
Pausiere die angegebene Anzahl von Sekunden zwischen zwei aufeinander
|
|
folgenden Verbindungen zum demselben Rechner. Standard ist keine Pause
|
|
zwischen Verbindungen.
|
|
.TP
|
|
\fB\-N\fP\fINAME\fP, \fB\-\-nntp\-server=\fP\fINAME\fP
|
|
Gibt ein NNTP Rechner für \fBnews:\fP Links. Standard ist die Umgebungsvariable
|
|
\fBNNTP_SERVER\fP. Falls kein Rechner angegeben ist, wird lediglich auf
|
|
korrekte Syntax des Links geprüft.
|
|
.TP
|
|
\fB\-\-no\-proxy\-for=\fP\fIREGEX\fP
|
|
Rechner welche dem angegebenen regulären Ausdruck entsprechen sollen direkt
|
|
und nicht über einen Proxy angesprochen werden.
|
|
.br
|
|
Diese Option kann mehrmals angegeben werden.
|
|
|
|
.SH KONFIGURATIONSDATEIEN
|
|
Konfigurationsdateien können alle obigen Optionen enthalten. Sie können
|
|
zudem Optionen enthalten, welche nicht auf der Kommandozeile gesetzt werden
|
|
können. Siehe \fBlinkcheckerrc\fP(5) für mehr Informationen.
|
|
|
|
.SH AUSGABETYPEN
|
|
Beachten Sie, dass standardmäßig nur Fehler und Warnungen protokolliert
|
|
werden. Sie sollten die \fB\-\-verbose\fP Option benutzen, um eine komplette URL
|
|
Liste zu erhalten, besonders bei Ausgabe eines Sitemap\-Graphen.
|
|
|
|
.TP
|
|
\fBtext\fP
|
|
Standard Textausgabe in "Schlüssel: Wert"\-Form.
|
|
.TP
|
|
\fBhtml\fP
|
|
Gebe URLs in "Schlüssel: Wert"\-Form als HTML formatiert aus. Besitzt zudem
|
|
Verknüpfungen auf die referenzierten Seiten. Ungültige URLs haben
|
|
Verknüpfungen zur HTML und CSS Syntaxprüfung angehängt.
|
|
.TP
|
|
\fBcsv\fP
|
|
Gebe Prüfresultat in CSV\-Format aus mit einer URL pro Zeile.
|
|
.TP
|
|
\fBgml\fP
|
|
Gebe Vater\-Kind Beziehungen zwischen verknüpften URLs als GML Graphen aus.
|
|
.TP
|
|
\fBdot\fP
|
|
Gebe Vater\-Kind Beziehungen zwischen verknüpften URLs als DOT Graphen aus.
|
|
.TP
|
|
\fBgxml\fP
|
|
Gebe Prüfresultat als GraphXML\-Datei aus.
|
|
.TP
|
|
\fBxml\fP
|
|
Gebe Prüfresultat als maschinenlesbare XML\-Datei aus.
|
|
.TP
|
|
\fBsql\fP
|
|
Gebe Prüfresultat als SQL Skript mit INSERT Befehlen aus. Ein
|
|
Beispielskript, um die initiale SQL Tabelle zu erstellen ist unter
|
|
create.sql zu finden.
|
|
.TP
|
|
\fBblacklist\fP
|
|
Für Cronjobs geeignet. Gibt das Prüfergebnis in eine Datei
|
|
\fB~/.linkchecker/blacklist\fP aus, welche nur Einträge mit fehlerhaften URLs
|
|
und die Anzahl der Fehlversuche enthält.
|
|
.TP
|
|
\fBnone\fP
|
|
Gibt nichts aus. Für Debugging oder Prüfen des Rückgabewerts geeignet.
|
|
.
|
|
.SH "REGULÄRE AUSDRÜCKE"
|
|
Lediglich Pythons reguläre Ausdrücke werden von LinkChecker
|
|
akzeptiert. Siehe \fBhttp://www.amk.ca/python/howto/regex/\fP für eine
|
|
Einführung in reguläre Ausdrücke.
|
|
|
|
Die einzige Hinzufügung ist, dass ein regulärer Ausdruck negiert wird falls
|
|
er mit einem Ausrufezeichen beginnt.
|
|
.
|
|
.SH COOKIE\-DATEIEN
|
|
Eine Cookie\-Datei enthält Standard RFC 805 Kopfdaten mit den folgenden
|
|
möglichen Namen:
|
|
.
|
|
.TP
|
|
\fBScheme\fP (optional)
|
|
Setzt das Schema für das die Cookies gültig sind; Standardschema ist
|
|
\fBhttp\fP.
|
|
.TP
|
|
\fBHost\fP (erforderlich)
|
|
Setzt die Domäne für die die Cookies gültig sind.
|
|
.TP
|
|
\fBPath\fP (optional)
|
|
Gibt den Pfad für den die Cookies gültig sind; Standardpfad ist \fB/\fP.
|
|
.TP
|
|
\fBSet\-cookie\fP (optional)
|
|
Setzt den Cookie Name/Wert. Kann mehrmals angegeben werden.
|
|
.PP
|
|
Mehrere Einträge sind durch eine Leerzeile zu trennen.
|
|
.
|
|
Das untige Beispiel sendet zwei Cookies zu allen URLs die mit
|
|
\fBhttp://example.org/hello/\fP beginnen, und eins zu allen URLs die mit
|
|
\fBhttps://example.org\fP beginnen:
|
|
|
|
Host: example.com
|
|
Path: /hello
|
|
Set\-cookie: ID="smee"
|
|
Set\-cookie: spam="egg"
|
|
|
|
Scheme: https
|
|
Host: example.org
|
|
Set\-cookie: baggage="elitist"; comment="hologram"
|
|
|
|
.SH "PROXY UNTERSTÜTZUNG"
|
|
Um einen Proxy unter Unix oder Windows zu benutzen, setzen Sie $http_proxy,
|
|
$https_proxy oder $ftp_proxy auf die Proxy URL. Die URL sollte die Form
|
|
\fBhttp://\fP[\fIuser\fP\fB:\fP\fIpass\fP\fB@\fP]\fIhost\fP[\fB:\fP\fIport\fP] besitzen. LinkChecker
|
|
erkennt auch die Proxy\-Einstellungen des Internet Explorers auf einem
|
|
Windows\-System. Auf einem Mac benutzen Sie die Internet Konfiguration.
|
|
.
|
|
Einen HTTP\-Proxy unter Unix anzugeben sieht beispielsweise so aus:
|
|
|
|
export http_proxy="http://proxy.example.com:8080"
|
|
|
|
Proxy\-Authentifizierung wird ebenfalls unterstützt:
|
|
|
|
export http_proxy="http://user1:mypass@proxy.example.org:8081"
|
|
|
|
Setzen eines Proxies unter der Windows Befehlszeile:
|
|
|
|
set http_proxy=http://proxy.example.com:8080
|
|
|
|
.SH "PERFORMED CHECKES"
|
|
All URLs have to pass a preliminary syntax test. Minor quoting mistakes will
|
|
issue a warning, all other invalid syntax issues are errors. After the
|
|
syntax check passes, the URL is queued for connection checking. All
|
|
connection check types are described below.
|
|
.
|
|
.TP
|
|
HTTP links (\fBhttp:\fP, \fBhttps:\fP)
|
|
After connecting to the given HTTP server the given path or query is
|
|
requested. All redirections are followed, and if user/password is given it
|
|
will be used as authorization when necessary. Permanently moved pages issue
|
|
a warning. All final HTTP status codes other than 2xx are errors.
|
|
.
|
|
HTML page contents are checked for recursion.
|
|
.TP
|
|
Local files (\fBfile:\fP)
|
|
A regular, readable file that can be opened is valid. A readable directory
|
|
is also valid. All other files, for example device files, unreadable or
|
|
non\-existing files are errors.
|
|
.
|
|
HTML or other parseable file contents are checked for recursion.
|
|
.TP
|
|
Mail links (\fBmailto:\fP)
|
|
A mailto: link eventually resolves to a list of email addresses. If one
|
|
address fails, the whole list will fail. For each mail address we check the
|
|
following things:
|
|
.
|
|
1) Check the adress syntax, both of the part before and after
|
|
the @ sign.
|
|
2) Look up the MX DNS records. If we found no MX record,
|
|
print an error.
|
|
3) Check if one of the mail hosts accept an SMTP connection.
|
|
Check hosts with higher priority first.
|
|
If no host accepts SMTP, we print a warning.
|
|
4) Try to verify the address with the VRFY command. If we got
|
|
an answer, print the verified address as an info.
|
|
.TP
|
|
FTP links (\fBftp:\fP)
|
|
|
|
For FTP links we do:
|
|
|
|
1) connect to the specified host
|
|
2) try to login with the given user and password. The default
|
|
user is \*(lqanonymous\*(lq, the default password is \*(lqanonymous@\*(lq.
|
|
3) try to change to the given directory
|
|
4) list the file with the NLST command
|
|
|
|
\- Telnet links (\*(lqtelnet:\*(lq)
|
|
|
|
We try to connect and if user/password are given, login to the
|
|
given telnet server.
|
|
|
|
\- NNTP links (\*(lqnews:\*(lq, \*(lqsnews:\*(lq, \*(lqnntp\*(lq)
|
|
|
|
We try to connect to the given NNTP server. If a news group or
|
|
article is specified, try to request it from the server.
|
|
|
|
\- Ignored links (\*(lqjavascript:\*(lq, etc.)
|
|
|
|
An ignored link will only print a warning. No further checking
|
|
will be made.
|
|
|
|
Here is a complete list of recognized, but ignored links. The most
|
|
prominent of them should be JavaScript links.
|
|
|
|
\- \*(lqacap:\*(lq (application configuration access protocol)
|
|
\- \*(lqafs:\*(lq (Andrew File System global file names)
|
|
\- \*(lqchrome:\*(lq (Mozilla specific)
|
|
\- \*(lqcid:\*(lq (content identifier)
|
|
\- \*(lqclsid:\*(lq (Microsoft specific)
|
|
\- \*(lqdata:\*(lq (data)
|
|
\- \*(lqdav:\*(lq (dav)
|
|
\- \*(lqfax:\*(lq (fax)
|
|
\- \*(lqfind:\*(lq (Mozilla specific)
|
|
\- \*(lqgopher:\*(lq (Gopher)
|
|
\- \*(lqimap:\*(lq (internet message access protocol)
|
|
\- \*(lqisbn:\*(lq (ISBN (int. book numbers))
|
|
\- \*(lqjavascript:\*(lq (JavaScript)
|
|
\- \*(lqldap:\*(lq (Lightweight Directory Access Protocol)
|
|
\- \*(lqmailserver:\*(lq (Access to data available from mail servers)
|
|
\- \*(lqmid:\*(lq (message identifier)
|
|
\- \*(lqmms:\*(lq (multimedia stream)
|
|
\- \*(lqmodem:\*(lq (modem)
|
|
\- \*(lqnfs:\*(lq (network file system protocol)
|
|
\- \*(lqopaquelocktoken:\*(lq (opaquelocktoken)
|
|
\- \*(lqpop:\*(lq (Post Office Protocol v3)
|
|
\- \*(lqprospero:\*(lq (Prospero Directory Service)
|
|
\- \*(lqrsync:\*(lq (rsync protocol)
|
|
\- \*(lqrtsp:\*(lq (real time streaming protocol)
|
|
\- \*(lqservice:\*(lq (service location)
|
|
\- \*(lqshttp:\*(lq (secure HTTP)
|
|
\- \*(lqsip:\*(lq (session initiation protocol)
|
|
\- \*(lqtel:\*(lq (telephone)
|
|
\- \*(lqtip:\*(lq (Transaction Internet Protocol)
|
|
\- \*(lqtn3270:\*(lq (Interactive 3270 emulation sessions)
|
|
\- \*(lqvemmi:\*(lq (versatile multimedia interface)
|
|
\- \*(lqwais:\*(lq (Wide Area Information Servers)
|
|
\- \*(lqz39.50r:\*(lq (Z39.50 Retrieval)
|
|
\- \*(lqz39.50s:\*(lq (Z39.50 Session)
|
|
|
|
|
|
.SH Rekursion
|
|
Before descending recursively into a URL, it has to fulfill several
|
|
conditions. They are checked in this order:
|
|
|
|
1. A URL must be valid.
|
|
|
|
2. A URL must be parseable. This currently includes HTML files,
|
|
Opera bookmarks files, and directories. If a file type cannot
|
|
be determined (for example it does not have a common HTML file
|
|
extension, and the content does not look like HTML), it is assumed
|
|
to be non\-parseable.
|
|
|
|
3. The URL content must be retrievable. This is usually the case
|
|
except for example mailto: or unknown URL types.
|
|
|
|
4. The maximum recursion level must not be exceeded. It is configured
|
|
with the \*(lq\-\-recursion\-level\*(lq option and is unlimited per default.
|
|
|
|
5. It must not match the ignored URL list. This is controlled with
|
|
the \*(lq\-\-ignore\-url\*(lq option.
|
|
|
|
6. The Robots Exclusion Protocol must allow links in the URL to be
|
|
followed recursively. This is checked by searching for a
|
|
"nofollow" directive in the HTML header data.
|
|
|
|
Note that the directory recursion reads all files in that directory, not
|
|
just a subset like \*(lqindex.htm*\*(lq.
|
|
|
|
.SH BEMERKUNGEN
|
|
URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie \fBftp://ftp.\fP
|
|
behandelt, URLs die mit \fBwww.\fP beginnen wie \fBhttp://www.\fP. Sie können auch
|
|
lokale Dateien angeben.
|
|
|
|
Falls sich Ihr System automatisch mit dem Internet verbindet (z.B. mit
|
|
diald), wird es dies tun wenn Sie Links prüfen, die nicht auf Ihren lokalen
|
|
Rechner verweisen Benutzen Sie die Optionen \fB\-s\fP und \fB\-i\fP, um dies zu
|
|
verhindern.
|
|
|
|
Javascript Links werden zur Zeit ignoriert.
|
|
|
|
Wenn Ihr System keine Threads unterstützt, deaktiviert diese LinkChecker
|
|
automatisch.
|
|
|
|
Sie können mehrere Benutzer/Passwort Paare in einer Konfigurationsdatei
|
|
angeben.
|
|
|
|
Beim Prüfen von \fBnews:\fP Links muß der angegebene NNTP Rechner nicht
|
|
unbedingt derselbe wie der des Benutzers sein.
|
|
.
|
|
.SH UMGEBUNG
|
|
\fBNNTP_SERVER\fP \- gibt Standard NNTP Server an
|
|
.br
|
|
\fBhttp_proxy\fP \- gibt Standard HTTP Proxy an
|
|
.br
|
|
\fBftp_proxy\fP \- gibt Standard FTP Proxy an
|
|
.br
|
|
\fBLC_MESSAGES\fP, \fBLANG\fP, \fBLANGUAGE\fP \- gibt Ausgabesprache an
|
|
.
|
|
.SH RÜCKGABEWERT
|
|
Der Rückgabewert ist nicht Null falls
|
|
.IP \(bu
|
|
ungültige Verknüpfungen gefunden wurden oder
|
|
.IP \(bu
|
|
Warnungen gefunden wurden und Warnungen aktiviert sind
|
|
.IP \(bu
|
|
ein Programmfehler aufgetreten ist.
|
|
.
|
|
.SH LIMITIERUNGEN
|
|
LinkChecker benutzt Hauptspeicher für jede zu prüfende URL, die in der
|
|
Warteschlange steht. Mit tausenden solcher URLs kann die Menge des benutzten
|
|
Hauptspeichers sehr groß werden. Dies könnte das Programm oder sogar das
|
|
gesamte System verlangsamen.
|
|
.
|
|
.SH DATEIEN
|
|
\fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkchecker/linkcheckerrc\fP \-
|
|
Standardkonfigurationsdateien
|
|
.br
|
|
\fB~/.linkchecker/blacklist\fP \- Standard Dateiname der blacklist Logger
|
|
Ausgabe
|
|
.br
|
|
\fBlinkchecker\-out.\fP\fITYP\fP \- Standard Dateiname der Logausgabe
|
|
.br
|
|
\fBhttp://docs.python.org/lib/standard\-encodings.html\fP \- gültige Ausgabe
|
|
Enkodierungen
|
|
.br
|
|
\fBhttp://www.amk.ca/python/howto/regex/\fP \- Dokumentation zu regulären
|
|
Ausdrücken
|
|
|
|
.SH "SIEHE AUCH"
|
|
\fBlinkcheckerrc\fP(5)
|
|
.
|
|
.SH AUTHOR
|
|
Bastian Kleineidam <calvin@users.sourceforge.net>
|
|
.
|
|
.SH COPYRIGHT
|
|
Copyright \(co 2000\-2009 Bastian Kleineidam
|