mirror of
https://github.com/Hopiu/linkchecker.git
synced 2026-03-20 16:00:26 +00:00
529 lines
21 KiB
Groff
529 lines
21 KiB
Groff
.\"*******************************************************************
|
|
.\"
|
|
.\" This file was generated with po4a. Translate the source file.
|
|
.\"
|
|
.\"*******************************************************************
|
|
.TH LINKCHECKER 1 2010\-07\-01 LinkChecker "LinkChecker auf der Kommandozeile"
|
|
.SH NAME
|
|
linkchecker \- prüfe HTML Dokumente und Webseiten auf ungültige Verknüpfungen
|
|
.
|
|
.SH SYNTAX
|
|
\fBlinkchecker\fP [\fIOptionen\fP] [\fIDatei\-oder\-URL\fP]...
|
|
.
|
|
.SH BESCHREIBUNG
|
|
.LP
|
|
LinkChecker bietet rekursives Prüfen, Multithreading, Ausgabe als farbigen
|
|
oder normalen Text, HTML, SQL, CSV oder einen Sitemap\-Graphen in GML oder
|
|
XML, Unterstützung für HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Telnet
|
|
und lokale Dateiverknüpfungen, Einschränkung der Verknüpfungsüberprüfung mit
|
|
URL Filtern bestehend aus regulären Ausdrücken, Proxy Unterstützung,
|
|
Benutzer/Passwort Authentifizierung für HTTP und FTP, Unterstützung des
|
|
robots.txt Protokolls, Mehrsprachigkeit, eine Kommandozeilenschnittstelle
|
|
sowie eine CGI Webschnittstelle (benötigt einen HTTP Server).
|
|
.
|
|
.SH BEISPIELE
|
|
Der häufigste Gebrauchsfall prüft die angegebene Domäne rekursiv,
|
|
inklusive aller einzelnen nach außen zeigenden Verknüpfungen:
|
|
\fBlinkchecker http://www.example.net/\fP
|
|
.br
|
|
Beachten Sie dass dies die komplette Domäne überprüft, welche aus mehreren
|
|
tausend URLs bestehen kann. Benutzen Sie die Option \fB\-r\fP, um die
|
|
Rekursionstiefe zu beschränken.
|
|
.br
|
|
Keine Verbindungen zu \fBmailto:\fP Rechnern, nur die URL Syntax wird geprüft. Alle
|
|
anderen Verknüpfungen werden wie üblich geprüft:
|
|
\fBlinkchecker \-\-ignore\-url=^mailto: mysite.example.org\fP
|
|
.br
|
|
Überprüfung einer lokalen HTML Datei unter Unix:
|
|
\fBlinkchecker ../bla.html\fP
|
|
.br
|
|
Überprüfung einer lokalen HTML Datei unter Windows:
|
|
\fBlinkchecker c:\etemp\etest.html\fP
|
|
.br
|
|
Sie können den \fBhttp://\fP URL Anteil weglassen wenn die Domäne mit \fBwww.\fP beginnt:
|
|
\fBlinkchecker www.example.com\fP
|
|
.br
|
|
Sie können den \fBftp://\fP URL Anteil weglassen wenn die Domäne mit \fBftp.\fP beginnt:
|
|
\fBlinkchecker \-r0 ftp.example.org\fP
|
|
.br
|
|
Erzeuge einen Sitemap Graphen und konvertiere ihn mit dem graphviz dot Programm:
|
|
\fBlinkchecker \-odot \-v www.example.com | dot \-Tps > sitemap.ps\fP
|
|
.
|
|
.SH OPTIONEN
|
|
.SS "Allgemeine Optionen"
|
|
.TP
|
|
\fB\-h\fP, \fB\-\-help\fP
|
|
Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus.
|
|
.TP
|
|
\fB\-f\fP\fIDATEINAME\fP, \fB\-\-config=\fP\fIDATEINAME\fP
|
|
Benutze \fIDATEINAME\fP als Konfigurationsdatei. Standardmäßig sucht
|
|
LinkChecker zuerst nach \fB/etc/linkchecker/linkcheckerrc\fP und dann
|
|
\fB~/.linkchecker/linkcheckerrc\fP.
|
|
.TP
|
|
\fB\-I\fP, \fB\-\-interactive\fP
|
|
Frage nach URLs, falls keine auf der Kommandozeile eingegeben wurden.
|
|
.TP
|
|
\fB\-t\fP\fINUMMER\fP, \fB\-\-threads=\fP\fINUMMER\fP
|
|
Generiere nicht mehr als die angegebene Anzahl von Threads. Standard Anzahl
|
|
von Threads ist 10. Um Threads zu deaktivieren, geben Sie eine nicht
|
|
positive Nummer an.
|
|
.TP
|
|
\fB\-\-priority\fP
|
|
Starte mit normaler Threadpriorität. Als Standard läuft LinkChecker mit
|
|
niedriger Threadpriorität, um als Hintergrundprozess geeignet zu sein.
|
|
.TP
|
|
\fB\-V\fP, \fB\-\-version\fP
|
|
Gebe die Version aus und beende das Programm.
|
|
.TP
|
|
\fB\-\-allow\-root\fP
|
|
Keine Entziehung der Priviligien, falls das Programm unter Unix als Benutzer
|
|
root läuft.
|
|
.TP
|
|
\fB\-\-stdin\fP
|
|
Lese Liste von URLs zum Prüfen von der Standardeingabe, getrennt durch
|
|
Leerzeichen.
|
|
.
|
|
.SS Ausgabeoptionen
|
|
.TP
|
|
\fB\-v\fP, \fB\-\-verbose\fP
|
|
Gebe alle geprüften URLs einmal aus. Standard ist es, nur fehlerhafte URLs
|
|
und Warnungen auszugeben.
|
|
.TP
|
|
\fB\-\-complete\fP
|
|
Gebe alle geprüften URLs aus. Standard ist es, doppelte URLs nur einmal
|
|
auszugeben.
|
|
.TP
|
|
\fB\-\-no\-warnings\fP
|
|
Gebe keine Warnungen aus. Standard ist die Ausgabe von Warnungen.
|
|
.TP
|
|
\fB\-W\fP\fIREGEX\fP, \fB\-\-warning\-regex=\fP\fIREGEX\fP
|
|
Definieren Sie einen regulären Ausdruck der eine Warnung ausgibt falls er
|
|
auf den Inhalt einer geprüften URL zutrifft. Dies gilt nur für gültige
|
|
Seiten deren Inhalt wir bekommen können.
|
|
.br
|
|
Benutzen Sie dies, um nach Seiten zu suchen, welche bestimmte Fehler
|
|
enthalten, zum Beispiel "Diese Seite wurde entfernt" oder "Oracle
|
|
Applikationsfehler".
|
|
.TP
|
|
\fB\-\-warning\-size\-bytes=\fP\fINUMMER\fP
|
|
Gebe eine Warnung aus, wenn die Inhaltsgröße bekannt ist und die angegebene
|
|
Anzahl von Bytes übersteigt.
|
|
.TP
|
|
\fB\-\-check\-html\fP
|
|
Prüfe Syntax von HTML URLs mit lokaler Bibliothek (HTML tidy).
|
|
.TP
|
|
\fB\-\-check\-html\-w3\fP
|
|
Prüfe Syntax von HTML URLs mit dem W3C Online Validator.
|
|
.TP
|
|
\fB\-\-check\-css\fP
|
|
Prüfe Syntax von CSS URLs mit lokaler Bibliothek (cssutils).
|
|
.TP
|
|
\fB\-\-check\-css\-w3\fP
|
|
Prüfe Syntax von CSS URLs mit dem W3C Online Validator.
|
|
.TP
|
|
\fB\-\-scan\-virus\fP
|
|
Prüfe Inhalt von URLs auf Viren mit ClamAV.
|
|
.TP
|
|
\fB\-q\fP, \fB\-\-quiet\fP
|
|
Keine Ausgabe, ein Alias für \fB\-o none\fP. Dies ist nur in Verbindung mit
|
|
\fB\-F\fP nützlich.
|
|
.TP
|
|
\fB\-o\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP], \fB\-\-output=\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP]
|
|
Gib Ausgabetyp als \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBdot\fP, \fBxml\fP,
|
|
\fBnone\fP oder \fBblacklist\fP an. Stadard Typ ist \fBtext\fP. Die verschiedenen
|
|
Ausgabetypen sind unten dokumentiert.
|
|
.br
|
|
Das \fIENCODING\fP gibt die Ausgabekodierung an. Der Standard ist das der
|
|
lokalen Spracheinstellung. Gültige Enkodierungen sind unter
|
|
\fBhttp://docs.python.org/library/codecs.html#standard\-encodings\fP
|
|
aufgelistet.
|
|
.TP
|
|
\fB\-F\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP][\fB/\fP\fIDATEINAME\fP], \fB\-\-file\-output=\fP\fITYP\fP[\fB/\fP\fIENKODIERUNG\fP][\fB/\fP\fIDATEINAME\fP]
|
|
Ausgabe in eine Datei namens \fBlinkchecker\-out.\fP\fITYP\fP,
|
|
\fB$HOME/.linkchecker/blacklist\fP bei \fBblacklist\fP Ausgabe, oder \fIDATEINAME\fP
|
|
falls angegeben. Der \fIDATEINAME\fP und \fIENKODIERUNG\fP Teil wird beim
|
|
Ausgabetyp \fBnone\fP ignoriert, ansonsten wird die Datei überschreiben falls
|
|
sie existiert. Sie können diese Option mehr als einmal verwenden. Gültige
|
|
Ausgabetypen sind \fBtext\fP, \fBhtml\fP, \fBsql\fP, \fBcsv\fP, \fBgml\fP, \fBdot\fP, \fBxml\fP,
|
|
\fBnone\fP oder \fBblacklist\fP. Standard ist keine Dateiausgabe. \fIENKODIERUNG\fP
|
|
gibt die Ausgabekodierung an,der Standard ist die Enkodierung der
|
|
ausgewählten Spracheinstellung. Gültige Enkodierungen sind unter
|
|
\fBhttp://docs.python.org/library/codecs.html#standard\-encodings\fP
|
|
aufgelistet. Beachten Sie, dass Sie mit der Option \fB\-o none\fP jegliche
|
|
Ausgaben auf der Konsole verhindern können.
|
|
.TP
|
|
\fB\-\-no\-status\fP
|
|
Gebe keine Statusmeldungen aus.
|
|
.TP
|
|
\fB\-D\fP\fINAME\fP, \fB\-\-debug=\fP\fINAME\fP
|
|
Gebe Testmeldungen aus für den angegebenen Logger. Verfügbare Logger sind
|
|
\fBcmdline\fP, \fBchecking\fP,\fBcache\fP, \fBgui\fP, \fBdns\fP und \fBall\fP. Die Angabe
|
|
\fBall\fP ist ein Synonym für alle verfügbaren Logger. Diese Option kann
|
|
mehrmals angegeben werden, um mit mehr als einem Logger zu testen. Um
|
|
akkurate Ergebnisse zu erzielen, werden Threads deaktiviert.
|
|
.TP
|
|
\fB\-\-trace\fP
|
|
Trace\-Information ausgeben.
|
|
.TP
|
|
\fB\-\-profile\fP
|
|
Schreibe Profiling\-Daten in eine Datei namens \fBlinkchecker.prof\fP im
|
|
aktuellen Arbeitsverzeichnis. Siehe auch \fB\-\-viewprof\fP.
|
|
.TP
|
|
\fB\-\-viewprof\fP
|
|
Gebe vorher generierte Profiling\-Daten aus. Siehe auch \fB\-\-profile\fP.
|
|
.
|
|
.SS "Optionen zum Prüfen"
|
|
.TP
|
|
\fB\-r\fP\fINUMMER\fP, \fB\-\-recursion\-level=\fP\fINUMMER\fP
|
|
Prüfe rekursiv alle URLs bis zu der angegebenen Tiefe. Eine negative Tiefe
|
|
bewirkt unendliche Rekursion. Standard Tiefe ist unendlich.
|
|
.TP
|
|
\fB\-\-no\-follow\-url=\fP\fIREGEX\fP
|
|
Prüfe URLs, welche dem angegebenen regulären Ausdruck entsprechen, aber
|
|
führe keine Rekursion durch.
|
|
.br
|
|
Diese Option kann mehrmals angegeben werden.
|
|
.TP
|
|
\fB\-\-ignore\-url=\fP\fIREGEX\fP
|
|
Prüfe lediglich die Syntax von URLs, welche dem angegebenen regulären
|
|
Ausdruck entsprechen.
|
|
.br
|
|
Diese Option kann mehrmals angegeben werden.
|
|
.TP
|
|
\fB\-C\fP, \fB\-\-cookies\fP
|
|
Akzeptiere und sende HTTP Cookies nach der RFC 2109. Lediglich Cookies, die
|
|
zum ursprünglichen Server zurückgesendet werden, werden akzeptiert.
|
|
Gesendete und akzeptierte Cookies werden als zusätzlicheLoginformation
|
|
aufgeführt.
|
|
.TP
|
|
\fB\-\-cookiefile=\fP\fIDATEINAME\fP
|
|
Lese eine Datei mit Cookie\-Daten. Das Cookie Datenformat wird weiter unten
|
|
erklärt.
|
|
.TP
|
|
\fB\-a\fP, \fB\-\-anchors\fP
|
|
Prüfe HTTP Ankerverweise. Standard ist, Ankerverweise nicht zu prüfen. Diese
|
|
Option aktiviert die Ausgabe der Warnung \fBurl\-anchor\-not\-found\fP.
|
|
.TP
|
|
\fB\-u\fP\fINAME\fP, \fB\-\-user=\fP\fINAME\fP
|
|
Verwende den angegebenen Benutzernamen für HTTP und FTP Autorisierung. Für
|
|
FTP ist der Standardname \fBanonymous\fP. Für HTTP gibt es keinen
|
|
Standardnamen. Siehe auch \fB\-p\fP.
|
|
.TP
|
|
\fB\-p\fP\fINAME\fP, \fB\-\-password=\fP\fINAME\fP
|
|
Lese ein Passwort von der Kommandozeile und verwende es für HTTP und FTP
|
|
Autorisierung. Für FTP ist das Standardpasswort \fBanonymous@\fP. Für HTTP gibt
|
|
es kein Standardpasswort. Siehe auch \fB\-u\fP.
|
|
.TP
|
|
\fB\-\-timeout=\fP\fINUMMER\fP
|
|
Setze den Timeout für TCP\-Verbindungen in Sekunden. Der Standard Timeout ist
|
|
60 Sekunden.
|
|
.TP
|
|
\fB\-P\fP\fINUMMER\fP, \fB\-\-pause=\fP\fINUMMER\fP
|
|
Pausiere die angegebene Anzahl von Sekunden zwischen zwei aufeinander
|
|
folgenden Verbindungen zum demselben Rechner. Standard ist keine Pause
|
|
zwischen Verbindungen.
|
|
.TP
|
|
\fB\-N\fP\fINAME\fP, \fB\-\-nntp\-server=\fP\fINAME\fP
|
|
Gibt ein NNTP Rechner für \fBnews:\fP Links. Standard ist die Umgebungsvariable
|
|
\fBNNTP_SERVER\fP. Falls kein Rechner angegeben ist, wird lediglich auf
|
|
korrekte Syntax des Links geprüft.
|
|
|
|
.SH KONFIGURATIONSDATEIEN
|
|
Konfigurationsdateien können alle obigen Optionen enthalten. Sie können
|
|
zudem Optionen enthalten, welche nicht auf der Kommandozeile gesetzt werden
|
|
können. Siehe \fBlinkcheckerrc\fP(5) für mehr Informationen.
|
|
|
|
.SH AUSGABETYPEN
|
|
Beachten Sie, dass standardmäßig nur Fehler und Warnungen protokolliert
|
|
werden. Sie sollten die \fB\-\-verbose\fP Option benutzen, um eine komplette URL
|
|
Liste zu erhalten, besonders bei Ausgabe eines Sitemap\-Graphen.
|
|
|
|
.TP
|
|
\fBtext\fP
|
|
Standard Textausgabe in "Schlüssel: Wert"\-Form.
|
|
.TP
|
|
\fBhtml\fP
|
|
Gebe URLs in "Schlüssel: Wert"\-Form als HTML formatiert aus. Besitzt zudem
|
|
Verknüpfungen auf die referenzierten Seiten. Ungültige URLs haben
|
|
Verknüpfungen zur HTML und CSS Syntaxprüfung angehängt.
|
|
.TP
|
|
\fBcsv\fP
|
|
Gebe Prüfresultat in CSV\-Format aus mit einer URL pro Zeile.
|
|
.TP
|
|
\fBgml\fP
|
|
Gebe Vater\-Kind Beziehungen zwischen verknüpften URLs als GML Graphen aus.
|
|
.TP
|
|
\fBdot\fP
|
|
Gebe Vater\-Kind Beziehungen zwischen verknüpften URLs als DOT Graphen aus.
|
|
.TP
|
|
\fBgxml\fP
|
|
Gebe Prüfresultat als GraphXML\-Datei aus.
|
|
.TP
|
|
\fBxml\fP
|
|
Gebe Prüfresultat als maschinenlesbare XML\-Datei aus.
|
|
.TP
|
|
\fBsql\fP
|
|
Gebe Prüfresultat als SQL Skript mit INSERT Befehlen aus. Ein
|
|
Beispielskript, um die initiale SQL Tabelle zu erstellen ist unter
|
|
create.sql zu finden.
|
|
.TP
|
|
\fBblacklist\fP
|
|
Für Cronjobs geeignet. Gibt das Prüfergebnis in eine Datei
|
|
\fB~/.linkchecker/blacklist\fP aus, welche nur Einträge mit fehlerhaften URLs
|
|
und die Anzahl der Fehlversuche enthält.
|
|
.TP
|
|
\fBnone\fP
|
|
Gibt nichts aus. Für Debugging oder Prüfen des Rückgabewerts geeignet.
|
|
.
|
|
.SH "REGULÄRE AUSDRÜCKE"
|
|
Lediglich Pythons reguläre Ausdrücke werden von LinkChecker
|
|
akzeptiert. Siehe \fBhttp://docs.python.org/howto/regex.html\fP für eine
|
|
Einführung in reguläre Ausdrücke.
|
|
|
|
Die einzige Hinzufügung ist, dass ein regulärer Ausdruck negiert wird falls
|
|
er mit einem Ausrufezeichen beginnt.
|
|
.
|
|
.SH COOKIE\-DATEIEN
|
|
Eine Cookie\-Datei enthält Standard RFC 805 Kopfdaten mit den folgenden
|
|
möglichen Namen:
|
|
.
|
|
.TP
|
|
\fBScheme\fP (optional)
|
|
Setzt das Schema für das die Cookies gültig sind; Standardschema ist
|
|
\fBhttp\fP.
|
|
.TP
|
|
\fBHost\fP (erforderlich)
|
|
Setzt die Domäne für die die Cookies gültig sind.
|
|
.TP
|
|
\fBPath\fP (optional)
|
|
Gibt den Pfad für den die Cookies gültig sind; Standardpfad ist \fB/\fP.
|
|
.TP
|
|
\fBSet\-cookie\fP (optional)
|
|
Setzt den Cookie Name/Wert. Kann mehrmals angegeben werden.
|
|
.PP
|
|
Mehrere Einträge sind durch eine Leerzeile zu trennen.
|
|
.
|
|
Das untige Beispiel sendet zwei Cookies zu allen URLs die mit
|
|
\fBhttp://example.org/hello/\fP beginnen, und eins zu allen URLs die mit
|
|
\fBhttps://example.org\fP beginnen:
|
|
|
|
Host: example.com
|
|
Path: /hello
|
|
Set\-cookie: ID="smee"
|
|
Set\-cookie: spam="egg"
|
|
|
|
Scheme: https
|
|
Host: example.org
|
|
Set\-cookie: baggage="elitist"; comment="hologram"
|
|
|
|
.SH "PROXY UNTERSTÜTZUNG"
|
|
Um einen Proxy unter Unix oder Windows zu benutzen, setzen Sie die
|
|
$http_proxy, $https_proxy oder $ftp_proxy Umgebungsvariablen auf die Proxy
|
|
URL. Die URL sollte die Form
|
|
\fBhttp://\fP[\fIuser\fP\fB:\fP\fIpass\fP\fB@\fP]\fIhost\fP[\fB:\fP\fIport\fP] besitzen. LinkChecker
|
|
erkennt auch die Proxy\-Einstellungen des Internet Explorers auf einem
|
|
Windows\-System. Auf einem Mac benutzen Sie die Internet Konfiguration.
|
|
.
|
|
Sie können eine komma\-separierte Liste von Domainnamen in der $no_proxy
|
|
Umgebungsvariable setzen, um alle Proxies für diese Domainnamen zu
|
|
ignorieren.
|
|
.
|
|
Einen HTTP\-Proxy unter Unix anzugeben sieht beispielsweise so aus:
|
|
|
|
export http_proxy="http://proxy.example.com:8080"
|
|
|
|
Proxy\-Authentifizierung wird ebenfalls unterstützt:
|
|
|
|
export http_proxy="http://user1:mypass@proxy.example.org:8081"
|
|
|
|
Setzen eines Proxies unter der Windows Befehlszeile:
|
|
|
|
set http_proxy=http://proxy.example.com:8080
|
|
|
|
.SH "Durchgeführte Prüfungen"
|
|
Alle URLs müssen einen ersten Syntaxtest bestehen. Kleine Kodierungsfehler
|
|
ergeben eine Warnung, jede andere ungültige Syntaxfehler sind Fehler. Nach
|
|
dem Bestehen des Syntaxtests wird die URL in die Schlange zum
|
|
Verbindungstest gestellt. Alle Verbindungstests sind weiter unten
|
|
beschrieben.
|
|
.
|
|
.TP
|
|
HTTP Verknüpfungen (\fBhttp:\fP, \fBhttps:\fP)
|
|
Nach Verbinden zu dem gegebenen HTTP\-Server wird der eingegebene Pfad oder
|
|
Query angefordert. Alle Umleitungen werden verfolgt, und falls ein
|
|
Benutzer/Passwort angegeben wurde werden diese falls notwendig als
|
|
Authorisierung benutzt. Permanent umgezogene Webseiten werden als Warnung
|
|
ausgegeben. Alle finalen HTTP Statuscodes, die nicht dem Muster 2xx
|
|
entsprechen, werden als Fehler ausgegeben.
|
|
.
|
|
Der Inhalt von HTML\-Seiten wird rekursiv geprüft.
|
|
.TP
|
|
Lokale Dateien (\fBfile:\fP)
|
|
Eine reguläre, lesbare Datei die geöffnet werden kann ist gültig. Ein
|
|
lesbares Verzeichnis ist ebenfalls gültig. Alle anderen Dateien, zum
|
|
Beispiel Gerätedateien, unlesbare oder nicht existente Dateien ergeben einen
|
|
Fehler.
|
|
.
|
|
HTML\- oder andere untersuchbare Dateiinhalte werden rekursiv geprüft.
|
|
.TP
|
|
Mail\-Links (\fBmailto:\fP)
|
|
Ein mailto:\-Link ergibt eine Liste von E\-Mail\-Adressen. Falls eine Adresse
|
|
fehlerhaft ist, wird die ganze Liste als fehlerhaft angesehen. Für jede
|
|
E\-Mail\-Adresse werden die folgenden Dinge geprüft:
|
|
.
|
|
1) Prüfe die Syntax der Adresse, sowohl den Teil vor als auch nach dem @\-Zeichen.
|
|
2) Schlage den MX DNS\-Datensatz nach. Falls kein MX Datensatz gefunden wurde, wird ein Fehler ausgegeben.
|
|
3) Prüfe, ob einer der Mail\-Rechner eine SMTP\-Verbindung akzeptiert.
|
|
Rechner mit höherer Priorität werden zuerst geprüft.
|
|
Fall kein Rechner SMTP\-Verbindungen akzeptiert, wird eine Warnung ausgegeben.
|
|
4) Versuche, die Adresse mit dem VRFY\-Befehl zu verifizieren. Falls eine Antwort kommt, wird die verifizierte Adresse als Information ausgegeben.
|
|
.TP
|
|
FTP\-Links (\fBftp:\fP)
|
|
|
|
Für FTP\-Links wird Folgendes geprüft:
|
|
|
|
1) Eine Verbindung zum angegeben Rechner wird aufgebaut
|
|
2) Versuche, sich mit dem gegebenen Nutzer und Passwort anzumelden. Der Standardbenutzer ist \*(lqanonymous\*(lq, das Standardpasswort ist \*(lqanonymous@\*(lq.
|
|
3) Versuche, in das angegebene Verzeichnis zu wechseln
|
|
4) Liste die Dateien im Verzeichnis auf mit dem NLST\-Befehl
|
|
|
|
\- Telnet\-Links (\*(lqtelnet:\*(lq)
|
|
|
|
Versuche, zu dem angegeben Telnetrechner zu verginden und falls Benutzer/Passwort angegeben sind, wird versucht, sich anzumelden.
|
|
|
|
\- NNTP\-Links (\*(lqnews:\*(lq, \*(lqsnews:\*(lq, \*(lqnntp\*(lq)
|
|
|
|
Versuche, zu dem angegebenen NNTP\-Rechner eine Verbindung aufzubaucne. Falls eine Nachrichtengruppe oder ein bestimmter Artikel angegeben ist, wird versucht, diese Gruppe oder diesen Artikel vom Rechner anzufragen.
|
|
|
|
\- Ignorierte Links (\*(lqjavascript:\*(lq, etc.)
|
|
|
|
Ein ignorierte Link wird nur eine Warnung ausgeben. Weitere Prüfungen werden nicht gemacht.
|
|
|
|
Dies ist eine komplette Liste von erkannten, aber ingorierten Links. Die bekanntesten von ihnen dürften JavaScript\-Links sein.
|
|
|
|
\- \*(lqacap:\*(lq (application configuration access protocol)
|
|
\- \*(lqafs:\*(lq (Andrew File System global file names)
|
|
\- \*(lqchrome:\*(lq (Mozilla specific)
|
|
\- \*(lqcid:\*(lq (content identifier)
|
|
\- \*(lqclsid:\*(lq (Microsoft specific)
|
|
\- \*(lqdata:\*(lq (data)
|
|
\- \*(lqdav:\*(lq (dav)
|
|
\- \*(lqfax:\*(lq (fax)
|
|
\- \*(lqfind:\*(lq (Mozilla specific)
|
|
\- \*(lqgopher:\*(lq (Gopher)
|
|
\- \*(lqimap:\*(lq (internet message access protocol)
|
|
\- \*(lqisbn:\*(lq (ISBN (int. book numbers))
|
|
\- \*(lqjavascript:\*(lq (JavaScript)
|
|
\- \*(lqldap:\*(lq (Lightweight Directory Access Protocol)
|
|
\- \*(lqmailserver:\*(lq (Access to data available from mail servers)
|
|
\- \*(lqmid:\*(lq (message identifier)
|
|
\- \*(lqmms:\*(lq (multimedia stream)
|
|
\- \*(lqmodem:\*(lq (modem)
|
|
\- \*(lqnfs:\*(lq (network file system protocol)
|
|
\- \*(lqopaquelocktoken:\*(lq (opaquelocktoken)
|
|
\- \*(lqpop:\*(lq (Post Office Protocol v3)
|
|
\- \*(lqprospero:\*(lq (Prospero Directory Service)
|
|
\- \*(lqrsync:\*(lq (rsync protocol)
|
|
\- \*(lqrtsp:\*(lq (real time streaming protocol)
|
|
\- \*(lqservice:\*(lq (service location)
|
|
\- \*(lqshttp:\*(lq (secure HTTP)
|
|
\- \*(lqsip:\*(lq (session initiation protocol)
|
|
\- \*(lqtel:\*(lq (telephone)
|
|
\- \*(lqtip:\*(lq (Transaction Internet Protocol)
|
|
\- \*(lqtn3270:\*(lq (Interactive 3270 emulation sessions)
|
|
\- \*(lqvemmi:\*(lq (versatile multimedia interface)
|
|
\- \*(lqwais:\*(lq (Wide Area Information Servers)
|
|
\- \*(lqz39.50r:\*(lq (Z39.50 Retrieval)
|
|
\- \*(lqz39.50s:\*(lq (Z39.50 Session)
|
|
|
|
|
|
.SH Rekursion
|
|
Bevor eine URL rekursiv geprüft wird, hat diese mehrere Bedingungen zu
|
|
erfüllen. Diese werden in folgender Reihenfolge geprüft:
|
|
|
|
1. Eine URL muss gültig sein.
|
|
|
|
2. Der URL\-Inhalt muss analysierbar sein. Dies beinhaltet zur Zeit HTML\-Dateien, Opera Lesezeichen, und Verzeichnisse. Falls ein Dateityp nicht erkannt wird, (zum Beispiel weil er keine bekannte HTML\-Dateierweiterung besitzt, und der Inhalt nicht nach HTML aussieht), wird der Inhalt als nicht analysierbar angesehen.
|
|
|
|
3. Der URL\-Inhalt muss ladbar sein. Dies ist normalerweise der Fall, mit Ausnahme von mailto: oder unbekannten URL\-Typen.
|
|
|
|
4. Die maximale Rekursionstiefe darf nicht überschritten werden. Diese wird mit der Option \*(lq\-\-recursion\-level\*(lq konfiguriert und ist standardmäßig nicht limitiert.
|
|
|
|
5. Die URL darf nicht in der Liste von ignorierten URLs sein. Die ignorierten URLs werden mit der Option \*(lq\-\-ignore\-url\*(lq konfiguriert.
|
|
|
|
6. Das Robots Exclusion Protocol muss es erlauben, dass Verknüpfungen in der URL rekursiv verfolgt werden können. Dies wird geprüft, indem in den HTML Kopfdaten nach der "nofollow"\-Direktive gesucht wird.
|
|
|
|
Beachten Sie, dass die Verzeichnisrekursion alle Dateien in diesem
|
|
Verzeichnis liest, nicht nur eine Untermenge wie bspw. \*(lqindex.html*\*(lq.
|
|
|
|
.SH BEMERKUNGEN
|
|
URLs von der Kommandozeile die mit \fBftp.\fP beginnen werden wie \fBftp://ftp.\fP
|
|
behandelt, URLs die mit \fBwww.\fP beginnen wie \fBhttp://www.\fP. Sie können auch
|
|
lokale Dateien angeben.
|
|
|
|
Falls sich Ihr System automatisch mit dem Internet verbindet (z.B. mit
|
|
diald), wird es dies tun wenn Sie Links prüfen, die nicht auf Ihren lokalen
|
|
Rechner verweisen Benutzen Sie die Optionen \fB\-s\fP und \fB\-i\fP, um dies zu
|
|
verhindern.
|
|
|
|
Javascript Links werden zur Zeit ignoriert.
|
|
|
|
Wenn Ihr System keine Threads unterstützt, deaktiviert diese LinkChecker
|
|
automatisch.
|
|
|
|
Sie können mehrere Benutzer/Passwort Paare in einer Konfigurationsdatei
|
|
angeben.
|
|
|
|
Beim Prüfen von \fBnews:\fP Links muß der angegebene NNTP Rechner nicht
|
|
unbedingt derselbe wie der des Benutzers sein.
|
|
.
|
|
.SH UMGEBUNG
|
|
\fBNNTP_SERVER\fP \- gibt Standard NNTP Server an
|
|
.br
|
|
\fBhttp_proxy\fP \- gibt Standard HTTP Proxy an
|
|
.br
|
|
\fBftp_proxy\fP \- gibt Standard FTP Proxy an
|
|
.br
|
|
\fBno_proxy\fP \- kommaseparierte Liste von Domains, die nicht über einen
|
|
Proxy\-Server kontaktiert werden
|
|
.br
|
|
\fBLC_MESSAGES\fP, \fBLANG\fP, \fBLANGUAGE\fP \- gibt Ausgabesprache an
|
|
.
|
|
.SH RÜCKGABEWERT
|
|
Der Rückgabewert ist nicht Null falls
|
|
.IP \(bu
|
|
ungültige Verknüpfungen gefunden wurden oder
|
|
.IP \(bu
|
|
Warnungen gefunden wurden und Warnungen aktiviert sind
|
|
.IP \(bu
|
|
ein Programmfehler aufgetreten ist.
|
|
.
|
|
.SH LIMITIERUNGEN
|
|
LinkChecker benutzt Hauptspeicher für jede zu prüfende URL, die in der
|
|
Warteschlange steht. Mit tausenden solcher URLs kann die Menge des benutzten
|
|
Hauptspeichers sehr groß werden. Dies könnte das Programm oder sogar das
|
|
gesamte System verlangsamen.
|
|
.
|
|
.SH DATEIEN
|
|
\fB/etc/linkchecker/linkcheckerrc\fP, \fB~/.linkchecker/linkcheckerrc\fP \-
|
|
Standardkonfigurationsdateien
|
|
.br
|
|
\fB~/.linkchecker/blacklist\fP \- Standard Dateiname der blacklist Logger
|
|
Ausgabe
|
|
.br
|
|
\fBlinkchecker\-out.\fP\fITYP\fP \- Standard Dateiname der Logausgabe
|
|
.br
|
|
\fBhttp://docs.python.org/library/codecs.html#standard\-encodings\fP \- gültige
|
|
Ausgabe Enkodierungen
|
|
.br
|
|
\fBhttp://docs.python.org/howto/regex.html\fP \- Dokumentation zu regulären
|
|
Ausdrücken
|
|
|
|
.SH "SIEHE AUCH"
|
|
\fBlinkcheckerrc\fP(5)
|
|
.
|
|
.SH AUTHOR
|
|
Bastian Kleineidam <calvin@users.sourceforge.net>
|
|
.
|
|
.SH COPYRIGHT
|
|
Copyright \(co 2000\-2010 Bastian Kleineidam
|