Provided by: linkchecker_3.3-1_i386 bug

NAME

       linkchecker - prüfe HTML Dokumente auf kaputte Verknüpfungen

SYNTAX

       linkchecker [ Optionen ] [ Datei-oder-URL ]...

BESCHREIBUNG

       LinkChecker  bietet  rekursives  Prüfen,  Multithreading,  Ausgabe  als
       farbigen oder normalen Text, HTML, SQL, CSV oder einen  Sitemap-Graphen
       in  GML  oder  XML,  Unterstützung  für  HTTP/1.1, HTTPS, FTP, mailto:,
       news:,   nntp:,   Gopher,   Telnet   und   lokale   Dateiverknüpfungen,
       Einschränkung der Verknüpfungsüberprüfung mit URL Filtern bestehend aus
       regulären   Ausdrücken,    Proxy    Unterstützung,    Benutzer/Passwort
       Authentifizierung  für  HTTP  und  FTP,  Unterstützung  des  robots.txt
       Protokolls, Mehrsprachigkeit,  eine  Kommandozeilenschnittstelle  sowie
       eine CGI Webschnittstelle (benötigt einen HTTP Server).

BEISPIELE

       Der  häufigste  Gebrauchsfall  prüft  die  angegebene  Domäne rekursiv,
       inklusive aller einzelnen nach außen zeigenden Verknüpfungen:
         linkchecker http://treasure.calvinsplayground.de/

       Beachten Sie dass  dies  die  komplette  Domäne  überprüft  welche  aus
       mehreren hunderttausend URLs bestehen kann. Benutzen Sie die Option -r,
       um die Rekursionstiefe zu beschränken.

       Keine Verbindungen  zu  mailto:  Rechnern,  nur  die  URL  Syntax  wird
       geprüft. Alle anderen Verknüpfungen werden wie üblich geprüft:
         linkchecker --ignore-url=^mailto: www.mysite.org

       Überprüfung einer lokalen HTML Datei unter Unix:
         linkchecker ../bla.html

       Überprüfung einer lokalen HTML Datei unter Windows:
         linkchecker c:\temp\test.html

       Sie  können  den  http:// URL Anteil weglassen wenn die Domäne mit www.
       beginnt:
         linkchecker www.myhomepage.de

       Sie können den ftp:// URL Anteil weglassen wenn  die  Domäne  mit  ftp.
       beginnt:
         linkchecker -r0 ftp.linux.org

OPTIONEN

   Allgemeine Optionen
       -h, --help
              Hilfe! Gebe Gebrauchsanweisung für dieses Programm aus.

       -fDATEINAME, --config=DATEINAME
              Benutze  DATEINAME  als Konfigurationsdatei. Standardmäßig sucht
              LinkChecker zuerst nach /etc/linkchecker/linkcheckerrc und  dann
              ~/.linkchecker/linkcheckerrc.

       -I, --interactive
              Frage  nach  URLs,  falls keine auf der Kommandozeile eingegeben
              wurden.

       -tNUMMER, --threads=NUMMER
              Generiere nicht mehr als  die  angegebene  Anzahl  von  Threads.
              Standard  Anzahl von Threads ist 10. Um Threads zu deaktivieren,
              geben Sie eine nicht positive Nummer an.

       --priority
              Starte  mit  normaler  Threadpriorität.   Als   Standard   läuft
              LinkChecker    mit    niedriger    Threadpriorität,    um    als
              Hintergrundprozess geeignet zu sein.

       --disable-psyco
              Verwende nicht die Psyco Laufzeitoptimmierung, auch  wenn  diese
              installiert ist.

       -V, --version
              Gebe die Version aus und beende das Programm.

   Ausgabeoptionen
       -v, --verbose
              Gebe  alle  geprüften URLs aus. Standard ist es, nur fehlerhafte
              URLs und Warnungen auszugeben.

       --no-warnings
              Gebe  keine  Warnungen  aus.  Standard  ist  die   Ausgabe   von
              Warnungen.

       -WREGEX, --warning-regex=REGEX
              Definieren Sie einen regulären Ausdruck der eine Warnung ausgibt
              falls er auf den Inhalt einer geprüften URL zutrifft. Dies  gilt
              nur für gültige Seiten deren Inhalt wir bekommen können.

              Benutzen  Sie  dies,  um nach Seiten zu suchen, welche bestimmte
              Fehler enthalten, zum Beispiel "Diese Seite wurde entfernt" oder
              "Oracle Applikationsfehler".

       --warning-size-bytes=NUMMER
              Gebe eine Warnung aus, wenn die Inhaltsgröße bekannt ist und die
              angegebene Anzahl von Bytes übersteigt.

       -q, --quiet
              Keine Ausgabe, ein Alias für -o none. Dies ist nur in Verbindung
              mit -F nützlich.

       -oTYP[/ENKODIERUNG], --output=TYP[/ENKODIERUNG]
              Spezifiziere  die  Ausgabe  als  text, html, sql, csv, gml, dot,
              xml,  none  oder  blacklist.  Standardausgabe  ist   text.   Die
              verschiedenen    Ausgabetypen   sind   weiter   unten   erklärt.
              Enkodierung gibt die Ausgabekodierung an, die  Standardkodierung
              erfolgt  mit  dem eingestellten Zeichensatz des Systems. Gültige
              Enkodierungen                     sind                     unter
              http://docs.python.org/lib/standard-encodings.html  aufgelistet.

       -FTYP[/ENKODIERUNG][/DATEINAME],
       --file-output=TYP[/ENKODIERUNG][/DATEINAME]
              Ausgabe    in    eine    Datei    namens    linkchecker-out.TYP,
              $HOME/.linkchecker/blacklist   bei   blacklist   Ausgabe,   oder
              DATEINAME falls angegeben. Der DATEINAME  und  ENKODIERUNG  Teil
              wird  beim  Ausgabetyp  none ignoriert, ansonsten wird die Datei
              überschreiben falls sie existiert. Sie können diese Option  mehr
              als einmal verwenden. Gültige Ausgabetypen sind text, html, sql,
              csv, gml, dot, xml, none  oder  blacklist.  Standard  ist  keine
              Dateiausgabe.   ENKODIERUNG  gibt  die  Ausgabekodierung  an,der
              Standard ist die Enkodierung der ausgewählten Spracheinstellung.
              Gültige            Enkodierungen            sind           unter
              http://docs.python.org/lib/standard-encodings.html  aufgelistet.
              Beachten  Sie, dass Sie mit der Option -o none jegliche Ausgaben
              auf der Konsole verhindern können.

       --no-status
              Gebe keine Statusmeldungen aus.

       -DNAME, --debug=NAME
              Gebe Testmeldungen aus für den  angegebenen  Logger.  Verfügbare
              Logger  sind  cmdline,  checking,cache,  gui,  dns  und all. Die
              Angabe all ist ein Synonym für alle  verfügbaren  Logger.  Diese
              Option  kann  mehrmals  angegeben  werden, um mit mehr als einem
              Logger zu testen. Um akkurate  Ergebnisse  zu  erzielen,  werden
              Threads    und    die    psyco    Laufzeitkompilierung   während
              Testdurchläufen deaktiviert.

       --trace
              Gebe Trace-Information aus. Die Psyco  Laufzeitoptimierung  wird
              währung Trace-Durchläufen deaktiviert.

       --profile
              Schreibe  Profiling-Daten  in eine Datei namens linkchecker.prof
              im aktuellen Arbeitsverzeichnis. Siehe auch --viewprof.

       --viewprof
              Gebe  vorher  generierte   Profiling-Daten   aus.   Siehe   auch
              --profile.

   Optionen zum Prüfen
       -rNUMMER, --recursion-level=NUMMER
              Prüfe  rekursiv  alle  URLs  bis  zu der angegebenen Tiefe. Eine
              negative Tiefe bewirkt unendliche Rekursion. Standard Tiefe  ist
              unendlich.

       --no-follow-url=REGEX
              Prüfe   URLs,   welche   dem   angegebenen   regulären  Ausdruck
              entsprechen, aber verhindere die rekursive Prüfung. Diese Option
              kann mehrmals angegeben werden.

       --ignore-url=REGEX
              Prüfe  lediglich  die  Syntax  von  URLs, welche dem angegebenen
              regulären  Ausdruck  entsprechen.  Diese  Option  kann  mehrmals
              angegeben werden.

       -C, --cookies
              Akzeptiere  und  sende HTTP Cookies nach der RFC 2109. Lediglich
              Cookies, die zum ursprünglichen  Server  zurückgesendet  werden,
              werden akzeptiert.  Gesendete und akzeptierte Cookies werden als
              zusätzlicheLoginformation aufgeführt.

       -a, --anchors
              Prüfe HTTP Anker Verweise. Standard ist keine Überprüfung.

       --no-anchor-caching
              Behandle url#anchora und url#anchorb  beim  Cachen  als  gleich.
              Dies   ist   zwar   Standard  bei  Browsern,  aber  in  der  URI
              Spezifikation nicht enthalten. Benutzen  Sie  diese  Option  mit
              Vorsicht.

       -uNAME, --user=NAME
              Verwende   den   angegebenen  Benutzernamen  für  HTTP  und  FTP
              Autorisierung. Für FTP ist der Standardname anonymous. Für  HTTP
              gibt es keinen Standardnamen. Siehe auch -p.

       -pNAME, --password=NAME
              Verwende das angegebene Passwort für HTTP und FTP Autorisierung.
              Für FTP ist das Standardpasswort anonymous@. Für  HTTP  gibt  es
              kein Standardpasswort. Siehe auch -u.

       --timeout=NUMMER
              Setze den Timeout für TCP-Verbindungen in Sekunden. Der Standard
              Timeout ist 30 Sekunden.

       -PNUMMER, --pause=NUMMER
              Pausiere die angegebene Anzahl von Sekunden zwischen dem  Prüfen
              jeder  URL. Diese Option deaktiviert Threads. Standard ist keine
              Pause zwischen dem Prüfen.

       -NNAME, --nntp-server=NAME
              Gibt  ein  NNTP  Rechner  für  news:  Links.  Standard  ist  die
              Umgebungsvariable NNTP_SERVER. Falls kein Rechner angegeben ist,
              wird lediglich auf korrekte Syntax des Links geprüft.

       --no-proxy-for=REGEX
              Rechner welche dem angegebenen  regulären  Ausdruck  entsprechen
              sollen  direkt  und  nicht über einen Proxy angesprochen werden.
              Diese Option kann mehrmals angegeben werden.

AUSGABETYPEN

       Beachten Sie, dass standardmäßig nur Fehler und Warnungen protokolliert
       werden.  Sie  sollten  die --verbose Option benutzen, um eine komplette
       URL Liste zu erhalten, besonders bei Ausgabe eines Sitemap-Graphen.

       text   Standard Textausgabe in "Schlüssel: Wert"-Form.

       html   Gebe URLs in "Schlüssel: Wert"-Form  als  HTML  formatiert  aus.
              Besitzt  zudem  Verknüpfungen  auf  die  referenzierten  Seiten.
              Ungültige  URLs   haben   Verknüpfungen   zur   HTML   und   CSS
              Syntaxprüfung angehängt.

       csv    Gebe Prüfresultat in CSV-Format aus mit einer URL pro Zeile.

       gml    Gebe  Vater-Kind  Beziehungen  zwischen verknüpften URLs als GML
              Graphen aus.

       dot    Gebe Vater-Kind Beziehungen zwischen verknüpften  URLs  als  DOT
              Graphen aus.

       gxml   Gebe Prüfresultat als GraphXML-Datei aus.

       xml    Gebe Prüfresultat als maschinenlesbare XML-Datei aus.

       sql    Gebe  Prüfresultat  als  SQL Skript mit INSERT Befehlen aus. Ein
              Beispielskript, um die initiale SQL  Tabelle  zu  erstellen  ist
              unter create.sql zu finden.

       blacklist
              Für  Cronjobs  geeignet.  Gibt  das  Prüfergebnis  in eine Datei
              ~/.linkchecker/blacklist   aus,   welche   nur   Einträge    mit
              fehlerhaften URLs und die Anzahl der Fehlversuche enthält.

       none   Gibt nichts aus. Für Skripte geeignet.

REGULÄRE AUSDRÜCKE

       Lediglich Pythons reguläre Ausdrücke werden von LinkChecker akzeptiert.
       Siehe  http://www.amk.ca/python/howto/regex/  für  eine  Einführung  in
       reguläre Ausdrücke.

       Die  einzige  Hinzufügung ist, dass ein regulärer Ausdruck negiert wird
       falls er mit einem Ausrufezeichen beginnt.

PROXY UNTERSTÜTZUNG

       Um einen Proxy  zu  benutzen,  setzen  Sie  $http_proxy,  $https_proxy,
       $ftp_proxy,  $gopher_proxy  unter  Unix  oder Windows auf die Proxy URL
       (zum Beispiel http://localhost:8080). Auf einem Mac  benutzen  Sie  die
       Internet Konfiguration.

BEMERKUNGEN

       URLs  von der Kommandozeile die mit ftp. beginnen werden wie ftp://ftp.
       behandelt, URLs die mit www. beginnen wie http://www.. Sie können  auch
       lokale Dateien angeben.

       Falls  sich Ihr System automatisch mit dem Internet verbindet (z.B. mit
       diald), wird es dies tun wenn Sie Links prüfen,  die  nicht  auf  Ihren
       lokalen  Rechner verweisen Benutzen Sie die Optionen -s und -i, um dies
       zu verhindern.

       Javascript Links werden zur Zeit ignoriert.

       Wenn  Ihr  System  keine   Threads   unterstützt,   deaktiviert   diese
       LinkChecker automatisch.

       Sie können mehrere Benutzer/Passwort Paare in einer Konfigurationsdatei
       angeben.

       Beim Prüfen von news: Links  muß  der  angegebene  NNTP  Rechner  nicht
       unbedingt derselbe wie der des Benutzers sein.

UMGEBUNG

       NNTP_SERVER - gibt Standard NNTP Server an

       http_proxy - gibt Standard HTTP Proxy an

       ftp_proxy - gibt Standard FTP Proxy an

       LC_MESSAGES, LANG, LANGUAGE - gibt Ausgabesprache an

RÜCKGABEWERT

       Der Rückgabewert ist nicht Null falls

       ·      ungültige Verknüpfungen gefunden wurden oder

       ·      Warnungen gefunden wurden und Warnungen aktiviert sind

       ·      ein Programmfehler aufgetreten ist.

DATEIEN

       /etc/linkchecker/linkcheckerrc,      ~/.linkchecker/linkcheckerrc     -
       Standardkonfigurationsdateien

       ~/.linkchecker/blacklist -  Standard  Dateiname  der  blacklist  Logger
       Ausgabe

       linkchecker-out.TYP - Standard Dateiname der Logausgabe

       http://docs.python.org/lib/standard-encodings.html  -  gültige  Ausgabe
       Enkodierungen

       http://www.amk.ca/python/howto/regex/  -  Dokumentation  zu   regulären
       Ausdrücken

AUTHOR

       Bastian Kleineidam <calvin@users.sourceforge.net>

                                 10. März 2001                  LINKCHECKER(1)