Additions:
Die Crawlertrap hat die Aufgabe Spider und Downloadprogramme, die sich nicht an die **robots.txt** halten zu sperren.
Deletions:
Die Crawlertrap hat die Aufgabe Spider und Downloadprogramme, die sich nicht an die robots.txt halten zu sperren.
Additions:
Um die Spider so fr�h wie m�glich auf die �berpr�fung der Crawlertrap zu schicken wird im Header-Template ein nicht sichtbarer Link zum Crawlertrap-Verzeichnis eingebaut.
Hier kann man den Pfad der Crawlertrap definieren. Wer hier den Pfad �ndert, muss auch den Ordner der Crawlertrap umbenennen und auch die robots.txt anpassen.
Wie lange eine IP in der dynamischen Sperrliste (blacklist) drin bleiben soll. Angabe in Minuten.
(Gerade zu Beginn empfohlen, um zu sehen, dass sie korrekt arbeitet und was sie an Arbeit und Traffik spart )
Um die Crawlertrap zu optimieren sammeln wir hier Daten der b�sen Bots. Ist diese Option aktiviert, werden die erfassten Daten an crawlertrap.com gesendet.
Deletions:
Um die Spider so fr�h wie m�glich auf die �berpr�fung der Crawlertrap zu schicken wird im Header-Template ist ein nicht sichtbarer Link zum Crawlertrap-Verzeichnis eingebaut.
Hier kann man den Pfad der Crawlertrap definieren. Wer hier den Pfad �ndert muss auch den Ordner der Crawlertrap umbenennen und auch die robots.txt anpassen.
Wie lange eine IP in der dynamischen Sperrliste (blacklist) drin bleiben soll.
Angabe in Minuten.
(Gerade zu Beginn empfohlen, um zu sehen, dass sie korrekt arbeitet und was sie an Arbeit und Traffig spart )
Um die Crawlertrap zu optimieren sammeln wir hier Daten der b�sen Bots. Ist diese Option aktiviert werden die erfassten Daten an crawlertrap.com gesendet.
Additions:
**//b�se// Crawler, Robots, Bots, Spider, G�stebuchspammer, Formularspammer, Forum- und Blogspammer bleiben draussen**
Die Crawlertrap hat die Aufgabe Spider und Downloadprogramme, die sich nicht an die robots.txt halten zu sperren.
Zus�tzlich k�nnen gezielt bestimmte IP-Adressen, IP-Bereiche und User-Agenten gesperrt werden.
Seri�se Suchmaschinen Spider und Robots lesen die Datei robots.txt im Hauptverzeichnis aus. Dort ist eingetragen, welche Dateien und Ordner ausgelesen und besucht werden d�rfen.
Hier steht das Verzeichnis der Crawlertrap als nicht erlaubt, d.h. alles was sich an die robos.txt h�lt, wird das Verzeichnis nie besuchen.
Wird trotzdem das Verzeichnis ausgelesen / besucht kommt diese IP in die dynamische schwarze Liste(blacklist) und bekommt ab sofort immer eine Fehlerseite gezeigt.
Da solche Robots aber auch �ber dynamische IP-Adressen komen k�nnen erfolgt die Sperrung nur f�r eine definierte Zeit.
Sobald diese definierte Zeit abgelaufen ist, wird die IP-Adresse wieder freigeschaltet. Sollte mal ein normaler User in die Falle kommen, kann sich dieser �ber die Eingabe eines Codes manuell freischalten. Dies bezeichnen wir als dynamische wei�e Liste (whitelist). Diese Freischaltung wird zeitlich eingeschr�nkt.
Um die Spider so fr�h wie m�glich auf die �berpr�fung der Crawlertrap zu schicken wird im Header-Template ist ein nicht sichtbarer Link zum Crawlertrap-Verzeichnis eingebaut.
Im Adminbereich k�nnen unter Crawlertrap die einzelnen Listen angesehen und modifiziert werden.
Folgende Einstellungen sind in der config.php m�glich:
CRAWLERTRAP_ACTIVE
Hier kann die Crawlertrap aktiviert(1) oder deaktiviert(0) werden.
CRAWLERTRAP_PATH
Hier kann man den Pfad der Crawlertrap definieren. Wer hier den Pfad �ndert muss auch den Ordner der Crawlertrap umbenennen und auch die robots.txt anpassen.
CRAWLERTRAP_ESCAPE_MINUTES_BLACKLIST
Wie lange eine IP in der dynamischen Sperrliste (blacklist) drin bleiben soll.
Angabe in Minuten.
CRAWLERTRAP_ESCAPE_MINUTES_WHITELIST
Wie lange eine manuelle Freigabe einer IP gestattet ist. Angabe in Minuten.
CRAWLERTRAP_EMAIL_ON_ADD
E-Mail-Benachrichtigung bei einem Eintrag in die dynamische Sperr- und Freigabeliste.
(Gerade zu Beginn empfohlen, um zu sehen, dass sie korrekt arbeitet und was sie an Arbeit und Traffig spart )
CRAWLERTRAP_EMAIL_ON_DEL
Wird eine IP aus der Whitelist oder Blacklist rausgenommen wird eine E-Mail geschickt.
CRAWLERTRAP_EMAIL_ADDRESS_TO
E-Mailadresse f�r Benachrichtigung
CRAWLERTRAP_EMAIL_ADDRESS_FROM
E-Mail Absenderkennung des Projektes
CRAWLERTRAP_EMAIL_COLLECT
Um die Crawlertrap zu optimieren sammeln wir hier Daten der b�sen Bots. Ist diese Option aktiviert werden die erfassten Daten an crawlertrap.com gesendet.
CRAWLERTRAP_EMAIL_SUBJECT_ADD
Betreffzeile der E-Mail beim Hinzuf�gen einer IP in eine dynamische Liste
CRAWLERTRAP_EMAIL_SUBJECT_DEL
Betreffzeile der E-Mail beim Entfernen einer IP aus den dynamische Listen
CRAWLERTRAP_EMAIL_TEXT_ADD
Hier kann der E-Mailtext beim Hinzuf�gen in eine Liste angepasst werden. Die Werte in den eckigen Klammer sind Platzhalter. Es stehen folgende Werte zur
Verf�gung:
[TIME] [IP] [IPRANGE] [UA] [HOST] [NETNAME] [DESCRIPTION] [PERSON] [ADDRESS] [COUNTRY] [PHONE] [EMAIL] [BASEURL]
CRAWLERTRAP_EMAIL_TEXT_DEL
Hier kann der E-Mailtext beim L�schen aus einer Liste angepasst werden. Die Parameter sind die gleichen wie bei CRAWLERTRAP_EMAIL_TEXT_ADD.
Deletions:
==//b�se// Crawler, Robots, Bots, Spider, G�stebuchspammer, Formularspammer, Forum- und Blogspammer bleiben draussen==
Additions:
==//b�se// Crawler, Robots, Bots, Spider, G�stebuchspammer, Formularspammer, Forum- und Blogspammer bleiben draussen==
Deletions:
===//b�se// Crawler, Robots, Bots, Spider, G�stebuchspammer, Formularspammer, Forum- und Blogspammer bleiben draussen===
Additions:
===//b�se// Crawler, Robots, Bots, Spider, G�stebuchspammer, Formularspammer, Forum- und Blogspammer bleiben draussen===
Deletions:
====//b�se// Crawler, Robots, Bots, Spider, G�stebuchspammer, Formularspammer, Forum- und Blogspammer bleiben draussen====
Additions:
Additions:
=====Crawlertrap Modul=====
====//b�se// Crawler, Robots, Bots, Spider, G�stebuchspammer, Formularspammer, Forum- und Blogspammer bleiben draussen====
Deletions:
=====Crawlertrap Modul - //b�se// Crawler, Robots, Bots, Spider, G�stebuchspammer, Formularspammer, Forum- und Blogspammer bleiben draussen=====