Startseite » Produkte » TrashBouncer Spamfilter

TrashBouncer

TrashBouncer ist ein statistischer Spamfilter und gehört zu einer Kategorie von „intelligenten“ Spamfiltern, die manchmal auch (nicht ganz korrekt) als Bayessche Spamfilter bezeichnet werden. TrashBouncer ist, im Gegensatz zu den meisten auf E-Mails spezialisierten Filtern, speziell für den Einsatz auf Webseiten ausgelegt. Er schützt Webformulare vor dem automatisierten Versenden durch das Berechnen einer Spamwahrscheinlichkeit mit Hilfe von statistischer Auswertung der eingegeben Texte.

Ähnlich wie handelsübliche E-Mail-Filter, kann auch TrashBouncer durch das Markieren von protokollierten Versuchen trainiert werden und erreicht so mit der Zeit immer höhere Trefferquoten.

TrashBouncer ist darüber hinaus leicht anpassungs- und erweiterungsfähig. So können bietet er vielfältige Einstellungsmöglichkeiten und kann durch eigene PHP-Klassen von Entwicklern leicht um neue Funktionen erweitert werden.

Der Filter steht unter der Lesser General Public License (LGPL) und kann daher unter Beachtung einiger Regeln, von jedermann kostenlos heruntergeladen, verwendet und weiterentwickelt werden.

Wenn Sie eine individuelle Anpassung erstellt, oder Verbesserungsvorschläge haben, teilen Sie uns doch Ihre Ideen mit. Wir veröffentlichen gern konstruktive Vorschläge und machen Sie für die Allgemeinheit zugänglich.

Wie funktioniert TrashBouncer?

TrashBouncer zerlegt den zu überprüfenden Text in einzelne Wortbestandteile („Tokens“) und schlägt diese in einer Datenbank nach. Je nachdem, wie der Filter zuvor trainiert wurde ergeben sich für jedes Token Bewertungen, die eher in Richtung harmlos oder in Richtung spamverdächtig tendieren. Aus der Kombination der einzelnen Tokens ergibt sich für den Gesamttext eine Spamwahrscheinlichkeit zwischen 0 (harmlos) und 1 (Spam). Je nächer die Gesamtbewertung des Textes in Richtung 1 geht, umso wahrscheinlicher ist der Text ein Spamkommentar.

Alle Textüberprüfungen werden dabei dokumentiert und können später als Spam oder Ham markiert werden. Durch diesen Vorgang lernt der Filter immer besser, zwischen Spam und Ham zu unterscheiden. Nach einer gewissen Zeit und einer (möglichst großen) Menge von kategorisierten Referenztexten erkennt TrashBouncer dann mit Trefferquoten von über 95% Spameinträge. Die tatsächliche Genauigkeit hängt dabei von den konkreten Einstellungen und den gefütterten Trainingsdaten ab.

Eigenschaften

  • geschrieben in der auf fast allen Webservern verfügbaren Skriptspache PHP
  • Unterstützung vieler Datenbanken (MySQL, MySQLite, MSSQL, PostgreSQL, Oracle), andere Datenbanken können durch Erweiterung der Datenbankklassen leicht hinzugefügt werden.
  • Einfache Anpassbarkeit durch modulare Programmierung einzelner Komponenten.
  • Mehrsprachigkeit und Unicode-Kompatibilität (nicht für alle Datenbankserver verfügbar)
  • Vielfältige Einstellungsmöglichkeiten
  • Protokollierung aller Versuche
  • Automatische Erlernung von „eindeutigen“ Versuchen, d.h. von Einträgen deren Wahrscheinlichkeiten nahe an den beiden Enden der Skala liegen
  • Einfache manuelle Kategorisierungsmöglichkeit von Protokolleinträgen
  • Zusätzlich zur Wahrscheinlichkeitsbewertung: Ignorierte und Stopwörter (Whitelist und Blacklist) können individuell hinzugefügt werden.
  • Import- und Exportmöglichkeiten für Trainigsdaten zur Datensicherung oder Übertragung von Trainigsdaten auf andere Installationen

Systemanforderungen

  • PHP >= 5
  • SQL-fähiger Datenbankserver z.B. (MySQL, MySQLite, MSSQL, ProstgreSQL oder Oracle)
  • Eine der Datenbank ensprechende PHP Erweiterung

Installation

Laden Sie sich die neuste Version unter Downloads herunter und entpacken Sie die Zip-Datei in ein Verzeichnis Ihrer Wahl. Passen Sie die Datenbankeinstellungen in der Datei config/config.php an und initialisieren Sie die Datenbanktabellen mit den SQL-Befehlen in database/tabledef.sql.

Lesen Sie dazu auch die Datei readme.txt.

Aktualisierung/Upgrade

Um eine veraltete Version von TrashBouncer zu aktualisieren, gehen Sie wie folgt vor: Bitte sichern Sie zunächst die Inhalte der Datei config/config.php um Ihre individuellen Einstellungen nicht zu verlieren. Entpacken Sie die heruntergeladene Zip-Datei in ihr Installationsverzeichnis und achten Sie darauf dass alle bereits existierenden Dateien überschrieben werden. Nach dem Überschreiben der bereits existierenden Dateien stellen Sie die Datei config/config.php einfach wieder her. Anpassungen der Datenbank sind nicht notwendig.

Download

Die aktuelle Version finden Sie bei unseren Downloads.

TrashBouncer als Contao- oder Redaxo-Plugin

Plugins zur Integration in die Content-Managment-Systeme Contao und Redaxo sind zur Zeit in der Entwicklung und werden in Kürze verfügbar sein. Über unser Newsarchiv halten wir Sie auf dem Laufenden.