Artikel mit Tag spam

Eine Woche mit dem neuen Spamschutz

Vor einer Woche schrieb ich über die neue Spamschutz-Konfiguration hier im Blog. In den Kommentaren wiesen mich Matthias und Grischa darauf hin, zum einen noch die Reihenfolge der Plugins zu ändern und außerdem sollte es einen neuen S9Y-Infocamp-Podcast zu diesem Thema geben, der zu der Zeit schon aufgenommen, aber noch nicht veröffentlicht war.

Zum ersten Punkt, die neue Spamschutz-Konfiguration funktioniert tadellos. Zwar war es seit der Umstellung sehr ruhig an der Spambot-Front (als ich damals Akismet in Betrieb nahm, war es um einiges wilder ;-) ), aber auch die wenigen eingegangenen Spamkommentare wurden erfolgreich erkannt und beseitigt.

Und zum zweiten, die neue S9Y-Infocamp-Folge ist seit heute online und ich hab sie mir sofort reingezogen :-). Robert, Matthias sowie die Gäste Grischa und Malte haben wieder einen tollen Job gemacht. Es ist ein kurzweiliger und interessanter Podcast entstanden, der einen kompletten Überblick über die Antispam-Maßnahmen in Serendipity gibt und eine konkrete Handlungsempfehlung für alle Nutzer "unseres" Blogsystems gibt. Vielen Dank für die tolle Folge an die Vier!

Änderungen im Maschinenraum

Der Mensch (ich auch) ist ja bekanntlich bequem. Wenn etwas funktioniert und gut läuft, tut man sich bekanntlich schwer, an Änderungen heranzugehen. Ein Thema, mit dem man sich als Blogbetreiber immer auseinander setzen muss, ist die "Bekämpfung" von Spam-Kommentaren. Bisher kam hier im Blog zum Spamschutz noch Akismet zum Einsatz. Der Dienst ist allerdings problematisch, da die Daten der Kommentatoren zum Analyse an den Server des Dienstanbieters in den USA geschickt werden. Es gibt Alternativen hierzu, aber wie schon oben erwähnt, das bisherige Setup funktionierte halt problemlos...

Jetzt habe ich allerdings mal den inneren Schweinehund überwunden und mich der Umstellung der Spamschutztechnik gewidmet. Die Kommentare werden jetzt durch ein dreistufiges Filtersystem geschickt:

1. Spamschutz-Plugin

Das Standard-Spamschutz-Plugin von Serendipity übernimmt als erstes rudimentäre Aufgaben wie eine Wort- und URL-Filterung, die bestimmte spamverdächtige Wörter und URL ausfiltert. Außerdem wird die Kommentaranzahl pro Minute und IP limitiert.

2. Spamschutz Biene

Die Spamschutz Biene von Grischa implementiert zwei einfache aber wirkungsvolle Mechanismen, die anhand eines Honeypots und eines versteckten Captchas sehr zuverlässig Kommentare von Nichtmenschen (Bots) erkennen und eliminiert.

3. Spamschutz Bayes

Das Bayes-Plugin von Onli bewertet die noch übrig gebliebenen Kommentare nach einem Algorithmus und filtert sie ab einer bestimmten Spamwahrscheinlichkeit aus. Die Bayes-Datenbank lernt anhand der Kommentare im Blog ständig dazu und verbessert so die Trefferquote.

Dieses Trio wird also ab sofort Akismet hier im Blog ersetzen. Das Setup ist ab heute aktiv und ich bin gespannt, ob das ganze weiterhin so gut funktioniert wie bisher.

Die vergessene Jahreszahl-Formel

Ein beliebter Trick von Spammern ist es, das Sendedatum von Mails weit in die Zukunft zu datieren. Dadurch steht die Mail in diversen Mailprogrammen und Webinterfaces, die die Mails nach Datum sortieren, immer an erster Stelle, auch wenn danach noch andere Mails eingehen.

Spamfilter nutzen das aus, um Mails mit einem Datum, das weit in der Zukunft liegt, als Spam auszusortieren, was ja erstmal kein Problem darstellt und einen Nutzen für den spamgeplagten Mailanwender bringt. 

Nun hat der Opensource-Filter Spam-Assassin einmal definiert, dass Mails, die ein Datum mit der Jahreszahl "20XX" weit in der Zukunft liegt. Und am 1.1.2010 kam dann, was kommen musste. Die Filterregel FH_DATE_PAST_20XX traf nun auf alle Mails zu und schraubte den Spam-Score der betroffenen (also allen) Mails hoch und somit wurden sehr viele "unschuldige" Mails als Spam ausgefiltert.

Viele Mailprovider (unter anderem auch GMX), die einen serverseitigen Spamfilter anbieten, nutzen Spamassassin und schoben so wohl die Neujahrsgrüße vieler Anwender in den Spamordner.

Wie Heise schon berichtet, wurde der Bug schon reportet und es wurde ein Umgehungsfix angeboten, welches das Datum, bei dem der Filter zuschlägt, erstmal auf das Jahr 2020 hochgesetzt. Also haben wir in 10 Jahren das Problem wohl wieder, aber wer weiß schon, was in 10 Jahren ist...

Spam-Charts

Und hier sind die Sieger der heutigen Spam-Subject-Charts:

Platz 3: Der Klassiker
"Ficken wie ein Weltmeister?"
Immer wieder gern genommen und ein ständiger Chart-Kandidat.

Platz 2: Der Wortkarge
"lila"
Viel ausgesagt mit wenig Worten.

Platz 1: Der literarisch Wertvolle
"Der gute Tag, bei mir ist die gute Software"
In blumigen Worten und beherzter Grammatik versucht dieser Kandidat, unsere Aufmerksamkeit auf sich zu ziehen.

Wie sehen eure Charts denn so aus?