Spamfilter, Erkennungsrate verbessert sich einfach nicht

Sven Gehr mailingliste at dreampixel.de
Mon Okt 10 09:34:40 CEST 2011


Hallo zusammen,

im Mai hatte ich dieses Problem hier schoneinmal erwähnt. Der Spamfilter lernt 
bei mir einfach nicht. Damals hatte ich den Hinweis erhalten er benötigt dazu 
ca. 3000 Mails. Mitlerweile sind ca. 10000 Spam-Mails hier eingetrudelt die 
der Spamfilter nicht erkannt hat und die ich ihm zum lernen vorgesetzt habe. 
Aber da passiert irgendwie nichts will heißen die Erkennungsleistung wird 
nicht besser. Es wundert mich da die nicht erkannten Mails eigentlich immer 
die gleichen sind.

Für die Konfiguration bin ich wie folgt vorgegangen. Ich habe in meinem 
Shared-Folder (shared.mail) den Ordner "Spam" mit den beiden Unterordnern 
"JUNK" und "noSPAM" angelegt. In den ersten Ordner (Spam) sollen per 
Verteilregel alle die Mails die der Spamfilter als solche erkennt. Das 
funktioniert mitlerweile auch. In den Unterordner JUNK schiebe ich alle die 
nicht als Spam erkannt wurden. Hiermit soll der Filter lernen. Der Ordner 
noSPAM ist für den entgegengesetzten Lernprozess zuständig. Hier sollen also 
die Mails rein die fälschlicherweise als Spam eingestuft wurden.

Auf dem Kolabserver habe ich (als root) die Datei crontab.txt mit dem Inhalt:
0 * * * * /kolab/bin/sa-learn --dbpath /kolab/var/amavisd/.spamassassin --spam 
/kolab/var/imapd/spool/domain/g/gehr-edv.de/s/shared^mail/Spam/JUNK --ham 
/kolab/var/imapd/spool/domain/g/gehr-edv.de/s/shared^mail/Spam/noSPAM/

(in einer Zeile) angelegt und mit "crontab crontab.txt" aktiviert. Ein 
"crontab -l" zeigt mir auch dass der Job aktiv ist.

Ist die Vorgehensweise falsch oder warum funktioniert der Filter bei mir so 
schlecht?


-- 
Viele Grüße

Sven Gehr

Mailclient: Linux / KDE-Kontact
Linux-User-Nr: #368994