А вот скажите, предусмотрено ли какое-нибудь удаление из базы слов, которые давно не встречались? Или слова только добавляются? IMHO было бы правильно, чтобы старые данные обучения со временем удалялись и замещались более новыми. Во-первых, СПАМеры постоянно придумывают новые приемы, а старые и уже неэффективные использовать перестают. Во-вторых, интересы пользователя тоже могут со временем меняться. В результате, если ничего не удалять, большинство слов со временем окажется в обоих словарях и качество фильтрации будет падать. Да и словарям расти до бесконечности нет никакого смысла.