Показано с 1 по 9 из 9

Тема: Влияние слова СПАМ в теме письма

  1. #1
    hit.SKuLL
    hit.SKuLL вне форума
    Участник Аватар для hit.SKuLL
    Регистрация
    27.11.2005
    Сообщений
    33

    Влияние слова СПАМ в теме письма

    Ситуация:
    "Добрый" провайдер в приступе заботливости или еще чего-то там, установил у себя антиспамерский софт, который особенно не напрягаясь, тупо ставит в начало темы письма слово "***SPAM***". Так письма и доходят. И не всегда верно помечает, в частности, НЕСПАМ приходит с темой "***SPAM***Тема…"

    Вопрос в следующем:
    Есть подозрение, что если все спамовые помечаются "как спам", то слово SPAM очень хорошо проассоциируется байесом как признак спама. И все письма с темой "SPAMТема...." будут определяться как спам, короче прямая зависимость от антиспама провайдера. Так ли это? Если да, то что можно с баейсом сделать, чтобы не обращал на слово внимания?

    Заранее спасибо, если будут ответы

  2. #2
    Vadim
    Vadim вне форума
    Участник Аватар для Vadim
    Регистрация
    01.11.2002
    Сообщений
    4,711

    Re: Влияние слова СПАМ в теме письма

    Еще раз, Байсит - это обучаемый плагин :-) Изначально он ничего не умеет :-)

    Вариантов решения несколько :-)
    1. Набрать много таких писем и сказал плагину, что не спам это
    2. (я считаю более правильно) - адрес этого отправителя добавить в белый список!

  3. #3
    Vadim
    Vadim вне форума
    Участник Аватар для Vadim
    Регистрация
    01.11.2002
    Сообщений
    4,711

    Re: Влияние слова СПАМ в теме письма

    Кстати, похоже у провайдера стоит тот же spanassassin, у которого есть 2 варианта работы:
    1. Изменять тему письма (это то, что Вы видите)
    2. Добавлять в заголовок дополнительные поля, которые говорят о спамности письма

    Например, у нас на почтовике реализован 2 вариант, что я считаю более правильно!

  4. #4
    hit.SKuLL
    hit.SKuLL вне форума
    Участник Аватар для hit.SKuLL
    Регистрация
    27.11.2005
    Сообщений
    33

    Re: Влияние слова СПАМ в теме письма

    Цитата Сообщение от Yavorsky Vadim
    Еще раз, Байсит - это обучаемый плагин :-) Изначально он ничего не умеет :-)

    Вариантов решения несколько :-)
    1. Набрать много таких писем и сказал плагину, что не спам это
    2. (я считаю более правильно) - адрес этого отправителя добавить в белый список!
    То, что "обучаемый", это изначально ясно, но главное я понял: все спамовые письма ему на обучение не давать, а дать только с непорченной темой.

    А с белым списком хоть и верно, но не катит: адреса заранее неизвестны, да и не более одного письма иногда присылают…

  5. #5
    Vadim
    Vadim вне форума
    Участник Аватар для Vadim
    Регистрация
    01.11.2002
    Сообщений
    4,711

    Re: Влияние слова СПАМ в теме письма

    Цитата Сообщение от hit.SKuLL
    А с белым списком хоть и верно, но не катит: адреса заранее неизвестны, да и не более одного письма иногда присылают…
    Ну тогда это уже и не провайдер :-)

  6. #6
    hit.SKuLL
    hit.SKuLL вне форума
    Участник Аватар для hit.SKuLL
    Регистрация
    27.11.2005
    Сообщений
    33

    Re: Влияние слова СПАМ в теме письма

    Ну да, не совсем провайдер, а почтовый сервак, если быть точным ) но это к белому списку отношения не имеет.
    Я это к тому, что если даже в белый список занести отправителя, то толку мало, если он больше писем слать не будет, а вот другой кто-нить новый пришлет неизвестный… Так вообще кабы знать заранее все адреса и плагин тогда лишний, сортировщиком можно обойтись, да и удобнее он

  7. #7
    kwn
    kwn вне форума
    Участник
    Регистрация
    19.04.2005
    Сообщений
    48

    Re: Влияние слова СПАМ в теме письма

    Если вы боитесь влияния слова СПАМ, внесите его в список "клуджей". Это список "слов" из заголовка письма, которые байсит игнорирует при своей работе.

  8. #8
    Wanderer
    Wanderer вне форума
    Участник
    Регистрация
    11.08.2003
    Сообщений
    774

    Re: Влияние слова СПАМ в теме письма

    Совет неправильный и даже вредный… В список исключений вносятся названия хидеров, на которые Bayes не смотрит при разборе, исключать из анализа Subject - крайне неправильно… иногда даже человеку названия темы достаточно для классификации

  9. #9
    Wanderer
    Wanderer вне форума
    Участник
    Регистрация
    11.08.2003
    Сообщений
    774

    Re: Влияние слова СПАМ в теме письма

    Цитата Сообщение от hit.SKuLL
    То, что "обучаемый", это изначально ясно, но главное я понял: все спамовые письма ему на обучение не давать, а дать только с непорченной темой.
    Сие не очень правильно… поскольку существует ненулевая вероятность правильной идентификации на сервере, этот токен тоже может быть значимым для для локального байеса… а чтобы его вес не был искажен, надо учить и НЕспамом, который был на сервере неправильно классифицирован, для понижения значимости токена ***SPAM*** до реального…
    И кстати, переучивать серверный на его ошибках - правильно ученый дает крайне мало ошибок, особенно если баллы по рулям адекватно поправить под себя

Похожие темы

  1. Шаблоны в теме письма
    от IGaDI в разделе The Bat!: вопросы и ответы
    Ответов: 1
    Последнее сообщение: 06.04.2006, 13:37
  2. регулярные выражения в теме письма
    от postscriptum в разделе The Bat!: вопросы и ответы
    Ответов: 1
    Последнее сообщение: 01.09.2005, 16:47
  3. кодировка в теме письма
    от fireton в разделе The Bat!: вопросы и ответы
    Ответов: 18
    Последнее сообщение: 21.07.2005, 19:04
  4. Ответов: 0
    Последнее сообщение: 22.06.2004, 12:42
  5. Кавычки в теме письма
    от vopros в разделе The Bat!: вопросы и ответы
    Ответов: 6
    Последнее сообщение: 17.06.2004, 14:29