Показано с 1 по 10 из 14

Тема: Оригинальная проверка на спам

  1. #1
    Sergo
    Sergo вне форума
    Участник
    Регистрация
    22.09.2003
    Сообщений
    17

    Оригинальная проверка на спам

    Учитывая, что все спаммеры специально пишут сообщения так, чтобы их
    никакие регэкспы их не ловили, к примеру какие-то слова пишут ч е р е з
    пробелы или со _в_с_т_а_в_к_о_й каких-то лишних символов и т.д., которые
    человек легко отсеивает, то пытаться угадать, что они напишут бесполезно.

    Лучший способ (который пришел мне в голову после прочтения архива) - это
    завести лишний почтовый ящик, всегда светить его вместе с нелишними
    почтовыми ящиками на всех конференциях и т.д., чтобы спам приходил на все
    ящики одновременно (у меня так и происходит), а потом удалять все
    сообщения дупликаты (с одинаковым текстом и названием присоединенных
    файлов, но не обязательно с совпадающей датой отправки и адресатом) в
    разных ящиках. Кто-нибудь может написать такой правило/макрос и т.д. ?


    Спасибо

    Сергей

  2. #2
    mil_alex
    mil_alex вне форума
    Участник
    Регистрация
    30.07.2003
    Сообщений
    25

    Re:Оригинальная проверка на спам

    Как разработчик софта, я специально содержу два зеркальных сайта на двух физически различных хостерах, и у меня двойной набор почтовых ящиков, плюс еще один у провайдера доступа в инет. Итого получается около десятка адресов, куда потенциальный пользователь может отправить "для надежности" свое письмо, просто перечислив все известные ему адреса.
    Не считать же теперь его письма спамом только потому, что они пришли одинаковые в разные ящики?

    Насчет регекспов, я не согласен. Напротив, если тема письма содержит более 10 (15?) пробелов, тире или знаков подчеркивания - это явный спам. Можете опровергнуть?

    У меня как раз нет проблем у детектированием спама по сабжу (есть проблема с кол-вом этих сигнальных слов )

    пример:
    ч.*е.*р.*е.*з.*п.*р.*о.*б.*е.*л

    или, более тонко, можно указать, допустим. до трех любых небуквенных символов между "значащими" буквами.

  3. #3
    mil_alex
    mil_alex вне форума
    Участник
    Регистрация
    30.07.2003
    Сообщений
    25

    Re:Оригинальная проверка на спам

    Еще, из формулировки вопроса я понял что требуется фильтровать уже полученный на компьютер спам - а это имхо тривиально. Достаточно написать обычный фильтр входящей почты и перечислить несколько фраз или слов, характерных для спама, например купи, выиграй, самые низкие, отписаться, открытых источников, английский, отдых в, рассылки, бухгалтеру, семинары и так далее. В качестве действия фильтра - предусмотреть перемещение спама в отдельную папку. Кстати, недостаток стратегии опознавания спама по синхронному приходу в ящики состоит еще и в том, что как только письмо не пришло в другой(другие) ящики, мы перестаем считать его спамом. Это имхо опрометчиво…

  4. #4
    Sergo
    Sergo вне форума
    Участник
    Регистрация
    22.09.2003
    Сообщений
    17

    Re:Оригинальная проверка на спам - уточняю

    По поводу службы поддержки - Вы меня не поняли. Завести надо "левые"
    адреса, к-ый не рекламируются в виде Ваших. Один, к примеру, засветится в
    конференции как Карл Маркс, а другой как Фридрих Энгельс. Вы не ждете
    никаких писем этим адресатам, свои письма вы ждете на свои официальные
    ящики. Так что если вдруг на левые адреса начинают приходить идентичне
    е-мейлы и такие же приходят на официальные ящики - значит это чистой воды
    спам.

    По поводу регэкспов - написать-то Вы их по образцу-то напишите, но спам уж
    сдишком изменчив стал - замучаетесь дописывать регэкспы - вроде сами в
    этом и сознались. Поробуйте хотя бы убить все сообщения об изучении
    английского языка - так сообщения меняются, что регэкспы неэффективны.

    Итак, как программист Вы можете написать нужное правило/макрос и т.д. для
    проверки дупликатов в нескольких ящиках ?

  5. #5
    akiselev
    akiselev вне форума
    Участник
    Регистрация
    02.11.2002
    Сообщений
    796

    Re:Оригинальная проверка на спам - уточняю

    Цитата Сообщение от Sergo
    По поводу службы поддержки - Вы меня не поняли. Завести надо "левые"
    адреса, к-ый не рекламируются в виде Ваших. Один, к примеру, засветится в
    конференции как Карл Маркс, а другой как Фридрих Энгельс. Вы не ждете
    никаких писем этим адресатам, свои письма вы ждете на свои официальные
    ящики. Так что если вдруг на левые адреса начинают приходить идентичне
    е-мейлы и такие же приходят на официальные ящики - значит это чистой воды
    спам.

    По поводу регэкспов - написать-то Вы их по образцу-то напишите, но спам уж
    сдишком изменчив стал - замучаетесь дописывать регэкспы - вроде сами в
    этом и сознались. Поробуйте хотя бы убить все сообщения об изучении
    английского языка - так сообщения меняются, что регэкспы неэффективны.

    Итак, как программист Вы можете написать нужное правило/макрос и т.д. для
    проверки дупликатов в нескольких ящиках ?
    Ититская сила, BayesIt поставьте, или SpamPal, или POP3Catcher, и будет вам счастье

  6. #6
    Sergo
    Sergo вне форума
    Участник
    Регистрация
    22.09.2003
    Сообщений
    17

    Re:Оригинальная проверка на спам

    Э, нет - саме себе поставьте и дайте адресок. Я Вас на спам подпишу - будете каждый вечер настравивать, саообучать и т.д. эти програмки. Скоро Вам это надоест.

  7. #7
    Vadim
    Vadim вне форума
    Участник Аватар для Vadim
    Регистрация
    01.11.2002
    Сообщений
    4,711

    Re:Оригинальная проверка на спам

    Ну не знаю человек, при умелых руках - все очень просто и быстро обучается.
    Ребята с НоБата не дадут соврать, что процент не сработывания очень мал. Его можно итого меньшим сделать, но… времени блин как всегда нет

  8. #8
    Tigris
    Tigris вне форума
    Участник
    Регистрация
    05.09.2003
    Сообщений
    294

    Re:Оригинальная проверка на спам

    Цитата Сообщение от Sergo
    Э, нет - саме себе поставьте и дайте адресок. Я Вас на спам подпишу - будете каждый вечер настравивать, саообучать и т.д. эти програмки. Скоро Вам это надоест.
    Извините, я конечно чайница и не разбираюсь в программировании, но у меня есть ящик в который спам валит до 250-300 писем в день, и только когда поставила плагин BayesIt, я вздохнула свободно . Предпоследняя версия очищала его от 220-235 писем, а последняя версия с выборочным сканированием очищает от 245-248 писем.

  9. #9
    akiselev
    akiselev вне форума
    Участник
    Регистрация
    02.11.2002
    Сообщений
    796

    Re:Оригинальная проверка на спам

    Более того, он-таки САМОобучается, в отличие от любителей писать хитровыгнутые фильтры… Математика + формула Байеса rulez!

  10. #10
    mil_alex
    mil_alex вне форума
    Участник
    Регистрация
    30.07.2003
    Сообщений
    25

    Re:Оригинальная проверка на спам

    Отвечу по порядку снизу вверх

    Как программист, я (может быть, пока еще) не умею написать макрос, работающий с несколькими ящиками.

    Проблема с сигнальными словами (точнее, регекспами) которые опознают спам, не у меня как программиста, а у Бата (1.62r) как интерпретатора их. Я уже упоминал, более 40Кб текста, состоящего из полутора тысяч шаблонов, - это (полуавтоматом создаваемый) спам-фильтр в моем случае. К сожалению, старый Бат такое не может обрабатывать целиком. Я оплатил версию 2, но поскольку в ней уже можно вынести регекспы в плагин, скорее всего так я и сделаю.

    Что касается любых фильтров которые анализируют содержимое письма, а не заголовка, меня это не устраивает, вне зависимости от технологии реализации. На локальной машине сортировать можно и средствами самого Бата, и поставить pop3-прокси - в любом случае надо выкачивать письма. Это меня категорически не устраивает.

    Диспетчер почты Бата - вот то единственное, что меня интересует, и то, его недостаток в том, что неизбежный прием заголовков все равно создает значительный трафик (платный в моем случае). Чтобы это обойти, я поставил на сервере скрипт-убийцу, который напоминает веб-интерфейс большинства бесплатных почтовых систем (mail.ru, zMail и т.п.) и позволяет ценой примерно 60 байт на письмо управлять ящиком, в том числе удаляя группы писем по срабатыванию регекспов (в этом случае трафик вообще еле заметен ).

    Естественно, что диспетчер по-своему тоже удобен, и вдобавок несколько гибче, чем тот мой скрипт, - почему я и пользуюсь обеими методами.

    Установка на сервер специализированных решений типа SpamAssasin мне не нравится, поскольку реконфигурация представляется более нудной процедурой, нежели коррекция фильтров (фактически, локальных - на стороне клиента). Установить более жесткие/мягкие критерии "и забыть" про настройку SpamAssasin я не могу, нужно свести к минимуму риск утраты нормальных писем.

    Насчет Байеса, обьясните мне, зачем использовать именно его для отнесения к спаму сообщения, тема которого содержит, к примеру, восемь восклицательных знаков или десяток согласных подряд, или латинские символы в русском слове (т.е. смесь кириллицы и отдельных латинских букв)? Мне не по душе сама идея тренировки фильтра. С тем же успехом я сам могу в Диспетчере пометить спам руками… Проще даже, мне кажется, взять словарь и если в заголовке написаны слова с ошибками, типа а!н!глийск!uй - то убивать такие письма молча. Напротив, если ошибок нет, но слово из спам-листа - то тоже убивать. Интересно куда подадутся спамеры в таком случае.

    Не знаю, отнести ли к себе титул любителя хитровыгнутых фильтров но писать их совершенно не трудно, и если бы Бат просто молча следовал данным ему правилам, я бы возможно даже не знал о существовании forum.NoBat.ru - но ведь не работает же…

Похожие темы

  1. Спам - НЕ Спам
    от xJoker в разделе The Bat!: вопросы и ответы
    Ответов: 0
    Последнее сообщение: 26.03.2014, 15:31
  2. "Пометить как спам" = перемещению письма в папку "СПАМ"?
    от q-post в разделе Антиспам плагин BayesIt
    Ответов: 4
    Последнее сообщение: 06.09.2005, 22:28
  3. Проверка на спам полученных писем
    от ags67 в разделе Антиспам плагин BayesIt
    Ответов: 8
    Последнее сообщение: 02.08.2005, 23:31
  4. Про спам
    от M0rFium в разделе The Bat!: вопросы и ответы
    Ответов: 11
    Последнее сообщение: 10.07.2003, 09:19
  5. Спам
    от Klan в разделе The Bat!: вопросы и ответы
    Ответов: 1
    Последнее сообщение: 22.04.2003, 22:54