Показано с 1 по 7 из 7

Тема: автообновление баз

  1. #1
    Lazy Engineer
    Lazy Engineer вне форума
    Участник
    Регистрация
    13.07.2005
    Сообщений
    10

    автообновление баз

    Доброго времени суток, многоуважаемый All.

    Просвети по поводу описанной ситуации,плииииз.

    Есть Bat Pro 3.51.0.0 & bayesit 0.8.1

    ----------- begin info -------------------------------
    Частотный словарь спама:
    ° …\THE_BAT!\MAIL\bayesit\base\spamdict.bye
    ° Размер: 494 писем.
    ° Ёмкость: 36000 слов.
    Частотный словарь НЕ-спама:
    ° …\THE_BAT!\MAIL\bayesit\base\nspamdict.bye
    ° Размер: 28635 писем.
    ° Ёмкость: 202299 слов.
    Текущий активный словарь:
    ° Текущий активный словарь содержит 134670 слов.
    ° Статус: OK
    ------------ end info --------------------------------
    Bayesit обученный, спам/несмам различает в большинстве
    случаев. При запуске Бата в лог Bayesit'a пишется:

    ------- New session log --------
    BayesIt! version:
    14:00:00 0.8.1
    Загрузка белого списка…
    Число правил белого списка: 0
    Белый список успешно загружен
    Загрузка чёрного списка…
    Число правил чёрного списка: 0
    Чёрный список успешно загружен
    Загрузка игнор-списка
    Число правил игнор-списка: 0
    Игнор-список успешно загружен
    Началось фоновое автообновление базы…

    Далее идет прием писем:

    <****************@mail.ru>
    Грэхем: 1
    Спамность: 1
    Значение для The Bat!: 99
    : -------------------------------------------
    Every: 0.01
    Where: 0.01
    finish: 0.01
    where: 0.973139
    has: 0.97558
    H US-ASCII: 0.983041
    future: 0.983919
    when: 0.984325
    as: 0.987094
    this: 0.987158
    new: 0.99
    H neutral: 0.99
    lose: 0.99
    info: 0.99
    : -------------------------------------------

    И до закрытия Бата в лог больше ничего не пишется
    (выдержал 12 часов не закрывая).
    При закрытии Бата добавляется строка:
    Текущая сессия автообновления баз прервана.

    Нормальное ли это поведение сей достойной программы?

    --
    WBR

  2. #2
    Vadim
    Vadim вне форума
    Участник Аватар для Vadim
    Регистрация
    01.11.2002
    Сообщений
    4,711

    Re: автообновление баз

    Когда Байсит очень хорошо обучен, это может быть и нормальное поведение. Ему не чему обучать :-)

  3. #3
    kwn
    kwn вне форума
    Участник
    Регистрация
    19.04.2005
    Сообщений
    48

    Re: автообновление баз

    Автообновление баз в Байсите идет после получения определенной порции писем. Величина этой порции рассчитывается умножением количества всех имеющихся в базах писем на коэффициент 0.005. В вашем случае Байсит начнет автообновление баз после получение примерно 150 писем.

  4. #4
    Lazy Engineer
    Lazy Engineer вне форума
    Участник
    Регистрация
    13.07.2005
    Сообщений
    10

    Re: автообновление баз

    Спасибо за консультацию
    А статистику он когда начнёт показывать? А то одни нули.

  5. #5
    Vadim
    Vadim вне форума
    Участник Аватар для Vadim
    Регистрация
    01.11.2002
    Сообщений
    4,711

    Re: автообновление баз

    Ну у меня вот так сейчас:

    Antispam filtering data:

    Spam frequency dictionary:
    ° C:\mail\BayesIt\base\spamdict.bye
    ° Size: 24497 letters.
    ° Capacity: 742012 words.

    Non-spam frequency dictionary:
    ° C:\mail\BayesIt\base\nspamdict.bye
    ° Size: 56756 letters.
    ° Capacity: 978865 words.

    Current active dictionary:
    ° Currently active dictionary contains 276595 words.
    ° Status: OK

    Last day statistic
    General numbers
    ° Spam traffic (bytes): 818535
    ° Spam emails: 62
    ° NON-spam traffic (bytes): 711724
    ° NON-spam letters: 119
    ° Total traffic (bytes): 1530259
    ° Total letters: 181

    ° Spam percentage of emails: 34.25%.
    ° []
    ° []
    °
    ° Spam percentage of traffic (bytes): 53.49%.
    ° []
    ° []
    °

    Errors
    ° SPAM errors (emails): 0%.
    ° []
    °
    ° SPAM errors (traffic): 0%.
    ° []
    °
    ° NON-spam errors (emails): 0%.
    ° []
    °
    ° NON-spam errors (traffic): 0%.
    ° []
    °
    ° Total errors (emails): 0%.
    ° []
    °
    ° Total errors (traffic): 0%.
    ° []
    °

    Last week statistic
    General numbers
    ° Spam traffic (bytes): 7685418
    ° Spam emails: 573
    ° NON-spam traffic (bytes): 4973914
    ° NON-spam letters: 849
    ° Total traffic (bytes): 12659332
    ° Total letters: 1422

    ° Spam percentage of emails: 40.3%.
    ° []
    ° []
    °
    ° Spam percentage of traffic (bytes): 60.71%.
    ° []
    ° []
    °

    Errors
    ° SPAM errors (emails): 0.52%.
    ° []
    ° []
    °
    ° SPAM errors (traffic): 0.09%.
    ° []
    °
    ° NON-spam errors (emails): 0%.
    ° []
    °
    ° NON-spam errors (traffic): 0%.
    ° []
    °
    ° Total errors (emails): 0.21%.
    ° []
    °
    ° Total errors (traffic): 0.05%.
    ° []
    °

    Last month statistic
    General numbers
    ° Spam traffic (bytes): 26545859
    ° Spam emails: 2397
    ° NON-spam traffic (bytes): 23109762
    ° NON-spam letters: 4139
    ° Total traffic (bytes): 49655621
    ° Total letters: 6536

    ° Spam percentage of emails: 36.67%.
    ° []
    ° []
    °
    ° Spam percentage of traffic (bytes): 53.46%.
    ° []
    ° []
    °

    Errors
    ° SPAM errors (emails): 0.54%.
    ° []
    ° []
    °
    ° SPAM errors (traffic): 0.47%.
    ° []
    ° []
    °
    ° NON-spam errors (emails): 0%.
    ° []
    °
    ° NON-spam errors (traffic): 0%.
    ° []
    °
    ° Total errors (emails): 0.2%.
    ° []
    °
    ° Total errors (traffic): 0.25%.
    ° []
    ° []
    °

    Plugin exports the macros:
    1. %BAYESBASE - returns the size of the currently active dictionary;
    2. %SPAMINESS('word') - returns the rank of 'word' according to the dictionary.
    3. %BAYESITVERSION - returns the name and version of BayesIt, like 'BayesIt! 0.7.7'.
    4. %REGEXED - starts visual editor for regular expressions and inserts the resulting expression
    5. %STATSPAMLETTERS(hours)
    5. %STATSPAMTRAFFIC(hours)
    5. %STATNONSPAMLETTERS(hours)
    5. %STATNONSPAMTRAFFIC(hours)
    5. %STATSPAMERLETTERS(hours)
    5. %STATSPAMERTRAFFIC(hours)
    5. %STATNONSPAMERLETTERS(hours)
    5. %STATNONSPAMERTRAFFIC(hours) - returns statistic for last x hours.


    Plugin is written by Alexey Vinogradov (antispam@ritlabs.com)
    Information and updates at https://www.ritlabs.com/en/solutions/BayesIt.php
    Current running version is 0.8.1

  6. #6
    kwn
    kwn вне форума
    Участник
    Регистрация
    19.04.2005
    Сообщений
    48

    Re: автообновление баз

    Статистика Байсита также зависит напрямую от накапливаемой для автообновления порции писем. У меня порция накапливается 2-3 дня и статистика за "прошедшие сутки" частенько бывает нулевой, несмотря на полученные и обработанные Байситом письма. В этом случае статистика за сутки становится бессмысленной, статистика за неделю имеет большую ошибку и нормальной является только статистика за месяц.
    Вообще я считаю, что базы которые дают минимальную ошибку, как например у Вадима, лучше отключить от автообновления.

  7. #7
    klirik
    klirik вне форума
    Участник
    Регистрация
    16.02.2003
    Сообщений
    180

    Re: автообновление баз

    Цитата Сообщение от kwn
    Автообновление баз в Байсите идет после получения определенной порции писем. Величина этой порции рассчитывается умножением количества всех имеющихся в базах писем на коэффициент 0.005. В вашем случае Байсит начнет автообновление баз после получение примерно 150 писем.
    М.м.м. уточню. Коэффициент задаётся в advanced.ini. При этом если он меньше единицы, то он действительно расценивается как доля от общего количества накопленных писем, однако в этом случае действует ещё одно условие - результат никогда не превышает 100 писем (т.е. если доля получается больше, то она "обрезается" до 100). Если же по каким-либо причинам требуется более частое обновление, то можно задать коэффициент больший 1 - в этом случае он округляется до ближайшего меньшего целого и интерпретируется как абсолютное число писем, после которых запускается автообновление (при этом он может быть практически любым, даже гораздо больше 100).