Добро пожаловать в Gene Office ! |
Обновлено 04.02.2012 г. |
Реально то, что кериоты назвали SpamAssassin, является ничем иным как фильтром Байеса, т.е. всего лишь одним из множества анализаторов SpamAssassin. Чтобы ясно понять что это и почему так, посмотрим на настоящий "исходный" SpamAssassin, а заодно разберемся что нам оставили кериоты на этой вкладке и что с этим делать.
Общие сведения о программе-анализаторе почтовых сообщений SpamAssassin можно посмотреть здесь и здесь. Из этих сведений отметим, что проект создавался изначально как OpenSource для *ксов, для своей работы требует как минимум трех дополнительных модулей, что он имеет свой собственный веб-интерфейс. Для любителей шпаций и для оценки того, что именно сделали кериоты для нашего удобства, рекомендую посмотреть вот это http://www.opennet.ru/base/net/clamav_setup.txt.html и почитать вот это http://www.samag.ru/archive/article/559. Если после всего просмотренного и прочитанного вы не сошли с ума, то продолжим именно про SpamAssassin. SpamAssassin поставляется с большим набором правил, которые определяют, какие письма являются спамом, а какие нет. Большинство правил основано на регулярных выражениях, которые сопоставляются телу или заголовку сообщения, но SpamAssassin также использует и другие методики. В документации SpamAssassin эти правила называются «tests». Каждый тест имеет некоторую «стоимость». Если сообщение успешно проходит тест, эта «стоимость» добавляется к общему баллу. Стоимость может быть положительной или отрицательной, положительные значения называются «spam», отрицательные «ham». Сообщение проходит через все тесты, подсчитывается общий балл. Чем выше балл, тем больше вероятность, что сообщение является спамом. У SpamAssassin есть настраиваемый порог, при превышении которого письмо будет классифицировано как спам. Обычно порог таков, что письмо должно подойти по нескольким критериям; срабатывание только одного теста недостаточно для превышения порога. (Ничего не напоминает из вкладок консоли управления керио?). На одном из форумов мне попалось очень душевное описание порядка работы с SpamAssassin. Чтобы не мусорить словами - приведу его полностью, сохранив орфографию. Мне кажется, что это описание вполне точно соответствует смыслу и составу SpamAssassin, а что касается керио - посмотрим ниже.
Типичная процедура для запуска спам-фильтрации с помощью эвристики (SpamAssassin):
bayes_auto_learn 0 use_auto_whitelist 0
Как точность станет достаточной для тебя — реши, что ты будешь делать со спамом... Проверять его, уничтожать (можно порог уничтожения в ассассине опустить, скажем до 20.0, НО следует помнить что даже аккуратно обученная эвристика, хоть и редко, но МОЖЕТ ошибаться...), или перенаправишь секретарю — завист от ситуации... CF легко позволяет манипулировать спамом... В письмах помеченных как спам есть заголовок X-Spam-Flag: YES, в хаме таких заголовков нет... удобная зацепка для условия CF.. ВАЖНО: При сортировке спам/хам обязательно нужно занять НЕПРЕДВЗЯТУЮ позицию... Если какой-то Вася будет класть МАХРОВЫЙ СПАМ, для обучения в хам только потому, что ему интересна информация (типа "машину хочу купить, а тут как раз про это..." или "во, а мне как раз курсы английского нужны...") — ИСПОРТИШЬ ВСЕ К ЕДРЕНЕ ФЕНЕ Спам-хам делится по СПОСОБУ ДОСТАВКИ ИНФОРМАЦИИ и ЕЕ ПРЕПОДНЕСЕНИЯ, НО НИКАК НЕ ПО СОДЕРЖАНИЮ ! Юзерам-лопоухим объяснить это ОЧЕНЬ тяжело... знаю по своему опыту... Посему лучше сортировкой заняться самому... Читать ассассин НЕ УМЕЕТ, СМЫСЛА НЕ ПОНИМАЕТ... Залив МАХРОВЕЙШИЙ СПАМ на обучение в хам — получишь такое чудо.... Если нужно чтобы какая-то конкретная ЛЕГАЛЬНАЯ рассылка проходила (subscribe, ozon и т.п.), то учить ее нужно в СПАМ, т.к. это и есть по сути СПАМ, но потом занести отправителя в WhiteList ассассин'а... Хотя я считаю такие рассылки — НЕ НУЖНЫ... Если юзеру нужно читать — он открывает браузер, идет и читает, иначе оно ему НАФИГ НЕ НУЖНО...
Эта страница расположена в закрытой зоне сайта, доступ к которой ограничен. Подробности смотреть здесь.
Удачи !
|
||
(С) Gene Office 2011 |