Методы фильтрации электронной почты

Есть множество решений фильтрации электронной почты, но опишу два основных метода защиты почтового сервера от спама:

1) защита от поступления спама на этапе получения почтовым сервером

2) «отделение спама» от остальной почты уже после получения почтовым сервером.

При первом метода наиболее популярны такие способы как использование DNS Black List (DNSBL), greylisting и различные timeouts при отправке почты; использование различных технических средств, таких как проверка существования пользователя, на отправляющей стороне (callback), проверка «правильности» отправляющего сервера такими методами как наличие записи в реверсной зоне DNS, легальности имени при установке SMTP-сессии (helo), проверка SPF записи (для работы этого в DNS записи о хосте используется соответствующая запись о легальных серверах отправителей).

При анализе содержимого письма наиболее популярны такие методы как проверка по различным алгоритмам, таким как поиск особых ключевых слов рекламного характера или на основе теоремы Байеса. Алгоритм на основе теоремы Байеса содержит в себе элементы теории вероятности, изначально обучается пользователем на письма которые, по его мнению, являются спамом и в дальнейшем отделяет по характерным признакам сообщения, в которых содержится спам.

Итак, рассмотрим более подробно 2 метода фильтрации электронной почты такие как:

- черные списки

- серые списки или грейлистинг

- aильтрация почты по ключевым словам

- запрос на подтверждение

- статистическая фильтрация

Черные списки. Почтовые и IP-адреса, с которых рассылается спам, вносятся в черные списки и блокируются на уровне провайдеров или самим пользователем. Широко используются такие списки, как списки «открытых релеев» и «открытых proxy» и различные списки динамических адресов которые выделяются провайдерами для конечных пользователей. Благодаря простоте реализации использование этих black-листов производится через службу DNS.

И этот метод в силу ряда причин становится все менее эффективным, зато приводит к нарушению целостности Сети, когда вполне добропорядочные пользователи теряют возможность вести свою переписку.

Серые списки или грейлистинг. Принцип действия серых списков (Greylisting) основан на тактике рассылки спама. Как правило, спам рассылается в очень короткое время в большом количестве с какого-либо сервера. Работа серого списка заключается в намеренной задержке получения писем на некоторое время. При этом адрес и время пересылки заносится в базу данных серого списка. Если удалённый компьютер является настоящим почтовым сервером, то он должен сохранить письмо в очереди и повторять пересылку в течение пяти дней. Спам-боты, как правило, писем в очереди не сохраняют, поэтому спустя непродолжительное время, прекращают попытки переслать письмо. Экспериментальным путём установлено, что в среднем время рассылки спама составляет чуть больше часа. При повторной пересылке письма с этого же адреса, если с момента первой попытки прошло необходимое количество времени письмо принимается и адрес заносится в локальный белый список на достаточно длительный срок.

Фильтрация почты по ключевым словам. Эффективность этого метода очень низка, поскольку требует больших затрат на создание и поддержание базы ключевых слов. Кроме того, спамеры постоянно изобретают новые и новые способы обойти подобные фильтры. Например, в русскоязычных письмах используется прием подмены русских букв латинскими, сходными по написанию (а, е, В, у и так далее).

Запрос на подтверждение. Прежде чем показать письмо получателю, генерируется запрос его отправителю: подтвердите, что вы действительно писали сообщение такому-то и такому-то. Если отправитель подтверждает факт написания письма, он признается "неспамером" и его адрес вносится в белый список. С этого момента почта от него к получателю проходит без проблем. Но этот метод фильтрации также не лишен очевидных недостатков. Во-первых, он доставляет массу неудобств "неспамерам"; во-вторых, многие спамеры уже вполне способны генерировать письма-подтверждения, что сводит на нет достоинства данного способа фильтрации, и приводит к еще большему увеличению паразитного трафика.

Статистическая фильтрация. Самыми перспективными, на сегодняшний день выглядят решения, основанные на статистической фильтрации входящей почты. В основу их работы положена теорема Байеса (Bayes), которая оценивает вероятность наступления какого-либо события исходя из статистики совершения этого же события в прошлом. Например, если пользователь встретил слово телемагазин в девяти спамерских посланиях и лишь в одном "чистом" письме, то у него появляется возможность оценить, с какой вероятностью следующее письмо, содержащее слово телемагазин, будет являться спамом.

Вышеперечисленные методы позволяют отсеивать около 90% спама еще на этапе доставки в почтовый ящик. Уже доставленную почту можно разметить средствами анализа содержимого письма, например, используя программу spamassassin. Данный продукт позволяет на основе особых алгоритмов добавлять в заголовки письма соответствующие строки, а пользователь, на основе почтовых фильтров в почтовом клиенте, может отфильтровать почту в нужные папки почтовой программы.

Разумеется, существуют и другие способы защиты от спама, наиболее действенными, к сожалению на данный момент являются превентивные меры, такие как не доставлять свой реальный E-mail на сайтах, форумах и досках объявлений, используя для подобных нужд временные адреса, которые в последствии можно удалить, в случае необходимости публикация e-mail на сайте вместо текста использовать графическое изображение и тому подобные меры.

Кроме того, для каждого отдельно взятого человека спам становится источником постоянного раздражения. Интернет-пользователи вынуждены начинать свой рабочий день с уничтожения вороха ненужной рекламы, свалившейся в их ящики. И, как это часто бывает, чистка ящиков от спама приводит к удалению нужной корреспонденции, затерявшейся среди невостребованных писем.

Вывод:

Разумеется, интернет-сообщество не сидит, сложа руки, пытается бороться со свалившейся на его голову напастью. С этой целью изобретаются и постоянно совершенствуются все новые и новые средства фильтрации спама. И хотя пока что в этой борьбе побеждают спамеры, некоторые разработки уже серьезно им препятствуют. Так что, рано или поздно, спамеры не смогут доставлять свою корреспонденцию столь массово как сегодня, и их бизнес перестанет быть сверхприбыльным. Это - вопрос времени и желания отдельных пользователей всерьез оградить себя от получения невостребованной почты.

Все разработчики современных почтовых клиентов встраивают в свои продукты различные спам-фильтры. Возможно, в течение пяти ближайших лет необходимость в этом и отпадет. А пока, рассказывая о почтовых клиентах, приходится подробно останавливаться на описании встроенных в них антиспамерских механизмов. В данной под главе были просмотрены такие методы как: черные списки, серые списки или грейлистинг, aильтрация почты по ключевым словам, запрос на подтверждение, статистическая фильтрация. Они позволяют отсеивать около 90% спама. Статистическая фильтрация сама перспективная на сегодняшний день. Так как в основу их работы положена теорема Байеса.

 




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: