Принцип проверки email-адресов
Всего в LetsExtract Email Verifier предусмотрено 10 способов (опций) проверки email-адресов. Включить или выключить опции проверки можно в окне Настроек.
В режиме Быстрой проверки используются только опции группы 1, в режиме Полной проверки - опции 1 и 2. При этом в режиме Полной проверки (через скрипты) проверки 2 группы выполняются скриптами на вашем сервере.
Синтаксис
Проверка синтаксиса заключается в проверке email-адреса на символьный состав. Допустимые символы "@", ".", "-", "_", "0-9", "A-Z", "a-z". Это очень быстрый способ проверки (более 100000 email-адресов в секунду), который не требует подключения к Интернет. Примеры адресов, которые не пройдут проверку: john,doe@gmail.com, gates$microsoft.com.
Фальшивый адрес
Часто пользователи не желают указывать свой реальный email-адрес, и используют "случайные" комбинации символов или известные фразы. Email Verifier также пометит такие email-адреса как недействительные. Примеры: 123@123.com, fksdfaas@mail.com, john.doe@gmail.com
Бесплатная почта
Для некоторых наших пользователей важно, чтобы email-адрес был корпоративным, т.е. не был размещен на бесплатном почтовом сервисе типа gmail.com, outlook.com, mail.com и проч. Эта опция позволит пометить такие адреса также как недействительные.
Одноразовый адрес
Существуют сервисы позволяющие создать почтовый адрес только на очень короткое время или для получения всего одного входящего письма. Для email-рассылок такие адреса также не имеют смысла. Примеры: 10minutemail, Tempmail, Mailnator, Guerrilla. Адреса с этих доменов будут помечены как одноразовые. Список доменов одноразовой почты можно изменять на вкладке Одноразовые домены в Настройках программы.
Черный список
Email Verifier имеет встроенные списки ключевых слов, в случае соответствии котором email-адреса будут помечены как недействительные. Обычно черные списки используют чтобы отсеять адреса-маркеры спам-фильтров, например abuse@, forspam@, reports.spamcop.net, а также известные мусорные email-адреса, такие как Рейтинг@Mail.ru, noreply@ и т.п.
Матерные слова
Фильтр отсеет адреса, содержащие известные программе нецензурные слова.
Существование почтового сервера (MX)
Программа проверит, что домен из адреса существует и имеет MX-запись в DNS. Этот способ работает медленнее, чем все синтаксис и его вариации (см. выше), но в тоже время значительно быстрее, чем непосредственно проверка существования адреса на сервере. До 25% email-адресов обычно отсеивается на этом этапе проверки.
Наличие сайта по домену
Проверяя email адрес, Email Verifier пробует открыть сайт (по протоколу http/https) домена электронной почты. Например, для email-адреса info@letsextract.com это будет URL-адрес https://letsextract.com/. Если сайт не существует (получена ошибка соединения), то такой адрес будет помечен как недействительный.
Проверка ящика на существование (SMTP)
Эта опция используется в режимах Полной проверки. Программа (или скрипт) симулирует подключение к почтовому серверу MX-записи домена email-адреса по протоколу SMTP и пробует отправить письмо. Если сервер отвечает, что алиас получателя не существует на сервере, то такой адрес будет помечен как недействительный. Для каждого проверенного email-адреса сохраняется протокол соединения сервером на вкладке Лог. Это самый надежный способ проверки email-адресов на существование, но при этом и самый затратный по времени, плюс имеется вероятность бана по IP/hostname.
Проверка на Catch-All (SMTP)
Некоторые почтовые серверы принимают почту для любых получателей, поэтому если email-адрес прошел проверку из предыдущего пункта, данная опция позволяет дополнительно установить, в каком режиме работает сервер-получатель. Для этого Email Verifier дополнительно пробует отправить письмо на случайно сгенерированный алиас домена проверяемого email-адреса. Если сервер отвечает, что алиас получателя (случайно сгенерированный) не существует на сервере, то такой адрес будет помечен как действительный. В противном случае - как неопределенный. При этом программа запомнит результат и не будет выполнять проверку для остальных адресов на том же домене.