Масове витягування електронних адрес за списком URL або ключовими словами
Ви можете використовувати інструмент для витягування електронних адрес з веб-сайту, щоб обійти конкретний сайт. Основна функція пошуку за ключовими словами дозволяє швидко запустити новий пошук. Інструмент масового пошуку призначений для обробки кількох сайтів або більш точного парсингу ключових слів.
Щоб запустити інструмент масового пошуку, натисніть кнопку "Масовий пошук".
Метод 1 - За списком доменів/URL адрес
Вкажіть список URL або доменів для обхіду. Програма буде переходити за посиланнями, завантажувати сторінки, витягувати електронні адреси та інші контакти. У параметрі Глибина Crawling ви можете вказати, чи потрібно завантажувати сторінки, посилання на які будуть виявлені на сторінках з початкового списку. Глибина Crawling = 0 означає, що LetsExtract повинен завантажити лише оригінальний URL.
Метод 2 - За ключовими словами
Натиснувши кнопку Вставити шаблони, ви можете вставити базовий шаблон запиту, який можна модифікувати відповідно до ваших вимог. Ця функція дозволяє вам більш точно налаштувати пошук за ключовими словами.
- Видаліть небажані пошукові системи.
- Обгорніть значення параметрів у лапки.
- Ви можете замінити параметр Engine на домен бажаної пошукової системи.
- Замініть параметр Keyword на ключове слово або фразу для обраної пошукової системи.
- Параметр Depth означає, скільки сторінок відвідувати з результатів (нові результати можуть закінчитись раніше). Значення = 0 означає першу сторінку пошукової системи.
- Параметр Max вказує, скільки посилань з кожної сторінки пошукової системи слід обійти максимально. Значення = -1 означає "без обмежень".
- Значення Crawl Depth означає, скільки сторінок має завантажити LetsExtract. При значенні = 0 програма завантажить лише сторінку з результатів пошуку.
Приклад: Ми хочемо шукати контакти лише на сайтах з першої сторінки Яндекса (Росія) та Google (Велика Британія). І без обмеження на кількість результатів, знайдених на цій одній сторінці. У цьому випадку наші шаблони виглядатимуть так:
{Engine="google.co.uk" Keyword="Купити хороший чай в Лондоні" Depth="0" Max="-1"}
{Engine="yandex.ru" Keyword="Виробництво пластикових вікон" Depth="0" Max="-1"}
Ми також хочемо, щоб LetsExtract відкривав кожен знайдений сайт і переглядав лише перші сторінки, на які є посилання в результатах пошуку (не занурюючись в глибину). Для цього давайте встановимо загальне значення Глибина Crawling = 1. Запустимо пошук:
Метод 3 - Згенерований список URL
Деякі веб-сайти мають сторінки на зразок цього:
http://website.com/forum/members?id=12932
Щоб уникнути завантаження всіх сторінок таких сайтів, ви можете згенерувати список необхідних URL. Щоб запустити генератор, натисніть Генерувати посилання. Відредагуйте шаблон, натисніть кнопку Генерувати, перевірте кілька згенерованих адрес і натисніть "ОК", щоб повернутися до основного вікна.