Masowa ekstrakcja adresów e-mail poprzez listę URL lub słowa kluczowe
Możesz użyć narzędzia do ekstrakcji adresów e-mail z witryny, aby ominąć określoną stronę. Podstawowa funkcja wyszukiwania według słów kluczowych umożliwia szybkie rozpoczęcie nowego wyszukiwania. Narzędzie do masowego wyszukiwania jest zaprojektowane do obsługi wielu stron lub bardziej precyzyjnego parsowania słów kluczowych.
Aby uruchomić narzędzie do masowego wyszukiwania, kliknij przycisk "Bulk search".
Metoda 1 - Według listy domen/adresów URL
Określ listę adresów URL lub domen do ominięcia. Program podąży za linkami, pobierze strony, wyodrębni adresy e-mail i inne kontakty. W parametrze Głębia Crawl możesz określić, czy pobierać strony, których linki zostaną wykryte na stronach z początkowej listy. Głębia Crawl = 0 oznacza, że LetsExtract powinien tylko załadować pierwotny URL.
Metoda 2 - Według słów kluczowych
Klikając przycisk Paste templates, możesz wstawić podstawowy szablon zapytania, który można modyfikować zgodnie z własnymi wymaganiami. Ta funkcja umożliwia bardziej precyzyjne dostosowanie wyszukiwania słów kluczowych.
- Usuń niepożądane wyszukiwarki.
- Otocz wartości parametrów cudzysłowami.
- Możesz zastąpić parametr Engine domeną swojej preferowanej wyszukiwarki.
- Zastąp parametr Keyword słowem kluczowym lub frazą dla wybranej wyszukiwarki.
- Parametr Depth wskazuje, ile stron odwiedzić z wyników (nowe wyniki wyszukiwania mogą kończyć się wcześniej). Wartość = 0 oznacza pierwszą stronę wyszukiwarki.
- Parametr Max wskazuje, ile linków z każdej strony wyszukiwarki powinno być pomijanych maksymalnie. Wartość = -1 oznacza "brak limitu".
- Wartość Głębia Crawl oznacza, ile stron powinno załadować LetsExtract. Przy wartości = 0 program załadowuje tylko stronę z wyników wyszukiwania.
Przykład: Chcemy wyszukiwać kontakty tylko na stronach z pierwszej strony Yandex (Rosja) i Google (Wielka Brytania). I bez limitu na liczbę wyników znalezionych na tej jednej stronie. W takim przypadku nasze szablony będą wyglądały tak:
{Engine="google.co.uk" Keyword="Kup dobry czaj w Londynie" Depth="0" Max="-1"}
{Engine="yandex.ru" Keyword="Produkcja okien plastikowych" Depth="0" Max="-1"}
Chcemy również, aby LetsExtract otworzył każdą znalezioną stronę i wyświetlił tylko pierwsze strony powiązane z wynikami wyszukiwania (nie głęboko zanurzał się). Aby to zrobić, ustawmy ogólną wartość Głębia Crawl = 1. Uruchamiamy wyszukiwanie:
Metoda 3 - Wygenerowana lista URL
Niektóre strony internetowe mają strony takie jak ta:
http://website.com/forum/members?id=12932
Aby uniknąć ładowania wszystkich stron takich witryn, możesz wygenerować listę wymaganych URL. Aby uruchomić generator, kliknij Generate Links. Edytuj szablon, kliknij przycisk Generate, sprawdź kilka wygenerowanych adresów i kliknij "OK", aby powrócić do głównego okna.