Extraction massive d'adresses email à partir de listes d'URL

Vous pouvez utiliser l’outil pour extraire des adresses email d’un site web pour contourner un site spécifique. La fonctionnalité de recherche par mots-clés permet de lancer rapidement une nouvelle recherche. L’outil de recherche en masse est conçu pour gérer plusieurs sites ou un parsing de mots-clés plus précis.

Pour exécuter l’outil de recherche en masse, cliquez sur le bouton “Recherche en vrac”.

Méthode 1 – Par liste de domaines/URL

Spécifiez une liste d’URL ou de domaines à contourner. Le programme suivra les liens, téléchargera les pages, extraira les adresses email et d’autres contacts. Dans le paramètre de profondeur de crawl, vous pouvez spécifier si vous souhaitez télécharger les pages dont les liens seront détectés sur les pages de la liste initiale. Crawl Depth = 0 signifie que LetsExtract doit uniquement charger l’URL d’origine.

Méthode 2 – Par mots-clés

En cliquant sur le bouton Coller des templates, vous pouvez insérer un modèle de requête de base qui peut être modifié pour répondre à vos besoins. Cette fonctionnalité vous permet de personnaliser votre recherche par mots-clés de manière plus précise.

Recherche personnalisée - exemples d'options

Supprimez les moteurs de recherche indésirables.
Entourez les valeurs des paramètres de guillemets.
Vous pouvez remplacer le paramètre Moteur par le domaine de votre moteur de recherche désiré.
Remplacez le paramètre Mots-clés par un mot-clé ou une phrase pour le moteur de recherche sélectionné.
Le paramètre Profondeur indique combien de pages visiter à partir des résultats (les nouveaux résultats de recherche peuvent se terminer plus tôt). Une valeur = 0 signifie la première page du moteur de recherche.
Le paramètre Max indique combien de liens de chaque page du moteur de recherche doivent être contournés au maximum. Une valeur = -1 signifie “pas de limite”.
La valeur Crawl Depth signifie combien de pages LetsExtract doit charger. Avec une valeur = 0, le programme chargera uniquement la page des résultats de recherche.

Exemple : Nous voulons rechercher des contacts uniquement sur les sites de la première page de Yandex (Russie) et Google (Royaume-Uni). Et sans limite sur le nombre de résultats trouvés sur cette seule page. Dans ce cas, nos templates ressembleront à ceci :

{Engine="google.co.uk" Keyword="Buy good tea in London" Depth="0" Max="-1"}
{Engine="yandex.ru" Keyword="Manufacture plastic windows" Depth="0" Max="-1"}

Nous voulons également que LetsExtract ouvre chaque site trouvé et ne consulte que les premières pages liées dans les résultats de recherche (sans plonger profondément). Pour cela, définissons la valeur globale de Crawl Depth = 1. Lançons la recherche :

Méthode 3 – Liste d’URL générée

Certaines sites web ont des pages comme ceci :

http://website.com/forum/members?id=12932

Pour éviter de charger toutes les pages de tels sites, vous pouvez générer une liste des URL requises. Pour démarrer le générateur, cliquez sur Générer des liens. Modifiez le modèle, cliquez sur le bouton Générer, vérifiez quelques adresses générées, puis cliquez sur “OK” pour revenir à la fenêtre principale.

Extraction massive d’adresses email par liste d’URL ou mots-clés

Méthode 1 – Par liste de domaines/URL

Méthode 2 – Par mots-clés

Méthode 3 – Liste d’URL générée