Estrazione massiva di indirizzi email tramite elenco di URL o parole chiave

Puoi utilizzare lo strumento per estrarre indirizzi email da un sito web per bypassare un sito specifico. La funzione di ricerca per parole chiave consente di avviare rapidamente una nuova ricerca. Lo strumento di ricerca massiva è progettato per gestire più siti o per un’analisi più precisa delle parole chiave.

Per eseguire lo strumento di ricerca massiva, fai clic sul pulsante “Ricerca massiva”.

Metodo 1 – Tramite l’elenco di domini/indirizzi URL

Specificare un elenco di URL o domini da bypassare. Il programma seguirà i collegamenti, scaricherà le pagine, estrarrà indirizzi email e altri contatti. Nel parametro Profondità di Scansione, puoi specificare se scaricare pagine i cui collegamenti saranno rilevati sulle pagine dall’elenco iniziale. Crawl Depth = 0 significa che LetsExtract deve caricare solo l’URL originale.

Esempio di scraping di URL in massa

Metodo 2 – Tramite parole chiave

Cliccando sul pulsante Incolla modelli puoi inserire un modello di query di base che può essere modificato per soddisfare le tue esigenze. Questa funzione ti consente di personalizzare la ricerca per parole chiave in modo più preciso.

Ricerca personalizzata - opzioni di esempio
  • Rimuovi i motori di ricerca indesiderati.
  • Inserisci i valori dei parametri tra virgolette.
  • Puoi sostituire il parametro Engine con il dominio del motore di ricerca desiderato.
  • Sostituisci il parametro Keyword con una parola chiave o frase per il motore di ricerca selezionato.
  • Il parametro Depth indica quante pagine visitare dai risultati (i nuovi risultati di ricerca potrebbero terminare prima). Un valore = 0 significa la prima pagina del motore di ricerca.
  • Il parametro Max indica al massimo quanti collegamenti da ogni pagina del motore di ricerca devono essere bypassati. Un valore = -1 significa “nessun limite”.
  • Il valore Crawl Depth indica quante pagine LetsExtract dovrebbe caricare. Con valore = 0, il programma caricherà solo la pagina dai risultati della ricerca.

Esempio: Vogliamo cercare contatti solo sui siti della prima pagina di Yandex (Russia) e Google (Regno Unito). E senza limiti sul numero di risultati trovati su questa pagina. In questo caso, i nostri modelli appariranno così:

{Engine="google.co.uk" Keyword="Buy good tea in London" Depth="0" Max="-1"}
{Engine="yandex.ru" Keyword="Manufacture plastic windows" Depth="0" Max="-1"}

Vogliamo anche che LetsExtract apra ogni sito trovato e visualizzi solo le prime pagine collegate nei risultati di ricerca (senza approfondire). Per fare ciò, impostiamo il valore complessivo di Crawl Depth = 1. Avviamo la ricerca:

Ricerca personalizzata - opzioni di esempio

Metodo 3 – Elenco URL generato

Alcuni siti web hanno pagine come questa:

http://website.com/forum/members?id=12932

Per evitare di caricare tutte le pagine di tali siti, puoi generare un elenco degli URL richiesti. Per avviare il generatore, fai clic su Genera collegamenti. Modifica il modello, fai clic sul pulsante Genera, controlla alcuni indirizzi generati e fai clic su “OK” per tornare alla finestra principale.

Generazione di link