Custom Extraction

Scopri la custom Extraction per collezionare dati personalizzati dal codice html.

Estrazione Dati Custom

Screaming Frog è un Seo Tool molto versatile che non si limita a restituire dati e metriche predefinite ma consente anche delle analisi avanzate personalizzabili. Una di queste è la “Custom Extraction”, una funzionalità molto potente che ti permette di collezionare tutti i dati dall’html di ogni pagina web (modalità text-only) o dati renderizzati con la modalità di scansione “Javascript Rendering Mode”.

Il Seo Spider prevede 3 modalità di estrazione dei dati con la “Custom Extraction”:

  1. XPath: XPath selectors;
  2. CSS Path;
  3. Regex: per estrazione di dati più avanzati (approfondimento: https://docs.oracle.com/javase/8/docs/api/java/util/regex/Pattern.html)

Se decidi di approfittare delle prime due soluzioni “XPath” e “CSS Path” puoi scegliere quali elementi estrapolare tramite:

  • Extract Html elements: permette di collezionare dati dagli elementi selezionati e dal loro contenuto interno (“Inner Html Content”).
  • Extract Inner HTML: permette di estrapolare il contenuto interno di un determinato elemento selezionato. Nel caso in cui l’elemento Html contenga altri elementi Html, anche i sottoelementi saranno a tua disposizione.
  • Extract Text: colleziona il contenuto testuale dell’elemento selezionato e il contenuto testuale dei suoi sottoelementi.
  • Function Value: restituisce il risultato della funzione fornita. Se ad esempio utilizzi una funzione come “count(//h1)” ottieni il numero di <h1> presenti nella pagina.
Voce del menu del seo spider per la custom extraction

Una volta selezionata la “Custom Extraction” ti basta cliccare su “Add” e inserire le tue istruzioni per l’estrazione dei dati.

Puoi anche decidere di cliccare su “Crawl Config” e scegliere tra le tab della prima colonna del popup proposto dal Seo Spider.

COnfigurazione della funzionalità custom extraction del seo spider

I dati ottenuti sono disponibili nella tab “Custom Extraction” e nella scheda “Internal” in una colonna dedicata.

Risultati della custom extraction con screaming frog

Ora che sai impostare la “Custom Extraction” e hai capito le potenzialità vediamo alcuni esempi di applicazione che credo ti possano essere utili per le tue scorribande nella seo tecnica.

Extraction con X-Path

Di seguito alcuni esempi di estrapolazioni utilizzando l’XPath.

Headings: di default il Seo Spider colleziona solamente i titoli principali della pagina ( H1 e H2) ma per un’analisi più specifica e completa potresti avere la necessità di reperire informazioni specifiche anche sugli altri “headings” presenti in pagina.

Estrazioni dati attributo hreflang

Scoprire e collezionare le diverse tipologie ( “Types”) nei dati strutturati.

Nota Bene: per la convalida dei dati strutturati non è necessario utilizzare una “Custom Extraction” ma puoi visualizzare i dati nella tab “Structured Data”.

Collezionare i Social Media Tag, Open Graph Tags e Twitter cards:

Estrarre gli indirizzi email e/o i numeri di telefono da un sito web

Estrarre particolari frames dal sito web come Google Tag Manager, Video Youtube.

Estrazione di contenuti da specifici Divs o Span fornendo la classe (da sostituire al posto di “example”)

Questo esempio colleziona i titoli e numero di commenti dei blog post (per funzionare dovrai adeguare le classi specifiche del tuo sito web).

estrazione dati customizzata con il seo spider

Extraction con Regex

Le regole Regex sono uno strumento molto potente per collezionare dati con Screaming Frog; vediamo alcuni esempi applicativi da poter utilizzare immediatamente nel tuo prossimi Seo Audit:

Estrazione dell’ID di Google Analytics e di Google Tag Manager:

Estrazione dei Structured Data.

Per estrapolare i dati strutturati abbiamo visto che è possibile utilizzare anche la modalità XPath ma se questi hanno una formattazione in JSON-LD è consigliabile utilizzare la sintassi RegEX:

Estrazione dei dati strutturati tramite Regex e funzione seo spider

Custom Extraction Video

Guide Correlate