Récupérer le code source
Seo Spider vous permet de vérifier la présence de n’importe quel élément contenu dans le code source des pages d’un site web grâce à la fonctionnalité « Custom Search ». Par défaut, le système recherche le code HTML brut, tandis que le passage au mode d’analyse « Javascript rendu » vous permet également d’extraire les données rendues. Cet outil vous permet de configurer jusqu’à 100 recherches personnalisées qui renvoient des URL contenant ou ne contenant pas les données recherchées.
Pour utiliser la fonctionnalité « Recherche personnalisée », il suffit de cliquer sur le bouton « Ajouter » à l’écran, de nommer le filtre, de choisir l’option « Contient » ou « Ne contient pas », de choisir le type de recherche entre texte ou RegEX, de saisir l’entrée à rechercher et de définir où chercher (html, texte de la page, un élément particulier, XPath, etc.)
Dans l’exemple suivant, nous avons supposé une recherche personnalisée avec deux objectifs :
- l’identification des produits en rupture de stock d’un commerce électronique en recherchant « Out of Stock » sur les pages détaillées (Contains).
- la définition des pages où le script Google Tag Manager est absent (Does Not Contain)
Pour collecter les résultats, il suffit de donner « ok » et d’exécuter la recherche.
Une fois l’analyse traitée, les données sont complétées en temps réel et divisées en colonnes dans l’onglet « Recherche personnalisée ».
Si vous le souhaitez, vous pouvez isoler l’une ou l’autre des « recherches personnalisées » en utilisant le filtre déroulant situé à gauche de la fenêtre supérieure.
Pour plus de commodité, vous pouvez également consulter les mêmes résultats dans le panneau latéral sous « Recherche personnalisée ».
Pour compléter l’analyse, vous pouvez exporter les résultats en cliquant directement sur le bouton « Exporter » de l’onglet ou utiliser la fonction « Exportation en bloc » pour obtenir tous les liens entrants de votre recherche personnalisée.
Maintenant que vous comprenez la polyvalence de la « recherche personnalisée », je vous propose quelques bonnes pratiques qui sont très utiles dans les audits Seo quotidiens.
Une première utilisation très intéressante en mode « Texte seul » consiste à détecter les fautes d’orthographe, les acronymes, etc. prendre en compte l’aspect « sensible à la casse » des mots (les RegEX sont déjà « sensibles à la casse » par défaut) en activant l’option correspondante.
Une autre application de la « recherche personnalisée » en mode RegEX est la recherche de requêtes spécifiques (correspondance exacte). Cette recherche vous permet de découvrir d’éventuels problèmes de cannibalisation avec des mots-clés stratégiques sur plusieurs pages de destination qui pourraient pénaliser votre intention de recherche sur Google.

La recherche ci-dessus peut également être étendue à d’autres mots en utilisant la même « recherche personnalisée » et en divisant les différents RegEX par le « | » (symbole du tuyau). Cette recherche permet d’évaluer la densité des requêtes dans le texte et d’éviter d’éventuelles pénalités pour surcharge.

Dans l’exemple suivant, les requêtes ont été effectuées : « optimisation pour les moteurs de recherche », « naturel » et « gratuit ».
Le résultat de l’analyse montre 5 occurrences pour la première page (3 fois « optimisation des moteurs de recherche », 1 fois « naturel » et « gratuit »).
Options de la fonction de recherche personnalisée
Lorsque vous utilisez la fonction « Recherche personnalisée », vous disposez de 7 options pour limiter la zone de recherche :
- HTML: comprend l’ensemble du code HTML.
- Texte de la page: ne prend en compte que le texte de la page web, mais tous les éléments HTML sont exclus.
- Texte de la page sans ancres: comprend le texte des pages web, à l’exclusion de tout HTML ou de tout texte contenu dans les balises d’ancrage HTML (également connues sous le nom d’éléments A). Cela peut s’avérer utile pour rechercher des mots qui figurent également dans le texte des liens figurant dans les menus.
- HTML Head : la recherche sera isolée dans le html de l’en-tête.
- HTML Body : la recherche porte sur les éléments textuels et html de la balise HTML Body.
- XPath: vous permet de spécifier un XPath pour définir la position dans le HTML où la recherche doit être effectuée. Par exemple, si vous souhaitez limiter l’enquête au texte contenu dans les titres h3, vous pouvez fournir //h3.
- Domaine du contenu: la recherche est effectuée par défaut dans l’élément html Body.
Par exemple, nous pourrions rechercher si le nom Screaming Frog a toujours été orthographié correctement ou s’il y a des « fautes d’orthographe » dans les articles de blog. Plus précisément, nous avons interrogé le Seo Spider pour vérifier si le nom de l’entreprise de l’outil Seo est correctement orthographié ou si la lettre minuscule se trouve au début du deuxième mot : « Screaming frog » (grenouille hurlante).












