ONGLET INTERNE

L'onglet Interne, le premier et le plus complet des onglets disponibles sur Screaming Frog pour consulter le Seo Spider.

Vue d’ensemble
Onglet “interne

Dans la console de Seo Spider, le premier onglet disponible est “Interne” et combine toutes les URL qui sont sur le même sous-domaine que la page d’exploration initiale. Cet onglet comprend toutes les mesures du Seo Spider, à l’exception des données collectées par les onglets“external“,“hreflang” et“structured data“. Tous les sous-domaines peuvent être considérés comme internes (et non pas comme des “références externes”) si vous utilisez la configuration “crawl all subdomains”, le mode “list” ou la fonction CDNs.

Scheda Internal del Seo Spider Screaming Frog

Code de statut

Dans cet onglet, vous pouvez consulter les données suivantes :

  • Adresse: identifie l’adresse (URL) de la ressource scannée (html, Javascript, Css, Images, Pdf, Flash, autre).
  • Contenu: l’URL examinée renvoie le type d’élément :
    • Html ;
    • Javascript ;
    • Css ;
    • Images (Images) ;
    • Pdf ;
    • Flash ;
    • Autre.
  • Code d’état: identifie la réponse Http du serveur :
    • code 200 ;
    • code 301 ;
    • code 302 ;
    • code 404 ;
    • code 500 ;
  • Statut: identifie la réponse Http de l’en-tête lorsqu’une URL spécifique est appelée :
    • code 200 : OK ;
    • code 301 : Moved Permanently (redirection permanente) ;
    • code 302 : Moved Temporarily (redirection temporaire) ;
    • code 404 : Non trouvé ;
    • code 500 : Erreur de serveur (problème lié au serveur) ,
    • Délai de connexion
  • Indexabilité: indique si une URL est “indexable” (indexable par le moteur de recherche) ou “non indexable”.
  • Statut d’indexabilité: spécifie la raison pour laquelle une URL ne peut pas être indexée. Par exemple, parce que “Canonicalisé” vers une autre ressource, code d’état différent de 200 etc., a “Connection Timeout” dans l’état et est donc considéré comme “No Response”, etc.

Métabalises

  • Titre 1: identifie le “Meta Title” (Titre de la page) qui est utilisé par Google dans ses résultats Serp.
  • Longueur du titre 1 : longueur du “titre 1” en nombre de caractères. Il est recommandé d’utiliser un titre de 30 à 55 caractères afin de ne pas subir de troncature de snippet dans Serp.
  • Title 1 Pixel Width : largeur du “Title 1” en termes de pixels.
    Il correspond en fonctionnalité au précédent, mais je vous conseille de toujours raisonner en pixels car l’espace différent occupé par les caractères pourrait vous induire en erreur.

Exemple :

Si vous utilisez une lettre “M” ou un “i” avec le premier indicateur, vous obtiendrez toujours 1, mais les pixels utilisés par les deux lettres seront différents, avec une incidence plus élevée du “M” majuscule en termes d’espace dans l’extrait. Je vous conseille de toujours vérifier la taille en pixels afin d’éviter toute troncature dans le Serp.

  • Meta Description 1: identifie la “Description” utilisée dans l’extrait Google.
  • Longueur de la méta-description : nombre de caractères utilisés pour la “méta-description”. Un texte de 70 à 155 caractères est recommandé.
  • Largeur des pixels de la méta-description: largeur en pixels de la méta-description. Il est recommandé de rester dans une fourchette de 400 à 1011 pixels.
  • Meta Keyword 1: mots-clés utilisés pour l’URL individuel. L’inclusion de méta-clefs est facultative, Google ayant déclaré qu’il ne les prenait pas en compte dans l’évaluation du contenu et son classement.
  • Longueur des méta-mots: nombre de caractères utilisés pour les méta-mots.
  • H1- 1: identifie la première rubrique “H1” de l’URL (titre principal de la page).
  • H1 Length-1: longueur en caractères de la première rubrique “H1”.
  • H2-1: identifie le premier titre “H2” (sous-titre).
  • H2-Length-1: indique la longueur en caractères de la première rubrique “H2”.

Exemple :

Le Seo Spider ne retient que les deux premiers titres H2 qu’il rencontre dans le code source. Pour extraire les données des autres rubriques (h3, h4, etc.), je vous recommande d’utiliser la fonction “Extraction personnalisée”.

  • Meta Robots 1 : identifie les directives meta robots (par exemple max-image-preview:large)
  • X-Robots-Tag 1 – X-Robots-tag HTTP: directives d’en-tête pour l’URL (par exemple, noindex).
  • Meta Refresh 1 : recherche si la chaîne “refresh” est présente dans le code d’une URL spécifique.
  • Élément de lien canonique: identifie les données de l’élément de lien “canonique”.
  • rel=”next” 1: Le Seo Spider collecte ces éléments de lien HTML conçus pour indiquer la relation entre les URL dans une série paginée, en particulier pour indiquer la relation avec la page suivante. Cet élément et le suivant se retrouvent souvent dans les blogs, les forums et le commerce électronique. Bien que Google ait déclaré qu’il était capable d’analyser complètement un site web sans ces indications, je pense qu’elles devraient être prises en compte pour les autres robots. Le mot “next” indique la relation avec la page suivante.
  • rel=”prev” 1: Le Seo Spider collecte ces éléments de lien HTML conçus pour indiquer la relation entre les URL dans une série paginée. Le mot “prev” indique la relation avec la page précédente.

Liens

  • Unique InLinks: correspond au nombre de liens internes “uniques” ciblant l’URL analysée.

Exemple :

Si la page A renvoie trois fois à la page B, il n’y aura qu’un seul “lien unique” (et trois liens entrants).

  • % du total: représente le pourcentage de liens internes uniques (ne prend en compte que les pages Html avec le code de statut 200) vers l’URL.
  • Outlinks: nombre de liens internes vers d’autres URL dans le même sous-domaine.
  • Liens externes uniques : nombre de liens uniques dans les éléments d’ancrage d’une URL donnée vers un autre sous-domaine.

Exemple :

Si la “page A” renvoie trois fois à la “page B” sur un sous-domaine différent, il s’agit de trois liens externes et d’un lien externe unique vers la “page B”.

  • Liens externes: nombre de liens de l’url examinée vers des sous-domaines externes (autres que celui analysé).

Contenu

  • Taille: cette taille est définie en kilo-octets. La valeur est fixée par l’en-tête Content-Length s’il est fourni, sinon elle est fixée à zéro. Pour les pages HTML, la valeur prend en compte la taille du HTML (non compressé) en Ko. A l’exportation, la taille est servie en octets Equivalence → Kilo-octets = 1.024 octets
  • Nombre de mots: cet indice identifie la somme de tous les “mots” scannés dans la balise body, à l’exclusion des balises HTML. Le décompte est basé sur la zone de contenu, à l’exclusion des éléments de navigation et de pied de page. Vous pouvez également personnaliser cette mesure en définissant une zone d’analyse différente. Pour un diagnostic plus granulaire, vous pouvez inclure ou exclure des éléments HTML, des classes et des ID. N’oubliez pas que, bien que Seo Spider soit très précis, il peut y avoir des écarts entre les valeurs rapportées et un calcul manuel. Ces incohérences sont dues au fait que l’analyseur syntaxique effectue certaines corrections lorsqu’il rencontre du HTML invalide. Il ne faut pas non plus sous-estimer les paramètres de rendu personnels qui peuvent également influencer le HTML examiné. Screaming Frog compte un mot en prenant le texte et en le divisant par des espaces sans tenir compte de la visibilité du contenu (par exemple, le texte dans une div définie comme cachée).
  • Correspondance de similitude la plus proche: cette fonction vous permet de voir l’indice de similitude entre plusieurs pages et d’éviter les doublons. En utilisant les seuils par défaut de Seo Spider, les pages sont identifiées comme des “quasi-doublons” si elles présentent une correspondance de 90 % ou plus. Vous pouvez également personnaliser cette fonction en définissant des seuils ad hoc.
    Pour remplir cette colonne, vous devez activer l’option “Crawl Analysis” à la fin de l’analyse. Seuls les URL dont le contenu est supérieur au seuil de similarité sélectionné contiendront des données, les autres resteront vides. Ainsi, par défaut, cette colonne ne contiendra que les données relatives aux URL dont la similarité est égale ou supérieure à 90 %.

> > > > Config Content Duplicates Enable Near Duplicates Near Duplicate Similarity Threshold (Seuil de similarité des quasi-doublons)

  • Hash: le Seo Spider prend en compte la valeur “hash” via l’algorithme MD5 de l’URL. Dans le cas de deux valeurs identiques, le contenu est considéré comme dupliqué et peut être pénalisé par le moteur de recherche. Cet index, contrairement à l’onglet “Correspondance la plus proche”, vérifie la présence d’un contenu dupliqué à l’identique.
    Veuillez noter que si deux valeurs de hachage correspondent, les pages ont exactement le même contenu. S’il n’y a qu’une différence d’un seul caractère, ils auront des valeurs de hachage uniques et ne seront pas détectés comme du contenu dupliqué.

> URL en double

  • Non. Quasi-doublonsIdentifie le nombre d’URL en quasi-double découvert lors de l’analyse et qui atteint ou dépasse le seuil défini dans le “Seuil de similarité en quasi-double” (la valeur par défaut est de 90 %). Ce paramètre peut également être modifié.

> > Config Content Duplicates

Pour remplir cette colonne, vous devez avoir préalablement sélectionné l’option “Activer les quasi-doublons” et lancé l'”Analyse Crawl”.

  • Erreurs d’orthographe : le nombre total d’erreurs d’orthographe découvertes pour une URL. Pour que cette colonne soit remplie, l’option “Activer la vérification orthographique” doit être sélectionnée.

> > Contenu de la configuration Orthographe et grammaire

  • Erreurs de grammaire : le nombre total d’erreurs de grammaire découvertes pour chaque URL. Pour que cette colonne soit remplie, l’option “Activer le contrôle grammatical” doit être sélectionnée. Dans les paramètres, vous pouvez définir la langue de contrôle, les règles de grammaire et le dictionnaire de référence.

Pour consulter les données sur les erreurs grammaticales et orthographiques, il suffit de consulter les colonnes dédiées dans l’onglet “Interne”, de sélectionner les URLs comportant des erreurs et de les voir en détail dans l’onglet “Détails orthographiques et grammaticaux” dans la fenêtre inférieure de Seo Spider. Excellente fonctionnalité pour le rédacteur, qui peut ainsi repérer les fautes de frappe ou l’utilisation incorrecte des règles de grammaire. Outre la liste des erreurs, vous trouverez des suggestions de correction et la section où elles ont été trouvées avec un aperçu. Pour la langue italienne, il est encore peu fiable dans les suggestions mais très utile en termes d’erreurs de frappe.

> > Config Contenu Orthographe et grammaire

Http & More

  • Temps de réponse: temps nécessaire en secondes pour télécharger l’URL. Il est calculé sur la base du temps nécessaire pour émettre une requête HTTP et obtenir une réponse HTTP complète de la part du serveur. Ce paramètre n’inclut pas le temps nécessaire au téléchargement de ressources supplémentaires avec le “mode de rendu JavaScript”.
  • Dernière modification: index extrait de l’en-tête “Last-Modified” de la réponse HTTP du serveur. Si le serveur ne la fournit pas, la valeur sera vide.
  • Redirect Url: si l’URL est redirigée, cette colonne comprendra la destination de l’URL.
  • Type de redirection: Spider Seo identifies :
    • Redirection HTTP: déclenchée par un en-tête HTTP.
    • Politique HSTS : redirection à partir de l’en-tête HSTS.
    • JavaScript Redirect: redirection déclenchée par l’exécution de JavaScript (ne peut être présente que lors de l’utilisation du mode “JavaScript rendering”).
    • Redirection MetaRefresh: déclenchée par une balise meta refresh dans le code HTML.
  • Version HTTP: cette colonne indique la version HTTP avec laquelle l’exploration a été effectuée. Le Seo Spider n’utilise actuellement que le protocole HTTP/1.1, mais cette colonne a été publiée en prévision de la prise en charge du protocole HTTP/2 dans une prochaine mise à jour.
Seo Spider Tab