INFORME

Visión general de los informes disponibles con Screaming Frog para análisis granulares y puntuales.

Screaming Frog, Guide e tutorial avanzati

ÍNDICE:

Informe de Oportunidades

Screaming Frog ha invertido mucho en los últimos años en actualizar la Herramienta Araña y, al mismo tiempo, los “Informes” disponibles han crecido. La herramienta te permite dedicarte a la exportación de datos, proporcionándote toda una serie de documentos ad hoc para analizar específicamente las cuestiones más críticas.

La lista de documentos está a tu disposición en el menú principal y puedes guardarlos localmente en formato ‘.csv’, ‘.xls’, ‘xlsx’ o en ‘gsheet’ utilizando Google Drive. En este último caso, los encontrarás en la carpeta “Screaming Frog SEO Spider” de Drive.

Redirige

Este informe te proporciona los datos que encuentras en la barra lateral de la Araña Seo.

El documento es un resumen muy útil de la exploración que debe utilizarse en primer lugar para una supervisión descendente de cada una de las pestañas y sus respectivos filtros.

Visión general del rastreo

Estos documentos se centran en las redirecciones descubiertas durante la exploración, identificando el origen del enlace.

Actualmente tienes a tu disposición tres informes diferentes:

  • Todas las redirecciones: muestra todas las redirecciones individuales e indica la presencia de cualquier cadena de enlaces.
  • Cadenas de Redirecciones: incluye URLs con 2 o más redirecciones consecutivas que crean una peligrosa “Cadena de Redirecciones”.
  • Redirecciones y cadenas canónicas: identifica las URL con al menos 2 redirecciones y cadenas de URL “canónicas”.
Report di screaming frog sui reindirizzamenti

Los documentos “Cadenas de redireccionamiento” y “Cadenas de redireccionamiento y canónicas” son muy útiles para mapear situaciones de “redireccionamiento”, “canónicas” y “bucles”, permitiéndote identificar el número de saltos a lo largo de la ruta y cuáles son las URL de origen.

> En el modo Araña (Modo Araña), estos informes te muestran todos los redireccionamientos descubiertos a partir de un solo salto.

El documento está dividido en columnas y consta de:

  1. el “número de redirecciones”.
  2. El tipo de cadena identificada:
    1. Redirección HTTP,
    2. Redireccionar con JavaScript,
    3. Canónico.
    4. etc.
  3. Si existen bucles de redireccionamiento.

Si el informe no tiene registros, significa que la araña no ha encontrado ningún bucle o cadena de redirecciones que haya que optimizar.

> Los informes “Redirecciones”, “Cadenas de redirecciones” y “Cadenas de redirecciones y canónicas” también pueden descargarse al escanear en modo lista (Modo Lista). En este caso, el documento mostrará una línea por cada URL de la lista.

Marcando las opciones “Seguir siempre las redirecciones” y “Seguir siempre las canónicas”, la Araña Seo continuará escaneando las redirecciones y canónicas en modo lista, ignorando la profundidad del escaneo. En resumen, seguirá todos los pasos hasta el destino final.

Nota: los documentos de redirección serán especialmente útiles al migrar un sitio web para comprobar la correcta redistribución de los rankings adquiridos y no malgastar innecesariamente los Presupuestos de rastreo.

Canónico

Los documentos “Cadenas canónicas” y “Canónicos no indexables” ponen de manifiesto errores y problemas con los elementos de enlace canónicos o la implementación de canónicos HTTP.

1. El informeCadenascanónicas” destaca cualquier URL que tenga más de 2 enlaces canónicos en una cadena.

  • La URL A está “canonizada” y tiene una “URL canónica” hacia la URL B
  • La URL B también se “canoniza” a la URL C.

2. El informe“Canónicos no indexables” pone de manifiesto errores y problemas con los enlaces canónicos. En concreto, este informe muestra todos los enlaces canónicos que tienen como URL de destino URL bloqueadas por robots.txt, tienen código de estado 3XX, 4XX o 5XX o cualquier otra cosa que no sea una respuesta 200 “OK”.

Este informe también proporciona datos sobre todas las URL que fueron descubiertas por la Araña Seo a través del enlace “canónico”, pero que no tienen enlaces (enlaces internos) desde el sitio.

Estos datos estarán disponibles en la columna “sin vincular” marcada como “verdadero”.

Paginación

Spider Seo proporciona dos informes dedicados a la paginación:

  • “URLs de paginación no-200”
  • “URLs de paginación no enlazadas

Estos dos documentos son muy útiles para señalar errores y puntos críticos con los atributos “rel=prev” y “rel=next” de las páginas.

Consultando “URLs de paginación no 200” puedes identificar cada URL con los atributos “rel=prev” y “rel=next” que llaman a recursos con un código de estado distinto de 200.

El filtro “URLs de paginación no enlazadas” te ayudará a definir todas las urls que han sido descubiertas por la Araña Seo gracias a los atributos “next/prev”, pero que no tienen ninguna conexión interna (enlace) con el sitio web.

En el momento de redactar la guía, Google ya no tiene en cuenta estos atributos, pero otros motores de búsqueda los siguen utilizando.

Hreflang

La etiqueta Hreflang permite a Google conocer las diferentes versiones lingüísticas de una página web y devolver al internauta la versión más adecuada en función de su navegador.

Screaming Frog dedica 7 documentos para descargar, cada uno con un enfoque diferente sobre el atributo:

  • Todas las URL Hreflang: este informe es el más completo y recoge todas las URL y URL Hreflang, incluidas las indicaciones por región e idioma descubiertas durante el rastreo.
  • URLs Hreflang no-200: a través de este documento puedes averiguar qué páginas incluyen enlaces Hreflang a páginas con un código de estado distinto de 200 (sin respuesta, bloqueadas por robots.txt, respuestas 3XX, 4XX o 5XX).
  • URLs Hreflang no enlazadas: documento que detecta todas las URLs descubiertas mediante un enlace “Hreflang” pero que ni siquiera tienen un Hiperenlace en el sitio (por ejemplo, Páginas Huérfanas).
  • Enlaces de confirmación que faltan: a través de este informe puedes identificar qué URLs carecen de enlaces de confirmación. Por ejemplo, la página A tiene un hreflang hacia la página B e informa al robot del motor de búsqueda de que A y B son dos versiones lingüísticas del mismo contenido, pero B no tiene un hreflang hacia la página A, lo que crea una incoherencia.
  • Enlaces de confirmación en idiomas incoherentes: este informe muestra las páginas de confirmación que utilizan códigos de idioma incoherentes y diferentes para el mismo contenido.
  • Enlaces de confirmación no canónicos: este documento muestra las URL con hreflang con destino a elementos “no canónicos”. Si decides “canonicalizar” un elemento, estás informando a la araña de que ese contenido específico tiene una versión primaria “canónica”, por lo que en tu “hreflang” deberías haber incluido esa versión.
  • Enlaces de confirmación Noindex: informe ideal para encontrar URL con la etiqueta Hreflang a recursos con el atributo “No index”. De nuevo, enviar al bot a recursos “No indexables” crea una enorme incoherencia entre la opción de inhibir un contenido e invitarle a servir ese mismo elemento como versión principal en el idioma.

Páginas huérfanas

Las páginas huérfanas representan URL que no reciben ningún enlace interno de otras páginas del sitio web y a las que el rastreador no puede llegar porque están aisladas.

El informe “Páginas huérfanas” proporciona una lista de las URL recopiladas a través de la conexión entre la araña Seo y la API de Google Analytics, Google Search Console (API de Search Analytics) o descubiertas a través de los sitemaps XML que no coinciden con las URL descubiertas durante el rastreo.

En resumen, se te sirven URLs a las que no puede llegar la araña Seo por falta de enlaces a seguir o que tienen el atributo “no follow”.

Pero si no tienen enlaces, ¿por qué existen en las bases de datos de Google Analytics o Search Console?

Probablemente se indexaron con la versión anterior del sitio o a partir de otras fuentes, como los sitemaps XML, o hay referencias a ellos.

Para recoger datos sobre las Páginas Huérfanas, basta con configurar la API a través de las configuraciones de la Araña Seo.

> > >Configurar el acceso a la API Elige las API a las que conectarte Conectarse a una nueva cuenta (o conectarse a cuentas previamente configuradas)

Al concluir la exploración, es esencial utilizar el “Análisis de rastreo” para rellenar con datos la pestaña correspondiente.

Las fuentes disponibles para comprobar las páginas huérfanas son:

  • GA: la URL se descubrió a través de la API de Google Analytics.
  • GSC: la URL se descubrió en Google Search Console, a partir de la API de Search Analytics.
  • Sitemap: la URL se descubrió a través del Sitemap XML.
  • GA & GSC & Sitemap: la URL fue descubierta en Google Analytics, Google Search Console & XML Sitemap.

Buena práctica: para optimizar tu análisis SEO con la API de Google Analytics, te recomiendo que elijas “Página de destino” como dimensión y “Tráfico orgánico” como segmento, para obtener datos más relevantes y evitar páginas de inicio de sesión, páginas de carrito de la compra de comercio electrónico, etc.

Contenido inseguro

Este informe es muy útil porque te avisa de las URL con contenido considerado inseguro y te permite evitar las advertencias de seguridad del navegador que podrían ahuyentar al internauta.

El documento “Contenido inseguro” te presenta todas las URL seguras (HTTPS) que tienen elementos inseguros del protocolo HTTP, como enlaces internos, imágenes, JS, CSS, SWF o imágenes externas en una CDN, perfiles sociales, etc.

El informe resulta muy útil, sobre todo en la fase de migración, para tener una visión completa de las posibles criticidades.

esempio blocco pagina non sicura su firefox

Aquí tienes un ejemplo de archivo en el que los destinos de las imágenes tienen un protocolo “http” y no son considerados fiables por la Herramienta Araña.

Report di screaming frog suigli elementi non sicuri del sito web

Datos estructurados

Como bien sabes, los datos estructurados desempeñan una función informativa para el motor de búsqueda y, si se gestionan correctamente, proporcionan enormes beneficios en términos de visibilidad a través de las distintas funciones del motor de búsqueda.

Screaming Frog te proporciona 4 informes para evaluar y optimizar cualquier problema crítico de validación en los Datos Estructurados:

  • Resumen de errores de validación y advertencias: agrega datos estructurados según errores de validación únicos y advertencias descubiertas mostrando el número de URL afectadas por cada problema crítico, con URL de muestra que identifican el problema específico.
  • Errores de validación y advertencias: muestra todos los errores de validación de datos estructurados de forma granular para cada URL, incluyendo el nombre de la propiedad (Organización, etc.), el formato (JSON-LD, etc.), la gravedad del problema (error o advertencia), el tipo de validación (Google Product, etc.) y el mensaje relacionado con el problema (por ejemplo: la propiedad /review es obligatoria).
  • Resumen de las funciones de resultados enriquecidos de Google: agrega los datos de las “funciones de resultados enriquecidos de Google” detectadas en un rastreo mostrando el número de URL que presentan cada función individual.
  • Características de los resultados enriquecidos de Google: mapea cada URL ampliamente según las características individuales disponibles y muestra cuáles se encontraron para cada URL.
Report di screaming frog sui dati strutturati trovati durante la scansione

Pagespeed

Este informe se basa en la API Page speed Insight y proporciona todos los indicadores principales sobre el tiempo de carga de las páginas web, permitiendo un diagnóstico muy preciso de los posibles bloqueos o causas que dificultan el rendimiento.

> > Config API Acceso Pagespeed Insights

Panoramica del report "Pagespeed" di Screaming Frog
  • Resumen de oportunidades PageSpeed: resume todas las oportunidades únicas descubiertas en el sitio, el número de URL implicadas y el ahorro potencial medio y total en términos de tamaño y milisegundos para priorizar la acción.
  • Resumen de la cobertura CSS: supone un ahorro potencial de tiempo si se elimina el código no utilizado de cada CSS que se carga en el sitio.
  • Resumen de la cobertura de JavaScript: destaca qué parte de cada archivo JS no se utiliza durante el escaneado y el ahorro potencial al eliminar el código cargado que no se utiliza.

Resumen del encabezado HTTP

Este documento devuelve una vista agregada de todas las cabeceras de respuesta HTTP descubiertas durante un escaneo. Muestra cada cabecera de respuesta HTTP única y el número de URL únicas que respondieron con la cabecera.

Para rellenar los datos con “cabeceras HTTP”, debes activar la función correspondiente.

> > Configurar la extracción de arañas

Puedes encontrar detalles más específicos sobre URLs y cabeceras en la pestaña “Cabeceras HTTP” de la ventana inferior y a través de la exportación de documentos “Todas las cabeceras HTTP”.

> > Exportación masiva web de todas las cabeceras HTTP

Como alternativa, puedes consultar los encabezados HTTP directamente en la pestaña “Interno”, donde se añaden en columnas únicas separadas.

Resumen de galletas

El informe “Resumen de cookies” muestra una vista agregada de las cookies únicas descubiertas durante una exploración, teniendo en cuenta su nombre, dominio de referencia, caducidad, valores de seguridad y HttpOnly.

También se muestra el número de URL en las que se emitió cada cookie única.

Para utilizar este informe, basta con activar la extracción de “cookies”.

> > Configurar la extracción de arañas

No olvides activar también el modo de renderizado JavaScript para obtener una visión precisa de las cookies que se cargan en la página mediante JavaScript o etiquetas de imagen de píxeles.

Este informe agregado es extremadamente útil para cumplir el GDPR sobre privacidad.

Puedes ver más detalles en la pestaña “Cookies” de la ventana inferior y a través de la exportación “Todas las cookies”.

> > Exportar masivamente todas las cookies de la web

Camino de arrastre

El Informe de la ruta de rastreo no se encuentra en el menú principal, a diferencia de los anteriores.

El documento está disponible haciendo clic con el botón derecho del ratón en una URL de la ventana superior de la Araña Seo y seleccionando la opción “exportar”.

il crawl path report di Screaming Frog

Este informe muestra el camino más corto que siguió la araña SEO durante el rastreo para descubrir la URL.

Esta información puede ser muy útil para páginas con una “Profundidad de rastreo” muy profunda y te ahorra tener que ver los “inlinks” de muchas URL para descubrir la fuente original; su aplicación podría formar parte del diagnóstico de URL infinitas causadas por plug-ins o calendarios periódicos.

Tienes que mirar el informe de abajo arriba. La primera URL de la parte inferior de la columna “fuente” es la primera URL escaneada (con un nivel “0”).

La columna “destino”, por su parte, te muestra qué URL se escanearon a continuación, y éstas constituyen las URL “origen” resultantes para el siguiente nivel (1) y así sucesivamente, hacia arriba.

La primera URL de la columna “destino” al principio del informe será la URL del informe de la ruta de exploración.

Screaming Frog, Guide e tutorial avanzati

ÍNDICE:

Ficha Seo Spider