Análisis de contenido duplicado

Análisis y mejores prácticas para evitar el contenido duplicado y no perder posiciones en los buscadores.

Contenido duplicado

Como Google ha afirmado en repetidas ocasiones, el contenido es uno de los elementos de clasificación más importantes, y la gestión de cualquier duplicación es una de las actividades a tener en cuenta en cualquier optimización SEO.

El contenido duplicado es uno de los problemas más comunes que cortan las alas a un proyecto y debe reducirse al mínimo para no malgastar el presupuesto de rastreo.

El objetivo de un especialista en Seo no debe limitarse a comprender y optimizar las páginas idénticas, sino que también debe centrarse en los contenidos “similares” que puedan crear condiciones de “canibalización de consultas”, creando una ineficacia absoluta en el rastreo de los motores de búsqueda.

A través de este tutorial, vemos cómo Screaming Frog te permite encontrar tanto contenido duplicado exacto (con el mismo hash) como contenido similar que podría parecer tener la misma “intención de búsqueda” a los ojos de Google.

  • 1. > > Activa “Casi duplicados” a través de “Configurar duplicados de contenido”.

Screaming Frog, por defecto, identifica automáticamente las páginas duplicadas exactas (las páginas duplicadas tienen el mismo “hash”), mientras que para identificar contenidos similares debes activar la opción “Activar casi duplicados”. Una vez activado, el Seo Spider considera que cualquier documento con una coincidencia mínima del 90% es una página “similar”.

Este umbral también puede ajustarse según el refinamiento que mejor se adapte a tu proyecto.

funzionalità di Near Duplicates del seo spider per contenuti duplicati

Por defecto, la araña SEO sólo comprueba las páginas similares o duplicadas si son “indexables” y no están “canonicalizadas”; el consejo es desmarcar la opción “Comprobar sólo las páginas indexables en busca de duplicados”, ya que esto puede ayudarte a encontrar áreas de posible desperdicio de presupuesto de la araña.

Nota: Por regla general, te aconsejo que en los proyectos nuevos, en los que te vas a encargar de toda la Investigación Clave, fijes el umbral en un 50-60%, y en los proyectos con cierto historial en un 70% como mínimo, para asegurarte de que la Intención de Búsqueda sea siempre única y esté bien marcada.

Mediante el uso de Search Console puedes comprobar periódicamente la relación Consulta-Página de Aterrizaje y, en caso de canibalización, elegir qué página de aterrizaje se adapta mejor (comprobando también los datos de GA) a esa Intención de Búsqueda concreta y renovar el contenido de las páginas secundarias o, en determinados casos, eliminarlas.

  • 2. Definir el área de contenido que se va a analizar

También para esta tarea, Screaming Frog es muy flexible y te permite elegir el foco de atención al buscar contenido duplicado o similar.

<> Por defecto, el Seo Spider excluye automáticamente los elementos del nav y el
<> pie de página para centrarte en el contenido del cuerpo principal. Sin embargo, no todos los sitios web están construidos con estos elementos HTML5, pero Seo Spider te permite “incluir” o “excluir” determinadas etiquetas, clases o ID HTML de tu revisión.

Por ejemplo, si rastreas el sitio web de Screaming Frog, te darás cuenta de que tiene un menú móvil fuera del elemento “nav”, pero, por defecto, este elemento se sigue incluyendo en el análisis de contenido. En este caso concreto, podrías definir la clase de menú (‘mobile-menu__dropdown’) y excluirla del examen para centrarte más en el contenido principal.

Content area del seo spider
  • 3. Escanea el sitio web.
  • 4. Mostrar duplicados en la pestaña “Contenido

En la pestaña “Contenido” tienes dos 2 filtros disponibles:

  • “duplicados exactos” (contenido idéntico).
  • casi duplicados” (contenido similar).

Durante el rastreo, esta pestaña se rellena con datos a medida que avanza el rastreo, pero sólo presenta los “duplicados exactos”.

  • 5. Configurar el análisis de rastreo

Para rellenar el filtro “Casi duplicados”, las columnas “Coincidencia de similitud más próxima” y “Nº de casi duplicados”, debes configurar y ejecutar el Análisis de rastreo.

  • 6. Visualiza la pestaña “Contenido” y los filtros “Exacto” y “Cercano”.

Tras realizar el análisis posterior al rastreo, se rellenarán el filtro “Casi duplicados”, las columnas “Coincidencia más parecida” y “Nº de casi duplicados”.

Sólo las URL cuyo contenido supere el umbral de similitud seleccionado contendrán datos, las demás permanecerán vacías.

En el caso que se muestra a continuación, el sitio de Screaming Frog sólo tiene dos recursos con un umbral del 92% que deben optimizarse.

scheda con tasso di similarità tra diverse pagine

Para una evaluación más precisa, puedes ordenar los datos según los dos filtros:

  • Duplicados exactos: identifica las páginas con un “hash” idéntico.
    Muy útil para gestionar las páginas principales y las páginas que hay que “canonizar”.
  • > > Casi duplicados: identifica las páginas con un umbral de “similitud” superior al 90 por ciento o con un índice diferente si lo has cambiado mediante “Config Duplicados de contenido” .

En resumen, en la columna “Coincidencia más parecida” puedes ver el porcentaje de similitud, y en “Nº de duplicados cercanos” el número de páginas afectadas por esta similitud.

  • 7. Mostrar URL duplicadas a través de la pestaña “Detalles duplicados”.

Para los “duplicados exactos”, simplemente pasa a la columna “hash” y ordénalos haciendo clic en la cabecera para encontrar todas las coincidencias.

En el ejemplo del sitio de la BBC, cada URL tiene un duplicado exacto porque tiene dos versiones, una con la “/” y otra sin ella.

Para conocer los “duplicados cercanos (similares)”, simplemente haz clic en la pestaña “Detalles del duplicado” de la ventana inferior.

En el caso anterior, al hacer clic en una URL de la ventana superior, hay cuatro páginas que superan el umbral de similitud del 90%.

El Seo Spider también proporciona una vista previa del contenido casi duplicado en la pestaña “Detalles del duplicado” y permite una visión muy intuitiva de las partes textuales que difieren de las páginas examinadas.

  • 8. Exportación masiva de URL duplicadas

Tanto los duplicados exactos como los casi duplicados pueden exportarse en bloque.

> > Exportación masiva de contenido Duplicados exactos/Casi duplicados

  • 8. Exportación masiva de URL duplicadas

Tanto los duplicados exactos como los casi duplicados pueden exportarse en bloque.

> > Exportación masiva de contenido Duplicados exactos/Casi duplicados

esportazione delle pagine considerate duplicate

Fichas relacionadas: Contenido | Barra lateral | Informe

Vídeo de Análisis de Contenido Duplicado

Canibalización de consultas

Ficha Seo Spider