Raspado de código fuente
El Seo Spider te permite comprobar la presencia de cualquier elemento contenido en el código fuente de las páginas de un sitio web mediante la funcionalidad «Búsqueda personalizada». Por defecto, el sistema busca HTML sin procesar, mientras que si cambias al modo de escaneo «Javascript renderizado» también podrás extraer los datos renderizados. La herramienta te permite configurar hasta 100 búsquedas personalizadas que devuelven URL que contienen o no la entrada buscada.
Para utilizar la funcionalidad «Búsqueda personalizada», sólo tienes que hacer clic en el botón «Añadir» de la pantalla, dar un nombre al filtro, elegir la opción «Contiene» o «No contiene», elegir el tipo de búsqueda entre texto o RegEX, introducir la entrada en la que se va a buscar y definir dónde buscar (html, texto de la página, un elemento concreto, XPath, etc.).
En el ejemplo siguiente, hemos supuesto una búsqueda personalizada con dos objetivos:
- la identificación de productos agotados de un ecommerce mediante la búsqueda de «Agotado» en las páginas de detalle (Contiene).
- la definición de las páginas en las que falta el script Google Tag Manager (No contiene)
Para recoger los resultados, sólo tienes que dar «ok» y ejecutar el rastreo.
Una vez procesado el escaneado, los datos se rellenarán en tiempo real y se dividirán en columnas en la pestaña «Búsqueda personalizada».
Si lo deseas, puedes aislar una u otra «Búsqueda personalizada» utilizando el filtro desplegable situado a la izquierda de la ventana superior.
Para tu comodidad, también puedes consultar los mismos resultados desde el panel de la barra lateral, en «Búsqueda personalizada».
Para completar el análisis, puedes exportar los resultados haciendo clic directamente en el botón «Exportar» de la pestaña o utilizar la función «Exportación masiva» para obtener todos los enlaces entrantes de tu búsqueda personalizada.
Ahora que entiendes la versatilidad de la «Búsqueda Personalizada», te propongo algunas buenas prácticas que son muy útiles en las auditorías Seo del día a día.
Un primer uso muy interesante en el modo «Sólo texto» es detectar faltas de ortografía, acrónimos, etc. considerando el aspecto «sensible a mayúsculas y minúsculas» de las palabras (RegEX ya es «sensible a mayúsculas y minúsculas» por defecto) activando la opción correspondiente.
Otra aplicación de la «Búsqueda personalizada» en modo RegEX es la búsqueda de consultas específicas (coincidencia exacta). Esta investigación te permite descubrir posibles problemas de canibalización con palabras clave estratégicas en varias páginas de destino que podrían penalizar tu intención de búsqueda en Google.

La búsqueda anterior también puede ampliarse a más palabras utilizando la misma «Búsqueda personalizada» y dividiendo los RegEX individuales con el «|» (símbolo de tubería). Esta búsqueda permite evaluar la densidad de las consultas en el texto y evitar posibles penalizaciones por sobrecarga.

En el siguiente ejemplo, se buscaron las consultas «optimización para buscadores», «natural» y «gratis».
El resultado del escaneo muestra 5 instancias para la primera página (3 veces «posicionamiento en buscadores», 1 vez «natural» y 1 vez «gratuito»).
Opciones de la función de búsqueda personalizada
Cuando utilices la función «Búsqueda personalizada», dispones de 7 opciones para limitar el área de búsqueda:
- HTML: incluye todo el código HTML.
- Texto de la página: sólo tiene en cuenta el texto de la página web, pero se excluyen todos los elementos HTML.
- Texto de la página sin anclas: incluye el texto de las páginas web, excluyendo cualquier HTML o cualquier texto contenido dentro de las etiquetas de anclaje HTML (también conocidas como elementos A). Esto puede ser útil cuando busques palabras que también estén incluidas en el texto de los enlaces dentro de los menús.
- Cabecera HTML: la búsqueda se aislará en el html de la cabecera.
- HTML Body: la búsqueda examina los elementos de texto y html de la etiqueta html Body.
- XPath: te permite especificar un XPath para definir la posición en el HTML donde debe realizarse la búsqueda. Por ejemplo, si quieres limitar la encuesta sólo al texto contenido en los encabezamientos h3, puedes proporcionar //h3.
- Área de contenido: la búsqueda se realiza por defecto dentro del elemento html Cuerpo.
Por ejemplo, podríamos investigar si el nombre Rana Gritona siempre se ha escrito correctamente o tiene «Faltas de ortografía» en los artículos del blog. Concretamente, interrogamos a la Araña Seo para comprobar si el nombre de la empresa de la Herramienta Seo está escrito correctamente o tiene la letra minúscula al principio de la segunda palabra: «Rana gritona».












