Auditoría de Rastreo y Arquitectura

Extractor de Sitemaps XML

Bypassea restricciones CORS y cortafuegos. Extrae, unifica y audita sitemaps anidados de forma recursiva simulando Googlebot.

Audita la indexabilidad de tu arquitectura web

Introduce la URL de tu sitemap XML o sitemap index. Mi servidor descargará recursivamente la estructura, clasificará los tipos de URLs, auditará métricas técnicas y te permitirá exportarlas listas para Screaming Frog, GSC o Excel.

1. Indicar origen del Sitemap

Total URLs Únicas 0 1 sitemap procesado

URLs Críticas (>75 chars) 0 Riesgo de truncado en Google SERPs

Actualizado en 30 días 0 0% del total de contenidos

Longitud Media URL 0 Caracteres de media

2. Filtrar, Inspeccionar y Exportar

URL	Última Modif.	Imágenes	Sitemap de Origen

Mostrando 0 de 0 URLs

Fundamentos del SEO de Trinchera

Errores críticos en Sitemaps XML que destrozan tu Crawl Budget

URLs sin estatus 200 OK

El error básico número uno es inyectar en el sitemap URLs que devuelven redirecciones (301, 302) o errores (404, 500). El sitemap es una carta de recomendación de indexación directa a Googlebot.

Si fuerzas al bot a rastrear URLs que redirigen, estás quemando su límite de rastreo diario (Crawl Budget) en procesar redirecciones inútiles en lugar de indexar nuevos contenidos de calidad.

Directivas 'noindex' contradictorias

Si una URL tiene la cabecera o metaetiqueta `noindex`, **nunca** debe incluirse en el sitemap XML. Esto confunde al robot de indexación, provocando avisos de indexación contradictorios en Google Search Console y retrasando la desindexación de las páginas que realmente deseas ocultar.

Sitemaps inflados y desactualizados

Un sitemap que pesa más de 50MB o que supera las 50,000 URLs viola las especificaciones de Schema.org. Utiliza Sitemap Indexes para segmentar tus contenidos lógicamente (páginas, posts, categorías) y mantén la etiqueta `` actualizada de forma sincrónica con tu base de datos para notificar solo los cambios reales.

Otras herramientas SEO técnicas gratuitas:

Analizador de Páginas Huérfanas Analizador de Logs HTTP Calculadora de Impacto WPO Auditor de Cookies RGPD Generador de Schema Local Extractor de Entidades Tester de Reglas .htaccess Auditor SEO Local GMB Analizador SEO Generador GSC PDF Editor de Metadatos EXIF

Preguntas Frecuentes (FAQ)

¿Por qué mi sitemap dice tener 500 URLs pero Google solo indexa 100?

Existen multitud de factores: desde que el sitemap contenga URLs bloqueadas por robots.txt, canonicalizadas hacia otra variante, marcadas como noindex, o simplemente que tu web no tenga la autoridad suficiente (Crawl Demand) para que Google procese todas tus páginas profundas.

¿Cuántas URLs o Megabytes puede tener un sitemap como máximo?

El protocolo oficial establece un límite estricto de 50.000 URLs (etiquetas <loc>) y un peso máximo de 50 MB por archivo. Si superas estos umbrales, debes dividir tu mapa web mediante un Sitemap Index.

¿Es necesario enviar el Sitemap todos los días a Search Console?

No. Solo debes enviarlo la primera vez. A partir de ahí, Googlebot leerá automáticamente la etiqueta <lastmod> para descubrir nuevo contenido. Puedes acelerar el proceso declarando la ruta de tu sitemap dentro de tu archivo robots.txt.

¿Debería incluir en el Sitemap páginas de políticas, avisos legales y paginaciones?

Generalmente no. El Sitemap XML es tu escaparate "VIP" para Google. Solo debe contener URLs canónicas, con código de estado 200 y que aporten valor comercial o de captación. Evita malgastar Crawl Budget en páginas huérfanas de utilidad orgánica.

¿Tienes problemas de rastreo o indexación?

Audito tu archivo robots.txt, la lógica del sitemap, códigos de estado HTTP y arquitecturas web complejas para potenciar tu posicionamiento orgánico real.

Auditar mi rastreo técnico WhatsApp