Extractor de Sitemaps XML
Bypassea restricciones CORS y cortafuegos. Extrae, unifica y audita sitemaps anidados de forma recursiva simulando Googlebot.
Audita la indexabilidad de tu arquitectura web
Introduce la URL de tu sitemap XML o sitemap index. Mi servidor descargará recursivamente la estructura, clasificará los tipos de URLs, auditará métricas técnicas y te permitirá exportarlas listas para Screaming Frog, GSC o Excel.
1. Indicar origen del Sitemap
Errores críticos en Sitemaps XML que destrozan tu Crawl Budget
URLs sin estatus 200 OK
El error básico número uno es inyectar en el sitemap URLs que devuelven redirecciones (301, 302) o errores (404, 500). El sitemap es una carta de recomendación de indexación directa a Googlebot.
Si fuerzas al bot a rastrear URLs que redirigen, estás quemando su límite de rastreo diario (Crawl Budget) en procesar redirecciones inútiles en lugar de indexar nuevos contenidos de calidad.
Directivas 'noindex' contradictorias
Si una URL tiene la cabecera o metaetiqueta `noindex`, **nunca** debe incluirse en el sitemap XML. Esto confunde al robot de indexación, provocando avisos de indexación contradictorios en Google Search Console y retrasando la desindexación de las páginas que realmente deseas ocultar.
Sitemaps inflados y desactualizados
Un sitemap que pesa más de 50MB o que supera las 50,000 URLs viola las especificaciones de Schema.org. Utiliza Sitemap Indexes para segmentar tus contenidos lógicamente (páginas, posts, categorías) y mantén la etiqueta `
¿Tienes problemas de rastreo o indexación?
Audito tu archivo robots.txt, la lógica del sitemap, códigos de estado HTTP y arquitecturas web complejas para potenciar tu posicionamiento orgánico real.