¿Que es un sitemap?
Definición en Wikipedia:
Un mapa de sitio web (o mapa de sitio o mapa web) es una lista de las páginas de un sitio web accesibles por parte de las arañas web y los usuarios. Puede ser tanto un documento en cualquier formato usado como herramienta de planificación para el diseño de una web como una página que lista las páginas de una web (ya realizada), organizadas comúnmente de forma jerárquica. Esto ayuda a los visitantes y a los bots de los motores de búsqueda a hallar las páginas de un sitio web.
Se trata de un mecanismo sencillo que pueden utilizar los webmasters para informar a los motores de búsqueda de las páginas que se pueden rastrear en sus sitios web, por lo que en algunas referencias se les denominan “índices de sitio web”.
En la actualidad los sitemaps son una herramienta imprescindible para la planificación SEO de un sitio o portal web, especialmente si las páginas del sitio están basadas en tecnologías como JavaScript ( incluyendo Mootools o JQuery) o Flash.
Como tantas otras tecnologías, tenemos que buscar su origen en Google. En este enlace teneis información específica sobre este tema. Data del 2005, así que sirve para comprender un poco más lo que representan para Google los sitemaps, pero, desde nuestro punto de vista, es más interesante suscribirse al RSS de noticias de Dirson. Lo podéis encontrar en este enlace.
Según dice Google en su página de ayuda “Acerca de los sitemaps“:
Los sitemaps le resultarán especialmente útiles en los siguientes casos:
- Su sitio incluye contenido dinámico.
- Su sitio contiene páginas que Googlebot no pueda localizar fácilmente durante el proceso de rastreo como, por ejemplo, las páginas que presentan AJAX o Flash enriquecido.
- Su sitio es nuevo y hay pocos enlaces que dirijan a él (Googlebot rastrea la Web siguiendo los enlaces de una página a otra; si los enlaces de su sitio no funcionan correctamente, podremos tener problemas para localizarlo).
- Su sitio dispone de un importante archivo de páginas de contenido que no están bien enlazadas entre ellas o que sencillamente no están enlazadas.
También puede utilizar un sitemap para proporcionarnos información adicional sobre sus páginas, como:
- La frecuencia con la que se modifican las páginas de su sitio. Por ejemplo, podría modificar la página de su producto diariamente, aunque recomendamos que actualice la página Acerca de mí solo una vez cada varios meses.
- La fecha en la que cada página se ha modificado por última vez.
- La importancia relativa de las páginas de su sitio. Por ejemplo, la página principal puede tener una importancia relativa de 1,0, las páginas de categorías pueden tener una importancia de 0,8 y las entradas de blog individuales o las páginas de productos, de 0,5. Esta clasificación de prioridades solo indica la importancia de una URL en particular en relación con otras URL de su sitio y no afecta a la clasificación de las páginas en los resultados de búsqueda
Se puede crear y enviar sitemaps generales o especializados para determinados tipos de contenido. En Google tienen estos enlaces con información sobre ellos:
- Sitemaps de noticias
- Sitemaps de vídeo
- Sitemaps de Code Code Search
- Sitemaps geográficos
- Sitemaps móviles
Tipos de sitemaps:
Actualmente se utilizan tres formatos para la creación de sitemaps: Archivos de texto, Feed y XML, incluyendo, los dos primeros, información más limitada de cara a la indexación de los motores de búsqueda. En este enlace tenéis información sobre estos.
El protocolo estándar para la implementación de sitemaps XML está definido en está página de sitemaps.org. En resumen consta de un conjunto de etiquetas y una serie de reglas para su construcción, como son:
- archivo debe estar codificado en UTF-8.
- Comenzar con una etiqueta de apertura <urlset> y terminar con una de cierre </urlset>
- Especificar el espacio de nombres (protocolo estándar) en la etiqueta urlset.
- Incluir una entrada <url> para cada dirección URL como una etiqueta XML principal.
- Incluir una entrada secundaria <loc> para cada etiqueta principal <url>.
En cualquier caso es muy importante que las direcciones URL que se incluyan se ajusten al estándar RFC-3986 para direcciones URI, al estándar RFC-3987 para direcciones IRI y al estándar XML.
Este es un ejemplo publicado en sitemap.org para el protocolo 0.9:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>En este enalce aparece un ejemplo con más URLs: http://www.sitemaps.org/es/protocol.php#sitemapXMLExample
Archivos de índice
Es posible proporcionar varios archivos de Sitemap, con las siguientes limitaciones:
- cada uno de ellos deberá contener un máximo de 50.000 direcciones URL
- no superar los 10 MB (10.485.760 bytes).
Es posible comprimir los archivos de Sitemap con gzip para reducir sus requisitos de ancho de banda, con la limitación de que el archivo comprimido no debe superar los 10 MB.
En el caso de utilizar varios archivos de Sitemaps, estos deben ir enumerados en un archivo de índice de Sitemap. Las restricciones para los archivos de índice son:
- no pueden contener más de 50.000 Sitemaps
- no deben superar los 10 MB.
El formato XML de un archivo de índice de Sitemap :
- Debe comenzar con una etiqueta de apertura <sitemapindex> y terminar con una de cierre </sitemapindex>.
- Debe incluir una entrada <sitemap> para cada Sitemap como una etiqueta XML principal.
- Debe incluir una entrada secundaria <loc> para cada etiqueta principal <sitemap>.
La etiqueta opcional <lastmod> también está disponible para archivos de índice de Sitemap.
Ubicación de los sitemaps en el servidor web
Este es, también, un tema importante la norma indica claramente las limitaciones. En la página citada desitemaps.org, nos ponen un ejemplo auto explicativo:
Un archivo de Sitemap ubicado en http://ejemplo.es/catalog/sitemap.xml puede incluir URL que empiecen por http://ejemplo.es/catalog/, pero no URL que empiecen por http://ejemplo.es/images/.
¿Cómo publicar los sitemaps?
Se puede enviar el sitemap directamente a un motor de búsqueda, por ejemplo:
- Para Google: desde las “Herramientas para Webmasters” después de haber creado una cuenta
- Para Yahoo: desde esta página (necesita registro)
- Para Ask: mediante el fichero robots.txt o HTTP (ver más adelante)
También se puede especificar la ubicación del Sitemap en el archivo robots.txt añadiendo una línea con los archivos:
Sitemap: http://www.example.com/sitemap-host1.xml Sitemap: http://www.example.com/sitemap-host2.xml
Otra forma es utilizando el protocolo HTTP mediante la sentencia:
<searchengine_URL>/ping?sitemap=sitemap_url
Por ejemplo, para Ask:
http://submissions.ask.com/ping?sitemap=http%3A//www.la URL de su sitemap aquí.xml
Un par de herramientas para la construcción de sitemaps
- Comercial
- Gratuita
- Xenu. Nuestra preferida, además rastrea el website en busca de enlaces rotos devolviendo un informe muy completo.

The Apuntes sobre sitemaps by AlmacenPlantillasWeb, unless otherwise expressly stated, is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Spain License.






muy buen post, y muy bien explicado. Un saludo