Sitemaps: todo lo que debes saber
Como su nombre indica, un sitemap es el mapa de una web y representa cómo está estructurada, incluyendo las carpetas y subpáginas que la componen. Sin embargo, en la actualidad los webmasters no necesariamente utilizan los mapas del sitio para facilitar la navegación a los visitantes, pues los usuarios ya cuentan en las web con otros elementos que hacen el proceso más sencillo e intuitivo. Aun así, estos archivos esquematizados no han quedado en absoluto obsoletos. Pero ¿para qué sirven realmente y cuántos tipos existen?
¿Qué es un sitemap?
Un sitemap (también conocido como mapa del sitio web, mapa del sitio o mapa web) es un archivo que presenta la estructura jerarquizada de todas las subpáginas que componen una web, es decir, proporciona una visión de conjunto de esta. Imaginemos por un momento la estructura de una web simple: cada uno de los documentos HTML está guardado en carpetas diferentes y se conectan entre sí mediante hiperenlaces. Todo ello se deposita en el espacio web. En el mapa del sitio las páginas se indican junto a sus URL correspondientes.
En los primeros días de la World Wide Web, el mapa web servía para facilitar la navegación. En muchas ocasiones se intercalaban como un marco adicional al contenido principal, permitiendo a los usuarios pasar de una página a otra sin tener que clicar en los hiperenlaces individuales. Pero con el tiempo, la navegación se ha vuelto mucho más elegante, aunque no por ello los sitemaps han perdido su legitimidad, y es que, además de aumentar la usabilidad de la web, permiten a los buscadores acceder a su contenido.
Comparativa: XML vs. HTML
Se pueden distinguir principalmente dos tipos diferentes de sitemaps dependiendo de si presentan un formato XML o HTML. Se recurrirá a los sitemaps HTML si se desea que los usuarios tengan acceso a los mapas web. En este caso, el mapa del sitio constituirá un documento más de la web y, como tal, podrá integrarse en la estructura web igual que cualquier otra página HTML. Por su parte, los sitemaps XML están pensados para los buscadores. XML, al igual que HTML, es un lenguaje de marcado, aunque con muchas más funciones.
¿Cuál de ellos habría que utilizar? Lo cierto es que ambos presentan ventajas e inconvenientes. Un archivo de navegación en formato HTML es de utilidad para los visitantes, pues los enlaces les permiten orientarse en una web cuando buscan algún resultado. El mapa del sitio acompaña a otros componentes de la web, por ejemplo, la función de búsqueda o la barra de navegación, pensados todos ellos para mejorar la experiencia del usuario. Por tanto, se trata de un elemento adicional que eleva la usabilidad de la web. Eso sí, a día de hoy ya prácticamente no se incluyen como marco, sino que se ponen a disposición del usuario mediante un enlace en el encabezado o el pie de la página.
Un mapa web escrito en lenguaje XML puede entregarse a la Google Search Console con el objetivo de dar al buscador un mayor entendimiento de toda la web. Además, con este lenguaje es posible crear sitemaps de vídeos y es que a Google y al resto de buscadores les resulta muy difícil leer el contenido de los archivos de vídeo, motivo por el que dependen de la información indicada en los metadatos. Si se quiere que Google integre en la búsqueda de vídeos todos los vídeos que están incluidos en la propia web, es necesario crear un sitemap de vídeo. Este se trata de un archivo XML con información de cada uno de los vídeos de la página: el título y la descripción de los archivos de vídeo, el URL de la subpágina en la que se encuentra, el enlace a las miniaturas y la ubicación del reproductor de vídeo utilizado. Con las imágenes se sigue el mismo proceso.
Como webmaster no es obligatorio decantarse por un formato u otro, pues es posible trabajar con ambos al mismo tiempo, ofreciendo así los mejores resultados tanto para los usuarios como para las arañas de los buscadores. Además, aunque el sitemap XML está especialmente pensado para los motores de búsqueda, los buscadores recurren también a los mapas web de HTML, pues presentan a las arañas todas las páginas de una web.
En el siguiente artículo de la Digital Guide puedes obtener más información sobre lo que es capaz de hacer un sitemap XML.
Los sitemaps y SEO
Los sitemaps desempeñan un papel muy importante en la optimización para los motores de búsqueda. ¿El motivo? Los buscadores permiten que los programas (arañas o rastreadores web) examinen Internet para poder indexarlo y organizarlo de la mejor forma posible. Cuando este tipo de programa rastrea una web, sigue los enlaces internos para conocer el contenido, pero no se garantiza que sea capaz de llegar a cada una de las subpáginas, más aún si se trata de una web muy extensa. Los sitemaps XML o HTML presentan a la araña del buscador el índice de una web con todas las subpáginas, facilitando la indexación.
Las webs que no tienen una estructura con páginas correctamente enlazadas impiden a la araña de Google acceder a todo su contenido. Por ello, un sitemap que contenga los enlaces de cada una de las subpáginas es de gran utilidad en estos casos. Aun así, Google no garantiza que la araña tenga en cuenta cada subpágina, aunque la probabilidad de que lo haga es sin duda mucho mayor. Esto ocurre también cuando una web es relativamente nueva y aún no hay enlaces externos que hagan referencia a ella.
Un sitemap XML ofrece a los buscadores información adicional de la página en cuestión: la fecha de creación, la frecuencia con la que se edita, la relación con el resto de páginas y la relevancia del contenido con respecto a la web completa.
Aunque normalmente se indica que un sitemap HTML está orientado hacia los usuarios y su homólogo en formato XML a los buscadores, ambos son importantes en el posicionamiento en los buscadores. Los sitemaps en formato HTML también influyen en el ranking de Google, pues, cuando se rastrea la web, también se tienen en cuenta estos documentos. Sin contar que, para establecer la posición de una web en los resultados de Google, el buscador valora su usabilidad y, como ya se ha dicho, los mapas de sitio en HTML son un elemento que facilita la navegación por la web y, por tanto, aumenta su valor.
Cómo crear un sitemap
La creación del mapa de una web es muy sencilla, más si se utiliza un generador de sitemaps. En función del formato que se desea aplicar, el procedimiento varía. Los sitemaps en HTML son, en principio, muy fáciles de crear, pues solo requiere que el usuario tenga algunos conocimientos básicos de HTML, aunque son indispensables aquellos relativos a cómo marcar correctamente los enlaces. Para ello, basta con utilizar el atributo href, el cual permite crear un listado de enlaces. No obstante, en la práctica, los webmasters suelen hacer un esfuerzo mayor para crear sitemaps y, por ejemplo, adaptan su diseño al del resto de la web.
<li class="lpage"><a href="http://one-test.website/" title="Theme Preview – Previewing Another WordPress Blog">Theme Preview – Previewing Another WordPress Blog</a></li>
Theme Preview – Previewing Another WordPress Blog
<li class="lpage"><a href="http://one-test.website/about-us" title="About us – Theme Preview">About us – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/our-projects" title="Our Projects – Theme Preview">Our Projects – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/sample-page" title="Sample Page – Theme Preview">Sample Page – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/shop" title="Products – Theme Preview">Products – Theme Preview</a></li>
La creación de los archivos en formato XML es algo más compleja: aquí se inicia el mapa del sitio con una etiqueta <urlset>, donde se indica el protocolo estándar. A continuación, se incluyen tantas etiquetas <url> como enlaces se quieran escribir en el sitemap, si bien el enlace a la subpágina en sí mismo se encierra en una etiqueta <loc>. Mientras que estos datos son obligatorios, se pueden incluir de forma opcional las siguientes etiquetas: <changefreq> (frecuencia de edición), <lastmode> (fecha del último cambio) o <priority> (importancia de la página).
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
<url></url>
<loc>http://one-test.website/</loc>
<lastmod>2018-03-23T14:32:21+00:00</lastmod>
<priority>1.00</priority>
<url></url>
<loc>http://one-test.website/about-us</loc>
<lastmod>2018-03-23T14:32:21+00:00</lastmod>
<priority>0.80</priority>
Quien quiera que el proceso sea aún más sencillo, puede evitar escribir el mapa del sitio a mano utilizando un generador de sitemaps. Tras introducir el URL principal de la web, el generador de sitemaps rastrea la web completa y crea un índice con todas las páginas que la componen. Estos servicios web están disponibles tanto para HTML como para XML e incluso algunos de ellos son capaces de crear directamente distintos tipos de mapas web. En algunos sistemas de gestión de contenido como WordPress los usuarios pueden recurrir a plugins específicos, pensados para crear los sitemaps de esa web.
Recomendaciones de Google para sitemaps
Aunque la apariencia del documento de navegación puede determinarse con bastante libertad, Google establece algunas condiciones para los sitemaps que hay que respetar si con ellos se pretende mejorar el ranking de búsqueda de la web. Un mapa web tiene que estar codificado en UTF-8, no ha de contener más de 50 000 URL y no debe superar los 50 MB. Este límite de tamaño es aplicable a los archivos no comprimidos, por lo que si estos se pasan de los MB establecidos, se puede optar por la compresión para reducir el tamaño.
En caso de que se trate de una web muy extensa, Google propone crear varios mapas de sitio. Al finalizar, se crea un archivo de índice que enlace a todos los sitemaps y pueda mostrarse a los buscadores.
No es obligatorio incluir todas las subpáginas de una web en el sitemap. En el caso de aquellas páginas a las que se puede acceder a través de diferentes URL, es posible indicar solo uno de ellos (por ejemplo, aquellas que tienen el mismo contenido pero han sido diseñadas para distintos dispositivos). Se indican solo las llamadas páginas canónicas con las que Google debe trabajar.
Finalmente, existen dos posibilidades para que Google conozca el sitemap. Por un lado, se puede cargar el archivo directamente en la Google Console, y, por el otro, se puede añadir un enlace al archivo en el robots.txt. Hay que tener en cuenta que el archivo de texto está concretamente diseñado para buscadores y las arañas al rastrear acceden primero a él. Con un enlace al mapa del sitio en el servidor, el rastreador sabe dónde tiene que buscar.