Episodio 3. Sitemap.xml

Hola, bienvenidos y bienvenidas a SEO para WordPress, el podcast para conocer a fondo el mundo del SEO, en el gestor de contenidos más usado de internet.


La semana pasada abordamos el robots.txt que es un clásico esencial del mundo del rastreo.

Esta semana veremos mejor el sitemap.xml. Mapa de sitio, pero ojo, no debemos confundirlo con los antiguos mapas de sitio que se creaban antes en una página para guiar a los usuarios.

El mismo Google nos deja una definición muy clara:

Archivos en los que le proporcionamos a buscadores información sobre las páginas de tu sitio, los tipos de contenidos y las relaciones entre ellos.

Google

Resumiendo: Es un archivo que permite a buscadores leer y rastrear de forma más eficiente.

En 2006 buscando mejorar los procesos de rastreo de las webs, Google, Yahoo y Microsoft anunciaron el soporte para sitemaps.org una forma gratuita y libre que los webmaster podían usar para enviar información comprensible a los buscadores.

El protocolo fue creado en 2005 por Google y apoyada desde su comienzo por Yahoo. Home, ayudaba al webmaster y a los buscadores (ojo).

Sitemap creado con el plugin The SEO Framework

Me quiero parar un poco en esto de ser eficiente. La semana que viene les hablaré sobre el origen de Google, que tiene una historia muy interesante.

Yo no apuesto nunca en lotería, pero tengo mucha suerte en otros ámbitos, y el año pasado por un afortunado comentario, me gané un curso increíble en la web de referencia de WordPress en el mundo de habla hispana: Ayuda WordPress.

Para aprender de SEO, que mejor que con Fernando Tellado y su dilatada experiencia en la creación de contenidos de valor. En su curso hizo una reflexión que me quedó grabada a fuego, si quieres tener buen posicionamiento (en Google):

«No le hagas perder tiempo, ni dinero. Ahorrale trabajo «

Fernando Tellado

Un sitemap cumple esa función: ayudar a buscadores a entender toda tu web y su relación de páginas internas.

Teóricamente, si tienes bien enlazadas todas tus URLs no haría falta el sitemap, pero no está de más y es una herramienta muy útil. Es esencial en webs grandes.

Ollo ao piollo: Tener un sitemap NO es garantía de rastreo e indexación. Siempre será beneficioso, en ningún caso será negativo.

Puedes aportar información extra, como la fecha de ultima actualización.

Puedes crear sitemaps de contenidos específicos como imágenes y vídeos con información contextual de ese tipo de contenido como la duración, categoría, tipos de licencias de las imágenes, etc.

Sitemap XML de Jetpack

¿Qué tipos de formatos de sitemaps existen?

  1. XML, es el mas usado. La mayoría de plugins SEO utilizan este formato.
  2. RSS como los feeds que se crean de forma automática si tienes un blog (pero ojo, los feed no incluyen de forma automática todas las URLs, solo las últimas).
  3. MRSS, son específicos para vídeos, tienen una serie de etiquetas obligatorias como la imagen miniatura, titulo, descripción y otras recomendadas como la duración, la puntuación o el número de veces que se ha visto.
  4. TXT, lo podemos enviar como texto poniendo cada URL en una línea, con codificación del archivo UTF-8 y con extensión txt.

Directrices de los sitemaps

  1. URLs exactas a tu web (no mezclar versiones con www o sin www). Un poco de sentidiño, que refleje de forma exacta la estructura de tus URLs.
  2. Codificación UTF-8.
  3. Ningún sitemap debe contener más de 50.000 URLs ni un tamaño superior a los 50 MB sin comprimir.
  4. Usa las extensiones correctas en caso de imágenes, vídeos y noticias que tienen sus propias especificaciones.
  5. Deja tu sitemap en la raíz del sitio. Todos los plugins SEO lo hacen de esta forma.
  6. Agrega y prueba tu sitemap directamente en Search Console de Google. En Bing también puedes agregarlo a su herramienta de webmasters. Los buscadores te indicarán si hay un problema con el archivo. No cuesta nada hacer esa revisión.

¿Cuál es el problema con los sitemaps?

La mala configuración de los plugins SEO.

Eso genera que hayan muchas URLs que NO se deben indexar y que aparecen en el archivo, listos para ser indexados por buscadores.

¿Algunos ejemplos?

Testimonios, algunos temas generan custom post types como los testimonios y suele ser información poco relevante para buscadores y no está enfocado en tus contenidos. Mirar esta captura

Sitemap de Yoast SEO
Sitemap creado por Yoast con una mala configuración por tipo de contenido

Si se fijan, en este ejemplo, la web está mandando a indexar contenido innecesario como el portafolio, o incluso las diapositivas (slides) de un tipo de carrousel que implementa el tema instalado en esta web.

Obviamente son contenidos no relevantes para buscadores que NO deben estar en el sitemap y que deberían de tener un meta robots no index en las cabeceras de cada una de estas secciones.

Otro caso típico, el de los medios e imágenes (en la captura lo ven como attachment-sitemap.xml) que una mala configuración puede hacer que se genere una URL para ese medio, con lo que se produce el típico «thin content» o contenido débil que genera contenido duplicado para buscadores.

Recordar la máxima de Fernando Tellado que les comenté al inicio del podcast: «No le hagas perder tiempo ni dinero, ahorrale trabajo».

¿Para qué quieres que vaya un buscador a esa URL? ¿Aporta algo nuevo, valioso, único? Mejor hacerle un «Yipicake» y voilá. 😉

Para controlar bien los sitemaps, debemos controlar bien las opciones de configuración del plugin SEO que escojamos.

Es un archivo que dependerá de la configuración del plugin que hagamos. Por poner un ejemplo: si tu web es sencilla y no tiene blog, ¿para qué quieres indexar las entradas? Elimina esa opción en tu plugin de preferencia y listo.

Si tiene un solo autor, ¿para qué quieres que tenga un sitemap de autores?

Si tienes dudas me las puedes hacer llegar a hola@seoparawp.com y trataré de responderlas a través del podcast.

Gracias por acompañarme. Si te gusta, comparte, me ayudará a llegar a más personas.

¡Larga vida y prosperidad a WordPress!

Enlaces, recursos finales y plugins:

Plugins:

Muchas gracias a Unsplash por la excelente fotografía que acompaña este podcast. Photo by Capturing the human heart. on Unsplash

2 comentarios en “Episodio 3. Sitemap.xml”

Deja un comentario

  Acepto la política de privacidad

Información sobre protección de datos

  • Responsable: Wajari Velásquez | SEO para WP
  • Fin del tratamiento: Controlar el spam, gestión de comentarios
  • Legitimación: Tu consentimiento
  • Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  • Derechos: Acceso, rectificación, portabilidad, olvido.
  • Contacto: hola@seoparawp.com.
  • Información adicional: Más información en nuestra política de privacidad.

SEO para WordPress

¿Sigues este podcast?

Suscríbete y recibirás nuestro podcast semanal con novedades y noticias de SEO

Aviso legal

Felicidades. Te has suscrito y recibirás un mail para confirmar tus datos. Bienvenid@

Pin It on Pinterest