Episodio 24. La cobertura en Search Console (parte II)

EL SEO en la actualidad no se puede entender de forma completa sin pasar por Search Console, la herramienta básica de Google para entender cómo el buscador analiza y clasifica nuestra página web.

Hoy analizaremos uno de sus informes más importantes: El informe de cobertura que además, suele ser el que nos envía más notificaciones por mail.

Una auténtica joya que debemos analizar a fondo para mejorar nuestro posicionamiento en buscadores.



Antes de empezar el programa, y como siempre, un breve repaso a los eventos de WP, SEO, networking, tecnología, emprendimiento y desarrollo.

Esta semana viene marcada por el Maker Faire Galicia que se celebra en el Museo de la Cidade da Cultura, en Santiago de Compostela. Charlas, talleres, artesanía, de todo para la feria de inventores por excelencia. Si quieres participar, están hasta el 07 de julio.

Nosotros el viernes pasado en nuestra querida WP Pontevedra la pasamos genial en la charla de Jesús Amieiro y CiudadanoB pudo anunciar oficialmente nuestra WordCamp Pontevedra, así que ya puedes comprar cuando quieras tu entrada.

Y si te animas a dar una charla, ya está abierta la convocatoria, te puedo prometer que es algo único, si tienes algo que contar, no te lo pienses, te puede cambiar tu vida desde muchos punto de vista, sé que suena exagerado, pero no lo es, es muy recomendado, te dará mucha visibilidad y con tu colaboración, haces que el proyecto y la comunidad crezca, así que ya sabes.

A controlar esos nervios y muéstrale al mundo tu trabajo, solo por vivir la experiencia, ya vale la pena.

Ahora que es verano, bajan un poco la cantidad de eventos, y aunque no está anunciada aún, la meetup de verano (julio) será el viernes 19 aunque no tenemos muy claro el sitio. Como dice la famosa frase: «Estamos trabajando en ello». La próxima semana me imagino podremos comentarles más detalles.


Bueno, al lío. Hoy les traigo la segunda parte del episodio de Search Console. Para los que no escucharon la primera parte, no hace falta seguirlo en orden, pero sería lo ideal.

Como les comentaba, Search Console es la herramienta SEO por definición, ya que es la única forma de intercambiar información con Google y que el buscador nos informe del estado de salud de tu web, estado de indexación, fallos de seguridad o de usabilidad móvil, etc.

Quiero resaltar sobre este tema dos fantásticos recursos disponibles que les dejo:

  1. Un vídeo de Luis Villanueva que se titula: Entendiendo el índice de cobertura de Search Console. Buenísimo el vídeo, no tiene desperdicio y está muy bien explicado todo.
  2. Un artículo de Iñaki Huerta de cómo sacar partido a los informes de cobertura.

Yo les plasmo mi opinión y análisis y os dejo estos dos recursos que me parecen geniales, para que profundicen.

Muchas cosas están cambiando, tanto es así, que algún detalle que les conté en el primer episodio (y esto fue hace solo 5 semanas), como todo el tema de configuración de dominio preferido, Google publicó la semana pasada que ya no hace falta. Ellos ya lo pueden definir por si mismos, y que nosotros solo debemos cerciorarnos de tener la versión canonical correcta.

Les hablé del importante informe de rendimiento. Hoy profundizaremos en el segundo aspecto: La cobertura.

La verdad que la palabra en español no es muy afortunada, me lleva mi cabeza directo a frosting, o fondant de chocolate, a coberturas de tartas. Pero no se trata de eso obviamente.

Informe de cobertura de search console

Informe de cobertura de Search Console

Como dice el mismo Google, puedes ver en este informe el estado de indexación de todas las URLs.

Las encuentras agrupadas en 4 categorías:

  1. Error
  2. Válidas pero con advertencias
  3. Válidas
  4. Excluidas

Este es un informe muy importante ya que como siempre insisto con la frase de Tellado, «La clave del SEO es ahorrarle tiempo y dinero a Google», mandando a indexar solo en contenido necesario.

Si tuviéramos URLs con algún tipo de problema lo veríamos en la sección de errores, donde se plasman aquellas URLs que por la razón que sea, Google no es capaz de indexarlo bien. Hay que examinar cada caso y no olvidemos que el buscador también puede cometer errores.

Cuadro de errores de search console

Errores en rastreo e indexación

Si pulsas en la categoría de error, te saldrá un cuadro con más detalles. Puede deberse a errores del servidor, eso significa códigos 5xx (si tienes muchos de esos, buena señal para migrar a un hosting de calidad), o puede ser que tengas algún problema técnico en la web.

Problemas de rastreo pueden deberse a factores del mismo Google, u otros casos como por ejemplo, una URL bloqueada en el robots.txt pero que tenga un index en la cabecera, lo que sería una especie de contradicción; lo bueno de la nueva versión de la herramienta es que puedes validar este tipo de errores.

Si ves que la URL en cuestión no tiene problema, ni la estás bloqueando, puedes mandar a Google a validar otra vez y normalmente lo cerciora sin problema.

Analizando grosso modo el gráfico, como dice Iñaki, podemos ver las impresiones con las páginas excluidas y los errores, cosa que es muy útil para descubrir relaciones de causa y efecto entre indexación y visibilidad. Solo debes marcar la casilla de impresiones y ver si existe una correlación entre las variables mostradas.

Errores e impresiones en análisis de cobertura

Me he topado con cierta frecuencia, sobre todo en webs grandes el error de URL enviada con etiqueta noindex. Cuando reviso esos errores no tiene un noindex, así que debe tratarse de algún problema del mismo buscador.

En esos casos, con mandar a validar, debería de ser suficiente. Lo mismo con los errores de redirección. A veces puede ser un error real, o no.

Herramienta inspección URL

Si pulsas sobre el cuadro te saldrá la opción de inspeccionar URL, debería de ser tu primer paso, segundo paso, probar el bloqueo de robots.txt y si en ambos caso está todo bien, tienes un botón de «validar corrección» que con hacerlo una vez, es suficiente.

¿Qué otros errores podemos encontrar?

El famoso soft 404, o suavecito 404. ¿Qué tipo de error es?

Una página que informa al usuario que la página no existe (como un 404) pero en la cabecera está enviando un código 200 (de petición correcta).

Esto obviamente no es deseable, el usuario ve el error, pero esto también debería de verlo el buscador, para eso existe el 404 (pagina no encontrada) o 410 (página no disponible), y ofrecer al usuario una alternativa o un buscador interno para ubicar la información que desee.

Si tienes un suavecito 404 deberías de revisar bien qué puede estar pasando en tu web, igual tienes redirecciones masivas, etc.

Utiliza el inspector de Search Console y haz distintas pruebas de la URL en distintos navegadores. Trata de determinar si estás haciendo demasiadas solicitudes desde ese contenido, o si algún tipo de contenido no se está ejecutando de forma correcta.

Obviamente un 404 se debe eliminar de este listado. Cierto nivel de errores es habitual en toda web, y los buscadores esperan encontrarlos, pero es importante disminuir al máximo estos fallos, y mucho más si se trata de una URL importante o que recibiéramos un link en la misma.

Creamos su redirección y le avisamos a Search Console del cambio. ¿No sabes cómo hacer una redirección? Tranquilidad, que ya lo pensamos desde el principio en SEO para WP ya tenemos un capítulo muy chulo dedicado a las redirecciones en WordPress.

En el caso de las válidas también debemos revisar e inspeccionar si los números nos coinciden, no de forma exacta, pero al menos, debería de haber una coherencia entre tu contenido real y el indexado por el buscador.

Un buen nivel de URLs válidas, es también indicador que la web es accesible para el buscador y que no tiene problema agregando las páginas a su índice.

NOTA: Algo que no he mencionado y es clave de este informe. Una de las principales ventajas que podemos encontrar en el nuevo search console es que podemos distinguir los datos entre:

  1. Todas las páginas conocidas, eso significa el rastreo libre de Google por la web
  2. Las páginas enviadas, que normalmente lo hacemos a través del sitemap
  3. Los distintos sitemaps enviados
Informe de URLs excluidas del índice de Google

Informe de excluidas

Gracias a esta nueva versión de la herramienta por fin podemos entender a fondo cómo interpreta Google nuestros contenidos y comprendemos mejor, qué URLs son excluidas del índice y por qué.

Dentro de las excluidas tenemos varias posibilidades, las enumero para analizar cada caso:

(1) Excluida por una etiqueta noindex

De todos los avisos, este es el que fuimos nosotros, quienes decidimos que fuera así.

Si tenemos una buena estrategia de indexación, habremos mandado a excluir del índice mucho contenido irrelevante para el buscador, haciendo uso de la etiqueta noindex en la cabecera de la web.

(2) Páginas con redirecciones

Mas del mismo caso anterior, se trata de URLs que hemos creado redirecciones.

Lo que debemos revisar en este punto es, si tenemos enlaces internos a una redirección, deberíamos de sustituirlos por el link final y listo.

(3) Anomalías en el rastreo

Esto sucede cuando se ha producido una anomalía sin determinar al obtener la URL, lo que podría implicar un código de respuesta 4xx o 5xx.

Debemos revisar ese listado y ver si son errores normales o hay alguna sección de nuestra web que se ve afectada por estas anomalías.

(4) Página alternativa con etiqueta canónica adecuada

Si no sabes lo que es la canónica, te recomiendo vayas al capítulo de meta robots donde aclaro todos estos aspectos.

Este tipo de URL excluida lo marcamos nosotros con la etiqueta canónica, así que es, en principio, una exclusión creada por nosotros mismos.

(5) Duplicada: Google ha elegido una versión canónica diferente a la del usuario

Como dice el mismo Google:

«Se ha indicado que esta página es la canónica de un conjunto de páginas, pero Google considera que debería ser otra».

Google Search Console

En esos casos es muy positivo inspeccionar la URL con la herramienta y determinar la razón o por qué Google entiende esto.

En muchos casos puede tratarse de un error y podremos simplemente crear una redirección.

(6) Bloqueada por robots.txt

Pues eso, no necesita mucha explicación. Si es positivo revisar el listado y recordar que la mejor manera de controlar la indexación es con la meta etiqueta no index. Pero en principio no es un listado que nos afecte mucho.

(7) Rastreada: actualmente sin indexar

En este cajón suele enviar Google todo contenido que considera es thin content o contenido débil. Vamos que no sigue las directrices de calidad de Google.

También podemos encontrar URLs con poca autoridad (que apenas reciben enlaces), formatos de archivos que no supo clasificar bien el buscador, etc.

Es muy importante revisar este listado de excluidas y revisar qué puede estar pasando o si existe alguna sección relevante de nuestra web en este cajón desastre.

Es muy útil que analicemos la cobertura de excluidas haciendo el filtro de las enviadas por nosotros mismos. ¿Por qué?

Porque son URLs que en principio tenemos una clara intención de posicionamiento, está plasmada en el sitemap y debemos analizar por qué el buscador decide no incluirlas en el indice.

¿Chulo no? Un par de detalles que no he mencionado.

Si te fijas, en la parte de arriba del informe de cobertura tienes el rastreador principal, o user-agent específico de googlebot que analiza tus datos. Puede ser el de escritorio o el de móvil.

Si tu web está más centrada en dispositivos móviles la mayoría de rastreos se hará desde ese agente y solo una parte desde ordenadores. Y lo contrario puede suceder también.

De esto se trata el SEO en la actualidad. De analizar los datos, de ir mejorando poco a poco los rastreos e indexaciones, de eliminar 404, de eliminar bucles de redireccionamientos, de mejorar los enlazados internos, y un largo etc.

Por ello Search Console es clave para ir mejorando todos estos procesos. Iremos viendo capítulo a capítulo pequeños consejos y análisis que nos ayudan a mejorar nuestras webs de forma continua.

Si te gustó este podcast, para poder llegar a más gente, te agradezco que lo compartas, me ayudará a crecer, solo pulsa me gusta en tu aplicación de podcast favorita, deja una valoración en itunes, ivoox.

Compártelo en redes y si quieres, suscríbete al boletín, lo hago manualmente y con mucho cariño cada semana.

Nos vemos en el próximo episodio que vuelvo a retomar al plugin más famoso de SEO, pero esta vez, me meto de lleno en su análisis más famoso y polémico: el análisis SEO y de legibilidad, y con eso serían ya 4 episodios dedicado a Yoast.

Larga vida y prosperidad a WordPress. ¡Hasta loguiño!

Muchas gracias a Joseph Gonzalez de Unsplash por la fantástica foto que utilicé para la imagen destacada.

2 comentarios en «Episodio 24. La cobertura en Search Console (parte II)»

  1. Saludos, excelente articulo.
    La nueva Search Console esta volviedo loco a medio mundo.
    Te consulto lo siguiente:
    1 – Cobertura: Rastreada: actualmente sin indexar – Fuente: Smartphones
    Estado: Excluidas – Paginas afectadas 47 – Todas las paginas son del Feed
    2 – Excluida por una etiqueta «noindex» – Fuente: Smartphones – Todas son categorias

    Esto es un problema?
    Hay que hacer algo al respecto?

    Gracias

    Responder
    • Carlos, me alegra que te haya gustado el post. Disculpar mi retraso en contestarte.

      Un caso muy interesante y ahora entiendo porqué dices que está volviendo locos a todos 😉

      Ambos casos que comentas, si te entendí bien, no deben preocuparte en lo más mínimo. Cada uno:

      (1) URLs rastreadas sin indexar y que forman parte del feed es lo normal, no son contenidos que se indexan.
      (2) El segundo caso, si debes analizar si realmente tienen un noindex, pues es lo que quieres: que esas categorías no vayan al índice de Google. Por lo tanto no debes hacer nada.

      En esta sección a veces se pueden colar partes de tu web que quieres que se indexen, pero son excluidas; es en esos casos donde debes tomar acciones y forzar su indexación.

      Espero haber contestado tu consulta y si te quedó alguna pregunta, un placer contestarte por aquí, o por mail, como quieras. 🙂

      Un abrazo y mucha suerte en tus proyectos,

      Responder

Deja un comentario

  Acepto la política de privacidad

Información sobre protección de datos

  • Responsable: Wajari Velásquez | SEO para WP
  • Fin del tratamiento: Controlar el spam, gestión de comentarios
  • Legitimación: Tu consentimiento
  • Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  • Derechos: Acceso, rectificación, portabilidad, olvido.
  • Contacto: hola@seoparawp.com.
  • Información adicional: Más información en nuestra política de privacidad.

 

SEO para WordPress

¿Sigues este podcast?

Suscríbete y recibirás nuestro podcast semanal con novedades y noticias de SEO

Aviso legal

Felicidades. Te has suscrito y recibirás un mail para confirmar tus datos. Bienvenid@

Pin It on Pinterest