El día 14 de septiembre de 2023 Google anunció un update a su sistema de Helpful Content o contenido útil. Esta actualización consiste en una mejora del clasificador o algoritmo de machine learning que distingue entre contenido útil y no útil, pero aparte de esto, el anuncio de Google introduce un par de novedades respecto a anteriores updates de este sistema:
- A partir de ahora, el contenido de terceros presente en un sitio puede influir en la valoración de contenido útil de ese sitio
- Google elimina de su guía de contenido útil el requisito de que el contenido esté escrito por personas
Hago un pequeño resumen de cómo ha evolucionado el sistema de contenido útil en su primer año de vida, y luego analizaré ambas novedades.
Breve cronología del sistema de contenido útil
El Helpful Content Update se anunció originalmente el 18 de agosto de 2022, y se lanzó oficialmente por primera vez entre el 25 de agosto y el 9 de septiembre de 2023.
En este primer momento, el HCU sólo afectaba a contenido en inglés, y sus efectos se redujeron a un porcentaje relativamente pequeño de webs en inglés, tal y como conté en un post el año pasado.
Google explicó que, tras el lanzamiento, el algoritmo de contenido útil estará activo, y que además harían progresivas actualizaciones, algunas de las cuales anunciarían y otras no (podéis leer todos los detalles del anuncio en este post).
La primera actualización de contenido útil anunciada oficialmente tuvo lugar en diciembre de 2022 (entre el 5 de diciembre de 2022 y el 12 de enero de 2023). Su novedad fue que ampliaba el ámbito del algoritmo a contenido en todos los idiomas, incluyendo por tanto el español).
Sistemas vs Updates. Aunque no es una actualización a la forma de funcionar los algoritmos en sí, desde noviembre de 2022 Google habla oficialmente de “sistemas” en lugar de algoritmos, como por ejemplo el “sistema de Helpful Content” en lugar del algoritmo de Helpful Content. Por tanto, cualquier actualización posterior a esta fecha es oficialmente una actualización al sistema de contenido útil. Todo ello, para enfatizar que lo que cambia no es una señal individual o específica, sino un sistema de señales que trabajan en conjunto.
Por último, el 14 de septiembre de 2023 se lanza un nuevo update al sistema de Helpful Content, con un “algoritmo de clasificación mejorado” y las dos novedades que detallo a continuación.
Contenido de terceros
La principal novedad destacada por Google al anunciar su nuevo update de contenido útil es la que tiene que ver con el contenido de terceros. El sistema de contenido útil ahora evalúa todo el contenido de terceros incluido en un sitio web, aunque esté alojado en subdominios o directorios concretos del sitio.
Aunque ya de primeras parecía claro que esto venía a causa del comportamiento de unos sitios concretos, un mensaje de Gary Illyes en Linkedin lo dejaba aún más claro:
(Hemos oído, y visto, que algunos sitios “alquilan” sus subdominios y a veces directorios a terceros, generalmente sin ninguna supervisión sobre el contenido que se publica en esos nuevos micrositios, que no tienen nada que ver con el sitio principal […] La única razón por la que los micro-sitios alquilan estos espacios es para manipular los resultados de búsqueda.
Gracias a los que nos habéis informado de esto, mandando abundantes ejemplos, e incluso a los que habéis blogueado sobre ello).
¿A qué sitios se refiere Illyes? Sobre todo a Outlook India, y otros similares.
El caso Outlook India y el “Parasite SEO”
De manera muy breve:
Outlook India es un medio indio que en el último año había crecido mucho en visibilidad en varios países (incluido EEUU) y que en la comunidad anglosajona de SEO de nichos se estaba usando mucho para colocar artículos pagados (a un precio relativamente asequible).
Estos artículos en general rankeaban muy bien (siempre dependiendo de otros factores como competencia de la keyword, calidad del contenido, etc). Todo esto era ya un secreto a voces en la comunidad SEO anglosajona, donde la técnica de apalancarse en la autoridad de dominio de un medio establecido para entrar en una SERP competida se conoce como «Parasite SEO».
Era obvio que Google tenía que intervenir, y el primer signo de que la marea había cambiado para Outlook India y otros sitios similares llegó hace días, con el Core Update de agosto.
Pero esto no ha sido todo por parte de Google, ya que su medida de hacer que el contenido creado por terceros puede influir sobre la puntuación general de contenido útil de un sitio, parece claramente dirigida a lidiar con lo que Outlook India y otros medios parecidos estaban haciendo.
Outlook India ha estado alojando estos artículos pagados en varios directorios concretos, como por ejemplo:
/outlook-spotlight
/business-spotlight
En estas páginas, el medio indicaba que «no se hacía responsable del contenido».
Outlook India no es el único sitio donde se ha abusado del llamado «Parasite SEO». Newsdirect tiene varios directorios en los que se colocan estas notas de prensa.
¿Por qué funcionaba (hasta ahora) el Parasite SEO?
Los medios establecidos y populares suelen tener una «autoridad» SEO alta, por los enlaces que han recibido a lo largo del tiempo y otras señales, que un blog creado hace medio año no puede replicar.
Ojo, lo que llamamos desde fuera DA, DR, etc son métricas de terceros, no de Google. Pero una autoridad de dominio alta suele corresponder con «facilidad» para rankear y visibilidad alta, siempre que el sitio esté activo y no haya sido afectado previamente por updates.
Es común que este tipo de sitios exploten su popularidad, vendiendo enlaces o apariciones pagadas en sus páginas. Esto no está «prohibido» como tal (aunque no es del todo ético, al ser publicidad encubierta), pero de cara a SEO lo importante es cómo lo trata Google.
Google indica desde 2005 que si vendes un link debes etiquetarlo como nofollow. Desde 2019, también podemos marcar los enlaces no editoriales como «sponsored», y si es un enlace puesto ahí por un tercero (por ej, en los comentarios o en un foro), puede marcarse como «ugc»
¿Todo esto por qué? Porque Google quiere mantener su grafo de enlaces libre de enlaces pagados o que son simplemente spam. Para ser efectivo como señal de ranking, es esencial que no pueda llegar cualquiera y pagar por un enlace con peso considerable dentro del sistema.
¿Y si marco los links con nofollow o sponsored, pero pago por aparecer en un medio, donde digo que mi producto es el mejor? Si esa página rankea, acción redonda para mí, ¿no? Sí, pero no tiene mucho sentido para Google usarlo para sus rankings.
Si buscas en Google «mejores aspiradoras de mano» y el primer resultado es un medio con una lista escrita por un afiliado, con el único fin de recomendar aspiradoras cuyas ventas reportan a ese afiliado una comisión… ¿Es esto útil para el usuario que hizo la búsqueda?
En suma, lo que estaban haciendo Newsdirect, Outlook India, etc. ya estaba en contra de las guidelines de Google, y aún así rankeaban.
Ahora, con el core update primero, y con un update específico a su sistema de contenido útil, ¿habrán dado con la tecla?
En teoría ahora deberíamos ver menos sitios que venden reseñas y enlaces a diestro y siniestro rankeando bien para casi todas sus keywords. Pero, en la práctica, quizá surja otro Outlook India, y el proceso se repita: el sitio rankea – se abusa de ello – Google lo corta.
El contenido útil ya no tiene por qué ser creado “por personas”
En agosto de 2022, una frase destacada en el anuncio de Google era que el Helpful Content buscaba premiar el contenido creado por y para personas.
Un año después, la parte de “por personas” ha desaparecido de su guía sobre el sistema de contenido útil, quedando sólo “para personas” (frente al contenido creado para buscadores).
¿Por qué ha hecho este cambio Google? Como todos sabemos, desde la aparición de ChatGPT se ha hecho mucho más común (y efectiva) la creación de contenido por medio de chatbots y APIs basadas en modelos de lenguaje.
El propio Google se ha unido a la carrera en el desarrollo y lanzamiento de estas herramientas, con Bard como chatbot IA, y una serie de LLMs o grandes modelos de lenguaje, que son la tecnología que forma la base de estas aplicaciones.
Como conté en mi post Qué opina Google sobre el contenido generado por IA, hacia mediados de 2022 Google empezó a moderar su postura respecto al contenido creado con este tipo de herramientas, que antes de eso era contraria, sin matices. Empezaron a aceptar el contenido generado de esta manera, siempre que el resultado sea algo de valor para el usuario.
Quitar el requisito “creado por personas” de la documentación del sistema de contenido útil es simplemente una confirmación definitiva de este cambio de postura. Según Google, el contenido generado por una IA puede ser útil, siempre que sea supervisado por una persona conocedora del tema y capaz de asegurar que el resultado cumple con los requisitos enumerados por Google en su página de ayuda para redactar contenido útil, fiable y centrado en las personas.
¿Es lo mismo contenido útil que contenido con experiencia de primera mano?
No. Hay temáticas en las que un contenido, para ser útil, requiere experiencia de primera mano por parte del autor (la primera E de EEAT), y otros casos en los que esto no es necesario.
Por ejemplo, si estoy leyendo reseñas de destinos turísticos para decidir a dónde viajar en mis vacaciones, apreciaré sobre todo que el autor demuestre conocer el destino y me dé una opinión personal de lo que le ha gustado y lo que no.
Por el contrario, si sólo quiero conocer un dato objetivo, como por ejemplo cuánto se tarda en llegar a un destino, o cuál es el aeropuerto más cercano a esa localidad, no necesitaré que quién escribe tenga experiencia de primera mano o que demuestre haber estado allí, siempre que me dé información veraz y en un formato adecuado.
Citando al propio Google, un contenido puede ser útil y fiable gracias a la experiencia que comparte su autor, y otro contenido puede serlo gracias a su conocimiento.