Afirmar que sabes cómo funciona Google ha sido siempre una verdad a medias. El buscador más utilizado del mundo se guarda muchos ases en la manga con su algoritmo, que se ha convertido prácticamente en el sistema más importante de Internet, ya que determina cómo vemos el contenido de la web —y, por lo tanto, qué páginas tendrán éxito y cuáles no—.

Ahora, una filtración masiva de documentos internos pertenecientes a la compañía de Mountain View puede que haya conseguido lo que tantos otros han intentado: revelar el misterio de cómo funciona el algoritmo de búsqueda de Google.

Si bien el gigante tecnológico se había mantenido hasta este momento en silencio con respecto a la posible brecha de seguridad, finalmente Google ha reconocido indirectamente la autenticidad de 2.500 documentos internos filtrados.

Qué hay en los miles de documentos internos de Google que se han filtrado

En concreto, la filtración describe qué datos recopila Google de páginas web, sitios y buscadores y ofrece pistas indirectas a los expertos en SEO sobre lo que parece importarle a la compañía —y, por tanto, los contenidos que se mostrarán más a los usuarios—.

La existencia del material filtrado fue descrita por primera vez por los expertos en optimización de motores de búsqueda (SEO) Rand Fishkin y Mike King, quienes publicaron análisis iniciales de los documentos y sus contenidos a principios de esta semana.

Algunos detalles de los documentos filtrados ponen en duda la exactitud de las declaraciones públicas de Google sobre cómo funciona la Búsqueda. “«Mentir» es duro, pero es la única palabra precisa que se puede utilizar aquí”, afirmaba King sobre el material analizado. “Si bien no necesariamente culpo a los representantes públicos de Google por proteger su información de propiedad exclusiva, sí discrepo de sus esfuerzos por desacreditar activamente a las personas en los mundos del marketing, la tecnología y el periodismo que han presentado descubrimientos reproducibles”, añadía.

Según King y Fishkin, parte de la información contenida en los documentos parece estar en conflicto con declaraciones públicas de representantes de Google. La compañía ha comentado en diferentes ocasiones cómo trabaja el algoritmo de su buscador y el modo en que pretende ofrecer el mejor resultado posible, a fin de cumplir con su política de transparencia con los usuarios.

Entre los temas que se pueden encontrar en los documentos filtrados hay información sobre qué tipo de datos recopila y utiliza Google, qué páginas destaca o cómo maneja pequeños sitios web.

5 descubrimientos clave de los documentos filtrados de Google

Según los investigadores, estos son los puntos más importantes que han encontrado en la filtración de Google:

  • Google parece utilizar diversas técnicas para filtrar los clics que no desea registrar en sus sistemas de clasificación, incluyendo únicamente aquellos que son de su interés. Además, monitorean la duración de los clics y las impresiones.
  • Google mantiene una lista de las URL más importantes y utiliza la cantidad de clics en las páginas de Chrome para determinar cuáles son las más populares.
  • Google introduce ciertos dominios en “consultas muy controvertidas o potencialmente peligrosas” relacionadas con viajes y política, lo que resulta en la presentación de información sesgada en los resultados de búsqueda.
  • Hay indicios de que las evaluaciones y datos generados por algunos evaluadores de la plataforma EWOK, que miden la calidad de los sitios web, podrían estar directamente implicados en el sistema de búsqueda de Google, “en lugar de ser simplemente un conjunto de entrenamiento para experimentos”.
  • Google utiliza datos de los clics para determinar cómo ponderar los enlaces en las clasificaciones (baja, media o alta calidad). Así, si un enlace no registra clics, se clasifica como de baja calidad y se ignora. En cambio, si recibe un alto volumen de clics desde dispositivos verificables, se clasifica como de alta calidad.

Google advierte contra el uso de estos documentos

Un portavoz de la empresa tecnológica ha hecho una declaración que pretende subrayar la dificultad de interpretar los datos publicados sin tener más conocimiento de ellos: “Advertimos contra hacer suposiciones inexactas sobre la Búsqueda basadas en información fuera de contexto, desactualizada o incompleta. Hemos compartido amplia información sobre cómo funciona la Búsqueda y los tipos de factores que pesan nuestros sistemas, al mismo tiempo que trabajamos para proteger la integridad de nuestros resultados contra la manipulación”.

Es decir, Google hace hincapié en que sería incorrecto suponer que esta filtración de datos es completa, totalmente relevante o incluso proporciona información actualizada sobre sus clasificaciones de búsqueda.

No obstante, lo que queda claro es que el pasado mes de marzo miles de documentos fueron publicados en Github por un bot automatizado y gracias a ello la comunidad SEO y los expertos se han podido asomar a cómo puede funcionar el algoritmo de clasificación de Google. No obstante, es bastante conocido el hecho de que la compañía cambia sus sistemas de clasificación cada cierto tiempo.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.