Google Leak : on nous aurait menti ?

Un debunkage en règle s’impose sur l’affaire des Google Leaks…

Car, oui, on vous a menti… mais sur la nature véritable de ces « fuites ».

Pour ceux qui vivent dans une grotte, voici un petit rappel sur l’affaire.

Deux personnalités bien connues du monde du SEO, Rand Fishkin (ex patron de Moz) et Michael King (CEO de Ipullrank) ont annoncé sur leurs blogs respectifs avoir découvert, grâce à un informateur, l’existence d’une API qui selon eux :

émane des équipes de Google Search
et prouve que Google ment sur certains sujets à propos de son algorithme depuis longtemps

Voici les deux articles :

https://sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/
https://ipullrank.com/google-algo-leak

Des documents dont la nature réelle n’est pas celle qui est présumée partout sur le net

La « source anonyme » ne l’est plus : il s’agit de Erfan Azimi, le patron d’une petite agence baptisée EA Digital, basée en Géorgie. Comment M. Azimi a découvert l’existence de ces documents ? C’est encore peu clair.

Par contre il a publié une vidéo, dans laquelle il explique ses motivations. Qui sont clairement de « révéler tous les mensonges de Google ». Et c’est donc lui qui a choisi de contacter Rand Fishkin (qui a quelques revanches à prendre sur les porte parole de Google, qui ont été sévères avec lui avec de nombreuses reprises) et Michael King. Bref deux personnes qui étaient très perméables à son discours, pour tenir des propos similaires depuis longtemps.

Mais du coup, cette « fuite » n’émane pas du tout d’un lanceur d’alerte chez Google. En fait, la seule chose que l’on sait, c’est qu’en mars 2024 le bot « yoshi-code-bot » a publié sur GitHub le code d’une API qui ressemble à des APIs de Google, avec une nomenclature et un code qui ressemble à ce qui pourrait être produit par des ingénieurs de Google.

Elle est nommée « Google API Content Warehouse ». La documentation fait des liens vers la « Document AI Warehouse API », donc il y’a probablement un lien de parenté. Selon Mike King, il s’agirait de la version interne à Google de la même chose.

Le code a déjà été retiré : il s’agit probablement d’une erreur, pas d’une fuite volontaire.

Et faute de confirmation de Google sur le caractère authentique de cette API et de sa doc, il faut être vraiment prudent en les invoquant pour tirer des conclusions. Toute possibilité de manipulation ou de mystification n’est pas écartée à date.

La documentation automatique est restée accessible, ce qui permet de se faire une idée sur ce qu’était véritablement cette API.

Probablement une API d’accès à un repository de contenu Google, mais rien qui donne accès à des informations réellement actionnables sur l’algorithme de Google

Si on creuse un peu, on s’aperçoit vite qu’annoncer la découverte d’ informations sensationnelles via cette fuite est très exagéré.

Ce qui a pu laisser penser que cette API avait quelque chose à voir avec Google Search, c’est qu’elle donne accès à des signaux (que les SEOs aiment bien appeler « critères de classement) qui ressemblent clairement à des informations qui pourraient être stockées dans l’index du moteur de recherche Google.

Mais la documentation de l’API n’indique pas clairement :

les signaux réellement utilisés par Google Search, et ceux par d’autres services de Google
le poids réel des différents signaux
la façon dont les signaux sont exploités

Il s’agit apparemment d’une API d’accès à un repository qui contient, pour chaque document, toute une série de signaux exploitables, et qui ressemble à des signaux exploités sur Google Search.

Cela me rappelle les serveurs...

Derniers événements

Derniers Articles