Derniers Articles
GEO vs SEO : faut-il choisir ou combiner les deux ? Open Knowledge Format : Google pose les bases d’un nouveau standard pour les agents IA Un tribunal allemand juge Google responsable des erreurs de ses AI Overviews La reconversion à l’ère de l’IA générative : les nouvelles compétences attendues des entreprises Google confirme qu’il ignore le fichier llms.txt et clôt le débat L’édition de juin 2026 de Réacteur est en ligne ! SEO technique : comment un agent IA peut auditer et corriger votre site à votre place Sundar Pichai livre un discours aux diplômés de Stanford 2026 : trois règles de vie à retenir Google Business Profile : des numéros WhatsApp ajoutés automatiquement et sans possibilité de suppression SEO + GEO : un nouveau livre blanc pour comprendre les LLM et mieux les influencerLire l'article complet : Google Leak : on nous aurait menti ?
Publié le 29/05/2024 à 13:59:37 par Neper
Google Leak : on nous aurait menti ?
Un debunkage en règle s’impose sur l’affaire des Google Leaks…
Car, oui, on vous a menti… mais sur la nature véritable de ces « fuites ».
Pour ceux qui vivent dans une grotte, voici un petit rappel sur l’affaire.
Deux personnalités bien connues du monde du SEO, Rand Fishkin (ex patron de Moz) et Michael King (CEO de Ipullrank) ont annoncé sur leurs blogs respectifs avoir découvert, grâce à un informateur, l’existence d’une API qui selon eux :
- émane des équipes de Google Search
- et prouve que Google ment sur certains sujets à propos de son algorithme depuis longtemps
Voici les deux articles :
- https://sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/
- https://ipullrank.com/google-algo-leak
Des documents dont la nature réelle n’est pas celle qui est présumée partout sur le net
La « source anonyme » ne l’est plus : il s’agit de Erfan Azimi, le patron d’une petite agence baptisée EA Digital, basée en Géorgie. Comment M. Azimi a découvert l’existence de ces documents ? C’est encore peu clair.
Par contre il a publié une vidéo, dans laquelle il explique ses motivations. Qui sont clairement de « révéler tous les mensonges de Google ». Et c’est donc lui qui a choisi de contacter Rand Fishkin (qui a quelques revanches à prendre sur les porte parole de Google, qui ont été sévères avec lui avec de nombreuses reprises) et Michael King. Bref deux personnes qui étaient très perméables à son discours, pour tenir des propos similaires depuis longtemps.
Mais du coup, cette « fuite » n’émane pas du tout d’un lanceur d’alerte chez Google. En fait, la seule chose que l’on sait, c’est qu’en mars 2024 le bot « yoshi-code-bot » a publié sur GitHub le code d’une API qui ressemble à des APIs de Google, avec une nomenclature et un code qui ressemble à ce qui pourrait être produit par des ingénieurs de Google.
Elle est nommée « Google API Content Warehouse ». La documentation fait des liens vers la « Document AI Warehouse API », donc il y’a probablement un lien de parenté. Selon Mike King, il s’agirait de la version interne à Google de la même chose.
Le code a déjà été retiré : il s’agit probablement d’une erreur, pas d’une fuite volontaire.
Et faute de confirmation de Google sur le caractère authentique de cette API et de sa doc, il faut être vraiment prudent en les invoquant pour tirer des conclusions. Toute possibilité de manipulation ou de mystification n’est pas écartée à date.
La documentation automatique est restée accessible, ce qui permet de se faire une idée sur ce qu’était véritablement cette API.

Probablement une API d’accès à un repository de contenu Google, mais rien qui donne accès à des informations réellement actionnables sur l’algorithme de Google
Si on creuse un peu, on s’aperçoit vite qu’annoncer la découverte d’ informations sensationnelles via cette fuite est très exagéré.
Ce qui a pu laisser penser que cette API avait quelque chose à voir avec Google Search, c’est qu’elle donne accès à des signaux (que les SEOs aiment bien appeler « critères de classement) qui ressemblent clairement à des informations qui pourraient être stockées dans l’index du moteur de recherche Google.
Mais la documentation de l’API n’indique pas clairement :
- les signaux réellement utilisés par Google Search, et ceux par d’autres services de Google
- le poids réel des différents signaux
- la façon dont les signaux sont exploités
Il s’agit apparemment d’une API d’accès à un repository qui contient, pour chaque document, toute une série de signaux exploitables, et qui ressemble à des signaux exploités sur Google Search.
Cela me rappelle les serveurs...