DAC Blog Auteurs Que signifie la fuite de données de Google pour le SEO ?
Filter By
Analytique web & mesure de performance Design Gestion de la présence locale Gestion des relations clients Médias numériques Nouvelles Perspectives stratégiques Référencement organique (SEO) Référencement payant (SEM) Stratégie de Contenu Voir tous nos auteurs
Le numérique va vite. On va encore plus vite.
Abonnez-vous à notre infolettre mensuelle pour ne manquer aucun de nos nouveaux articles, vidéos, livres blancs, évènements, et bien d’autres. Vous pouvez vous désabonner quand vous le souhaitez. Pour plus d’informations, consultez notre politique de confidentialité.
Que signifie la fuite de données de Google pour le SEO ?

Que signifie la fuite de données de Google pour le SEO ?

Vendredi, mai 31, 2024

Comme l’a dit Harvey Dent, le méchant de Batman, « soit on meurt en héros, soit on vit assez longtemps pour se voir devenir le méchant ». Dent faisait référence à l’accumulation de pouvoir de Jules César tout au long de sa vie et à son résultat inévitablement tragique, mais cette phrase pourrait également décrire la relation de plus en plus conflictuelle entre Google et les propriétaires de sites web et l’ensemble de la communauté des spécialistes en SEO.

Les deux dernières années ont été un véritable tourbillon pour Google, qu’il s’agisse du procès antitrust intenté par le DOJ, des dix mises à jour confirmées de l’algorithme (dont quatre mises à jour fondamentales ayant des implications importantes), du lancement rapide de la Search Generative Experience (SGE) dans les laboratoires, de l’arrivée mouvementée d’IA Overview ou de l’augmentation controversée du contenu de Reddit en haut des SERP. La quasi-totalité de ces mises à jour et événements ont, à juste titre, généré une presse négative pour Google.

Puis, comme un coup de tonnerre, les documents de l’API de Google Search qui ont fait l’objet d’une fuite cette semaine semblent avoir dévoilé certains des secrets les mieux gardés du géant de la recherche. L’ex-Googler Erfan Azimi revendique la responsabilité de la fuite sur GitHub de documents de l’API Google provenant de l’entrepôt de l’API de contenu interne de Google en mars 2024, documents qu’il a ensuite partagés avec Rand Fishkin, pilier respecté du référencement, qui en a vérifié l’authenticité et donné son avis. De même, Mike King, expert en référencement technique, a examiné des milliers de pages des documents et a analysé l’impact potentiel sur les caractéristiques et les signaux de classement interne.

Au début, certains étaient sceptiques quant à ces fuites, mais elles semblent légitimes puisqu’elles ont été examinées par des figures de confiance de l’industrie du référencement, y compris un certain nombre d’ex-Googlers proches d’Azimi. Puis, mercredi dernier, Google a réagi en publiant sa propre déclaration :

« Nous mettons en garde contre les hypothèses inexactes sur le Search basées sur des informations hors contexte, obsolètes ou incomplètes. Nous avons partagé de nombreuses informations sur le fonctionnement du Search et les types de facteurs que nos systèmes prennent en compte, tout en nous efforçant de protéger l’intégrité de nos résultats contre les manipulations. » 

Que révèle la fuite d’API de Google ?

Avec 2 500 pages de documentation sur l’API contenant des informations sur plus de 14 000 attributs, la fuite décrit des fonctionnalités dont personne en dehors de Google ne connaissait l’existence. Fait inquiétant, de nombreuses données contenues dans cette fuite contredisent les déclarations publiques faites par Google au cours des 20 dernières années. Il apparaît, par exemple, que les taux de clics affectent effectivement le classement, que les sous-domaines ont leur propre classement et que l’âge du domaine est un facteur de classement – autant d’éléments sur lesquels les référenceurs ont déjà spéculé, avant que le géant de la recherche ne les nie.

Il pourrait bien s’agir de l’une des plus grandes affaires de l’histoire du référencement, et d’innombrables questions restent encore sans réponse. Google lui-même recommande la prudence dans l’utilisation de ces informations, tout comme les spécialistes en référencement de DAC, pour plusieurs raisons :

  1. La fuite ne fournit pas de détails complets sur le système d’algorithme de Google.
  2. Les caractéristiques ou les facteurs mentionnés dans les documents ayant fait l’objet d’une fuite ne sont pas nécessairement utilisés actuellement pour classer les résultats de recherche.
  3. Nous ne savons pas quel est le poids de ces différents signaux par rapport à d’autres facteurs de classement.

Cela va tout changer dans le domaine du référencement… ou pas ?

En bref, les principes de base restent inchangés (pour l’instant) et les principes fondamentaux de la construction de l’autorité restent pertinents. Créez un contenu de qualité qui crée des relations, génère un trafic qualifié et donne aux gens une raison de partager ou de mentionner. Générer une demande de recherche pour renforcer la visibilité en ligne de votre marque est toujours le mot d’ordre.

Il y a cependant quelques conseils et astuces à prendre en compte. La révélation du fait que Google utilise les données relatives aux clics dans ses signaux de classement, par exemple, signifie que l’optimisation de l’engagement de l’utilisateur doit être équilibrée avec la nécessité d’un contenu « utile », le SEO et l’UX travaillant en tandem plutôt qu’en concurrence.

Cette fuite ne changera rien au fait que les stratégies de référencement de DAC sont basées sur un référencement fondamental qui a fait ses preuves. Nos experts continueront à souligner l’importance de prendre des décisions basées sur des données afin de créer et de distribuer un contenu pertinent, de haute qualité et « utile » qui offre une excellente expérience à l’utilisateur sur le site.

Le futur de la recherche n’est pas écrit

Depuis quelques années, la réputation de Google ne cesse de se dégrader. Après avoir fait l’objet de plaintes concernant la qualité de ses résultats de recherche, le géant de la recherche a apparemment perdu la course à l’armement en matière d’IA après avoir été pris au dépourvu par ChatGPT (puis avoir bâclé ses propres lancements SGE et Gemini). Depuis l’annonce des aperçus de l’IA lors de la conférence Google I/O, de nombreux exemples de réponses inappropriées de l’IA ont fait surface, notamment des réponses contenant des propos haineux et des conseils franchement dangereux en matière de santé, de médecine et de finances. Le déploiement a été si mauvais que les utilisateurs ont essayé de comprendre comment se désengager des aperçus d’IA dans les 24 heures. Avant cette fuite, la cerise la plus récente sur le gâteau de la controverse était le contenu de Reddit apparaissant de manière proéminente pour des requêtes YMYL (votre argent, votre vie) potentiellement sensibles.

Plus que tout autre chose, le plus grand problème de Google est la confiance. Le géant de la recherche a-t-il finalement vécu assez longtemps pour devenir le méchant ? Connaîtra-t-il le même sort que Harvey  dans The Dark Knight ? Seul l’avenir nous le dira.

D’ici là, Google doit être beaucoup plus transparent et collaborer avec les propriétaires de sites web et l’industrie du référencement. En construisant des ponts et en regagnant la confiance des internautes au fil du temps, Google pourra réparer une partie des dommages qu’il s’est infligés à lui-même. Bing, Yahoo et d’autres moteurs de recherche seront-ils en mesure de prendre l’avantage et de s’approprier des parts de marché entre-temps ? À suivre…

CONTACTEZ-NOUS

Inscrivez-vous à notre infolettre mensuelle pour prendre une longueur d’avance.
x
Recevez exclusivement des articles, des vidéos, des études, des invitations à des évènements et bien plus encore. Désinscrivez-vous à tout moment. Pour plus d’informations, voir notre Politique de Confidentialité.