đ„ NumĂ©ro spĂ©cial Google : apocalypse en vue ?
[Hors-série #09] Vous aimez Google ? Alors on va en causer en long, en large et par devers
Impossible que vous lâayez loupĂ© ces derniĂšres semaines :
Google vient de subir l'une des plus grosses fuites de documents de son histoire.
Et quand on lit ce que ça donne dans le détail, c'est plutÎt riche d'enseignements.
Petit récap si vous l'avez loupé : le 5 mai dernier, Rand Fishkin (le mec qui a créé Moz entre autres) reçoit un mail d'une source anonyme qui lui dit grosso modo :
Salut jeune entrepreneur, jâai accĂšs Ă tout un tas de docs internes de chez Google. RĂ©pond âintĂ©ressĂ©â si tu les veux dans tes DM.
Un truc comme ça, quoi.
Le mail précisait également que ces documents étaient confirmés comme authentiques par d'anciens employés de Google.
Et on parle pas d'une petite fuite, attention.
LĂ , on parle de 2500 pages de documentation de la division de recherche de Google.
Bref, du lourd. Du titane. De lâosmium.
LĂ , vous vous posez peut-ĂȘtre une question : est-ce que c'est un vrai leak, avec des vrais documents, et pas juste une intox Ă deux sesterces pour faire le buzz ?
Fishkin s'est posĂ© la mĂȘme question.
AprÚs pas mal de vérifications en sondant notamment des contacts qu'il a chez Google, il semblerait que oui, ces documents sont véridiques.
Alors, forcément, dans ces documents, y'a tout un tas de trucs croustillants, et je vous invite à lire le petit résumé plus loin dans cette newsletter pour en avoir un aperçu.
Moi, je retiens surtout deux choses :
1) La marque est le facteur le plus important pour le classement organique, qui surpasserait a priori souvent les liens et le contenu. Ce qui ferait dire que les facteurs E-E-A-T peuvent ne pas ĂȘtre aussi influents qu'on le pensait.
2) Que le SEO est principalement un jeu entre des grandes marques bien établies, mais ça clairement c'est pas une surprise en soi, ceux qui touchent un peu au domaine le constatent depuis longtemps.
Et puis, surtout : les créateurs de contenu doivent se concentrer sur la construction d'une marque notable et reconnue en dehors de Google pour améliorer leur classement.
Et je sais pas vous, mais moi je trouve que ça, ce constat, c'est une DĂFLAGARATION.
Parce que pendant des années, tout un tas de boßtes ont commis des textes dégueulasses pour ranker dans les résultats de recherche, et là on apprend quoi ?
Que pour performer Ă l'organique, ou du moins pour rivaliser avec les grandes marques, bah c'est pas suffisant.
Ou du moins, ça ne lâest plus en 2024.
Si ça, ça nâincite pas les entreprises Ă mettre le paquet sur leur branding, je ne comprends pas.
Je laisse le mot de la fin à Fishkin, qui écrit dans sa conclusion :
"Pour la plupart des petites et moyennes entreprises et des nouveaux crĂ©ateurs/Ă©diteurs, le SEO est susceptible d'ĂȘtre peu rentable tant que vous n'avez pas Ă©tabli votre crĂ©dibilitĂ© et une solide rĂ©putation auprĂšs d'un public assez large."
Alléluia.
đŹ Quâest-ce que vous en pensez, de ce leak ? Ce qui a Ă©tĂ© rĂ©vĂ©lĂ© Ă©tait une surprise pour vous, ou alors paaaas du tout ?
Sur ce :
# La veille :
đïž Pâtit rĂ©sumĂ© des analyses de Fishkin & King
đ€ En 2024, les IA de Google vont vous rĂ©sumer le Web, que vous le vouliez ou non
đȘ Lâhistoire de lâhomme qui a dĂ©truit Google
đ” Le PDG de Google ne sait pas quand son IA cessera d'halluciner
đ Google nettoie les saloperies de Gemini Ă la main
đ Certaines industries sont inquiĂštes face aux rĂšgles du DMA
# La boĂźte aux lettres :
âQuels sont tes outils de veille ?â
đïž Pâtit rĂ©sumĂ© des analyses de Fishkin & King
La flemme de lire le gros retex de Fishkin ? Idem pour le gros pavĂ© de Mike King, que Fishkin dĂ©signe comme lâun des plus gros techos SEO au monde ?
Petite synthĂšse trĂšs succincte pour que vous ayez quand mĂȘme les grandes lignes de leurs analyses :
1. Sur les pratiques internes de Google
Les documents leakés montrent une grande variété de fonctionnalités et de modules utilisés par Google pour classer et indexer le contenu.
Ces modules couvrent des aspects comme YouTube, Assistant, Books, et l'infrastructure de crawl.
Les fonctionnalitĂ©s incluent des signaux de qualitĂ©, des scores de promotion/dĂ©classement de pages, et des mesures de la qualitĂ© des pages UGC (pour rappel, âcontenu gĂ©nĂ©rĂ© par l'utilisateurâ).
Les documents contiennent des informations sur l'utilisation par Google des données de clics pour améliorer et/ou ajuster la qualité des résultats de recherche.
Un systÚme appelé "NavBoost" utilise les données de clics pour évaluer la qualité des sites et influencer les classements.
Google utilise notamment l'historique des cookies & les données des utilisateurs connectés à Chrome pour lutter contre le spam de clics (cf. en dessous).
Les liens internes et externes, ainsi que leur qualité, jouent toujours un rÎle significatif dans le classement des pages.
2. Utilisation des données des utilisateurs de Chrome
Google utilise des datas récoltées via Chrome pour déterminer les URL les plus populaires sur un site, ce qui influence également les fonctionnalités comme les sitelinks.
Les documents révÚlent des métriques basées sur les vues via Chrome liées aux pages individuelles et aux domaines.
Note : le RGPD en PLS ?
3. Listes blanches pour les sujets sensibles
Google emploie des whitelists pour les sites dans des secteurs comme les voyages, la COVID-19, et les Ă©lections (pas trop de surprise, ce systĂšme existe dĂ©jĂ dans dâautres domaines).
Ces listes blanches garantissent que des sources fiables apparaissent en haut des résultats de recherche pour des sujets potentiellement controversés.
4. Feedback des évaluateurs de qualité
Google utilise les remontées des évaluateurs de qualité (EWOK) dans ses systÚmes de recherche pour évaluer la pertinence des documents.
Les scores et les données générées par ces évaluateurs sont directement impliqués dans le systÚme de recherche de Google.
5. Utilisation des données de clics pour pondérer les liens
Google classe les index de liens en trois catégories (basse, moyenne, haute qualité) en fonction des données de clics.
Les liens dans l'index de haute qualité peuvent transmettre des signaux de classement, tandis que ceux dans l'index de basse qualité sont ignorés.
Les intentions utilisateurs et les modÚles de clics sont des facteurs déterminants dans les classements.
6. Mesures de l'originalité et des dates de contenu
Google évalue l'originalité du contenu, surtout pour les contenus courts, à travers un score spécifique.
Les dates, qu'elles soient explicites, sémantiques ou extraites de l'URL, sont cruciales pour évaluer la fraßcheur et la pertinence des pages.
Les sites oĂč plus de 50 % des pages contiennent des vidĂ©os sont traitĂ©s diffĂ©remment.
7. Facteurs de déclassement algorithmique
Plusieurs facteurs peuvent entraĂźner le dĂ©classement d'une page, tels que les mismatchs d'ancres ou une navigation jugĂ©e âpauvreâ.
Les documents mentionnent des systÚmes comme Panda (tiens tiens) et NavBoost, qui sont utilisés pour ajuster les classements en fonction de la qualité perçue des pages et des sites.
đ€ En 2024, les IA de Google vont vous rĂ©sumer le Web, que vous le vouliez ou non
Vous voulez lire un mec qui a le seum, le vrai, celui qui est aussi salĂ© que la Mer Morte ? Encore plus que moi avec mon âComment Google a bousillĂ© la crĂ©a' de contenusâ ?
Dans ce cas, filez lire la chronique de Thibault PrĂ©vost, Apocalypse Google, que jâai trouvĂ©e Ă la fois drĂŽle, intĂ©ressante et terriblement pertinente, autant dans ses observations que ses conclusions.
PrĂ©vost commence par quelques rappels, Ă commencer par lâintĂ©gration prochaine de Gemini au sein de Google afin de rĂ©sumer le web automatiquement.
On sait dĂ©jĂ ce que ça donne avec les exemples qui se sont multipliĂ©s ces derniĂšres semaines, et câest un dĂ©sastre. Ă un moment donnĂ©, faut correctement nommer les poneys.
En cause : les IA génératives, comme Gemini, ont des taux d'erreur significatifs - les fameuses hallucinations dont je parle juste aprÚs - ce qui les rend peu fiables pour fournir des informations exactes⊠Ce qui fait dire à Prévost que les IA génératives dégradent la qualité de l'information et créent une marée noire informationnelle qui englue tout ce qu'elle touche. Il a pas tort.
Cette Ă©volution sâinscrit en tout cas dans un projet de longue date, puisque cela fait quelques annĂ©es que Google cherche Ă devenir un moteur de rĂ©ponse : un portail informationnel dont on ne sort pas, et qui rĂ©pond aux questions directement sur sa plateforme sans rediriger les utilisateurs vers d'autres sources dâinformations.
Ce qui non seulement renforce la domination de Google sur le Web, mais place ce dernier dans un Ă©tat trĂšs pĂ©rilleux, qui nâa dâailleurs pas grand-chose Ă voir avec la vision originelle de Tim Berners-Lee.
Bref, ça pue franchement du derche.
đȘ Lâhistoire de lâhomme qui a dĂ©truit Google
Vous reprendrez bien une dose de seum ?
Dans son article The Man Who Killed Google Search, Edward Zitron ne se contente pas de tirer Ă boulets rouge, mais Ă coups dâogives thermonuclĂ©aires sur Prabhakar Raghavan et Sundar Pichai.
Zitron décrit notamment comment la pression pour augmenter le flouze généré avec le Search a conduit à des décisions débiles qui ont détérioré sa qualité.
Ainsi, en février 2019, un "code jaune" a été déclenchée par des dirigeants de Google en raison d'une baisse des revenus de recherche, et quand on sait à quel point ça brasse de la thune, on comprend leur inquiétude.
Dâailleurs, leur code jaune, contrairement Ă ce que lâon peut croire, câest lâĂ©quivalent dâun DEFCON 1. Ăa dĂ©connait vraiment pas.
Ben Gomes, le responsable de la recherche chez Google, exprimait alors certaines inquiĂ©tudes : selon lui, la boĂźte aimait un peu trop le pognon et dĂ©plorait le fait que le moteur ne pensait quâĂ la croissance.
Comme dâhabitude dans ces cas-lĂ , cet objecteur de conscience a Ă©tĂ© dĂ©barquĂ© par Prabhakar Raghavan en mai 2019. Objectif : tout pour le flouze.
Le truc, câest que Raghavan, ancien boss de la recherche chez Yahoo, a un lourd passif de dĂ©cisions controversĂ©es (Zitron lâaccuse carrĂ©ment dâavoir coulĂ© Yahoo).
Sous sa direction, Google Search est devenu moins fiable et plus orientĂ© vers la pubâ, et lui et Sundar Pichai ont Ă©tĂ© accusĂ©s de sacrifier la qualitĂ© pour des gains financiers Ă court terme ; et au vu des mails internes rĂ©vĂ©lĂ©s lors du procĂšs antitrust de Google, il semblerait quâil y ait bien eu des bidouilles du moteur pour rĂ©pondre aux besoins de l'Ă©quipe publicitaire.
Notez que Google a rĂ©pondu Ă cet article (classe) auquel Zitron a apportĂ© une nouvelle rĂ©ponse cinglante. Nâoubliez pas dâenfiler casque et gilet pare-balles avant de cliquer sur le lien, ça tire Ă balles numĂ©riques rĂ©elles.
đ” Le PDG de Google ne sait pas quand son IA cessera d'halluciner
Jâimagine que vous ĂȘtes au courant : les IA gĂ©nĂ©ratives, comme celles de Google, ont tendance Ă "halluciner". Dit autrement, elle balance des faits aussi honteux quâincorrects (comme quand Google annonce sans sourciller quâil faut manger au moins un caillou par jour).
Eh bien, histoire de rajouter de lâhuile sur le brasero, Sundar Pichai (PDG de Google) a admis Ă The Verge que les hallucinations restent Ă ce jour un problĂšme non rĂ©solu.
Mieux encore : il décrit carrément ces erreurs comme une "caractéristique inhérente" des modÚles de langage (LLM).
Il souligne que la crĂ©ativitĂ© des LLM permet des rĂ©alisations aussi impressionnantes que crĂ©atives, mais que cette crĂ©ativitĂ© entraĂźne justement des erreurs factuelles - et pis quâau fond, câest pas bien grave, car malgrĂ© ces erreurs, les LLM sont trĂšs utiles (lol).
Pour un peu, il va bientĂŽt balancer que câest une feature belle et bien prĂ©vue par les devs.
Pour rappel, Meta a lancĂ© en 2022 une IA appelĂ©e Galactica qui a dĂ» ĂȘtre retirĂ©e peu aprĂšs son lancement car elle conseillait entre autres aux gens de manger du verre.
đŹ On prend les paris ? Ă votre avis, combien de temps va durer Gemini ? đ
đ Google nettoie les saloperies de Gemini Ă la main
On vient de le voir, Gemini délire comme un Pierre Palmade dans ses heures les plus folasses.
Dans cet article, The Verge montre à quel point Google commence à flipper sa race et s'efforce de supprimer manuellement les réponses loufoques de l'IA dans ses résultats de recherches.
L'entreprise a ainsi confirmĂ© qu'elle âprenait des mesures rapidesâ pour supprimer certaines des rĂ©ponses de Gemini.
Enfin, âcertainesâ⊠AI Overview, lancĂ© en bĂȘta en mai 2023, a quand mĂȘme traitĂ© plus d'un milliard de requĂȘtes en un an (!). Et dans le lot, comme on lâa vu, on se retrouve avec des tas de conneriesâŠ
⊠Lesquelles sont, sans aucun doute possible, traitées à la main pour réduire les hallucinations de Gemini.
(remember : câĂ©tait dĂ©jĂ le cas pour ChatGPT)
Lâorigine du problĂšme, câest que les modĂšles de langage actuels ne peuvent pas vĂ©rifier la cohĂ©rence de leur propre travail, et câest justement cette incapacitĂ© Ă vĂ©rifier l'exactitude dâune information qui est aujourdâhui LE problĂšme majeur pour l'industrie de l'IA.
Comme le pointe un observateur en commentaire : la recherche et la suppression manuelles des réponses incorrectes est l'admission directe du fait que les LLM et l'IA peuvent atteindre un certain niveau de précision mais ne peuvent jamais continuer à s'améliorer au-delà .
Ăa rejoint ce que dit Yann LeCun : selon lui, les modĂšles actuels comme Gemini et GPT-4 ne crĂ©eront pas l'AGI. Bon, on sâen doutait.
Ayons quand mĂȘme une petite pensĂ©e pour les escl⊠sous-traitants dans les pays en voie de dĂ©veloppement qui doivent cruncher comme des malades avant la release fatidique pour nettoyer les saloperies de Gemini.
đ Certaines industries sont inquiĂštes face aux rĂšgles du DMA
Rien Ă voir avec lâIA gĂ©nĂ©rative, mais ça concerne quand mĂȘme Google : les compagnies aĂ©riennes, les hĂŽtels et les dĂ©taillants craignent d'ĂȘtre marginalisĂ©s par les nouvelles rĂšgles du Digital Markets Act (DMA) de l'UE, lequel impose sa street law aux gĂ©ants de la tech comme Google pour offrir plus de choix aux utilisateurs et permettre davantage de concurrence.
Du coup, fùchés, plusieurs groupes de lobbying représentant ces industries ont exprimé leurs préoccupations aux régulateurs de l'UE : ils craignent que les ajustements nécessaires pour se conformer au DMA augmentent la discrimination contre leurs malheureux petits sites.
Les modifications pourraient en effet réduire sévÚrement leurs ventes directes, car les industries concernées estiment (sans doute avec raison) que cette tendance donne un traitement préférentiel aux puissants agrégateurs en ligne.
Dâailleurs, Google a reconnu dans un article en mars dernier que les changements pourraient effectivement diriger plus de trafic vers les grands intermĂ©diaires et moins vers les hĂŽtels, compagnies aĂ©riennes, commerçants et restaurants locaux.
Entre ça et Gemini, ça va pas ĂȘtre triste le nouveau Google.
đš La boĂźte aux lettres
Ma question de lectrice : comment réalises-tu ta veille ? As-tu des outils dédiés ? - Christine
Câest top secret. Allez salut !
Bon, plus sĂ©rieusement : ma veille, je lâeffectue au fil de lâeau chaque semaine, puisque je commence en gĂ©nĂ©ral mon lundi par prendre 30 minutes (1h max) pour faire le tour de mes canaux habituels :
LinkedIn, vous connaissez bien, je vais pas mâĂ©tendre lĂ -dessus. Jây suis mĂȘme tous les jours.
Du Substack pour voir ce que font les copains / copines, ou des gens que jâapprĂ©cie.
Mon board Feedly, oĂč jâai ajoutĂ© lâensemble de mes sources pour ma veille âcontent marketingâ. Câest donc ici que rĂ©side le nerf de la guerre.
Assez rarement, du Reddit pour les trucs qui sortent un peu du âcontenuâ pur et dur.
DĂšs que je tombe sur un truc intĂ©ressant, je consulte la source en dĂ©tail et, si câest validĂ©, je la note dans un coin pour lâajouter Ă une prochaine Ă©dition. Thatâs all !
đŹ Vous avez une question ? Ask Me Anything (comme on dit sur Reddit) en commentaire pour que jây rĂ©ponde dans la prochaine Ă©dition.
đ« Câest dĂ©jĂ fini ?!
HĂ©las oui, Ă lâheure oĂč vous recevrez cette newsletter, je serai encore en vacances en Dordogne Ă recharger tranquilou les batteries (du moins autant que se peut, des vacances avec un bambin, câest pas vraiment des vacances).
Du coup, jâai Ă©tĂ© contraint de prĂ©parer cette Ă©dition un peu en urgence avant mon dĂ©part, mais promis, on reviendra sur un imbuvable pavĂ© trĂšs rapidement.
Sur ces entrefaites, je vous laisse : jâai un bĂ©bĂ© Ă qui jâapprends Ă marcher.





C'est carrément la fin d'un monde, quoi...
La communication par les rĂ©seaux sociaux va devenir encore plus cruciale pour mettre en place cette fameuse rĂ©putation dont tu parles ! Et ce n'est que sur le web... Ăa veut dire que les pros vont devoir se sortir les doigts pour rayonner autour d'eux dans la vraie vie. Retour en arriĂšre avec 25 ans de promesses du web. Franchement, j'ai les boules.
Bonne fin de vacances, tu seras pas reposĂ© mais au moins tu auras profitĂ© de ce que c'est que la vraie vie organique, charnelle, incarnĂ©e : ĂȘtre avec les gens qu'on aime. Ă cĂŽtĂ© de ça, qu'est ce que vaut google ? Pas grand-chose. MĂȘme si lui au moins ne nous empĂȘche pas dormir...
La vache, elle est dense celle-ci... Je n'ai pas grand-chose à dire, si ce n'est que ce que font actuellement les Peyronnet pourrait t'intéresser à propos des leaks de Google (et j'pense que s'il y a des personnes à qui faire confiance, c'est bien eux...).
Et franchement : bravo pour ton travail et de veille et de restitution. C'est hyper impressionnant :o