Spam sur Google Actualités sources, causes et conséquences
Il m’a été reproché par plusieurs personnes lors de ma conférence au VLC 2015 de citer explicitement des sites qui spamment Google Actualités pour illustrer mon propos sur les différentes techniques de spam qui existent sur Google News.
Alors je voudrais ici expliciter pourquoi j’ai cité ces sites, car mon idée à la base était plus de mettre le doigt sur la collusion ou l’entente tacite qui existe en Google et ces médias. Je n’ai pas réussi a faire passer ce message lors de ma conférence ce qui à laissé place à une exposition en mode « Caliméro » … « C’est vraiment trop injuste » et pour certain très porté sur le « spam report ». Ce n’était pas mon idée et c’est pour cela que je voudrais expliquer plus en détail ce qui m’a poussé à citer ces sites.
Remettre en cause l’impartialité de Google
La communication de Google est toujours la même et ce depuis toujours il existe une « neutralité » de l’algorithme sur les résultats, peu importe si le site est gros ou petit, l’algorithme traite tous les sites de manière « anonyme » le traitement humain étant réservé aux sanctions manuelles, qui elles peuvent toucher 100% des sites, personne n’est à l’abri, théoriquement. La fameuse « white list » a toujours été un mythe SEO jamais vérifiée ni prouvée même si des indicateurs laissent a penser que cette white list existe, en ce qui concerne Google elle n’existe pas.
Dans la même veine, et je reprends les termes de Zineb Ait Bahajji lors du VLC 2015 même un très gros annonceur Adwords peut voir son site sanctionné et en aucune personne d’Adwords ne pourra mettre la pression sur les responsables du Search pour sortir ce site de sa pénalité.
Il y a donc trois principes intangibles chez Google
1 – La neutralité de l’algorithme
2 – Pas de « white list »
3 – Égalité de traitement dans les sanctions
C’est d’ailleurs en se basant sur ces trois points que Google s’est défendu avec succès auprès de la commission européenne dans son conflit avec les comparateurs de prix qui accusaient Google de favoriser ses propres services au détriment des acteurs privés.
Pas de preuves tangibles jusqu’à aujourd’hui ?
Jusqu’à aujourd’hui on ne pouvait avoir que des suspicions de manipulation de l’algorithme en faveur de sites présents sur une « white list » sans pour autant en avoir la preuve formelle. Google Actualités nous permet de démontrer que si, Google favorise sans la moindre ambiguïté certains sites au détriment d’autres.
En ce qui concerne l’algorithme, le dernier changement de mai dernier a littéralement boosté les sites a fort « trust rank » (ou site à forte notoriété), nous ne savons pas comment ce « trust rank » se construit et même si l’on peut penser que dès l’inclusion Google affecte manuellement une valeur a celui-ci en fonction de la notoriété du site. Il n’y a pas de preuves formelles de son existence et donc de sa manipulation. Ce n’est donc pas sur ce point que l’on peut parler de manipulation des résultats.
L’autre point est la « white list » ici c’est totalement différent, le concept de « white list » se base sur deux éléments, le premier une prime de notoriété qui permet de mieux ranker et le deuxième une latitude au niveau des sanctions si le site ne suit pas à lettre les guidelines de Google. C’est sur ce deuxième point que l’on peut détecter chez Google la volonté de favoriser ou de protéger certains sites.
Rappel de ce que Google interdit comme pratiques sur Google News
Il existe une liste assez longue des mauvaises pratiques à ne pas suivre pour rester sur Google Actualités, en voici trois qui sont emblématiques et qui résument assez bien les pratiques de spam les plus courantes sur Google Actualités
- Mise à jour d’un article sans modification
- Changer l’url d’un article
- Dupliquer un article sur différentes catégories
Si un site ne respecte pas ces guidelines il sera alors exclu de Google Actualités, de ce point de vue les explications de Google sont limpides.
Je vais citer en vrac des sites qui d’une manière ou d’une autre ne respectent pas ces règles, 20minutes.fr, sports.fr, Nouvel Obs, Le Figaro, Le Monde etc… Tous ces sites d’une manière ou d’une autre ne respectent pas les règles posées par Google et ce en toute impunité, imaginez donc l’avantage comparatif que ces sites possèdent sur l’ensemble des sites inclus dans Google Actualités, c’est un monde qui nous sépare !
Clairement mon message qui était en partie de démontrer cette évidence n’est pas bien passé au VLC 2015 et un nombre important de participants sont restés sur l’idée que je faisais du spam report déguisé. Il faut bien voir que nombre des cas que je souligne ici ont été cités à de très nombreuses reprises sur le propre forum de Google dédié à Google Actualités. Google ne peut donc nier connaître ces dérives. Dans d’autres cas, si vous abusez de ces techniques en moins de semaine vous recevrez un mail d’avertissement, j’ai plusieurs exemples qui confirment cela, la surveillance de Google est assez stricte sur le comportement des sites sur sa partie news et ils sont particulièrement réactifs en terme de sanction.
Google ne respecte pas les règles de la concurrence
Alors le premier réflexe de beaucoup de personnes est de dire que finalement Google fait bien ce qu’il veut sur ses sites, il donne de bons points et de mauvais points à sa guise, il est chez lui ! On pourrait en effet penser de la sorte, sauf que dans une économie libérale cela ne fonctionne pas comme cela. Pour simplifier, le pilier central d’une économie libérale est la libre et équitable concurrence entre les acteurs d’un même marché et à partir du moment que de par sa taille et son envergure Google devient un espace de marché les concepts fondamentaux de l’économie de marché s’imposent à lui, et par conséquent Google ne peut plus agir à sa guise sur ses propres services. Pour faire un parallèle « grossier » si une grande entreprise ou une collectivité cherche un fournisseur ou un prestataire de service elle devra faire un appel d’offres aux règles connues de tous et qui s’imposent à tous. Google ne respecte pas ces fondamentaux et s’expose a une plainte auprès de l’autorité correspondante, la commission européenne en ce qui nous concerne par exemple.
Il est vraiment important de sortir de prisme « Google fait ce qu’il veut sur son site » sa taille et sa prédominance sur internet impose des règles de fonctionnement et d’équité qu’il se doit de respecter pour le bon fonctionnement du marché.
Pourquoi Google agit de la sorte ?
En soi la réponse est a priori simple, Google veut s’assurer le meilleur service possible (de son point de vue), et pour cela il ne peut pas se passer des plus grands médias français. C’est un problème de crédibilité et non de qualité. Je fais une parenthèse sur la qualité ou l’originalité, ce qu’il faut bien savoir c’est que 80% des articles publiés par ces grands médias sur Google News sont des dépêches AFP ou Reuters qui dans le meilleur des cas sont légèrement re-travaillées. Le contenu original étant réservé aux abonnés ou ceux qui achètent la version papier du journal. De ce point de vue le contenu online des grands médias est finalement assez pauvre et il est bien souvent plus intéressant de lire un article sur le même sujet sur au autre site.
Au moment où j’écris ces lignes sur Google News sur « A la Une » sur les 6 articles 5 sont des dépêches AFP (publiés sur Le Point, TF 1, Les Echos, Le Parisien) . Sur les 4 articles en Une de International les 4 sont de l’AFP, sur la rubrique France 2 sur 4 sont de l’AFP, en Économie, 2 articles originaux, un de Reuters et un de l’AFP. Poursuivons, High-Tech un article AFP pour trois originaux, en Culture trois articles AFP sur quatre, Sports 3 articles originaux et pour conclure en Santé 2 dépêches AFP.
Si l’on fait le total des articles à la Une sur Google News on trouve 20 articles d’agence et 14 originaux, pour moi cela démontre que Google cherche plus une crédibilité de la source qu’une originalité de l’information
Mais pour Google cela n’a aucune importance, car en terme d’audience il lui est impossible de se passer de ces médias, d’autant plus qu’aujourd’hui avec Twitter, Facebook ou encore Apple la concurrence va prendre une grande partie de l’audience de Google sur l’actualité.
Quelle conclusion ?
Difficile de faire une conclusion à vrai dire, mais je voulais souligner que mon « attaque » ne va pas contre les médias, a titre personnel si j’avais cette « chance » j’en profiterais encore plus. Ils ont raison de profiter de la mansuétude de Google sur ce sujet. Par contre j’en veux plus à Google d’avoir un double discours sur sa neutralité et impartialité dans le traitement des sites, car aujourd’hui je viens de démontrer que cette posture est totalement factice. Google pourrait assumer cette position en donnant explicitement plus de visibilité à certains médias au détriment des autres sites de contenus. Google donne donc l’impression que 95% des sites inclus dans Google News ne sont que de simple faire valoir. Heureusement, il est encore de tirer son épingle du jeu et d’obtenir une visibilité importante sur ce service de Google.
La question que je me pose aujourd’hui est combien de temps Google News va encore exister dans les conditions actuelles ? Il y a clairement de nombreux problèmes que Google ne pourra plus ignorer très longtemps surtout avec l’augmentation de la concurrence, notamment de Facebook, Twitter et Apple, l’année 2016 marquera sans aucun doute un tournant dans la gestion des contenus sur Google Actualités, reste a savoir quel sera la direction que prendra Google.
Ce n’est pas parce que Google communique plus avec les français, que les employés sont gentils et souriants qu’ils disent la vérité ou qu’ils savent tout.
C’est évident que Google gère ses résultats comme il le souhaite tout en préservant une certaine liberté, nous avons de nombreux cas qui le prouvent : favoriser des sites du groupe, supprimer rapidement des pénalités de grandes entreprises, grande tolérance pour les grands sites qui trichent, spam… alors qu’un petit serait pénalisé, voire blacklisté.
Bref, les employés de Google font de la communication, pas du SEO… C’est un peu comme si vous laissiez les « spécialistes AdWords » de Google gérer vos campagnes. 😉
« Bref, les employés de Google font de la communication, pas du SEO… C’est un peu comme si vous laissiez les « spécialistes AdWords » de Google gérer vos campagnes. ? »
==> Tout est dit !
@Clément : je n’ai pas eu l’opportunité d’assister au VLC mais je soutien ta démarche. Pour te dire, à l’époque (en 2007), j’avais donné une conférence au salon e-commerce qui s’appelait « le référencement sans tabou »
Salut,
Pour avoir suivi le VLC, je ne pense pas qu’il y ai eu tant de plainte sur le fait que tu balances des sites ? Je n’en ai vu passé qu’une en fait.
Personnellement cela ne me choque pas du tout, combien d’articles rien qu’en web francophone sur les techniques hardcore de cdiscount ou lelynx ?
Et comme tu dis, le forum Google est bourré de dénonciations.
Je ne vois pas comment on pourrait accuser Google de malveillance sans démontrer preuve à l’appui ce que l’on avance…
Pas d’inquiétude Clément, ton discours lors du VLC allait bien dans le sens de la démonstration, pas de la « vengeance ». Je pense que c’est comme cela que ça a été pris par la plus grande partie de l’audience.