Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales

Un récent rapport de 404media.co affirmait que « Google News stimule les sites qui escroquent d’autres médias en utilisant l’IA pour produire rapidement du contenu ».

Bien que Danny Sullivan, SearchLiaison de Google, ait offert une réponse officielle à cette affirmation, celle-ci n'offre pas d'explication complète sur la raison pour laquelle certains domaines surpassent d'autres dans l'actualité.

Cet article explorera certaines de ces raisons, ainsi que des conseils de référencement spécifiques pour les éditeurs, les journalistes et les reporters qui souhaitent être mieux classés dans les résultats de recherche.

Google stimule-t-il le contenu généré par l'IA ?

Non, Google ne fait rien pour placer manuellement certains éléments de contenu en haut des résultats de recherche, selon Google SearchLiaison sur X.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de X, janvier 2024

L’algorithme de Google utilise plutôt des facteurs de classement spécifiques pour déterminer quel contenu doit apparaître en premier dans les résultats de recherche.

5 raisons pour lesquelles un article d'actualité se classe bien dans la recherche et la découverte Google

À l'aide de quelques exemples mentionnés dans le rapport 404 Media, voici quelques explications sur les raisons pour lesquelles le contenu généré par l'IA, le contenu dupliqué, le contenu syndiqué, les agrégateurs de contenu et les voleurs de contenu surpassent les sources d'information originales.

1. Récence

L'une des premières explications proposées par Google SearchLiaison pour expliquer que le contenu généré par l'IA dépasse les autres éditeurs est la récence du contenu d'actualité lorsqu'il est trié par date.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de X, janvier 2024

Voici deux sites qui figurent parmi les meilleurs articles d’actualité pour ESPN Spectrum.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Captures d'écran de Watcher.guru & Examiner, janvier 2024

Les deux sites surpassent CNET, Kiplinger et The Verge, probablement en raison de leur récence.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Google, janvier 2024

L'analyseur de contenu d'Originality.ai était sûr à 100 % que le contenu d'un site était généré par l'IA, alors qu'il n'était sûr qu'à 52 % de celui de l'autre. Ce dernier site proposait une clause de non-responsabilité concernant l'utilisation de l'IA dans la création de contenu.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran d'Originality.ai, janvier 2024

Comment les autres moteurs de recherche se comparent-ils ? Voici un aperçu des principaux résultats de recherche de Bing.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales

Capture d'écran de Bing, janvier 2024Watcher.guru apparaît plus bas sur la page dans les résultats de recherche de Bing, mais pas dans les actualités.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de ChatGPT, janvier 2024

Le domaine apparaît également comme l'une des sources dans une réponse ChatGPT sur le sujet.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de ChatGPT, janvier 2024

Alors qu'Originality.ai n'était sûr qu'à 62 % de l'une d'elles, il était sûr à 100 % que les trois autres sources étaient générées par l'IA.

2. Âge du domaine et backlinks

Maintenant, prenons du recul par rapport au contenu et analysons quelques métriques sur les domaines dans l'exemple ci-dessus.

Watcher.guru a une autorité et une visibilité plus fortes dans la recherche Google, selon Semrush. Mais le domaine n'a que neuf ans.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Semrush, janvier 2024

En comparaison, Examiner.com a plus de domaines référents et de backlinks ainsi que 19 ans d'historique de domaine.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Semrush, janvier 2024

Bien entendu, la force du domaine n’a pas aidé Examiner.com en termes de trafic organique et de mots-clés au fil des ans. Cela n'aide qu'occasionnellement le site dans les résultats d'actualités Google.

3. Pertinence

Lorsque les résultats de recherche ne sont pas triés par date, la pertinence devient un facteur clé dans les résultats de recherche.

Bien qu'il ne soit pas lié au contenu généré par l'IA, John Mueller, défenseur de la recherche Google, a un jour noté que le contenu syndiqué pourrait surpasser les sources d'information originales en raison du contenu du site Web qui l'entoure.

En effet, les sites Web qui republient vos articles d'actualité pourraient vous surclasser car leur contexte dans l'en-tête, la barre latérale, les articles environnants ou le pied de page est plus pertinent par rapport à la requête de recherche de l'utilisateur que celle de votre site.

Voici un autre exemple. Lorsque j'ai recherché le streaming de la NFL en direct, les actualités suivantes sont apparues après le site Web officiel NFL.com et les vidéos YouTube liées à la requête.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Google, janvier 2024

L'article de Yahoo Entertainment provient du magazine Rolling Stone.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Yahoo, janvier 2024

Sur la même page que l'article Yahoo se trouve un menu de navigation avec une section Sports, un clip vidéo à lecture automatique d'un match récent de la NFL et d'autres actualités liées à la NFL après l'article.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Yahoo, janvier 2024

Maintenant, comparons la page Yahoo avec l'article de Rolling Stone à l'article réel sur le site Web de Rolling Stone.

  • Le menu principal n'a pas de section sports dans son menu principal.
  • Les dernières nouvelles de la barre latérale couvrent la politique et le divertissement.
  • L'article est suivi d'autres suggestions d'actualités dans les domaines de la mode, de la musique, de l'éducation et des voyages.
Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Rolling Stone, janvier 2024

Cela rend la version Yahoo de l'article de Rolling Stone plus pertinente pour les utilisateurs recherchant des expressions de mots clés avec NFL.

Concernant l'âge du domaine, Rolling Stone (créé le 21 septembre 1994) a trois mois de plus que Yahoo.

Ce que Yahoo a : 7 milliards de backlinks provenant de 2,3 millions de domaines référents, contre Rolling Stone avec 60 millions de backlinks provenant de 352 000 domaines référents.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Semrush, janvier 2024

4. Accès au robot

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de X, janvier 2024

Un moyen rapide de vérifier si Google a accès au contenu d'un domaine spécifique est la recherche par mot clé site:domain.com .

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Google, janvier 2024

Amener Google à indexer le contenu d’un site Web ne représente que la moitié de la bataille.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Google, janvier 2024

Amener Google à placer une page spécifique de votre site Web en haut des résultats de recherche pour une requête par mot clé spécifique est le véritable défi.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Google, janvier 2024

5. API de sujets

L'API Topics fait partie de l'initiative Privacy Sandbox de Google visant à améliorer la confidentialité des utilisateurs.

« Dans le passé, des cookies tiers et d'autres mécanismes ont été utilisés pour suivre le comportement de navigation des utilisateurs sur des sites afin d'en déduire des sujets d'intérêt. Ces mécanismes sont progressivement supprimés.

Avec l'API Topics, le navigateur observe et enregistre les sujets qui semblent intéresser l'utilisateur, en fonction de son activité de navigation. Ces informations sont enregistrées sur l'appareil de l'utilisateur. L'API Topics peut ensuite donner aux appelants de l'API (tels que les plateformes de technologie publicitaire) l'accès aux sujets d'intérêt d'un utilisateur, mais sans révéler d'informations supplémentaires sur l'activité de navigation de l'utilisateur.

Bien que Google ait conçu cette fonctionnalité pour le ciblage publicitaire après la dépréciation des cookies tiers, il faut se demander si la classification d'un site Web affecte également son placement auprès de sites Web similaires dans Google Actualités.

Ce qui suit est une comparaison de 404media.co par rapport aux sites classés dans Google Actualités pour le sujet traité.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Google Chrome, janvier 2024

Pas un facteur de classement : l'auteur

Un thème récurrent dans les recherches passées est la manière dont Google traiterait le contenu généré par l’IA.

En avril 2022, Mueller a déclaré que le contenu généré automatiquement – y compris le contenu créé avec des outils d’IA générative – était contraire aux directives de la recherche Google.

« Je soupçonne que la qualité du contenu est peut-être un peu meilleure que celle des outils très anciens, mais pour nous, il s'agit toujours de contenu généré automatiquement, ce qui signifie pour nous que cela est toujours contraire aux directives aux webmasters. Nous considérerions donc cela comme du spam.

Avance rapide jusqu’en février 2023, lorsque Google a publié des conseils sur le contenu généré par l’IA. Plus précisément, Google a déclaré qu'il récompenserait le contenu de haute qualité, quelle que soit la manière dont il était produit. Les divulgations sur le contenu génératif de l’IA sont « utiles » lorsqu’elles sont « raisonnablement attendues ».

« Les divulgations liées à l'IA ou à l'automatisation sont utiles pour les contenus dans lesquels quelqu'un pourrait se demander : « Comment cela a-t-il été créé ? ». Envisagez de les ajouter lorsque cela serait raisonnablement prévu.

Une idée similaire a été partagée en juin 2023 concernant les divulgations de contenu généré par l’IA et EEAT.

"Du point de vue de Google, il n'est pas nécessaire de qualifier explicitement le contenu généré par l'IA de contenu généré par l'IA, car nous évaluons la nature du contenu."

Pour enfoncer davantage le clou, Google SearchLiason a déclaré dans un article sur X que les signatures des auteurs sont destinées aux utilisateurs et ne constituent pas un facteur de classement pour la recherche Google.

« Je sais que ce sera une « réponse simple, presque pittoresque », mais cette partie de l'article est fausse et ne nous cite pas non plus en disant cela. Google ne « vérifie pas nos informations d'identification » d'une manière ou d'une autre.

4 conseils SEO pour surpasser vos concurrents dans Google Actualités

Peu importe que le site Web qui vous surpasse dans les résultats de recherche soit une ferme de contenu générée par l'IA ou une agence de presse établie. Tout site qui vous surpasse est votre concurrent dans les recherches.

Il n’est pas garanti que ces conseils fonctionnent, mais ils pourraient certainement vous aider.

1. Recherchez les problèmes techniques qui affectent la façon dont les moteurs de recherche indexent votre contenu.

Google propose des astuces, des outils et des conseils pour aider les propriétaires de sites Web à résoudre les problèmes techniques de référencement qui peuvent empêcher les robots de recherche d'accéder et d'indexer le contenu du site Web.

2. Créez un lien vers votre propre contenu dans vos articles avec contexte.

Les liens sont l’un des principaux facteurs de classement qui aident Google à trier les résultats de recherche.

Google suggère spécifiquement aux propriétaires de sites Web de croiser leur propre contenu avec des liens internes.

Les liens internes doivent utiliser un texte d'ancrage optimisé pour les mots clés, comme le plus vieux brie du monde, pour donner aux lecteurs et aux moteurs de recherche le contexte du lien.

liens internes de l'essentiel de la recherche Google Capture d'écran de Google, janvier 2024

Dans le paragraphe ci-dessous du rapport de 404 Media, il est possible d'ajouter un lien interne vers l'un des articles de 404 Media sur CivitAI avec le mot-clé d'ancrage CivitAI.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de 404media.co, janvier 2024

Au lieu de cela, il existe deux liens sortants : un vers Google Actualités et un autre vers un éditeur qui les surpasse dans les résultats de recherche.

résultats de Google Actualités Capture d'écran de Google Actualités, janvier 2024

Cela nous amène à un autre conseil SEO important concernant les liens.

3. Évitez de créer des liens vers des concurrents.

En règle générale, ne créez pas de liens vers des sites Web que vous ne souhaitez pas classer bien ou mieux que votre site Web dans les résultats de recherche.

Tout comme les liens internes vers vos articles peuvent optimiser votre contenu pour la recherche, les liens externes vers les articles d'un concurrent peuvent optimiser le contenu du concurrent pour la recherche.

Si vous pensez qu'un site a volé du contenu ou n'a pas correctement crédité quelqu'un pour du contenu « emprunté », ne l'aidez pas avec un lien.

Tout ce qu'il fait, c'est envoyer vos visiteurs ET les robots des moteurs de recherche vers des concurrents, « augmentant » encore leur visibilité et leur portée.

Dans le paragraphe suivant du rapport, vous trouverez des liens vers des articles originaux sur Heavy et Distractify, ainsi que vers un site qui aurait « arraché » du contenu pour générer des revenus publicitaires.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran de Google Actualités, janvier 2024

Cela donne à la fois aux créateurs de contenu original et à leurs concurrents un précieux « jus de liens ».

Ensuite, vous devez vous concentrer sur la création de liens entrants depuis d’autres sites Web vers votre contenu. Comment?

4. Contactez toute personne qui utilise votre recherche originale pour obtenir un lien.

Si vous étiez vraiment la première personne à découvrir un problème ou à partager une histoire, vous en méritez le mérite.

La meilleure façon d’obtenir du crédit pour votre travail est de contacter l’auteur du contenu qui a utilisé votre recherche. Faites-leur savoir que vous apprécieriez un lien vers votre article en guise de crédit pour l'utilisation de l'information.

Si l'auteur ne répond pas, vous pouvez contacter l'équipe éditoriale du site ou le formulaire de contact général pour les demandes de révision.

Si ces efforts n’aboutissent pas à une réponse, vous pouvez leur donner un coup de pouce public sur X ou sur la plateforme sociale qu’ils utilisent le plus.

Alors que certains sites vous créditeront d’un lien offrant la valeur SEO maximale possible, d’autres ne suivront pas votre lien.

Pourquoi Google peut classer le contenu généré par l'IA par rapport aux actualités originales Capture d'écran d'Engadget, janvier 2024

Le nofollow enlève effectivement une partie de son « pouvoir de stimulation » pour la recherche, même s'il pourrait toujours entraîner une augmentation du trafic de référence, de nouveaux abonnés et de nouveaux fans sur les réseaux sociaux.

Dans les situations où votre contenu a été volé textuellement et que le propriétaire du site refuse de créditer ou de supprimer votre contenu, vous avez la possibilité de soumettre une demande de retrait DMCA .

Comme mentionné précédemment, la dernière chose que vous souhaitez faire est de créer des liens vers des sites qui vous surpassent sans crédit – vos liens ne font que « booster » le classement d’autres sites plus haut dans les résultats de recherche.

Les captures d'écran sont votre meilleure option pour partager des mentions non créditées de votre travail sur d'autres sites.

Il en va de même pour les réseaux sociaux. Lorsque vous partagez le lien d'un autre site Web ou marquez le nom d'utilisateur d'un voleur de contenu, vous augmentez son trafic de référence et son engagement sur cette plateforme sociale.

L'engagement – qu'il soit positif ou négatif – augmentera la visibilité de cet utilisateur. Demandez-vous si vous voulez vraiment faire cela.

Conclusion

Alors que Google continue de mettre à jour son algorithme et d'ajouter de nouvelles fonctionnalités d'IA générative à la recherche, il est important que les propriétaires de sites Web surveillent la visibilité de leur site dans les résultats de recherche et continuent d'optimiser le contenu de leur site Web pour la recherche, les médias sociaux et les sources de trafic supplémentaires.

Image en vedette : Funstock/Shutterstock