Google explique les raisons pour lesquelles l'exploration n'est pas indexée

Google explique les raisons pour lesquelles l'exploration n'est pas indexée

En mai dernier, Gary Illyes de Google a participé à une interview lors de la conférence SERP Conf 2024 en Bulgarie et a répondu à une question sur les causes de l'exploration mais non de l'indexation, offrant plusieurs raisons utiles pour déboguer et corriger cette erreur.

Bien que l’interview ait eu lieu en mai, la vidéo de l’interview a été sous-estimée et peu de personnes l’ont réellement regardée. Je n'en ai entendu parler que parce que la toujours géniale Olesia Korobka ( @Giridja ) a récemment attiré l'attention sur l'interview dans une publication sur Facebook.

Ainsi, même si l’entretien a eu lieu en mai, l’information est toujours d’actualité et utile.

Raison de l'exploration – Actuellement non indexé

Crawled Actuellement Non Indexé est une référence à un rapport d'erreur dans le rapport d'indexation des pages de la console de recherche de Google qui alerte qu'une page a été explorée par Google mais n'a pas été indexée.

Lors d'un entretien en direct, quelqu'un a posé une question demandant :

« Est-ce qu'une page explorée mais non indexée peut être le résultat d'une page trop similaire à d'autres éléments déjà indexés ?

Alors, Google suggère-t-il qu'il existe déjà suffisamment d'autres éléments et que les vôtres ne sont pas assez uniques ? »

La documentation de la console de recherche de Google ne fournit pas de réponse quant à la raison pour laquelle Google peut explorer une page et ne pas l'indexer. C'est donc une question légitime.

Gary Illyes a répondu que oui, une des raisons pourrait être qu'il existe déjà d'autres contenus similaires. Mais il ajoute également qu’il existe d’autres raisons.

Il a répondu:

« Ouais, ça pourrait être une chose que cela peut signifier. L'analyse mais non l'indexation l'est, idéalement, nous diviserions cette catégorie en morceaux plus granulaires, mais c'est très difficile en raison de la façon dont les données existent en interne.

Cela peut être un tas de choses, l'élimination des duplications est l'une de ces choses, où nous explorons la page et ensuite nous décidons de ne pas l'indexer car il existe déjà une version de celle-ci ou une version extrêmement similaire de ce contenu disponible dans notre index et il a de meilleurs signaux.

Mais oui, mais ça peut être plusieurs choses.

La qualité générale du site peut avoir un impact sur l'indexation

Gary a ensuite attiré l'attention sur une autre raison pour laquelle Google pourrait explorer mais choisir de ne pas indexer un site, affirmant qu'il pourrait s'agir d'un problème de qualité du site.

Illyes poursuivit alors sa réponse :

« Et la qualité générale du site, qui peut avoir une grande importance dans le nombre de sites explorés mais non indexés que vous voyez dans la console de recherche. Si le nombre de ces URL est très élevé, cela pourrait laisser penser à des problèmes de qualité généraux.

Et j'ai souvent vu cela depuis février, où tout à coup nous avons décidé d'indexer une grande quantité d'URL sur un site simplement parce que… notre perception du site a changé.

Autres raisons pour lesquelles l'exploration n'est pas indexée

Gary a ensuite proposé d'autres raisons pour lesquelles les URL pourraient être explorées mais non indexées, affirmant qu'il se pourrait que la perception du site par Google ait changé, mais qu'il pourrait s'agir d'un problème technique.

Gary a expliqué :

« …Et il est possible que lorsque vous voyez ce chiffre augmenter, que la perception de… La perception de Google à l'égard du site ait changé, cela pourrait être une chose.

Mais il se peut également qu'il y ait eu une erreur, par exemple sur le site, et qu'il ait ensuite diffusé exactement la même page sur chaque URL du site. Cela pourrait également être l’une des raisons pour lesquelles ce chiffre augmente.

Alors oui, il pourrait y avoir beaucoup de choses.

Points à retenir

Gary a fourni des réponses qui devraient aider à déboguer pourquoi une page Web peut être explorée mais non indexée par Google.

  • Le contenu est similaire au contenu déjà classé dans les pages de résultats des moteurs de recherche (SERP)
  • Exactement le même contenu existe sur un autre site qui a de meilleurs signaux
  • Problèmes généraux de qualité du site
  • Problèmes techniques

Bien qu'Illyes n'ait pas précisé ce qu'il voulait dire à propos d'un autre site avec de meilleurs signaux, je suis presque certain qu'il décrit le scénario dans lequel un site syndique son contenu sur un autre site et que Google choisit de classer l'autre site pour le contenu et non pour le contenu. éditeur original.

Regardez Gary répondre à cette question après 9 minutes de l'interview enregistrée :

Image en vedette par Shutterstock/Roman Samborskyi