John Mueller de Google a répondu à une question sur Reddit sur la marche à suivre face aux milliers d'erreurs 404 signalées dans Google Search Console.
La réponse de John a clarifié la manière d'aborder le rapport d'indexation des pages de la Search Console en ce qui concerne les erreurs 404 qui y sont répertoriées.
Réponse à une erreur 404
La réponse d'erreur 404 est un message d'un serveur au robot d'exploration (ou à un navigateur) indiquant au robot d'exploration que le serveur a rencontré une erreur lors de la récupération de la page Web demandée car elle n'existe pas.
L'erreur est que la page Web n'existe pas.
Ce n'est pas une erreur dans le sens où il s'agit d'un problème à corriger.
Cela dit, il existe des situations dans lesquelles des mesures devraient être prises pour faire disparaître ces 404.
Raisons du 404
Certaines des raisons les plus courantes pour un 404 :
- Le plan du site répertorie les pages qui n'existent plus
- Les pages Web internes renvoient vers des pages Web qui n'existent plus
- La page Web contient une URL mal orthographiée
- Le contenu a été déplacé mais aucune redirection n'a été mise en place
- Les pages de spam renvoient vers des pages Web inexistantes
Ce qui précède est une liste de six raisons auxquelles je peux penser spontanément. Il peut y avoir d'autres raisons.
Parmi les six raisons pour lesquelles 404 pages sont répertoriées ci-dessus, les cinq premières sont celles qui constituent des problèmes de site Web qui doivent être résolus.
Le dernier, les 404 provoqués par des liens externes vers des pages Web qui n'existent pas, peut être ignoré en toute sécurité.
Question Reddit sur les 404 signalés dans la console de recherche
La personne qui posait la question voulait savoir quoi faire en cas d'erreurs 404 provoquées par des sites de spam renvoyant vers des milliers de pages Web qui n'existent pas.
C'est la question posée :
«J'ai reçu aujourd'hui un e-mail de Google concernant la validation des correctifs dans GSC. La plupart des correctifs concernent des erreurs 404 pour des URL qui n'existent pas sur mon site Web.
Il semble que les sites de spam contiennent des liens vers des pages de mon site Web qui n'existent pas. Je ne sais donc pas comment procéder puisque Google souhaite que je « valide le correctif ».
Dois-je rediriger tous les liens vers notre page d’accueil ? Dois-je simplement laisser tomber ?
John Mueller a répondu :
"Ignore les. Si la page n'est pas censée exister, elle devrait renvoyer 404.
Si vous pensiez que la page était censée exister, alors cette erreur est un bon rappel.
L'erreur 404 est une réponse du serveur
Comme mentionné précédemment, la réponse 404 n’est pas toujours quelque chose qui doit être corrigé.
Si vous savez que la page n'existe pas, comme l'a dit John Mueller, le serveur fait ce qu'il faut en renvoyant une réponse 404.
Certains ne souhaitent pas que leur serveur renvoie une réponse 404. Ce qu'ils font, c'est créer une redirection vers la page d'accueil afin qu'il n'y ait plus d'erreurs 404. Mais ce n’est pas une bonne pratique car cela crée ce qu’on appelle un soft 404.
Cette pratique repose sur l’idée que le 404 est une erreur. Ce n'est pas une erreur. C'est une réponse du serveur, c'est tout.
Ce qu'il faut retenir, c'est qu'il est correct qu'une page Web qui n'existe pas renvoie une réponse d'erreur 404.
Sauf s'il y a une erreur sur le site Internet responsable de la réponse du serveur 404.
Image en vedette par Shutterstock/Friends Stock