L'équipe des relations de recherche de Google confirme que les pages non indexées n'ont pas d'impact négatif sur le budget d'exploration d'un site Web, quel que soit le nombre de sites.
Ce sujet n'est pas abordé une, mais trois fois au cours du mois de novembre Édition 2022 de la session de questions-réponses Google sur les heures de bureau SEO.
Recherche Google Les avocats John Mueller et Gary Illyes répondent à tour de rôle à trois questions similaires posées par des personnes craignant d'avoir trop de pages non indexées sur leurs sites.
D'après les réponses de Mueller et Illyes, nous apprenons qu'il n'y a pas de "trop" pages indexées. De plus, à moins que votre site Web ne compte plus d'un million de pages, vous n'avez pas à vous soucier du budget d'exploration.
Voici un bref récapitulatif de chaque question et réponse.
Question 1 : Pages indexées excessives
À 8h23 des heures de bureau de Google en novembre 2022, Illyes répond à une question demandant si un nombre "excessif" de pages indexées est un problème pour la découverte ou l'indexation.
Illyes dit que noindex est un outil pour aider les sites Web à garder le contenu hors des moteurs de recherche. Google encourage l'utilisation de la balise noindex lorsque cela est nécessaire, et pour cette raison, il n'y a aucun effet indésirable associé.
"Noindex est un outil très puissant que les moteurs de recherche prennent en charge pour vous aider, ce propriétaire de site, à garder le contenu hors de leurs index. Pour cette raison, il n'entraîne aucun effet indésirable en matière d'exploration et d'indexation. Par exemple, avoir de nombreuses pages sans index n'influencera pas la façon dont Google explore et indexe votre site. arrive à 10h22 :
« Devons-nous garder un œil sur le rapport entre les pages indexées et non indexées dans la Search Console afin de mieux reconnaître le budget de crawl éventuellement gaspillé sur les pages non indexées ? pages indexées ?"
Mueller démystifie le fait que les sites Web devraient tenter d'équilibrer leurs pages indexées et non indexées.
À cette fin, le budget de crawl est un facteur auquel peu de sites doivent penser ; Mueller dit :
"Non, il n'y a pas de ratio magique à surveiller. De plus, pour un site qui n'est pas gigantesque, avec peut-être moins d'un million de pages, vous n'avez vraiment pas à vous soucier du budget de crawl de votre site Web. C'est bien de supprimer les liens internes inutiles, mais pour les sites de petite et moyenne taille, c'est plus un sujet d'hygiène du site qu'un sujet de référencement.
À 11:26, une question sur l'absence de pages indexées est légèrement différente des deux précédentes.
La question se lit comme suit :
"De nombreux référenceurs se plaignent d'avoir des millions d'URL signalées comme exclues par noindex dans Google Search Console . Tout cela sur des pages de recherche internes absurdes liées à des sites de spam. Est-ce un problème pour le budget de crawl ?"
Ilyes réitère le point précédent sur le fait que noindex est un outil que les sites peuvent utiliser au besoin.
En supposant que les pages sont intentionnellement non indexées , vous n'avez pas à vous soucier du fait que la Search Console les signale. Cela ne signifie pas que vous faites quelque chose de mal.
Illyes déclare :
"Noindex est là pour vous aider à garder les choses hors de l'index, et il ne t viennent avec des effets négatifs involontaires, comme nous l'avons dit précédemment. Si vous voulez vous assurer que ces pages ou leurs URL, plus précisément, ne se retrouvent pas dans l'index de Google, continuez à utiliser noindex et ne vous souciez pas du budget de crawl. »
Source : Google
"Noindex est un outil très puissant que les moteurs de recherche prennent en charge pour vous aider, ce propriétaire de site, à garder le contenu hors de leurs index. Pour cette raison, il n'entraîne aucun effet indésirable en matière d'exploration et d'indexation. Par exemple, avoir de nombreuses pages sans index n'influencera pas la façon dont Google explore et indexe votre site. arrive à 10h22 :
« Devons-nous garder un œil sur le rapport entre les pages indexées et non indexées dans la Search Console afin de mieux reconnaître le budget de crawl éventuellement gaspillé sur les pages non indexées ? pages indexées ?"
« Devons-nous garder un œil sur le rapport entre les pages indexées et non indexées dans la Search Console afin de mieux reconnaître le budget de crawl éventuellement gaspillé sur les pages non indexées ? pages indexées ?"
Mueller démystifie le fait que les sites Web devraient tenter d'équilibrer leurs pages indexées et non indexées.
À cette fin, le budget de crawl est un facteur auquel peu de sites doivent penser ; Mueller dit :
"Non, il n'y a pas de ratio magique à surveiller. De plus, pour un site qui n'est pas gigantesque, avec peut-être moins d'un million de pages, vous n'avez vraiment pas à vous soucier du budget de crawl de votre site Web. C'est bien de supprimer les liens internes inutiles, mais pour les sites de petite et moyenne taille, c'est plus un sujet d'hygiène du site qu'un sujet de référencement.
À 11:26, une question sur l'absence de pages indexées est légèrement différente des deux précédentes.
La question se lit comme suit :
"De nombreux référenceurs se plaignent d'avoir des millions d'URL signalées comme exclues par noindex dans Google Search Console . Tout cela sur des pages de recherche internes absurdes liées à des sites de spam. Est-ce un problème pour le budget de crawl ?"
Ilyes réitère le point précédent sur le fait que noindex est un outil que les sites peuvent utiliser au besoin.
En supposant que les pages sont intentionnellement non indexées , vous n'avez pas à vous soucier du fait que la Search Console les signale. Cela ne signifie pas que vous faites quelque chose de mal.
Illyes déclare :
"Noindex est là pour vous aider à garder les choses hors de l'index, et il ne t viennent avec des effets négatifs involontaires, comme nous l'avons dit précédemment. Si vous voulez vous assurer que ces pages ou leurs URL, plus précisément, ne se retrouvent pas dans l'index de Google, continuez à utiliser noindex et ne vous souciez pas du budget de crawl. »
Source : Google
"Non, il n'y a pas de ratio magique à surveiller. De plus, pour un site qui n'est pas gigantesque, avec peut-être moins d'un million de pages, vous n'avez vraiment pas à vous soucier du budget de crawl de votre site Web. C'est bien de supprimer les liens internes inutiles, mais pour les sites de petite et moyenne taille, c'est plus un sujet d'hygiène du site qu'un sujet de référencement.
À 11:26, une question sur l'absence de pages indexées est légèrement différente des deux précédentes.
La question se lit comme suit :
"De nombreux référenceurs se plaignent d'avoir des millions d'URL signalées comme exclues par noindex dans Google Search Console . Tout cela sur des pages de recherche internes absurdes liées à des sites de spam. Est-ce un problème pour le budget de crawl ?"
"De nombreux référenceurs se plaignent d'avoir des millions d'URL signalées comme exclues par noindex dans Google Search Console . Tout cela sur des pages de recherche internes absurdes liées à des sites de spam. Est-ce un problème pour le budget de crawl ?"
Ilyes réitère le point précédent sur le fait que noindex est un outil que les sites peuvent utiliser au besoin.
En supposant que les pages sont intentionnellement non indexées , vous n'avez pas à vous soucier du fait que la Search Console les signale. Cela ne signifie pas que vous faites quelque chose de mal.
Illyes déclare :
"Noindex est là pour vous aider à garder les choses hors de l'index, et il ne t viennent avec des effets négatifs involontaires, comme nous l'avons dit précédemment. Si vous voulez vous assurer que ces pages ou leurs URL, plus précisément, ne se retrouvent pas dans l'index de Google, continuez à utiliser noindex et ne vous souciez pas du budget de crawl. »
"Noindex est là pour vous aider à garder les choses hors de l'index, et il ne t viennent avec des effets négatifs involontaires, comme nous l'avons dit précédemment. Si vous voulez vous assurer que ces pages ou leurs URL, plus précisément, ne se retrouvent pas dans l'index de Google, continuez à utiliser noindex et ne vous souciez pas du budget de crawl. »
Source : Google
SourceGoogle