Utiliser Python pour expliquer la redirection de la page d'accueil vers C-Suite

Utiliser Python pour expliquer la redirection de la page d'accueil vers C-Suite

24 avril 2024

Si vous êtes un professionnel du référencement, vous travaillez peut-être sur un site qui redirige la page d'accueil vers un sous-répertoire, par exemple en redirigeant vers une version du site spécifique à un pays. Ou, en utilisant un contenu d'espace réservé renvoyant à la page d'accueil du site principal dans un sous-répertoire.

Dans ces deux cas, vous pourriez avoir du mal à convaincre votre client ou vos collègues de suivre les meilleures pratiques. Si tel est le cas, alors cet article est fait pour vous.

Je vais vous montrer un moyen de communiquer avec les C-suites qui a du sens pour eux techniquement et commercialement en fournissant des exemples basés sur des données.

Pour ce faire, je vais vous montrer comment utiliser Python pour calculer le TIPR de toutes les pages du site afin de fournir un scénario comparatif avant et après pour justifier les modifications demandées.

Nous couvrirons :

Tout d’abord, voyons pourquoi la page d’accueil doit être fusionnée avec la racine.

Hébergement de pages d'espace réservé sur les redirections racine et racine

Certains sites hébergent une page d'espace réservé sur l'URL racine ou, pire encore, redirigent la racine vers un sous-répertoire ou une page.

De nombreuses marques mondiales, notamment celles du secteur de la mode, exploiteront des sites multirégionaux où chaque magasin régional réside dans son dossier régional.

Par exemple, si j'allais chez Gucci, je m'attendrais à trouver les magasins suivants :

…et ainsi de suite.

Dans le cas de Gucci, il y a non seulement un dossier régional, mais aussi un dossier linguistique, ce qui est très logique.

Parce que je réside à Londres, le dossier racine https://www.gucci.com/ me redirige vers la boutique britannique.

Une recherche sur le site Gucci.com ( site:gucci.com ) montre que le dossier racine est indexé et propose un menu de sélection de magasin régional.

Pour de nombreux sites, le dossier racine sera redirigé de manière permanente vers leur magasin régional par défaut ou le plus populaire.

Pourquoi la page d'accueil devrait être fusionnée avec la racine

Les moteurs de recherche utilisent l'autorité (une mesure de la probabilité qu'une page soit découverte via des hyperliens) pour déterminer son importance relative sur le Web. Par conséquent, plus une page a d’autorité, plus son potentiel de classement dans les résultats de recherche (SERP) est élevé.

Étant donné que la plupart des sites génèrent le plus de liens vers leur URL racine, c’est là que réside le pouvoir de classement des moteurs de recherche.

Ce n'est pas idéal pour l'architecture du site, car cela signifie que toutes les pages de liste de produits (PLP) et les pages de description de produit (PDP) se trouvent à un pas supplémentaire de la page d'accueil.

Ce saut supplémentaire semble petit ; cependant, ce n’est pas sans conséquence, comme nous l’illustrerons maintenant et le quantifierons plus tard.

Visualisons le graphique des liens des sites notant leur page d'accueil dans le dossier racine.

Vous trouverez ci-dessous un site réel où son URL racine a un score d'autorité au niveau de la page (selon Ahrefs) de 40 PR, redirigeant vers son magasin principal de langue anglaise /en (21 PR) avant de créer un lien vers tous les PLP et PDP.

L'URL racine a un score d'autorité au niveau de la page (selon Ahrefs) de 40 Image de l'auteur, avril 2024

Naturellement, toutes les pages (bleues) via le logo seront liées à la page d'accueil de leur magasin régional (pour leurs utilisateurs) et à d'autres pages d'accueil régionales (affichées en rose) au lieu de relier l'URL racine, ce qui gonfle artificiellement la valeur du site régional. page d'accueil.

Notez que les pages du site au niveau 2 du site (qui sont directement liées depuis la page d'accueil) ont une note au niveau de la page de 19 PR et les autres pages du niveau 3 du site ont 18 PR.

Ce qui se produit également, c'est que les pages sont supprimées d'une étape de l'URL racine et ne reçoivent donc pas toute l'autorité.

Pensez à la détérioration de la qualité du son musical lorsque vous faites des copies d'une copie au lieu d'une copie de la musique originale.

C'est l'expérience que votre site offre aux moteurs de recherche lorsqu'ils tentent d'évaluer l'importance relative du contenu de votre site !

Si les magasins étaient liés à l'URL racine, cela ne serait pas souhaitable car cela créerait une charge de redirections sur l'ensemble du site, gaspillant encore davantage la distribution de l'autorité.

La meilleure approche consisterait à éliminer les intermédiaires en fusionnant la racine avec la page d'accueil afin que toutes les pages du site soient supprimées d'un saut de moins, comme indiqué ci-dessous :

fusionner la racine avec la page d'accueil Image de l'auteur, avril 2024

Suite à la fusion de la page d'accueil et de l'URL racine, le PR de la page d'accueil est désormais de 72, ce qui est beaucoup plus proche de l'autorité de domaine du site de 75 DR, et chacune des pages a reçu 1 PR supplémentaire, augmentant ainsi leur potentiel de classement.

Les difficultés liées à la communication des avantages aux dirigeants non experts en référencement

Pour un public non expert en référencement, comme vos collègues marketing et informatique, tout cela semble plutôt académique et abstrait – et probablement assez incroyable.

Même si vous avez utilisé les diagrammes ci-dessus, ils sont naturellement plus intéressés par l'impact sur le trafic, voire par les implications sur les revenus.

Ils n'ont probablement aucune idée de la métrique PageRank de Google pour mesurer l'autorité de la page et s'en moquent à moins que vous leur fournissiez les chiffres.

Utiliser Python pour estimer l'amélioration du PageRank

Heureusement, grâce à la puissance de la science des données, nous pouvons effectuer ces calculs complexes en Python pour estimer les nouvelles valeurs PR en suivant les meilleures pratiques de déplacement vers l'URL racine.

Prenez la formule du PageRank :

 PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Comme expliqué dans L'anatomie d'un moteur de recherche Web hypertextuel à grande échelle par les fondateurs de Google :

« Nous supposons que la page A contient des pages T1…Tn qui y pointent (c'est-à-dire des citations). Le paramètre d est un facteur d'amortissement qui peut être réglé entre 0 et 1. On fixe généralement d à 0,85. … Également C(A) est défini comme le nombre de liens sortant de la page A.

Notez que les PageRanks forment une distribution de probabilité sur les pages Web, donc la somme des PageRanks de toutes les pages Web sera un.

L'essentiel de la formule est que le montant du PageRank d'une URL (A) est principalement déterminé par le PageRank (PR Ti) des pages qui y renvoient (Ti) et le nombre de liens internes sur ces pages C (Ti) .

La version Python de la formule PageRank peut être trouvée ici .

En tant qu'expérience de pensée armée de la connaissance de la formule ci-dessus, nous nous attendrions à :

  • La nouvelle page d'accueil bénéficiera du fait que toutes les pages sont liées à l'URL racine (PR Ti) partagée avec les autres liens internes sortants C(Ti).
  • Toutes les pages du site bénéficient de leur URL parent plus puissante (la nouvelle page d'accueil fusionnée dans l'URL racine).

En gardant ce qui précède à l’esprit, il ne nous reste plus qu’à recalculer l’impact sur l’ensemble du site de la fusion du dossier /en avec l’URL racine sur l’ensemble du site, ce qui se fait en plusieurs phases :

  • Calculer le TIPR de toutes les pages du site : Comme expliqué précédemment dans ce que la science des données peut faire pour les architectures de sites, alors que le logiciel d'audit de site donne le PageRank relatif en interne, celui-ci doit être combiné avec le PageRank externe d'Internet à l'aide d'outils d'intelligence de liens comme Ahrefs.
  • Calculez le nouveau TIPR de la nouvelle page d'accueil : c'est à dire /en fusionné ou migré avec l'URL racine.
  • Calculez le nouveau TIPR de toutes les pages suivantes et restantes du site Web.

Comme le montrent les diagrammes ci-dessus, la nouvelle configuration des meilleures pratiques affiche les nouvelles valeurs TIPR de toutes les pages.

Python pour modéliser l'impact du trafic à partir de l'amélioration du PageRank

Une fois les étapes de calcul du TIPR suivies, votre prochaine tâche consiste à traduire les avantages techniques du référencement en impact commercial afin d'obtenir l'adhésion de vos collègues.

Une mesure de résultat à modéliser serait le trafic de recherche organique en fonction du TIPR. Avec suffisamment de points de données (disons 10 000), cela peut être réalisé grâce à l’apprentissage automatique (ML).

Votre entrée serait l'ensemble de données avant le recalcul TIPR où vous alimenteriez la colonne TIPR et les clics de recherche (vraisemblablement joints à partir de Google Search Console).

Le graphique ci-dessous visualise la relation entre TIPR et les clics.

Relation entre TIPR et clics : modèle de la ligne bleue Image de l'auteur, avril 2024

La ligne bleue est un modèle approximatif indiquant combien de clics supplémentaires une page recevrait avec une augmentation du PageRank unitaire.

Les mathématiciens aiment dire : « Tous les modèles sont faux mais certains sont utiles ». Cependant, la science peut être assez convaincante en fournissant une certaine crédibilité à vos augmentations prévues à l'aide de la fonction Python predict() utilisant votre modèle ML. Vous pouvez trouver un exemple ici.

Dans le cas ci-dessus, nous constatons que jusqu'à 20 TIPR, il y a une augmentation de trafic de 0,35 visites par mois par page, et au-delà de 20 TIPR, c'est 0,75 visites.

L'utilisation d'une approche basée sur les données est plus convaincante pour les dirigeants

Cela peut sembler peu. Cependant, en regroupant les centaines de milliers d'URL indexables, nous prévoyons un trafic mensuel supplémentaire de 200 000 pour un client.

Cette prévision leur a donné la confiance et la volonté de donner enfin suite à la recommandation répétée de définir la page d'accueil sur root, que l'entreprise a reçue de nombreux consultants SEO.

La différence réside dans la quantification, tant sur le plan technique que commercial.

En combinant TIPR et en appliquant la formule PageRank pour simuler un scénario avant et après pour votre recommandation technique de référencement – dans ce cas, en définissant l'URL racine comme page d'accueil – votre référencement est basé sur les données et, plus important encore, beaucoup plus convaincant. .

Non seulement techniquement mais aussi commercialement, ce qui vous aidera à mettre en œuvre davantage de vos recommandations SEO et, espérons-le, à promouvoir votre carrière.

Cela mis à part, adopter une approche basée sur les données peut également vous aider à vérifier vos recommandations de bonnes pratiques en fonction des idées que vous avez lues en ligne.

C'est vrai aujourd'hui comme il y a 20 ans : les meilleurs professionnels du référencement testent constamment des idées plutôt que de suivre inconditionnellement les dogmes des meilleures pratiques.

Davantage de ressources:

  • Redirections d'URL pour le référencement : un guide technique
  • Utiliser Python + Streamlit pour trouver des opportunités de mots clés à distance frappante
  • Le cahier d’exercices complet d’audit technique SEO

Image en vedette : BestForBest/Shutterstock