Headless SEO : 8 étapes essentielles pour la mise en œuvre technique

Headless SEO : 8 étapes essentielles pour la mise en œuvre technique

Les systèmes de gestion de contenu (CMS) sans tête sont en plein essor et sont rapidement adoptés par de grandes marques comme IKEA, Nike et National Geographic.

Il existe des tonnes d'options, et il est plus probable qu'improbable qu'en tant que professionnel du référencement, vous devrez travailler avec une à l'avenir.

Cela présente certains avantages, comme la possibilité de s'intégrer plus facilement à des technologies tierces ou de réutiliser le contenu sur plusieurs canaux pour répondre aux nouveaux comportements de recherche des utilisateurs.

Mais les professionnels du référencement sont habitués à travailler avec des CMS traditionnels, et s'adapter à cette nouvelle façon de penser le contenu peut demander un certain travail.

Qu’est-ce que le référencement sans tête ?

Le référencement sans tête fait référence aux processus uniques requis pour optimiser le contenu pour la recherche à l'aide d'un CMS sans tête.

Fondamentalement, un CMS headless détache le contenu de sa présentation.

Dans les CMS traditionnels comme WordPress, le contenu et la présentation sont étroitement liés. Vous créez des pages plutôt que du contenu.

Deux diagrammes côte à côte montrant comment un CMS traditionnel (ou monolithique) est construit par rapport à un CMS sans tête. Image de Sanity.io, novembre 2023

Dans le monde sans interface graphique, au lieu de pages, vous créez des unités de contenu contenant différents champs. Ce contenu peut ensuite être affiché sur différentes surfaces.

Certaines de ces surfaces sont assez basiques, comme un site Web ou une application, mais vous pouvez aller au-delà et l'intégrer aux médias sociaux, à l'affichage numérique ou à des marchés comme Etsy ou Amazon.

Ainsi, le référencement sans tête consiste moins à créer du contenu et à créer des liens qu’à saisir les nuances d’un système découplé.

Le défi technique

Travailler avec un CMS sans tête présente un défi spécifique. Dans les CMS traditionnels, le fait que le contenu et la présentation soient strictement liés nous a permis de créer de très bons sites Web prêts à l'emploi.

Dans une configuration sans tête, nous n'avons pas ces garde-corps prêts à l'emploi et nous devons être beaucoup plus précis dans notre mise en œuvre technique.

Lorsque vous faites du référencement dans un CMS headless, vous devez vous soucier de deux choses très différentes d'un point de vue technique :

  • Le front-end : vérifier la manière dont le contenu est présenté aux utilisateurs et aux moteurs de recherche est un élément standard du référencement technique, ce qui n'est pas nouveau pour la plupart des professionnels du référencement.
  • Le CMS : headless CMS vous permet d'ajouter et de supprimer des champs modifiables de votre contenu. Les professionnels du référencement travaillant sur un CMS sans tête doivent comprendre comment chacun des champs est connecté à la présentation frontale et s'ils disposent de tous les champs dont ils ont besoin pour bien faire leur travail, comme une balise de titre modifiable, un slug ou une méta-description. – ou même si le contenu permet d’ajouter des liens internes et des images.

Votre liste de contrôle SEO sans tête en 8 étapes

Remettons les garde-fous dans votre CMS sans tête afin que vous puissiez plutôt vous concentrer sur la croissance de votre site.

Cette liste de contrôle vous aidera à communiquer vos exigences techniques en matière de référencement à votre équipe de développement et à diagnostiquer les principaux problèmes qui peuvent survenir dans cette configuration.

1. Vérifiez toutes les balises méta essentielles

Bien que ceux-ci soient généralement du ressort des développeurs front-end, ils auront un impact sur vos performances SEO, il est donc essentiel de les auditer dans le cadre de votre lancement.

Exemple des types de balises méta utilisées sur un en-tête HTML et à quoi elles ressemblent. Image de Sanity.io, novembre 2023

Bien qu’il en existe de nombreux, voici les bases d’une bonne implémentation du référencement sans tête :

  • Titre – Vérifiez comment il est généré sur le site. Sur certaines pages, vous souhaiterez avoir un champ spécifique dans votre CMS pour les modifier. Pour les autres pages, telles que les catégories, les balises ou les archives, vous souhaitez implémenter des règles sur la façon de les générer automatiquement. Vous pouvez même implémenter des règles de validation au sein de votre CMS qui vous obligent à respecter une certaine limite de caractères.
  • Méta description – Comme pour le titre, vous souhaiterez avoir un champ dans votre CMS qui vous permettra de le modifier directement sur la plupart des pages. Pour certains, vous devrez implémenter des règles pour les générer automatiquement. Certains CMS sans tête vous permettent d'intégrer des fonctionnalités d'IA pour vous aider. Vous pouvez également intégrer des règles de validation dans le CMS pour limiter vos méta descriptions à moins de 160 caractères.
  • Méta robots – En fonction de la méthode de gestion de l'indexation choisie, vous devrez vérifier si cette balise est présente dans votre en-tête HTML et si elle se comporte correctement. Je reviendrai sur la gestion de l'indexation un peu plus loin dans l'article.
  • Type de contenu – Cette balise méta est utilisée pour indiquer au navigateur quel type de contenu se trouve sur la page, ainsi que le jeu de caractères et l'encodage utilisés. Ceci est particulièrement pertinent lorsque vous travaillez dans un contexte international et permet de garantir que les caractères spéciaux, tels que les accents et les trémas, s'affichent correctement. Là encore, vous pouvez inclure des règles de validation afin que le contenu de cette balise méta corresponde toujours aux normes ISO requises.
  • Viewport – La balise viewport indique aux navigateurs comment gérer les dimensions d'une page, et elle est essentielle pour une conception réactive. Votre travail ici consiste à vérifier que la balise méta est correctement implémentée et à vérifier que le site est adapté aux mobiles, selon Google.
  • Balise de langue – Cette balise méta est utilisée pour déclarer la langue dans laquelle le contenu sera. Dans une configuration internationale, vous voulez vous assurer que cela est correct sur toutes les pages afin de pouvoir créer un balisage hreflang correct en interrogeant l'attribut lang. de chaque document. Encore une fois, vous pouvez configurer des règles de validation pour que cette balise reste conforme à la norme ISO.
  • Balises graphiques ouvertes – Bien qu’elles ne soient pas liées au référencement, nous sommes devenus en quelque sorte les gardiens de ces balises au fil du temps. Vous voudrez vous assurer que tous les éléments de base ( og:title , og:type , og:image et og:url ) sont correctement implémentés. La plupart d'entre eux extraient simplement le contenu d'autres champs, vous n'aurez donc pas toujours besoin d'un champ dans votre CMS pour les modifier, mais vous souhaiterez peut-être créer des règles de titre uniques ou créer un champ pour remplacer votre description et votre image.

2. Gestion de l'indexation

Vous pouvez décider si vous autorisez les moteurs de recherche à indexer votre page via la balise méta robots, comme nous l'avons vu ci-dessus, ou si vous pouvez le faire via la balise x-robots sur la réponse d'en-tête HTTP.

La balise x-robots est la meilleure pour les PDF et autres fichiers, mais pour la gestion des pages, la balise méta robots est plus facile à gérer et à diagnostiquer.

Vous souhaiterez disposer d’un champ dans votre CMS qui vous permettra de contrôler l’indexation page par page. Une bascule avec une description claire de ce que signifie autoriser les moteurs de recherche à indexer la page est la meilleure solution.

Lorsque vous construisez sur un CMS sans tête, vous devez collaborer avec votre équipe de développement pour décider de la meilleure approche de gestion de l'indexation.

Il peut y avoir des priorités contradictoires ou des intégrations complexes qui vous empêchent d'obtenir la configuration souhaitée. Vous devez les examiner avec votre équipe de développement pour trouver une solution satisfaisante.

3. Assurez-vous que les slugs d'URL sont modifiables

Sans contribution directe de votre équipe SEO, vous pourriez vous retrouver avec une implémentation CMS qui utilise des chaînes aléatoires de chiffres et de lettres comme URL ou une copie du titre.

Assurez-vous que votre équipe de développement inclut un champ modifiable pour votre slug d'URL pour les bonnes pages.

Étant donné qu’il est essentiel de conserver une structure d’URL stable, vous ne souhaiterez peut-être pas accorder à tout le monde des autorisations de modification sur le slug d’URL.

Vous pouvez personnaliser votre CMS uniquement pour autoriser la modification des URL après la publication d'une page par un membre de l'équipe SEO. Vous pouvez même créer une automatisation qui crée automatiquement une redirection lorsque l'URL est modifiée.

4. Établir des règles d'URL canoniques

Les URL canoniques indiquent aux moteurs de recherche quelle est la version principale du contenu et vous aident à gérer les problèmes potentiels de contenu en double.

Voici quelques instructions de base à partager avec votre équipe de développement et à garder à l’esprit lors de votre audit :

  • Définissez vos canoniques dans l'en-tête de la page ou dans l'en-tête HTTP .
  • Utilisez des URL absolues, y compris le protocole et le sous-domaine, tels que https://www.google.com.
  • Définissez une seule canonique par page .
  • Les pages que vous souhaitez indexer doivent être auto-canonisées . Autrement dit, ils doivent pointer vers leur propre URL dans la balise canonique.

Les sites de commerce électronique présentent des niveaux de complexité supplémentaires en matière de canonisation, car ils doivent souvent gérer des problèmes de contenu en double plus importants liés aux catégories et aux filtres.

Dans ce cas, il est préférable de travailler avec votre équipe de développement pour trouver la meilleure façon de définir les règles de canonisation pour votre entreprise.

5. Définissez la configuration de votre plan de site XML

Bien que cela soit évident pour tout référencement, les plans de site sont des fichiers dynamiques et ils doivent être mis à jour à des intervalles spécifiques ou lorsqu'ils sont déclenchés par une action. Il est important de convenir avec votre équipe de développement de la manière dont votre plan de site sera mis à jour.

Votre plan de site ne doit contenir que des URL canoniques indexables avec un code de réponse HTTP de 200.

Il doit se trouver dans le répertoire racine de votre site, mais si pour une raison quelconque cela n'est pas possible, vous pouvez l'indiquer dans votre fichier robots.txt comme ceci :

Sitemap: https://www.example.com/sitemap.xml

En fonction des besoins spécifiques de votre site, vous devez déterminer si vous souhaitez diviser votre plan de site par type de contenu et si vous souhaitez disposer d'un plan de site pour les images , les vidéos ou les articles d'actualité .

6. Demandez votre balisage de schéma

Le balisage de schéma offre aux moteurs de recherche une compréhension plus riche de votre contenu.

Sans que les plugins SEO ne fassent le gros du travail à votre place, vous devrez demander le bon balisage pour votre type de contenu et votre site. Cela doit être ajouté à l'en-tête HTML en tant que script. Le code ressemblera à ceci :