En tant que plus grand moteur de recherche de Chine et leader mondial des technologies de l'IA et de l'Internet, Baidu est une puissance d'innovation. Le modèle linguistique ERNIE, surpassant le BERT de Google en matière de traitement du langage chinois, positionne Baidu à la pointe du progrès technologique.
Dans notre étude complète de corrélation des facteurs de classement Baidu SEO*, nous avons analysé les SERP de 10 000 mots-clés chinois, en fouillant dans les 20 premiers classements pour découvrir les facteurs qui influencent les algorithmes des moteurs de recherche de Baidu.
Informations sur les moteurs de recherche
Cette étude est une mine d’or pour les praticiens du référencement du monde entier, et pas seulement pour ceux qui ciblent le marché chinois. L'approche unique de Baidu en matière de technologie des moteurs de recherche offre des informations inestimables, en particulier à une époque où une compréhension approfondie des algorithmes et du fonctionnement des moteurs de recherche est cruciale pour le succès du référencement.
De la même manière que la communauté SEO a étudié en profondeur les documents Yandex divulgués, comprendre la construction SERP de Baidu est tout aussi essentiel.
Services Baidu dans les SERP Baidu
Pour comprendre l'influence de Baidu dans le référencement, il est important de reconnaître sa gamme de services propriétaires qui dominent souvent les résultats de recherche. Par exemple, des services comme Baidu Maps font partie intégrante des recherches locales, à l’instar du rôle de Google Maps dans d’autres régions.
Un pourcentage notable de 34,9 % des 10 premiers résultats de recherche sont dominés par les propres services de Baidu, ce qui représente une augmentation significative par rapport aux 24,7 % indiqués dans l'étude sur les facteurs de classement Baidu de Searchmetrics en 2020**.
2020
2023
Pourcentage des résultats de Baidu dans le top 10
24,70%
34,91%
Pourcentage des résultats de Baidu dans le top 20
N / A
24,91%
Pourcentage des propres résultats de Baidu sur la position n°1
39,00%
60,13%
Cette domination s'étend à 60,13 % des premières places, contre 39 % auparavant.
Image de l'auteur, décembre 2023
Ces données ne sont pas seulement informatives ; c'est une directive claire pour les experts SEO de recalibrer leurs stratégies dans l'espace numérique unique de la Chine.
La priorisation par Baidu de ses plates-formes, de Baike à Wenku, signifie plus qu'une préférence : il s'agit d'une décision stratégique visant à fidéliser les utilisateurs au sein de son écosystème.
Image de l'auteur, décembre 2023
Baidu Baike, leur version de Wikipédia, se distingue par son contenu fortement modéré, garantissant la qualité mais présentant également un défi pour les créateurs de contenu.
La plateforme de questions-réponses Baidu Zhidao, semblable à Quora, et Baidu Wenku, un service complet de partage de fichiers, apparaissent également fréquemment dans les résultats de recherche, reflétant les préférences algorithmiques uniques de Baidu.
Ces plates-formes, en particulier Wenku, ont tendance à avoir une présence plus importante dans les SERP de Baidu que les plates-formes similaires de l'écosystème de Google, soulignant l'approche personnalisée adoptée par Baidu pour répondre aux besoins de recherche de ses utilisateurs.
Les experts SEO chinois comme Stephanie Qian (de The Egg Company) et Veronique Duong (de Rankwell) soulignent le potentiel de tirer parti de ces domaines de haute autorité pour une visibilité améliorée.
Il ne s'agit pas seulement d'un changement dans les SERP de Baidu ; c'est un nouveau playbook pour le succès SEO de Baidu en 2024.
Le paysage SEO unique en Chine
Naviguer dans le paysage SEO chinois implique de comprendre des facteurs uniques au-delà des stratégies SEO classiques. Au cœur de cette démarche se trouve la réglementation rigoureuse de l'Internet en Chine, le Grand Pare-feu chinois, qui vise à protéger sa population des contenus considérés comme nuisibles.
Cela entraîne des temps de chargement plus lents pour les sites hébergés en dehors de la Chine en raison de l'analyse du contenu et d'un blocage potentiel. De plus, les sites Web hébergés sur des serveurs signalés pour contenu illégal risquent d’être totalement inaccessibles en Chine continentale.
Baidu, le moteur de recherche dominant en Chine, s'adresse principalement au public parlant le mandarin du continent, privilégiant le contenu en chinois simplifié. Cela contraste avec le chinois traditionnel utilisé à Taiwan et à Hong Kong.
Bien que Baidu indexe le contenu mondial, son algorithme montre une nette préférence pour le chinois simplifié, un élément crucial pour le référencement ciblant cette région.
En ce qui concerne la part de marché, notre étude contredit le récit selon lequel Bing dépasserait Baidu.
Sur le marché chinois, Baidu reste la principale source de trafic organique, contribuant à environ 70 % pour nos clients B2B, tandis que Bing-Chine représente environ 20 % – sur la base des données analytiques de nos clients B2B en Chine.
Cela contredit les rapports basés sur les données de StatCounter, qui ne sont utilisées que par 0,01 % des pages les mieux classées sur Baidu et, selon BuiltWith, ne sont utilisées que par 946 sites Web .
Analyse approfondie des facteurs de classement Baidu 2024
Structures de domaines et d'URL
Les résultats dressent un tableau clair : l'algorithme de classement de Baidu montre une préférence distincte pour certains TLD et structures d'URL, avec une tendance notable vers les TLD chinois et les URL simplifiées et linguistiquement uniformes.
Pour les clients internationaux ciblant le marché chinois, il est essentiel de s’adapter à ces préférences.
TLD : l'essor des domaines de premier niveau chinois
La répartition des domaines de premier niveau (TLD) parmi les meilleurs résultats de Baidu montre une nette préférence :
Image de l'auteur, décembre 2023
Les domaines .com sont en tête avec 72,59 %.
Les domaines .cn ont connu une augmentation significative, passant de 3,8 % en 2020 (via Searchmetrics) à 14,06 % en 2023.
.com.cn suit avec une augmentation de 5,5% en 2020 à 6,55%.
Cette tendance à la hausse pour les TLD chinois, notamment .cn, suggère leur importance croissante en tant que facteur de classement potentiel pour 2024.
Image de l'auteur, décembre 2023
Sous-domaines et structures d'URL
La majorité des pages de classement, 58,42 %, se trouvent sur un sous-domaine « www ».
Il est intéressant de noter que les URL contenant des caractères chinois sont rares, ne constituant que 0,8 % des URL classées et encore moins dans les noms de domaine, à seulement 0,0035 %.
Image de l'auteur, décembre 2023
Stephanie Qian de The Egg Company commente :
"La position officielle de Baidu décourage l'utilisation de caractères chinois dans les URL, dissipant ainsi les mythes sur leurs avantages potentiels en matière de classement."
Indicateurs de longueur d’URL et de langue
Contrairement à la croyance selon laquelle les URL plus courtes sont mieux classées sur Baidu, notre étude a révélé que la longueur moyenne des URL des pages bien classées est de 48,25 caractères, avec 2,3 dossiers/répertoires.
Cette découverte suggère que la structure des liens internes pourrait jouer un rôle plus crucial que la longueur de l’URL ou la proximité avec le domaine racine.
De plus, seulement 2,3 % des pages les mieux classées utilisent des indicateurs de langue chinoise dans leurs URL (comme, par exemple, le sous-domaine « cn. » ou le dossier « /cn/ »), ce qui conforte l'idée selon laquelle Baidu favorise les sites Web chinois monolingues.
Cette information est particulièrement pertinente pour les sites Web internationaux multilingues visant à optimiser pour Baidu.
Meilleures pratiques sur la page pour le référencement chinois
Pour Baidu SEO en 2024, il ne s'agit pas seulement d'inclure des mots-clés, mais de les placer stratégiquement dans un contenu pertinent et bien structuré. Cette approche s'aligne sur les pratiques de référencement modernes où l'expérience utilisateur et la pertinence du contenu règnent en maître.
Balises de titre et méta-descriptions
La longueur moyenne des balises de titre sur les pages les mieux classées est de 25 caractères chinois, tandis que les méta-descriptions comportent en moyenne 86 caractères. Ces longueurs assurent la visibilité dans les SERP de Baidu sans être tronquées.
Il est intéressant de noter que 36 % des pages les mieux classées utilisent des mots-clés exacts dans les balises de titre, un chiffre qui s'élève à 54,4 % pour les mots-clés à tête courte plus compétitifs.
Image de l'auteur, décembre 2023
Ensemble complet de mots-clés
Mots-clés courts
Mots-clés Midtail
Mots-clés longue traîne
Score de corrélation
-0,1
-0,17
-0,14
-0,02
Pourcentage
36%
54,4%
41,7%
18,6%
Pour les méta-descriptions, 22,2 % des pages les mieux classées incluent le mot-clé de correspondance exacte, passant à 34,4 % pour les mots-clés à tête courte.
Le positionnement du mot-clé est également important : il se situe généralement devant la balise titre mais autour de la 10ème position dans les méta-descriptions.
Titres : hiérarchie et placement des mots clés
Les titres jouent un rôle essentiel dans le référencement Baidu :
71,2 % des pages les mieux classées utilisent correctement une balise H1.
Près de la moitié (47,8 %) utilisent efficacement les structures hiérarchiques des titres.
21,1 % intègrent le mot-clé de correspondance exacte au H1, généralement autour de la 4e ou de la 5e position.
Les balises H2 et H3 sont utilisées respectivement par 44 % et 46 % des pages les mieux classées, avec une moyenne d'environ neuf titres chacune.
Les titres H4 moins utilisés apparaissent dans 22,4 % des pages les mieux classées, tandis que les titres H5 et H6 sont utilisés dans moins de 10 %.
Image de l'auteur, décembre 2023
Densité du contenu et des mots clés
La longueur du contenu est un facteur important, les pages les mieux classées comptant en moyenne 4 929 caractères, bien que la médiane soit de 3 147 caractères.
Environ 85 % du contenu est en caractères chinois, une référence essentielle pour les entreprises internationales qui localisent du contenu.
Les mots-clés exacts sont utilisés dans le contenu de 49 % des pages les mieux classées, avec une probabilité croissante pour les mots-clés plus compétitifs (57 % pour les mots-clés à mi-queue et 66 % pour les mots-clés à tête courte).
Cependant, la densité des mots clés est inférieure à 1 % en moyenne, ce qui indique un abandon du contenu sur-optimisé et spammé.
La première apparition du mot-clé se situe souvent dans les 18 premiers % du contenu.
Le rôle des images
Les images sont cruciales. Plus de 94 % des pages les mieux classées comportent en moyenne 27,5 images ; 55,4 % utilisent des balises alt et 12,8 % incluent le mot-clé dans au moins une balise alt.
Liens internes
Il est intéressant de noter que l’utilisation du mot-clé dans le texte d’ancrage des liens sortants ne semble pas freiner le potentiel de classement, comme le font 20,3 % des pages les mieux classées.
Backlinks : un facteur clé dans le classement SEO de Baidu
En plus des éléments de référencement sur la page, les backlinks jouent un rôle crucial dans la détermination du classement sur Baidu.
Notre analyse, étayée par les données de DataForSEO et Majestic, révèle une forte corrélation positive entre le nombre de domaines référents et l'amélioration des classements.
Quantité et qualité des domaines référents
La quantité de domaines référents a un impact significatif sur le classement Baidu. Les sites Web comportant un plus grand nombre de domaines référents obtiennent généralement de meilleures positions.
Il est intéressant de noter que les données montrent que même les sites comportant moins de domaines référents peuvent obtenir un bon classement. Les 50 domaines les moins bien classés avaient en moyenne seulement 1,1 domaine de liaison selon DataForSEO et 1,3 selon les données de Majestic.
Cela indique que même si le nombre de backlinks est important, il existe des opportunités pour les sites avec moins de liens de toujours bien fonctionner sur Baidu.
L'impact de la qualité des liens
La qualité du lien est tout aussi cruciale.
Il existe une forte corrélation entre les liens de haute qualité (tels que mesurés par le Trust Flow/Citation Flow et le classement DataForSEO de Majestic) et un meilleur classement sur Baidu.
Les sites avec des liens de meilleure qualité ont tendance à être mieux classés.
Capture d'écran du Trust Flow/Citation Flow et du classement DataForSEO de Majestic, décembre 2023
De plus, les sites les mieux classés ont généralement un score de spam de backlinks DataForSEO inférieur, soulignant l'importance non seulement de la quantité, mais aussi de la qualité et de la fiabilité des backlinks.
Ces informations soulignent qu'un profil de backlinks complet, combinant un nombre sain de liens et une qualité élevée, est essentiel pour atteindre et maintenir un classement élevé sur Baidu.
Il s'agit d'obtenir suffisamment d'attention pour être considéré comme faisant autorité tout en garantissant que l'attention provient de sources réputées et de haute qualité.
Cette approche s'aligne sur les meilleures pratiques de référencement plus larges, soulignant l'importance de créer un profil de backlink naturel et réputé pour un succès de référencement durable.
Tendances émergentes et stratégies de référencement pratiques pour Baidu
À mesure que les stratégies de référencement évoluent, il est crucial de comprendre l'impact d'éléments spécifiques tels que les balises, les protocoles de sécurité et les intégrations des médias sociaux, en particulier pour Baidu.
L’analyse met en lumière ces aspects avancés.
Utilisation et structure des balises
Utilisation de la liste : 86,5 % des pages les mieux classées emploient
listes, avec une moyenne de 10,8 listes par page avec 7,9 points chacune. Fait intéressant, 12,9 % intègrent le mot-clé cible dans ces listes.
Tableaux : 18,2 % des pages les mieux classées utilisent des balises, mais seulement 3,1 % incluent le mot-clé cible dans ces tableaux, ce qui suggère que les tableaux concernent moins le placement de mots-clés que la présentation de données structurées.
Balises d'accentuation : 9,7 % des pages les mieux classées utilisent des balises d'accentuation telles que , et , indiquant une approche sélective de leur utilisation. SEO technique et sécurité
SEO technique et sécurité
HTTPS : désormais facteur de classement officiel pour Baidu, l'adoption du HTTPS est passée de 55 % en 2020 (étude Searchmetrics) à 69,6 % parmi les pages les mieux classées.
Optimisation mobile : une tendance significative est la baisse du référencement de pages mobiles distinctes, de 35 % en 2020 à seulement 10,3 % aujourd'hui, reflétant une évolution vers un design réactif.
Google Tag Manager : l'utilisation parmi les pages les mieux classées a diminué de 8 % en 2020 à seulement 2,5 %, reflétant peut-être les préférences de localisation des outils et des technologies.
Hreflang et référencement international
Utilisation du Hreflang : seulement 1,5 % des pages les mieux classées utilisent le Hreflang, des experts comme Dan Taylor et Owain Lloyd-Williams notant que Baidu ne prend pas en charge cette balise. L'observation de Simon Lesser met en évidence la domination des sites nationaux uniquement chinois sur Baidu.
Tendances émergentes en matière de code et de balisage
Adoption HTML5 : de moins de 30 % en 2020, l'utilisation du HTML5 parmi les pages les mieux classées est passée à 53,2 %.
Schema.org : malgré le non-support officiel de Baidu, 11 % des pages les mieux classées implémentent les données structurées Schema.org, l'expert Owain Lloyd-Williams suggérant ses avantages potentiels, tandis qu'Adam Di Frisco recommande la prudence en raison de la position actuelle de Baidu.
Intégration des médias sociaux
Médias sociaux chinois : 60 % des pages les mieux classées incluent des intégrations de médias sociaux chinois, ce qui indique leur importance dans le référencement de Baidu.
Médias sociaux occidentaux : en revanche, seulement 2 % intègrent des plateformes occidentales comme Facebook ou YouTube, ce qui reflète l'orientation régionale de Baidu.
Ces résultats soulignent la complexité évolutive du référencement Baidu. Si certaines bonnes pratiques mondiales s’appliquent, d’autres nécessitent une adaptation à ce marché unique.
L'utilisation stratégique des balises, l'adoption de nouvelles technologies telles que HTML5 et la localisation des intégrations de médias sociaux apparaissent comme des éléments essentiels pour atteindre les meilleurs classements sur Baidu.
Au-delà de l'étude : autres facteurs d'influence dans le référencement de Baidu
Dans Baidu SEO, certains facteurs de classement clés, bien que non directement mesurables, sont essentiels.
Les professionnels expérimentés du référencement Baidu reconnaissent l'importance des signaux des utilisateurs, comme les taux de clics dans les SERP, comme influents sur les classements. Cela concorde avec les conclusions des documents du procès antitrust de Google, suggérant une approche similaire de la part de Baidu.
Les progrès de Baidu en matière d'IA sont tout aussi importants, en particulier avec Baidu ERNIE, qui surpasse le BERT de Google dans la compréhension des nuances de la langue chinoise.
Cela suggère que Baidu utilise le NLP avancé dans ses algorithmes d'analyse de contenu, ce qui rend des techniques telles que WDF-IDF, adaptées au chinois, essentielles pour créer un contenu de haute qualité qui résonne à la fois avec les utilisateurs et avec l'analyse basée sur l'IA de Baidu.
Démystifier 4 mythes courants sur le référencement Baidu
Démystifions certains des mythes répandus sur le référencement Baidu avec les informations de notre récente étude.
Mythe 1 : Nécessité d'un domaine .cn
La croyance commune est que sans domaine .cn, le succès sur Baidu est impossible.
Cependant, notre étude montre que les domaines .com dominent en réalité les résultats de recherche de Baidu. Bien qu’il existe une tendance croissante aux TLD chinois dans les meilleurs SERP, l’idée selon laquelle un domaine .cn est essentiel est plus un mythe que la réalité.
Mythe 2 : La licence ICP comme exigence de classement
Un autre mythe est qu'une licence ICP (Internet Content Provider) est obligatoire pour le classement sur Baidu.
Contrairement à cette croyance, moins de la moitié (48 %) des pages les mieux classées ont une référence ICP. Ceci est corroboré par notre expérience avec des sites Web clients sans licence qui obtiennent toujours des classements.
Mythe 3 : Seuls les sites Web hébergés en Chine continentale sont classés
L’idée fausse selon laquelle seuls les sites Web hébergés en Chine continentale peuvent être classés sur Baidu est très répandue. En réalité, n’importe quel site Web accessible en Chine peut être classé.
Cependant, il convient de noter que les sites Web hébergés en dehors de la Chine peuvent connaître des vitesses de chargement plus lentes, ce qui pourrait avoir un impact sur leur classement.
Mythe 4 : les méta-mots-clés comme facteur de classement
Beaucoup pensent que les méta-mots-clés sont toujours un facteur de classement pertinent pour Baidu.
Malgré cette conviction, la position officielle de Baidu, comme l'a noté le porte-parole Lee, est que les méta-mots-clés ne sont plus pris en compte dans leur algorithme de classement.
Nous espérons que ces informations aideront à clarifier les choses autour du référencement Baidu. Il est important de s’adapter à des stratégies factuelles plutôt que de suivre des mythes dépassés.
Conclusion : naviguer dans l'avenir du référencement Baidu
Alors que nous démystifions le paysage du référencement Baidu pour 2024, il est évident que le succès dépend d'un mélange d'adoption de nouvelles tendances et de rejet des mythes dépassés.
De la reconnaissance de la domination des domaines .com à la montée en puissance des TLD .cn et .com.cn, en passant par la compréhension de la nature non essentielle (mais recommandée) des licences ICP et l'importance réduite accordée aux méta-mots-clés, les stratégies de référencement doivent évoluer avec ces derniers. connaissances.
L’essor de l’IA, l’importance des signaux des utilisateurs et l’approche nuancée du contenu et des backlinks soulignent la nécessité de stratégies sophistiquées basées sur les données.
Alors que Baidu continue d'affiner ses algorithmes, les professionnels du référencement doivent s'adapter, en s'assurant que leurs tactiques non seulement s'alignent sur les meilleures pratiques actuelles, mais sont également prêtes à tirer parti des avancées futures.
Ce voyage à travers le terrain du référencement de Baidu donne aux praticiens les connaissances et les outils nécessaires pour naviguer dans les complexités du classement sur le principal moteur de recherche chinois, ouvrant ainsi la voie au succès dans le monde dynamique du marketing numérique.