Il y a eu beaucoup de spéculations sur ce qu'est Navboost, mais à ma connaissance, personne n'a identifié un brevet adéquat qui pourrait être le brevet Navboost original. Ce brevet de 2004 s'aligne étroitement sur Navboost
J’ai donc pris les quelques indices dont nous disposions à ce sujet et identifié quelques brevets probables.
Les indices avec lesquels je travaillais sont que l'ingénieur logiciel de Google, Amit Singhal, a été impliqué dans Navboost et a contribué à son invention. Un autre indice est que Navboost date de 2005. Enfin, les documents judiciaires indiquent que Navboost a été mis à jour plus tard, il peut donc y avoir d'autres brevets à ce sujet, que nous aborderons à un moment donné, mais pas dans cet article.
J’en ai donc déduit que si Amit Singhal était l’inventeur, alors il y aurait un brevet portant son nom et il existe effectivement, datant de 2004.
Parmi tous les brevets que j’ai vus, les deux plus intéressants étaient les suivants :
- Systèmes et procédés pour corréler l'actualité et la popularité des documents 2004 (page Web du brevet )
- Résultats de recherche entrelacés 2007
Cet article traitera du premier brevet répertorié ci-dessus.
Navboost date-t-il de 2005 ?
Le témoignage du procès indique que Navboost date d'environ 2005. Le 24e jour du procès ( PDF ), le Googler P. Pandurang Nayak a témoigné :
Q. Alors rappelez-moi, Navboost remonte-t-il à 2005 ?
R. C'est quelque part dans cette fourchette. Ce serait peut-être même avant.
La date de 2005 convient bien au brevet Systèmes et méthodes permettant de corréler l'actualité et la popularité des documents, déposé en 2004. La date du brevet est logique.
Mais le brevet ne mentionne pas les clics ?
Une qualité intéressante de ce brevet est qu'il ne mentionne pas explicitement les clics et je soupçonne que les personnes recherchant le brevet Navboost ont peut-être ignoré ce brevet car il ne mentionne pas les clics. Ce que le brevet aborde, ce sont des concepts liés aux interactions des utilisateurs et aux modèles de navigation qui sont eux-mêmes des références aux clics.
Vous ne pouvez pas avoir d'interactions utilisateur ou de modèles de navigation à moins qu'un utilisateur ne clique sur quelque chose dans les résultats de recherche.
Cas où les clics des utilisateurs sont implicites dans le brevet
Sélection et récupération de documents :
Le brevet décrit un processus par lequel un utilisateur sélectionne des documents (ce qui peut être déduit qu'il clique dessus) à partir des résultats de recherche. Ces sélections sont utilisées pour déterminer la popularité des documents.
Mappage de documents à des sujets :
Une fois les documents sélectionnés par les utilisateurs (ce qui implique des clics), ils sont mappés à un ou plusieurs sujets. Cette cartographie est un élément clé du processus, car elle associe les documents à des domaines d'intérêt ou à des sujets spécifiques.
Modèles de navigation des utilisateurs :
Le brevet fait fréquemment référence aux modèles de navigation des utilisateurs, qui incluent la manière dont les utilisateurs interagissent avec les documents, tels que les documents sur lesquels ils choisissent vraisemblablement de cliquer. Ces modèles sont utilisés pour calculer les scores de popularité des documents.
Il est clair que les clics des utilisateurs constituent un élément fondamental de la manière dont le brevet propose d'évaluer la popularité des documents.
En analysant les documents avec lesquels les utilisateurs choisissent d'interagir, le système peut attribuer des scores de popularité à ces documents. Ces scores, combinés à la pertinence thématique des documents, sont ensuite utilisés pour améliorer l'exactitude et la pertinence des résultats des moteurs de recherche.
Navboost attribue des scores relatifs aux documents
Eric Lehman, directeur de Google, a décrit lors du procès que Navboost attribuait des scores aux documents.
C'est ici que Lehman parle de l'attribution de scores aux documents en fonction des données de clics, a témoigné Lehman :
« Et donc je pense que Navboost fait un peu la chose naturelle, c'est-à-dire que, face à ce genre d'incertitude, vous prenez des mesures plus douces. Vous pouvez donc modifier la partition d’un document, mais de manière plus légère que si vous disposiez de plus de données.
Le passage ci-dessus de l'essai Google décrit comment un score est relatif au nombre de visites que la page Web reçoit. Si un site reçoit moins de visites, le score est modifié « légèrement », ce qui suppose que s'il y a beaucoup de clics vers le site, le score est différent.
Voici une citation du brevet qui montre comment le score est relatif au nombre de visites sur une page Web :
"...un document qui a été consulté par les utilisateurs plus souvent qu'un autre document peut avoir un score de popularité plus élevé."
Brevet : les interactions des utilisateurs sont une mesure de popularité
Le brevet US8595225 fait implicitement référence aux « clics des utilisateurs » dans le contexte de la détermination de la popularité des documents. Bon sang, la popularité est si importante pour le brevet qu'elle figure dans le nom du brevet : systèmes et méthodes pour corréler l'actualité et la popularité d'un document.
Les clics des utilisateurs, dans ce contexte, font référence aux interactions des utilisateurs avec divers documents, tels que des pages Web. Ces interactions constituent un élément essentiel dans l’établissement des scores de popularité de ces documents.
Le brevet décrit une méthode dans laquelle la popularité d'un document est déduite des modèles de navigation des utilisateurs, qui ne peuvent être que des clics.
J'aimerais m'arrêter ici et mentionner que Matt Cutts a expliqué dans une vidéo que la popularité et le PageRank sont deux choses différentes. La popularité dépend de ce que les utilisateurs ont tendance à préférer et le PageRank est une question d'autorité, comme en témoignent les liens.
Matt a défini la popularité :
"Et donc, dans un certain sens, la popularité est une mesure de la destination des gens, alors que le PageRank est bien plus une mesure de la réputation."
Cette définition datant d'environ 2014 correspond à ce dont parle ce brevet en termes de popularité, à savoir où vont les gens.
Voir Matt Cutts explique comment Google sépare la popularité de la véritable autorité
Regardez la vidéo YouTube : Comment Google sépare-t-il la popularité de l'autorité ?
Comment le brevet utilise les scores de popularité
Le brevet décrit plusieurs façons d’utiliser les scores de popularité.
Attribution de scores de popularité :
Le brevet discute de l'attribution de scores de popularité aux documents en fonction des interactions des utilisateurs telles que la fréquence des visites ou les modèles de navigation (ligne 1).
Popularité par sujet :
Il parle de dériver des informations sur la popularité par sujet en corrélant les données de popularité associées à chaque document à des sujets spécifiques (ligne 5).
Scores de popularité dans le classement :
Le document décrit l'utilisation des scores de popularité pour classer les documents parmi un ou plusieurs sujets associés à chaque document (ligne 13).
Popularité dans la recherche de documents :
Dans le contexte de la recherche de documents, le brevet décrit l'utilisation des scores de popularité pour classer les documents (ligne 27).
Détermination de la popularité en fonction de la navigation de l'utilisateur :
Le processus de détermination du score de popularité de chaque document, qui peut impliquer l'utilisation de modèles de navigation des utilisateurs, est également mentionné (ligne 37).
Ces exemples démontrent l'accent mis par le brevet sur l'intégration de la popularité des documents, telle que déterminée par l'interaction de l'utilisateur (clics), dans le processus de classement et de corrélation avec des sujets spécifiques.
L'approche décrite dans le brevet suggère une méthode plus dynamique et plus adaptée à l'utilisateur pour déterminer la pertinence et l'importance des documents dans les résultats des moteurs de recherche.
Plus ce brevet est analysé, plus il ressemble à ce que les documents d'essai décrivaient comme Navboost.
Lisez le brevet ici :
Systèmes et procédés pour corréler l'actualité et la popularité d'un document
Image en vedette par Shutterstock/Sabelskaya