Recherche : Presentation du systeme de classement
Source : Official Google Blog
En mai, Udi Manber vous a présenté notre groupe de recherche qualité, l’équipe responsable du classement des résultats de recherche. Il a détaillé plusieurs équipes regroupées sous le terme “Qualité”, dont le Core Ranking, la Recherche internationale, les Interfaces utilisateurs, l’Evaluation ainsi que d’autres équipes. Dans ce billet, je souhaite vous détailler un peu plus l’une de ces équipes : le Core Ranking.
Laissez-moi tout d’abord me présenter. Mon nom est Amit Singhal. Je suis un fidèle employé de Google chargé des équipes de classement chez Google. J’ai travaillé dans le secteur de la recherche durant les dix-huit dernières années, ayant découvert la recherche en 1990, tout juste diplômé des sciences informatiques. Dans des termes plus acédémiques, le secteur de la recherche est connu sous l’appélation de “Recherche d’information” ou IR. Après avoir passé une décennie dans en tant que chercheur IR, je suis arrivé chez Google en 2000, et ait depuis contribué au classement de Google.
Le classement par Google est un ensemble d’algorithmes utilisé pour fournir les documents les plus pertinents à la requête d’un utilisateur. Ce système entre en action plus de cent millions de fois par jours, incluant des milliards et des milliards de pages. Ces algorithmes sont mis en jeu lors de chaque requête effectuée sur la plupart des services de recherche de Google. Même si la recherche Internet est le service le plus utilisé, nos algorithmes fonctionnent aussi pour les autres services comme Google Images, News, Cartes, Product Search, Livres, YouTube et autres.
La question la plus fréquente que l’on me pose est “comment vous faites ?”. Il y a bien sûr beaucoup de paramêtres inpliqués dans un système de classement à la pointe de la technologie comme le notre, et je rentrerai plus dans le détail dans un prochain billet. Aujourd’hui, je vais me concentrer sur la philosophie derrière le classement par Google :
1) Localisation des résultats
2) Rester simple
3) Aucune interventaion humaine
Le premier point est évident. Etant donnée notre passion pour la recherche, nous tenons à ce que chaque requête soit traitée le plus efficacement possible. Selon ce principe, aucune requête ne doit être laissée de côté. S’il s’avère que nous ne fournissons pas des résultats optimum pour une requète dans un langage et une pays donnés – et ça arrive (la recherche n’est en aucun cas une science exacte) – nous nous en servons comme source d’inspiration en vue de futures améliorations.
Le second principe semble lui aussi évident. N’est-ce pas le désir de tout concepteur de système que ne maintenir leur système à un niveau de simplicité abordable ? Avec l’évolution des systèmes de recherche, et connaissant la quantité de requêtes dans de multiples langages que nous devons traiter, il est tentant de suivre la voie où la complexité s’empare du système pour anticiper le nombre croissant de requêtes. Nous travaillons très dur pour que notre système reste simple sans pour autant compromettre la qualité des résultats. C’est un effort de tout instant, mais qui en vaut la peine. Nous apportons environ dix modifications au système de classement chaque semaine, et la simplicité est une importante considération avant chaque lancement. Nos ingénieur comprennent parfaitement pourquoi une page a été classée de cette façon lors d’une requête donnée. Ce système simple et compréhensible nous a permi d’innover rapidement, ce qui porte ses fruits. La philosophie “Rester simple” nous a bien aider.
Aucune discussion à propos du système de classement ne serait complète sans l’inévitable – mais érronnée ! :) – question “Google modifie-t-il manuellement ses résultats ?” Je répondrai à ceci avec notre troisième philosophie : aucune intervention humaine. De notre point de vue, le web est constitué par les internautes. Vous êtes ceux qui créent les pages et les liens vers les pages. Nous utilisons ces contributions dans nos algorithmes. Le classement final des résultats est entièrement décidé par les algorithmes et donc par la communauté, noun n’y avons aucune implication. Nous pensons que la décision subjective d’un individu est… subjective, et les informations distillées par nos algorithmes, tirées des vastes contributions humaines encodées sur la toile, ainsi que leurs liens, sont bien plus pertinents que la subjectivité de quelques individus.
La seconde raison pour la quelle nous sommes contre toute intervention humaine dans l’ajustement des les résultats et que, souvent, une requête mal traitée est source d’amélioration dans notre système de classement. Améliorer l’algorithme sous-jacent améliore non seulement une requête, mais aussi une catégorie entière de requêtes, et souvent dans toutes les langues. J’ajouterai cependant qu’il y a des recommendantions pour les sites web, et nous prenons des sanctions à l’encontre des sites en violation avec ces règles ou pour d’autres raisons (violation de la loi, pédophilie, virus/programmes frauduleux, etc).
Ne loupez pas mon prochain billet, où j’expliquerai en détail les technologies derrière notre classement, et vous donnerai des exemples de techniques de pointe en action. Pour conclure, notre passion pour la recherche est plus forte que jamais – et en tant que chercheur sur la recherche, j’exerce le plus beau métier au monde. :-)
– Présentation du système de classement
– Les mécanismes du classement Google
– Google, d’une complexité enfantine
– Des expérimentations pour tous les goûts
– L’évaluation de la recherche chez Google
– Comportement des internautes dans leur habitat naturel
– Notre approche internationale de la recherche
“Fellow” ça se traduit vraiment par “fidèle” ? ce serait pas plutôt “assistant” ou “membre” ?
Salut Tom,
J’ai choisi Fidèle du fait que ce monsieur travaille chez Google depuis 8 ans… Mais oui, littéralement, ce n’est pas tout à fait la bonne traduction.
Assistant ou membre de Google ? Ça ne sonne pas terrible :) Fidèle non plus remarque :P
Sinon il y a “employé”, qui convient peut-être mieux.
“Fidèle employé” alors :)
Parfait ! Merci ;)