Politique : Google, transparence, et notre formule pas si secrète que ça
Cet Article est la traduction d'une annonce officielle publiée par Google.
Récemment, la commission européenne a ouvert une enquête préliminaire suite à des plaintes de la concurrence. Une partie de ces plaignants accusent Google de ne pas faire preuve de suffisamment de transparence sur les procédés utilisés pour classer les sites web dans nos résultats de recherche. La notion selon laquelle Google ne serait pas assez transparent est difficile pour moi à avaler. Google a établi plusieurs standards de communications avec les sites web éditeurs. Permettez-moi de vous décrire certains moyens que nous utilisons pour expliquer aux sites web comment et pourquoi nous les classons.
L’un des aspects ayant suscités le plus de discussion a toujours été le PageRank. Cet “ingrédient secret” n’est plus si secret. Le voici. Cet article assez ancien a non seulement donné la formule du PageRank, mais a également révélé plusieurs autres facteurs du classement de Google, dont les ancres, la position des mots dans les documents, la relative proximité des mots-clés dans un document, le type et la taille de police utilisée, le code HTML de chaque page, et la capitalisation des mots. Google a continué de publier des centaines de papiers au cours des années. Ces papiers révèlent une grande partie des formules secrètes à la source du fonctionnement de Google. Certains de ces papiers ont donné l’impulsion non seulement à plusieurs projets Open Source, mais aussi à des entreprises dans leur globalité.
Les papiers académiques sont une chose, mais Google s’est également engagé via d’autres moyens. En 1999, Sergey Brin a participé à la première conférence “Search Engine Strategies” pour les webmasters. En 2001, Google a été le premier moteur de recherche à contribuer à un forum d’éditeurs nommé WebmasterWorld. Un employé (GoogleGuy) a posté plus de 2800 fois, et un autre (AdWordsAdvisor) plus de 5000 fois.
Les efforts de Google en matière de transparence et de communication ont évolué avec le Web. Nous avons commencé à bloguer en mai 2004, et avons publié des milliers d’articles sur notre blog officiel. Google possède maintenant plus de 70 blogs, dont un dédié à aider les webmasters à comprendre comment Google fonctionne et à améliorer leur classement dans nos résultats de recherche. Google publie plus de blogs que n’importe quelle autre grosse entreprise. Nous fournissons également un grand nombre de documentations publiques sur notre site avec des conseils pour les éditeurs, en des douzaines de langues différentes.
Etant à la tête de l’équipe anti-spam de Google, les gens me demandent souvent comment Google fonctionne. C’est pourquoi j’ai lancé mon propre blog en 2005, sur lequel j’ai publié des centaines de billets sur Google. Les sujets varient des erreurs les plus fréquentes aux conseils pour les nouveaux blogueurs. J’ai eu le plaisir de rencontrer des éditeurs de sites et d’intervenir lors de plus de 30 conférences sur la recherche. En fait, je répondrai à des questions lors d’une nouvelle conférence cette semaine, avec une douzaine d’autres collègues de chez Google.
Nous avons essayé toutes sortes d’expérimentations pour aider les éditeurs de sites à comprendre comment le classement de Google est établi. Nous avons organisé plusieurs discussions en direct avec des centaines de participants. Nous avons essayé Twitter. Nous avons participé à des podcasts. Mais voici mon moyen préféré de donner des conseils aux éditeurs de site : l’année dernière, nous avons pris des questions du public et avons posé des réponses sous forme de vidéo sur notre chaîne Webmasters. Ces vidéos ont été regardé plus de 1.5 millions de fois (!). Nous nous investissons également sur la blogosphère afin de répondre aux questions concernant les pratiques de Google.
La liste est longue. Google s’est concerté avec les autres moteurs de recherche sur des méthodes destinées à faciliter la vie des webmasters. Les standards issus de ces réunions incluent la possibilité de choisir un format d’URL, ainsi que les Sitemaps, un moyen simple pour les webmasters de donner aux moteurs de recherche plus d’informations sur les pages constituant leur site. Google offre également un forum pour les webmasters où des employés de Google ainsi que des passionnés répondent aux questions. Nous avons procédé à des audits de sites. Nous avons même confirmé l’inutilisation de certains facteurs par nos algorithmes, comme la balise keywords, ce qui permet aux webmasters de gagner du temps et d’éviter des procès futiles.
L’aspect frustrant est que même si les 20 000 employés de Google travaillaient à plein temps à répondre aux questions des éditeurs de site, nous ne pourrions pas parler à chacun d’entre eux. Pourquoi pas ? Parce qu’il y a plus de 192 millions de noms de domaine enregistrés. C’est pourquoi nous avons ouvert les Outils pour les Webmasters, un endroit central où les éditeurs peuvent nous renseigner sur leurs sites, et obtenir des infos sur la performance de leurs domaines. Décrire chaque outil à disposition prendrait un autre article sur ce blog, mais en voici une liste condensée :
- Les éditeurs de sites peuvent recevoir des recommandations concernant des balises description en double ou des balises title manquantes.
- Les éditeurs de site qui pensent avoir violer nos règles de conduite et pour lesquels Google a pris des sanctions peuvent envoyer une demande de reconsidération.
- Les éditeurs de site victimes de piratage peuvent avoir des informations sur les logiciels malveillants repérés sur leur site. Après avoir supprimé le contenu piraté, ils peuvent consulter ce que voit le robot Google et ainsi vérifier que le contenu piraté est vraiment parti.
- Les éditeurs de site peuvent en savoir plus sur les erreurs que Google a rencontré lors de l’indexation de leur site.
Un employé de Google a récemment écrit un billet sur l’utilisation de ces outils publics et gratuits pour diagnostiquer les problèmes rencontrés par son hébergeur où il avait atteint la limite de bande passante. Des millions de webmasters ont pu profiter des outils gratuit de Google pour obtenir des informations utiles sur leur site.
Chez Google, nous essayons d’être aussi ouverts que possible, au point d’aider les utilisateurs à quitter Google et à prendre leurs données avec eux. Parallèlement, nous ne pensons pas qu’il soit déraisonnable pour n’importe quelle entreprise d’avoir quelques secrets, nous ne tenons pas à aider les spammeurs et les pirates à perturber la neutralité de notre système. Si les gens qui essayent de pirater nos algorithmes connaissaient chaque détail de notre façon de classer les sites, ce serait très facile pour eux de spammer nos pages de résultats avec des sites non pertinents et frustrants pour les utilisateurs — incluant des sites pornos et des sites malveillants.
En fin de compte, critiquer Google pour sa “formule secrète” est facile, mais n’est simplement pas la vérité. Google a travaillé jour après jour pendant des années pour être ouvert, pour aider les éditeurs à mieux comprendre notre classement, et pour répondre au questions des éditeurs et des utilisateurs. Si c’est ce que certains qualifient de “secret”, alors le notre doit être le moins bien gardé de l’histoire de la recherche.
Par Matt Cutts, Ingénieur en chef, équipe Recherche Qualité