Webmaster Tools : Arrivée de nouveaux outils d’analyse des erreurs d’indexation
Cet Article est la traduction d'une annonce officielle publiée par Google.
Les erreurs d’exploration sont l’une des fonctionnalités les plus populaires dans les outils pour les webmasters, et nous déployons aujourd’hui une séries d’améliorations significatives qui, nous l’espérons, rendront ce rapport encore plus utile.
Nous détectons désormais de nombreux nouveaux types d’erreur. Pour que ces nouvelles données soient plus compréhensibles, nous avons réparti les erreurs en deux sections : erreurs au niveau du site et erreurs au niveau des URL.
Erreurs au niveau du site
Les erreurs de ce type ne sont pas spécifiques à une URL, elles affectent votre site dans son ensemble. Elles regroupent les échecs de résolution DNS, les problèmes de connexion à votre serveur, et les problèmes que nous rencontrons lorsque nous parcourons votre fichier robots.txt. Nous avions pour habitude de vous signaler ces erreurs classées par URL, mais ce n’était pas très pertinent puisqu’elles ne sont pas propres aux URL. En effet, elles empêchent les robots Google de faire la moindre requête sur votre serveur. Nous vous indiquons à présent le taux d’erreur pour chaque type, au niveau du site dans son ensemble. Nous essaierons également de vous alerter si nous rencontrons un trop grand nombre de ces erreurs.
De plus, si vous n’avez aucun problèmes de ce type, comme c’est le cas pour la majorité des sites, nous ne vous embêterons pas avec ces sections. Nous vous afficherons simplement des petites icônes de validation pour vous indiquer que tout va bien dans le meilleur des mondes.
Erreurs au niveau des URL
Les erreurs de ce type sont spécifiques à une page en particulier. En d’autres termes, lorsque le Googlebot a essayé d’explorer l’URL, il a été capable de résoudre votre DNS, de se connecter à votre serveur, et de lire votre fichier robots.txt, mais une erreur est survenue par la suite. Nous classons les URL de ce type en plusieurs catégories, selon la cause de l’erreur. Si votre site propose du contenu à Google Actualité ou au mobile, nous afficherons des catégories à part pour ces erreurs.
Faire plus avec moins
Nous vous proposions jusqu’à présent de voir au plus 100 000 erreurs de chaque type. Essayer d’analyser toutes ces données était comme d’essayer de trouver une aiguille dans une botte de foin, et vous n’aviez aucun moyen de faire le tri parmi les erreurs importantes (votre page d’accueil ne répond plus) et celles moins importantes (un autre site a fait une faute d’orthographe dans l’URL vers votre site). Il n’y avait aucun moyen réaliste de visualiser les 100 000 erreurs – aucun moyen de trier, de rechercher, ou de garder une trace de vos actions. Dans cette nouvelle version, nous avons essayé de ne vous afficher que les erreurs les plus critiques. Pour chaque catégorie, nous vous donnerons ce que nous pensons être les 1000 erreurs les plus importantes et pour lesquelles vous pouvez apporter des solutions. Vous pouvez filtrer et trier ce top 1000, nous signaler lorsque vous les corriger, et voir les détails sur chacune d’elle.
Certains sites ont plus de 1000 erreurs pour un type donné, vous pourrez donc continuer à consulter le nombre total d’erreurs que vous avez dans chaque catégorie, ainsi qu’un graphe établi sur les données datant de 90 jours. Pour ceux qui auraient besoin d’avoir accès au détail de plus de 1000 erreurs, nous réfléchissons à proposer une API afin de vous permettre de télécharger l’intégralité des erreurs relatives à votre site.
Nous avons retiré la liste des pages bloquées par votre fichier robots.txt. Ce rapport, bien que parfois utile, est constitué de page que vous avez volontairement bloqué, et nous voulions nous concentrer sur les erreurs. Nous allons bientôt ajouté dans la section Configuration > Accès du robot d’dxploration un nouveau rapport sur les URL affectées par votre robots.txt.
Toujours plus de détails
Lorsque vous cliquez sur une URL en erreur dans la liste principale, nous vous indiquerons la date à laquelle nous avons pour la dernière fois essayé d’explorer cette URL, la date à laquelle nous avons remarqué pour la première fois cette erreur, ainsi qu’une courte description du problème.
Depuis ces informations complémentaires, vous pouvez cliquer sur le lien correspondant pour voir par vous-même ce qu’il se passe lorsque vous essayer d’y accéder. Vous pouvez également :
- Marquer l’erreur en tant que “corrigée” (voir plus bas)
- Accéder à des ressources d’aide
- Consulter la liste des sitemaps contenant cette URL
- Voir les autres pages présentant un lien vers cette URL
- Et même demander au Googlebot d’explorer à nouveau cette URL immédiatement, soit pour obtenir plus d’informations, soit pour vérifier que le problème est bel est bien corrigé.
A vous de jouer !
Toutes ces nouveautés vous permettent notamment de vous concentrer sur la correction des erreurs réellement importantes. Nous avons classé les erreurs de sorte que celles en tête de liste soient possibles à corriger, que ce soit en corrigeant des liens cassés, en résolvant des bugs sur votre site, ou en mettant vos sitemaps à jour afin de supprimer les URL non fonctionnelles, ou en redirigeant vos visiteurs en 301 vers une page “réelle”. Nous faisons ce classement selon une multitude de facteurs, comme la présence d’une URL dans vos sitemaps, sa popularité dans les pages de résultats naturels de Google, et le nombre de liens menant vers elle, depuis votre site ou ailleurs.
Une fois que vous pensez avoir résolu une erreur, vous pouvez nous le signaler en marquant l’erreur comme “corrigée”. Notez que l’accès à cette fonctionnalité nécessite que vous soyez un utilisateur disposant d’un accès total sur Webmaster Tools. Marquer une erreur aura pour effet de la supprimer de la liste. Par la suite, les erreurs que vous avez marqué comme “corrigées” ne seront plus incluses dans la liste, sauf si nous les rencontrons à nouveau.
Nous avons beaucoup travaillé à ces nouvelles fonctionnalités, et nous espérons que vous pourrez en tirer le plus de bénéfices possibles. Faites nous part de vos retours et de vos suggestions via notre forum.
Posté dans sa version originale en anglais par Kurt Dresner, équipe Webmaster Tools
Bonjour,
C’est effectivement un outil que j’apprécie car il me permet de corriger des erreurs et d’améliorer l’expérience utilisateur. Cependant j’ai découvert cette mise à jour ce matin avec un message “1 000 premières pages comportant des erreurs” et rien de plus dans la rubrique “Erreurs d’exploration”. J’ai l’impression qu’il y a un problème, car ces “erreurs” (que je n’avais pas avant ce changement) ne sont pas consultables. On ne peut pas comprendre/analyser le problème ? Y aurait-il un souçi sur l’outil ?
Je donne la réponse obtenue du support. Le message affiché n’est pas une erreur mais juste un label dans le cas ou il y aurait des erreurs :o)
J’ai eu aussi ce message ! Merci pour le retour Alain. Je me disais, c’est étrange d’avoir 1000 erreurs et rien sur GWT.
Bonjour,
Merci pour ces informations.
La majeure partie des erreurs remontées par google bot est “introuvées” car ce sont des url que j’ai supprimées. Est-il possible de les retirer de la liste que google crawle?
PS : j’ai deja tout supprimé des sitemaps, et google les crawle tout de meme…
Merci pour vos éclairages