Webmasters : Est-ce que les 404 sont nuisibles pour mon site ?
Cet Article est la traduction d'une annonce officielle publiée par Google.
Vous voici donc en train de vérifier que tout tourne bien pour votre site sur Google Webmaster Tools… Mais attendez ! La page Erreurs d’exploration est pleine d’erreurs 404 (introuvables) ! Désastre à l’horizon ??
N’ayez aucune crainte, jeune padawan. Regardons ensembles les 404 et comment elles affectent (ou pas) votre site :
Q : Est-ce que les erreurs 404 signalées dans les outils pour les webmasters affectent mon classement dans Google ?
R : Les pages 404 sont un phénomène normal sur le Web ; Internet est en constante mutation, du contenu nouveau apparaît, et du contenu ancien meurt, et lorsqu’il meurt, il renvoie un code d’erreur 404. Les moteurs de recherches en sont conscients. Nous avons des erreurs 404 sur nos propres sites, comme vous pouvez le voir ci-contre, et nous en trouvons partout sur le Web. Nous préférons d’ailleurs que les pages supprimées sur vos sites renvoient un code 404 ou 410 au lieu de ne rien renvoyer du tout. Gardez à l’esprit que, pour que nos robots soient en mesure de voir la réponse HTTP d’une URL, cette URL doit être accessible. Si l’URL est bloquée par votre robots.txt, nous ne pourrons pas l’indexer et voir son code HTTP. Le fait que certaines URLs sur votre site n’existe plus ou renvoie un code d’erreur 404 n’affecte en rien le classement de vos autres URLs (celles qui renvoient un code 200) dans nos résultats de recherche.
Q : Donc les 404 ne nuisent pas du tout à mon site ?
R : Si certaines URLs sur votre site renvoient une erreur 404, alors pas de problème. Cependant, certaines 404 peuvent nécessiter une action de votre part. Par exemple, si certaines des pages en 404 sont des pages importantes pour vous, vous devriez regarder pourquoi nous les voyons en 404 lorsque nous les indexons ! Si vous remarquez une URL mal orthographiée (par exemple www.exemple.com/superpage au lieu de www.exemple.com/super-page), il est fort probable qu’un site tiers ait voulu faire un lien vers vous mais se soit trompé dans l’URL. Au lieu de renvoyer 404, vous pourriez rediriger l’URL mal orthographiée en 301 vers la bonne version. Vous devriez également faire en sorte que votre page 404 ne soit pas un cul de sac et permette aux visiteurs d’aller explorer d’autres pages de votre site.
Q : Dites m’en plus sur les “soft 404”
R : Une erreur “soft 404”, c’est quand un serveur renvoie un autre code que 404 pour une page qui n’existe pas. Nous voyons fréquemment des webmasters désirant afficher une page 404 utile pour le visiteur, et qui pensent qu’ils doivent renvoyer le code 200. Que néni ! Vous pouvez renvoyer le code 404 tout en affichant n’importe quel contenu. Autre exemple : un site qui redirige toutes les pages qui n’existent pas vers la page d’accueil au lieu renvoyer un code 404. Cas deux cas peuvent affecter négativement votre référencement, donc nous vous recommandons de toujours retourner le bon code d’erreur pour les pages inexistantes. Sachez aussi que parce qu’une page affiche “404 introuvable”, ça ne signifie pas pour autant que son code HTTP soit 404. Utilisez la fonctionnalité “Analyser comme Googlebot” dans les outils pour les webmasters pour bien vérifier. Si vous ne savez pas comment faire en sorte de retourner les bons codes HTTP, voyez avec votre hébergeur.
Q : Comment savoir si une URL doit renvoyer 404, 301, ou 410 ?
R : Lorsque vous supprimez une page de votre site, déterminez si ce contenu est déplacé autre part, ou si vous n’avez simplement plus besoin de ce contenu. Si vous le déplacez vers une nouvelle URL, vous devriez faire une redirection 301 de l’ancienne vers la nouvelle URL. De cette façon, lorsque les utilisateurs atterrissent sur l’ancienne URL, ils sont automatiquement redirigés vers la nouvelle. Si vous supprimez purement et simplement le contenu, alors l’ancienne URL doit retourner un code 404 ou 410. Actuellement, Google traite les codes 410 (contenu supprimé) et 404 (contenu introuvable) de la même façon.
Q : La plupart des mes erreurs 404 concernent des URLs qui n’ont jamais existé sur mon site. D’où viennent-elles ?
R : Si Google trouve un lien quelque part sur le Web qui pointe vers une URL chez vous, il pourrait essayer de l’indexer, que le contenu existe ou pas. Si il n’existe pas, votre serveur doit retourner un code 404. Ces liens découlent peut-être d’erreurs dans les liens sur des sites tiers, d’une erreur de configuration (si les liens sont automatiquement générés, par exemple par un CMS), ou des efforts de Google d’indexer les URLs présentes dans les bouts de code JavaScript. Google peut aussi tester comment votre serveur répond à un contenu inexistant. Si vous voyez des pages qui n’existent pas sur votre en 404, vous pouvez tout simplement les ignorer. Nous ne pouvons pas savoir quelles URLs sont importantes pour vous et lesquelles ne le sont pas, nous les affichons donc toutes dans le rapport afin que vous puissiez décider lesquelles nécessitent une action de votre part.
Q : Quelqu’un a aspiré mon site et a généré énormément de 404. Cela peut me poser un problème ?
R : En général, vous n’avez pas besoin de vous soucier des liens erronés. Nous comprenons que les webmasters n’aient aucun contrôle sur les gens qui aspirent leurs sites, ou sur les liens qui pointent vers eux. Si vous êtes un as de l’expression régulière, vous pouvez essayer de rediriger toutes ces URLs comme décrit ici, mais de manière générale vous n’avez pas besoin de vous en préoccuper.
Q : La semaine dernière, j’ai corrigé toutes les 404s signalées par Webmaster Tools, mais elles sont toujours listées dans le rapport. Cela veut dire que je ne les ai pas bien corrigé ? Combien de temps avant que le rapport se mette à jour ?
R : Regardez la colonne “détecté” sur le rapport d’erreurs d’exploration. Vous y verrez la date à laquelle nous avons repéré chaque erreur. Si la date indiquée est d’avant vos corrections, alors nous n’avons pas rencontré cette erreur depuis vos corrections.
Q : Puis-je utiliser l’outil de suppression d’URL de Google pour accélérer la procédure ?
R : Non. L’outil de suppression d’URL de Google supprime les URLs des résultats de Google, mais ne les supprime pas des rapports présents sur les outils pour les webmasters. Cet outil est destiné aux demandes urgentes, et l’utiliser n’est pas nécessaire lorsqu’une URL renvoie déjà un code 404 puisque cette dernière disparaîtra de nos résultats avec le temps.
Article original en anglais par Susan Moskwa, de l’équipe Google Webmaster Tools
Petite correction : c’est le code http 410 et non 401 pour une page supprimée définitivement.
Et petite précision : les pages qui renvoient un code 200 alors qu’aucune page n’a été trouvée sont appelées “softs 404” par Google, notamment dans GWT.
C’est corrigé, merci :)
Une page 404 bien optimisée peut être un excellent moyen de conserver un visiteur perdu.
Ça peut être aussi un excellent moyen d’inclure une touche d’humour sur son site et d’éviter une frustration au visiteur.
Pour des exemples originaux, visitez Bonjour 404, où je poste une page 404 originales par jour, cela commence à faire une belle collection puisqu’il y a déjà 178 pages 404 postées!