Webmasters : Travailler sur un site multilingue
Cet Article est la traduction d'une annonce officielle publiée par Google.
Un site multilingue est un site offrant du contenu en plus d’une langue. Par exemple, le site d’une entreprise canadienne comportant une version anglaise et une version française, ou bien le blog d’une association sportive latino-américaine disponible en espagnol et en portugais.
Habituellement, un site multilingue prend tout son sens lorsque votre audience cible comprend des personnes parlant différentes langues. Si votre blog latino-américain vise uniquement une audience brésilienne, alors vous voudrez probablement ne le publier qu’en portugais. Mais si vous voulez toucher aussi l’Argentine, alors proposer du contenu en espagnol pourrait vous aider.
Google et la reconnaissance du langage
Google essaye de déterminer les principales langues sur chacune de vos pages. Vous pouvez faciliter la reconnaissance du langage en n’utilisant qu’une seule langue par page et en évitant les traductions côte à côte. Même si Google est capable de reconnaître qu’une page est écrite en plus d’une langue, nous recommandons de n’utiliser qu’une langue sur tous les éléments d’une même page : en-tête, bare latérale, menus, etc.
Gardez à l’esprit que Google ignore tous les éléments du code faisant référence à la langue, de l’attribut “lang” au Doctype. Certains logiciels de programmation créent ces attributs automatiquement, ils ne sont donc pas fiables pour savoir quelle langue est utilisée sur une page.
Quelqu’un qui arrive sur Google et effectue une recherche dans sa langue s’attend à obtenir des résultats localisés, et c’est là où vous, webmasters, entrez en jeux : si vous vous apprêtez à localiser, faites-le savoir dans les résultats de recherche avec les astuces ci-dessous.
L’anatomie d’un site multi-lingue : Structure de l’URL
Il n’est pas nécessaire de créer des URLs spéciales pendant le développement d’un site multilingue. Néanmoins, vos utilisateurs pourraient aimer pouvoir identifier sur quelle section du site ils se trouvent en regardant l’URL. Par exemple, les URLs suivantes permettent aux visiteurs de savoir qu’ils sont sur la partie anglaise du site :
http://exemple.ca/en/mountain-bikes.html
http://en.exemple.ca/mountain-bikes.html
Alors que ces URLs permettent aux utilisateurs de savoir qu’ils sont sur la même page, mais en français :
http://exemple.ca/fr/mountain-bikes.html
http://fr.exemple.ca/mountain-bikes.html
De plus, cette structure d’URL vous permettra aussi de mieux analyser le référencement de vos contenus multilingues.
Si vous voulez créer des URLs avec des caractères non-anglophones, pensez à bien à encoder en UTF-8. Les URLs encodées en UTF-8 doivent être échappées correctement lorsque vous faites des liens depuis votre contenu. Si vous devez les échapper à la main, vous pouvez utiliser un encodeur d’URL en ligne. Par exemple, si vous souhaitez traduire l’URL suivante en français :
http://exemple.ca/fr/mountain-bikes.html
Cela donnerait quelque chose dans ce style :
http://exemple.ca/fr/vélo-de-montagne.html
Puisque cette URL contient des caractères accentués (non anglais), voici à quoi elle doit ressembler lorsque vous l’utilisez dans des liens au sein de vos pages :
http://exemple.ca/fr/v%C3%A9lo-de-montagne
Exploration et indexation de votre site multilingue
Nous vous recommandons de ne pas autoriser l’indexation de contenus traduits automatiquement. Les traductions automatiques ne sont pas toujours très censées et pourraient être considérées comme du spam. Plus important, l’objectif d’un site multilingue est de toucher une plus large audience en proposant du contenu de qualité en plusieurs langues. Si vos utilisateurs ne peuvent pas comprendre une traduction automatique et si elle leur semble artificielle, vous devriez vous demander si vous tenez vraiment à leur présenter ce type de contenu.
Si vous vous apprêtez à localiser, facilitez l’indexation de chaque version de votre site par le Googlebot. Pensez par exemple à lier vos pages entre elles. En d’autres mots, vous pouvez fournir des liens entre des pages proposant le même contenu en différentes langues. Cette manière de procéder peut aussi bénéficier aux utilisateurs. Admettons par exemple qu’un internaute français atterrisse sur la page http://exemple.ca/en/mountain-bikes.html ; il peut aisément cliquer sur le lien pour lire la page http://example.ca/fr/vélo-de-montagne.html.
Pour faciliter le référencement de votre contenu, évitez les redirections automatiques selon la langue parlée par le visiteur. Ces redirections pourraient empêcher les visiteurs (et les moteurs de recherche) de voir les différentes versions de votre site.
Pour terminer, faites en sorte que chaque version ait sa propre URL – n’utilisez pas les cookies pour montrer les versions traduites.
L’encodage des caractères
Google extrait directement le mode d’encodage des caractères des en-têtes HTTP, des en-têtes de la page, et du contenu. Il n’y a pas grand chose que vous puissiez faire concernant l’encodage des caractères, sinon de surveiller les informations conflictuelles — par exemple entre le contenu et les en-têtes. Même si Google est en mesure de reconnaître plusieurs sortes de mode d’encodage, nous recommandons l’utilisation d’UTF-8 dès que possible.
Si votre langue se tord
Maintenant que vous savez tout cela, votre langue peut bien se faire des noeuds lorsque vous parlez plusieurs langues, mais votre site Web ne le fera pas !
Pour plus d’informations, consultez notre article sur les sites multi-régionaux, et restez à l’écoute pour le prochain article dans lequel nous explorerons les cas spéciaux qui pourraient se présenter lorsque vous travaillez sur un site mondial. En attendant, n’hésitez pas à nous rendre une petite visite sur notre forum et à vous joindre aux discussions !
Par Xavier deMorales, Google Recherche Qualité
Dans la même série :
- Travailler avec un site international
- Travailler sur un site multilingue
Il ne vaut pas mieux utiliser un .fr et .com, plutot que d’avoir un paramètre dans l’URL ?
Ici nous sommes dans le cas d’un site en plusieurs langues, nous ne travaillons pas sur un pays mais sur plusieurs langues, dans certains des pays on parle plusieurs langues donc on n’utilisera qu’un site.
Pour info, l’extension .fr désigne la France et non la langue française.
L’avantage des paramètres dans l’URL ou des sous-dossiers, c’est que tout reste sur le même site, alors qu’avec un .fr et un .com, ça fait deux sites différents pour Google (et donc classements différents, moins de pages sur chacun, etc…)
un petit schéma que j’avais réalisé il y a quelques temps : http://ours.vox.com/library/post/site-web-multilingue.html