Article traduit par
Vincent Ballut

Code is Poetry. Crack the code.

Webmasters : Travailler sur un site multilingue

Cet Article est la traduction d'une annonce officielle publiée par Google.

Un site multilingue est un site offrant du contenu en plus d’une langue. Par exemple, le site d’une entreprise canadienne comportant une version anglaise et une version française, ou bien le blog d’une association sportive latino-américaine disponible en espagnol et en portugais.

Habituellement, un site multilingue prend tout son sens lorsque votre audience cible comprend des personnes parlant différentes langues. Si votre blog latino-américain vise uniquement une audience brésilienne, alors vous voudrez probablement ne le publier qu’en portugais. Mais si vous voulez toucher aussi l’Argentine, alors proposer du contenu en espagnol pourrait vous aider.

Google et la reconnaissance du langage

Google essaye de déterminer les principales langues sur chacune de vos pages. Vous pouvez faciliter la reconnaissance du langage en n’utilisant qu’une seule langue par page et en évitant les traductions côte à côte. Même si Google est capable de reconnaître qu’une page est écrite en plus d’une langue, nous recommandons de n’utiliser qu’une langue sur tous les éléments d’une même page : en-tête, bare latérale, menus, etc.

Gardez à l’esprit que Google ignore tous les éléments du code faisant référence à la langue, de l’attribut « lang » au Doctype. Certains logiciels de programmation créent ces attributs automatiquement, ils ne sont donc pas fiables pour savoir quelle langue est utilisée sur une page.

Quelqu’un qui arrive sur Google et effectue une recherche dans sa langue s’attend à obtenir des résultats localisés, et c’est là où vous, webmasters, entrez en jeux : si vous vous apprêtez à localiser, faites-le savoir dans les résultats de recherche avec les astuces ci-dessous.

L’anatomie d’un site multi-lingue : Structure de l’URL

Il n’est pas nécessaire de créer des URLs spéciales pendant le développement d’un site multilingue. Néanmoins, vos utilisateurs pourraient aimer pouvoir identifier sur quelle section du site ils se trouvent en regardant l’URL. Par exemple, les URLs suivantes permettent aux visiteurs de savoir qu’ils sont sur la partie anglaise du site :

http://exemple.ca/en/mountain-bikes.html

http://en.exemple.ca/mountain-bikes.html

Alors que ces URLs permettent aux utilisateurs de savoir qu’ils sont sur la même page, mais en français :

http://exemple.ca/fr/mountain-bikes.html

http://fr.exemple.ca/mountain-bikes.html

De plus, cette structure d’URL vous permettra aussi de mieux analyser le référencement de vos contenus multilingues.

Si vous voulez créer des URLs avec des caractères non-anglophones, pensez à bien à encoder en UTF-8. Les URLs encodées en UTF-8 doivent être échappées correctement lorsque vous faites des liens depuis votre contenu. Si vous devez les échapper à la main, vous pouvez utiliser un encodeur d’URL en ligne. Par exemple, si vous souhaitez traduire l’URL suivante en français :

http://exemple.ca/fr/mountain-bikes.html

Cela donnerait quelque chose dans ce style :

http://exemple.ca/fr/vélo-de-montagne.html

Puisque cette URL contient des caractères accentués (non anglais), voici à quoi elle doit ressembler lorsque vous l’utilisez dans des liens au sein de vos pages :

http://exemple.ca/fr/v%C3%A9lo-de-montagne

Exploration et indexation de votre site multilingue

Nous vous recommandons de ne pas autoriser l’indexation de contenus traduits automatiquement. Les traductions automatiques ne sont pas toujours très censées et pourraient être considérées comme du spam. Plus important, l’objectif d’un site multilingue est de toucher une plus large audience en proposant du contenu de qualité en plusieurs langues. Si vos utilisateurs ne peuvent pas comprendre une traduction automatique et si elle leur semble artificielle, vous devriez vous demander si vous tenez vraiment à leur présenter ce type de contenu.

Si vous vous apprêtez à localiser, facilitez l’indexation de chaque version de votre site par le Googlebot. Pensez par exemple à lier vos pages entre elles. En d’autres mots, vous pouvez fournir des liens entre des pages proposant le même contenu en différentes langues. Cette manière de procéder peut aussi bénéficier aux utilisateurs. Admettons par exemple qu’un internaute français atterrisse sur la page http://exemple.ca/en/mountain-bikes.html ; il peut aisément cliquer sur le lien pour lire la page http://example.ca/fr/vélo-de-montagne.html.

Pour faciliter le référencement de votre contenu, évitez les redirections automatiques selon la langue parlée par le visiteur. Ces redirections pourraient empêcher les visiteurs (et les moteurs de recherche) de voir les différentes versions de votre site.

Pour terminer, faites en sorte que chaque version ait sa propre URL – n’utilisez pas les cookies pour montrer les versions traduites.

L’encodage des caractères

Google extrait directement le mode d’encodage des caractères des en-têtes HTTP, des en-têtes de la page, et du contenu. Il n’y a pas grand chose que vous puissiez faire concernant l’encodage des caractères, sinon de surveiller les informations conflictuelles — par exemple entre le contenu et les en-têtes. Même si Google est en mesure de reconnaître plusieurs sortes de mode d’encodage, nous recommandons l’utilisation d’UTF-8 dès que possible.

Si votre langue se tord

Maintenant que vous savez tout cela, votre langue peut bien se faire des noeuds lorsque vous parlez plusieurs langues, mais votre site Web ne le fera pas !

Pour plus d’informations, consultez notre article sur les sites multi-régionaux, et restez à l’écoute pour le prochain article dans lequel nous explorerons les cas spéciaux qui pourraient se présenter lorsque vous travaillez sur un site mondial. En attendant, n’hésitez pas à nous rendre une petite visite sur notre forum et à vous joindre aux discussions !

Par Xavier deMorales, Google Recherche Qualité

Dans la même série :

  1. Travailler avec un site international
  2. Travailler sur un site multilingue

7 Commentaires

  1. Social comments and analytics for this post…

    This post was mentioned on Twitter by florentM: [Webmasters] Travailler sur un site multilingue http://bit.ly/beg6Rr

  2. Benjamin dit :

    Il ne vaut pas mieux utiliser un .fr et .com, plutot que d’avoir un paramètre dans l’URL ?

    • florentM dit :

      Ici nous sommes dans le cas d’un site en plusieurs langues, nous ne travaillons pas sur un pays mais sur plusieurs langues, dans certains des pays on parle plusieurs langues donc on n’utilisera qu’un site.
      Pour info, l’extension .fr désigne la France et non la langue française.

    • Vincent dit :

      L’avantage des paramètres dans l’URL ou des sous-dossiers, c’est que tout reste sur le même site, alors qu’avec un .fr et un .com, ça fait deux sites différents pour Google (et donc classements différents, moins de pages sur chacun, etc…)

  3. l'Ours dit :

    un petit schéma que j’avais réalisé il y a quelques temps : http://ours.vox.com/library/po.....ingue.html

Qu'en pensez-vous ?

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>