Google Actualité : 8 conseils pour aider Google Actualité à mieux indexer votre site.
Source : Google News Blog
De temps en temps, des webmasters nous demandent ce qu’ils peuvent faire afin d’améliorer leur présence dans Google Actualité. Les huit points suivants sont les conseils les plus utiles que nous leur fournissons le plus fréquemment. Pourquoi huit ? Car chez Google nous aimons les puissances de 2.
Gardez un corps d’article propre.
Quand il indexe un article, Google Actualité s’assure qu’il puisse trouver le corps de votre article. Si votre article est interrompu par des tags, des encarts publicitaires, une sidebar ou tout autre contenu non-relatif à votre article, il est possible que nous ne soyons pas capable de détecter l’article en tant que tel et que nous rejetions ainsi ce dernier.
Assurez-vous d’avoir des URLs uniques et définitives.
Si vous recyclez vos URLs d’articles, il se peut que notre système ait des difficultés à indexer et classer correctement vos articles. Par ailleurs, assurez-vous que vos URLs d’article contiennent plus de trois chiffres ne correspondant pas à une année (Par exemple, 5232 est correct, mais 2008 ne l’est pas). Vous pouvez passer outre cette obligation en nous soumettant vos articles via un sitemap pour Google Actualité. De même, notez que des identifiants de session peuvent troubler notre crawler et il est possible que nous ne réalisions pas que deux URLs distinctes pointent sur la même page. Vous pouvez en savoir plus sur ces pré requis ici.
Profitez des codes actions dans votre Sitemap
Les Sitemaps Google Actualité permettent aux rédacteurs de spécifier les codes des actions des entreprises cités dans des articles qui leur sont dédiés. L’usage de ces codes nous aident eux-aussi à mieux identifier le sujet de vos articles. Vous en saurez plus sur le format que nous utilisons pour intégrer ces données ici .
Vérifiez l’encodage de vos articles
Nous observons occasionnellement des articles se déclarant encodé dans un format (disons UTF-8 par exemple) alors qu’ils sont en fait encodé dans un format différent (disons ISO 8859-1). Évitez ceci. Cela nous cause des soucis lors de l’indexation.
Rendez explicite la date de publication de votre article
Pour faciliter notre crawler à déterminer la bonne date de publication de vos articles, rendez cette date explicite. Pour ce faire, placez la date et l’heure juste entre le titre et le corps de l’article. De même, vous pouvez retirer toute les autres dates du code HTML de la page de l’article et ajouter le tag correspondant à la date lors de l’ajout de l’article à votre Sitemap Google Actualité. Les dates présentes dans vos articles peuvent prendre les formats les plus classiques, par contre pour le Sitemap, nous vous demandons de la renseigner en utilisant le format W3C correspondant, par exemple : 2008-12-29T06:30:00Z.
Séparez votre contenu original des communiqués de presse
Si votre site produit du contenu original et relaie aussi des communiqués de presse et que vous voulez que nous indexions aussi ces derniers, garantissez-vous qu’ils soient séparés de votre contenu original en créant sur votre site deux sections bien distinctes. Comme vous devez le savoir, Google Actualité étiquette distinctement ces communiqués afin d’informer nos utilisateur sur le fait que l’article qu’ils sont en train de lire est un communiqué de presse. Si votre section comportant des articles originaux a des liens pointant vers des communiqués de presse, appliquer l’attribut rel=”nofollow” sur ces liens vous garantira que ces derniers seront étiquetés correctement. Pour en savoir plus sur ces attributs, rendez-vous ici.
Formatez correctement vos images
Pour permettre à Google Actualité d’identifier plus facilement vos images et de les lier avec vos articles, utilisez des image de taille honnêtes avec des ratios raisonnables, accompagnez-les de légendes. Placez-les proche du titre de l’article, alignez-les et rendez-les non-cliquable. Les images au format JPEG sont plus facilement indexées.
Renseignez correctement les titres de vos articles pour Google Actualité
Afin de faciliter la détermination du titre de vos articles, assurez-vous de le placer conjointement dans les headers du code HTML de votre page ( balise <TITLE>) et appliquez-leur la balise <H1> dans le corps de la page. Évitez d’en faire un lien. Pour plus d’information cliquez ici
Si vous avez trouvé ces suggestions utiles, vous pouvez aussi lire les conseils aux webmasters. Ces pratiques ne sont pas nécessairement spécifiques à Google Actualité, avec du bon sens, vous pourrez contribuer à rendre votre site plus accueillant pour l’indexation dans Google Actualité. Notre Centre d’aide pour Google Actualité contient des tas d’information à propos de tous ces sujets. Vous pouvez toujours visiter le Forum d’aide Google Actualité pour nous faire part de vos retours sur ces suggestions et partager d’autres astuces et conseils avec d’autres Webmasters et utilisateurs de Google Actualité.
Je remet les commentaires ayant été zappés lors de la migration
THIERRY
11 mars 2009 12:16
Bonjour,
J’ai lu avec attention votre guideline mais peine perdue, mes images ne sont toujours pas prisent en compte.
-www.thesiteoueb.net/modules/news/
Si quelqu’un connait la solution de mon problème :-)
cordialement
thierry
—
FLORENTM
11 mars 2009 13:48
Les conseils de Google sont ici : http://www.google.com/support/news_pub/bin/answer.py?hl=fr&answer=13369 (ce qui reprends en gros le contenu de l’article). Il parlent aussi de la présence de légende (que tu n’a pas).
Sur WebRankInfo ils parlent aussi de la taille de l’image (au moins 300 pixels de large) : http://www.webrankinfo.com/actualites/200804-astuces-referencement-google-news.htm les tiennes sont en-dessous de cette taille ça peut être une autre piste. J’ai remarqué que les sites de news dont les images sont indexées respectent cette taille .
Si tu arrives à les faire prendre en compte par Google News après tout cela, ce serait sympa de nous faire un petit retour d’expérience ;)
—
THIERRY
11 mars 2009 19:43
Florentm merci,
Je teste cela demain et je te tiens au courant.
—
THIERRY
12 mars 2009 17:56
bonjour Florentm,
bon j’ai testé différentes tailles (depuis je suis revenu à une taille standard) et rien. J’ai même écris un nouveau template pour avoir l’image à coté de la news avec la date en dessous.
Bref hormis le fait que les infos sont bien reprise, l’image ne s’affiche pas.
De plus en ce qui concerne la taille, certains sites affichent des images en dessous de 200 px.
Thierry
Ps: je continue de chercher :-)
—
THIERRY
13 mars 2009 12:15
Bon, énième test :-).
Cette fois j’ai une refonte complète des news (http://www.thesiteoueb.net/modules/news/article.php?storyid=3726) bien prise en compte mais toujours pas d’image.
On verra par la suite :-)
Thierry
Nos actualités immobilières sont bien reprises par Googles Actualités mais les images ne sont pas reprises. Elles sont 150X150 pixels… Prochainement je vais tester à 200 pour voir si je peux pas régler ce pb. Mais il y a encore 2 semaines, même les petites images passaient… GG a dû relever ses critères !