Chroniques : SEO : Le mystère de l’opérateur “site:”
Petit détour ce soir du côté du SEO pour se pencher sur un constat que beaucoup ont fait ces derniers temps : l’opérateur de recherche “site:” affiche significativement moins de pages indexées qu’auparavant. Cette technique étant utilisée par nombre de spécialistes du référencement pour avoir une idée des performances d’un site sur Google, ce changement en laisse quelques uns déstabilisés (et oui, certains sont choqués par les guerres ou par la pauvreté, alors que d’autres sont ébranlés par une petite modif sur Google :-) ).
Exemple pour Goopilation :
Si vous avez vous-aussi remarqué une chute libre de l’indéxation des pages de votre site, attendez un peu avant de paniquer : cela semble toucher pas mal de monde. Et personne ne peut dire si c’est vraiment le nombre de pages indexées qui en prend un coup, ou si c’est Google qui se plante lors de l’affichage des totaux… On pourrait attendre que Google communique sur le sujet, mais ne rêvons pas trop !
J’ai donc mené ma petite enquête, et tout semble indiquer qua la requête [site:goopilation.com] n’affiche pas le nombre réel de pages indexées par le moteur. Pour en arriver à cette conclusion, je suis allé faire un petit tour sur Google Webmaster Tools pour voir si le nombre de pages indexées était indiqué quelque part… Bien qu’il ne soit pas explicitement indiqué, on peut le déduire grâce à l’onglet “Liens internes“. Cet onglet liste tous les liens internes sur votre site (les liens présents sur votre site pointant vers votre site). Sur la colonne de gauche, vous pouvez voir tous les liens internes recensés… Et donc le nombre de pages indexées :
D’après GWT, il y aurait donc 6443 pages différentes référencées sur Goopilation, ce qui colle mieux avec la réalité que les pauvres 1450 de la recherche. On ne peut pas pour autant être 100% certain de la fiabilité de ce chiffre… Qu’en pensez-vous ?
Certains sites également n’affiche même plus de résultats, je n’ai plus d’exemples sous la main par contre.
Merci pour ton article.
Il n’y a pas de mystère là dedans.
Le nombre de pages annoncées par le moteur sur une requête, avec ou sans opérateur, est une estimation rapide. Le moteur n’a pas le temps de compter les pages et de répondre en 2/10 de seconde. Ils utilisent un raccourci mathématique assez approximatif.
On peut le constater lorsqu’on déroule les SERPs sur une requête. Le nombre de pages annoncé à tendance à se repréciser.
La difficulté est d’observer le phénomène lorsqu’il y a plus de 1000 résultats. En effet, sur une requête les moteurs ne fournissent jamais que 1000 résultats. Difficile alors de vérifier.
Bonjour,
Pour https://www.goopilation.com, Yahoo Site Explorer affiche 8 729 pages.
http://siteexplorer.search.yahoo.com/fr/search?p=http%3A%2F%2Fwww.goopilation.com&fr=sfp
La plupart des Seo utilisent Yahoo Site Explorer car plus fiable que les données que Google veut bien transmettre.
Par contre, l’opérateur “site:” sur Google est utile pour les sites dont le nombre de pages n’est pas grand.
Cordialement,
bonjour,
dans l’onglet sitemaps de GWT, le nombre de pages indéxées par rapport aux nombres de pages fournies dans le sitemap est indiqué.
C’est un bon indicateur je trouve (pour peu que le sitemap soit généré dynamiquement) dans le sens ou les pages du sitemap sont justement celles que l’on cherche à référencer (d’ailleurs quand le nombre de pages indéxées est largement supérieur au nb de pages dans mon sitemap, je passe en mode enquête pour découvrir le pourquoi et cherche à y remedier)
Personnellement j’ai un nombre très similaire de page sur GWT et via la commande site: (à 10% près – sur 6500 pages indexées) sur 2 de mes sites, et des résultats similaire au votre sur les autres.
Oui j’ai toujours eu un problème avec cette instruction :D mais ne peut on pas comparer avec le nombre de pages indexées dans la partie sitemap du GWT si il est continuellement mis à jour ?
La commande “site:” n’est pas du tout fiable. On note des fluctuations complètement folles d’un jour à l’autre. Je pense qu’il faudrait meme mieux supprimer cette commande qui ne sert à rien car non fiable…