Google Insights : Sur la prédictibilité des tendances de recherche
Cet Article est la traduction d'une annonce officielle publiée par Google.
Depuis le lancement de Google Trends et Google Insights for Search, nous fournissons un aperçu quotidien de ce que le monde recherche. La compréhension des tendances de recherche peut être très utile pour les annonceurs, les économistes, les universitaires, et quiconque intéressé par ce qui fait vibrer le monde qui nous entoure.
Comme beaucoup ont pu l’observer, les tendances de certaines requêtes sont assez saisonnières, et suivent des schémas qui se répètent. Prenez par exemple la requête “ski“, les tendances de recherche atteignent un pic en hiver. Pour le mot “basketball“, les tendances établissent une corrélation avec la saison sportive, et sont de même ampleur chaque année. Si on s’intéresse maintenant aux tendances de recherche d’une catégorie, on peut observer que certaines catégories, comme Nourriture ou Automobile, suivent également des schémas particuliers. De telles tendances semblent assez prédictibles, et on s’attend à ce que les séquences se répètent d’une année sur l’autre.
D’un autre côté, pour beaucoup d’autres requêtes et catégories, les tendances sont plutôt irrégulières et difficiles à prédire. Des exemples sont les tendances pour les requêtes obama, twitter, android, ou réchauffement climatique, ainsi que la catégorie Actualités.
Observer des tendances de recherche prédictibles peut avoir certains intérêts. On pourrait par exemple prédire les tendances dans le futur, et les utiliser pour diverses décisions commerciales, comme l’établissement du budget, les campagnes marketing, et l’allocation de ressources. On pourrait également identifier les facteurs perturbants qui influencent les tendances de recherche sur une période donnée, comme démontré dans les tendances de la grippe.
Nous nous sommes donc intéressés aux questions suivantes :
- Combien de requêtes ont des tendances prédictibles ?
- Certaines catégories sont-elles plus prédictibles que d’autres ? Comment se répartit la prédictibilité entre les différentes catégories ?
- Quelle est la prédictibilité des tendances de recherche des requêtes agrégées pour les différentes catégories ? Quelles catégories sont plus prédictibles et quelles le sont moins ?
Afin d’en savoir plus sur la prédictibilité des tendances, et par conséquent de surpasser notre limite habituelle qu’est de ne pas savoir ce que le futur nous réserve, nous déterminons la prédictibilité des tendances basées sur leurs performances passées. En d’autres mots, nous estimons la prédictibilité d’une séquence selon le rapport entre les erreurs de prédictions et les performances actuelles.
Nous avons utilisé un modèle de prédiction simple qui mémorise les tendances saisonnières et générales. Pour chaque séquence, nous prenons un instant t, se situant environ un an en arrière, le confrontons à une année de prédiction basée sur les données historiques disponibles à l’instant t, et le comparons aux tendances actuelles. L’erreur entre les tendances de prédiction et les tendances actuelles caractérise le niveau de prédictibilité d’une séquence, et lorsque l’erreur est inférieure à un certain seuil, nous considérons la requête comme prédictible.
Notre travail jusqu’à ce jour est résumé dans une publication intitulée Sur la prédictibilité des tendances de recherche, et inclue les observations suivantes :
- Plus de la moitié des requêtes les plus populaires effectuées sur Google sont considérées comme prédictibles sur une année, avec une chance d’erreur de 12%.
- Presque la moitié des requêtes les plus populaires ne sont pas prédictibles (selon le modèle que nous avons utilisé).
- Certaines catégories contiennent un grand pourcentage de requêtes prédictibles : Santé avec 74%, Nourriture avec 67%, et Voyage avec 65%.
- A contrario, d’autres catégories sont caractérisées par une prédictibilité plutôt faible : Divertissement avec 35%, et Réseaux sociaux & communauté en ligne avec 27%.
- Les tendances de requêtes agrégées par catégories sont beaucoup plus prévisibles : 88% des catégories répertoriées dans Insights for Search sont prédictibles, avec une marge d’erreur de 6%.
- Il y a une corrélation nette entre l’existence de schémas saisonniers et la prédictibilité. Pour la catégorie Divertissement, qui se caractérise par moins de recherches saisonnières et davantage de recherches ponctuelles, la prédictibilité s’élève à 35%, tandis que la catégorie Voyage, où on observe des tendances saisonnières, caracole à 65%.
- On doit toujours s’attendre à ce que les tendances actuelles dévient des prévisions pour de nombreuses requêtes dites prédictibles, à cause d’évènements imprévus ou de circonstances spéciales.
- Nous avons publié la comparaison entre les prévisions et les tendances actuelles pour quelques catégories, dont celles que nous avions utilisé pour prédire le présent de certains facteurs économiques. Ceci démontre à quel point les prévisions peuvent se révéler être d’excellents points de départ pour identifier les déviations importantes dans le trafic de recherche.
Alors que nous continuons à étudier la prédictibilité des tendances, nous introduisons aujourd’hui une nouvelle fonctionnalité dans Google Insights for Search, ainsi qu’une nouvelle version du produit. La nouvelle fonction de prévision s’applique aux requêtes réputées prédictibles (par exemple basketball, ou la catégorie Automobile), et affiche une extrapolation des tendances historiques.
Par Yossi Matias, Niv Efron, et Yair Shimshoni, Google Labs, Israel.
Note de florentM : Par la même occasion, nous vous annonçons que Google Insights a été traduit dans 39 langues dont le Français. Vous pourrez trouver la version Française dont le nom est Google Tendances des recherches . Pour découvrir cette nouvelle version, rendez-vous sur http://www.google.fr/insights/search/