Google et le temps reel

Le temps réel et google

Cette page fait partie de l'explication sur le fonctionnement de google

Tout le monde parle de temps réel au moins depuis le 11 septembre 2001, et surtout depuis l'utilisation massive de twitter. Je vais vous expliquer sommairement comment google arrive à intégrer cet aspect depuis peu.

Note: lorsque j'utilise la notion de Pagerank, j'entends le logarithme du nombre de liens rentrants (ou backlinks).
Il ne s'agit en aucun cas de l'information fournie par google dans sa barre d'outil, qui était à l'origine proche de la partie entière de cette valeur, et qui est actuellement un moyen de communiquer plutôt qu'un paramètre de l'algorithme.

Le nombre de backlinks ne suffit plus

Le nombre de liens était un bon indicateur lorsque Internet était supposé être en croissante stricte (c'est-à-dire que de nouvelles choses sont publiées, rien ne disparaît). Plus on trouvait de liens, plus on pouvait considérer que le site était reconnu. Cependant, cela posait le problème du « premier arrivé, premier servi », c'est-à-dire que les jeunes sites ne peuvent pas détrôner les vieux qui avaient été créés 10 ans avant, et avaient récupéré à leur début des liens à partir de sites qui sont maintenant eux-aussi devenus des références en terme de linking.

La solution pour remédier à ce problème est assez simple : la position seule ne suffit pas, la vitesse aussi est importante.

Un meilleur indice pour repérer les buzz

J'appelle cette nouvelle notion la fluxion. Si jamais quelqu'un veut se lancer dans la traduction de cet article en anglais, je propose "juice fluxion". Il s'agit de la dérivée du nombre de liens entrants par rapport au temps, c'est-à-dire la limite du taux d'accroissement du nombre de liens. Pour ceux qui n'ont rien compris, prenez par exemple le nombre de liens que le site considéré a obtenu pendant les x derniers mois.

Dans l'outil keywords de google adwords par exemple, on peut voir pour chaque mot clé analysé les tendances (trends) de recherche. Google trends for website aussi permet d'avoir un aperçu de la fluxion et propose les mots clés sur lesquels le nombre de requêtes est en très forte augmentation.

Voici une analogie de ces notions de page rank et fluxion que l'on peut trouver dans d'autres domaines que le SEO:

DomaineVariableDérivée de la variable
EconomiePIB taux de croissance
Google Nombre de liens absolus (Page Rank original) fluxion
Mécanique position vitesse

Etude de cas

Comparons le classement basé sur la position à celui basé sur la vitesse (ou meilleure progression) pour 2 sites A et B, le site A ayant 500 liens en Janvier 2010, et le site B étant complètement neuf. Le site A gagne 50 liens par mois, le B gagne 10 liens par mois, sauf en avril et en mai où il en comptabilise 400 de plus pour chacun des 2 mois. En août, ils ont 850 liens chacun.

	backlinks(A)	backlinks(B)
1-Jan	500			0
1-Feb	550			10
1-Mar	600			20
1-Apr	650			420
1-May	700			820
1-Jun	750			830
1-Jul	800			840
1-Aug	850			850
1-Sep	900			860
1-Oct	950			870
  1. Si l'on regarde la position (le nombre absolu de backlinks ), le site B devrait être devant le site A pour les mois de mai, juin et juillet, et au même niveau en août.
  2. Si on regarde maintenant la fluxion, on observe que le site B se positionne en première position uniquement en mai et juin. Ce sont les mois pendant lesquels l'afflux de liens externes a été maximum. Une fois cette période passée, il reprend sa place de second.

Si le classement ne se base que sur la fluxion, et qu'aucune page n'est créée, modifiée ou supprimée pendant une longue période, tous les sites seraient au même niveau (vitesse nulle). Ce qui est donc essentiel à comprendre est que le contenu du site ou le nombre de liens n'est pas essentiel, mais plutôt l'évolution de ceux-ci dans le temps et par rapport aux autres.

Google utilise très certainement une combinaison de la position et de la vitesse (dérivée de la position), voire même de l'accélération (dérivée de la vitesse).

Si l'on considère à titre d'illustration que l'indice appelé IndiceRM pour indice Rat Mort, définit tel que
IndiceRM = position + 0.2 * fluxion
est un indice pertinent, pour les sites A et B, on obtient ceci. B est en tête pour Mai, Juin et Juillet, et à un très faible retard pour août, avant de ce faire clairement distancer ensuite.

Un changement majeur dans l'algorithme google

Grâce à l'intégration de la fluxion dans la méthode de classement, google peut prendre en compte le temps réel dans la mesure où il prend en considération l'évolution du nombre de lien et non sa valeur absolue.

Les sites passés de mode, ou non maintenus et n'intéressant plus les internautes disparaissent peu à peu, et les nouvelles importantes peuvent sortir rapidement en tête.

Pour un site complètement neuf, 3 ou 4 nouveaux liens nécessaires pour lancer l'indexation constituent une augmentation de plus de 200% pendant les premiers jours. Le site est potentiellement un buzz et se place bien sur la première thématique que google a décelé. Ensuite, si le nombre de liens ne progresse plus au même rythme, il descend peu à peu dans les résultats. Dans le domaine du référencement, on parle de prime de fraîcheur, il s'agit uniquement d'une conséquence de la prise en considération de la fluxion. La prime de fraîcheur est le genre de conclusion qu'un référenceur peut tirer lorsque qu'il ne regarde pas plus loin que son nez que le bout de la première page de résultat.

Suite : La simplicité relative de l'algorithme google

Commentaires
Si vous avez appris des trucs, je vous remercie de cliquer sur le bouton google plus