L'algorithme de Google enfin dévoilé ?

Trouvé sur Vox in a blog de Francois Goube, cet article sur SEOmoz qui propose une formule simplifiée de l'algorithme de Google. SEOmoz avait déjà commis un guide très complet et pointus : Le référencement naturel pour débutants, traduit en français par 7 Dragons. Voici la formule de l'algorithme Google que propose Randfish, l'auteur :

GoogScore = (Score Densité de mots clés * 0.3) + (Force du nom de domaine * 0.25) + (Poids des liens entrants * 0.25) + (Statistiques utilisateurs * 0.1) + (Qualité du contenu * 0.1) + (optimisation manuelle) - (Pénalités automatiques ou manuelles)

Au delà des pourcentages approximatifs et les questions d’arbitrage sur la pondération exacte de chaque critère, la méthode est très intéressante et facilite je trouve la compréhension et l'appréhension de quelques-uns des rouages du référencement naturel sur Google.

En 2003, il y avait eu la révélation de la formule de calcul du PageRank, elle pour de vrais :

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Depuis cette publication, l'importance et la fiabilité de la valeur indiquée dans la petite barre verte a pris un sérieux coup chez les référenceurs. Le PageRank n'est plus un critère à prendre en compte en référencement naturel, il n'apparaît d'ailleurs pas non plus dans les critères donnés par SEOmoz. J'ai ajoutés quelques critères en gras et si vous en connaissez d'autres, indiquez-les en commentaire :)

Densité de mots clés :

  • MC dans la balise title
  • MC dans la balise description
  • MC dans le corps du document
  • MC dans le libellé du maillage interne
  • MC dans le nom de domaine et/ou l’URL
  • MC entre balise Hx
  • MC dans l’attribut ALT

Force du nom de domaine :

  • Historique du domaine
  • Ancienneté du nom de domaine
  • Popularité des liens pointant vers le nom de domaine
  • Thématique connexe des liens entrants et sortants du domaine
  • Lien du domaine avec des sites de confiance
  • Extensions du nom de domaine
  • Hébergement du nom de domaine

Poids des liens entrants :

  • Age des liens
  • Qualité/Pertinence des domaines liés
  • Qualité/Pertinence des pages liées
  • Le libellé des liens sur les pages liées
  • Adéquation des liens avec le thème du site
  • Liens depuis des sites de confiance

Statistiques utilisateurs :

  • Historique du taux de clic dans les pages de résultats organiques
  • Temps passé par l'utilisateur sur la page
  • Nombre de recherches par URL/nom de domaine
  • Historique des visites par URL/nom de domaine via un service Google (barre d’outils Google Toolbar, Google Wifi, Google Analytics, etc.)

Qualité des contenus :

  • Potentiellement écrit à la main pour les recherches et pages populaires
  • Evaluateur humain Google Eval
  • Algorithme pour noter la qualité et la lisibilité des contenus
  • Détection des duplications de contenu
  • Accessibilité et spécifications W3C

Difficile de résumer tout ceci en une formule simple, c'est pourtant ce que Rand à réussi tout en nous montrant que le référencement naturel est un art, il est empirique car il se base à la fois sur l’expérience utilisateur (que Google intègre de plus en plus) et votre propre expérience vis-à-vis de votre site web, son histoire, sa vie, et son passé aussi.

Réagissez au blog Référencement 2.0 et Marketing Internet

Commentaires

1. Le mercredi 18 octobre 2006 à 10:08, par David C

Cité dans la liste référencement.
Merci pour la trad.
David


2. Le mercredi 18 octobre 2006 à 13:00, par Xhtml power

En fin de compte, ce sont des critères normaux que nous prendrions nous pour comparer des documents, ni plus, ni moins.


3. Le mercredi 18 octobre 2006 à 20:52, par Davidd [1ère Position]

David Cohen merci pour la citation dans la liste referencement que j'avais délaissé au profit de forums que je trouvais plus pratique à utiliser, content de voir qu’elle est toujours en ligne et active ! La liste referencement est le premier groupe de discussion crée sur ce thème en France par l’agence CVFM.


4. Le vendredi 20 octobre 2006 à 01:55, par Charles

Rien de bien nouveau mais c'est un bon rappelle de criteres de bases de google.


5. Le vendredi 20 octobre 2006 à 03:35, par Bertimus

Hey Hey, pas si compliqué que ça l'algo de google ;)


6. Le samedi 21 octobre 2006 à 12:10, par Sabri

Bonjour David, Bonjour tout le monde,

Comme disais Sébastien B. dans la liste de diffusion référencement : "On en apprend pas beaucoup".
Mais ca permet quand meme d'avoir une bonne vue d'ensemble et de réviser ses bases...;-)
En tout cas, merci David pour cette traduction et tes ajouts...!!!


7. Le samedi 21 octobre 2006 à 16:52, par DavidD [1ère Position]

Une précision importante s’impose : Je n’écris pas des articles (ou relais des informations) sur le blog 1ère Position que pour apprendre des choses à mes concurrents ;-)

Je le fais aussi et avant tout pour les prospects, nos clients et les gens intéressés par le référencement, sur un principe d’échange et de partage quand je trouve que l’info est pertinente et susceptible de les intéresser, comme c’est le cas ici.

D’ailleurs je n’ai pas vu beaucoup (aucunes en réalité à ce jour) de propositions de nouveaux critères suite à cet article, ni personne pour les remettre en question. Bref une polémique de plus, bien de chez nous, et qui finalement n’apporte rien.

Enfin si, cette polémique montre encore l’incapacité des référenceurs à se mettre d’accord et reconnaître une bonne action d’un de leur pairs quand elle se présente. Il ne me semble pas que ce soit la meilleure stratégie pour valoriser notre métier à l’extérieur, si on continue sans cesse de reproduire les mêmes erreurs du passé et tout dénigrer.

Dans ce contexte j’ai vraiment du mal à comprendre cette polémique venant de pros ou d’experts en SEO, à qui cet article n’est pas exclusivement destiné. C’est oublier toutes les autres personnes que le référencement intéresse et rebute à la fois de part ses nombreux aspects techniques, sauf quand ils trouvent un article et une formule capable de les rendre accessibles comme Rand a réussi à le faire.

Pour ceux qui aiment ça, la polémique inutile est là : www.webmaster-hub.com/ind...


8. Le dimanche 22 octobre 2006 à 16:45, par Sebastien Billard

Hello David,

Voici ma vision des choses :
s.billard.free.fr/referen...

Je crois qu'il n'y a finalement aucun désaccord, et je n'ai rien contre l'article de SEOmoz en lui-même. Ce dont je me méfie, c'est de la propension des référenceurs et webmasters à spéculer sur ce type de formule. Bien trop souvent cela est improductif, alors que des choses peut être plus "terre à terre" le seraient davantage, comme l'aspect rédactionnel du référencement :)


9. Le mardi 31 octobre 2006 à 11:19, par Paul-Arnaud

Bonjour David,

Je suis tout à fait d’accord avec toi au sujet de la "polémique" que ton billet suscite. Celle-ci n’a aucune raison d’être car ton billet est destiné à des non professionnels et sont, pour moi, tous valables... bien qu'incomplet ;-)

Pour compléter les éléments que tu mentionnes ici, je rajouterais par exemple :
- la langue définit dans les documents et celles envoyées par l'entête des serveurs
- la prise en compte de la saisonnalité et de l’actualité sur un thème donné dans la publication de documents

Cordialement,

Paul-Arnaud


10. Le samedi 16 décembre 2006 à 18:54, par cain

N'étant pas un pro du réferencement donc contrairement a beaucoup j'apprends : a quoi correspond l'évaluation humaine de google et "Potentiellement écrit à la main pour les recherches et pages populaires " ce n'est pas tres compréhensible !

marci


11. Le vendredi 2 mai 2008 à 21:20, par Oscar

La question des évaluations humaines est intriguante et toujours d'actualité. Bien que Google ait confirmé à plusieurs reprises que ces évaluations sont seulement utilisées pour mesurer la pertinence et la qualité des résultats produits par l'algorithme, certains seo comme Rand à l'époque de la publication de cet article, pensent que des ajustements humains peuvent
avoir lieu notamment sur des requêtes très importantes et donc concurrentielles.


12. Le jeudi 8 mai 2008 à 14:04, par Netwebinfo

Lut,
Ui on le voit sur les très grosse requette, notament celle on l'on peut voir les 3 barres pour séparé les résultats

Aussi il y a des actions manuelle quand des personnes "reporte" un site web non conforme, il peut y avoir un filtre d'appliquer

et j'ai aussi déja vue des sites plonger sans trop de raison, notamment les sites qui "skoitait" les premières position sur "annuaire automatique " ou d'autre

"GoogScore = (Score Densité de mots clés * 0.3) + (Force du nom de domaine * 0.25) + (Poids des liens entrants * 0.25) + (Statistiques utilisateurs * 0.1) + (Qualité du contenu * 0.1) + (optimisation manuelle) - (Pénalités automatiques ou manuelles)"

impressionnant, merci pour cette formule, c'est pas si compliquer finalement, enfin..

"+(optimisation manuelle) "

optimisation manuelle de google ? déjà entendu dire que wikipedia était "upper" par google, et que c'était dans son intérêt puisque beaucoup d'utilisateur cherche via google pour trouver des info sur wikipédia et que si il ne trouvai pas wikipedia, il irait directement sur wiki faire leur recherche, c'est donc peut être vrai qu'il up artificiellement wiki.

"
Force du nom de domaine :
+Hébergement du nom de domaine"

Lut pas compris au niv de l'hébergeur ce qu'il pourrait apporté ?


13. Le samedi 17 mai 2008 à 17:06, par Oscar S.V. Paradi-SEO

Pour l'hébergement ça a du être rajouté par la suite. Je pense que c'est pour faire référence essentiellement à l'impact négatif sur le referencement si le serveur rame ou est souvent down. Mais l'hébergement peut avoir aussi d'autres implications sur le positionnement, par ex geolocalisation en fonction IP, puissance des liens lorsque provenant d'IP identiques, etc


14. Le dimanche 11 janvier 2009 à 12:38, par kana

dommage que cet article soit si ancien et que google n'ait pas validé cet algo.


Ajouter un commentaire

Les commentaires pour ce billet sont fermés.