"Nouveau millénaire, Défis libertaires"
Licence
"GNU / FDL"
attribution
pas de modification
pas d'usage commercial
Copyleft 2001 /2014

Moteur de recherche
interne avec Google
Améliorer son référencement par Google

Origine http://www.generationcyb.net/article.php3?id_article=431


Le but du jeu est que votre site bénéficie du meilleur référencement possible chez Google, qui draine la moitié des recherches par mots-clés sur le Web. Comment se décide le positionnement de votre site chez Google ? Mots-clés, popularité, PageRank, balises méta... Essayons d’y voir clair et d’en déduire quelques bons conseils pour être bien référencé...

___

Le principe général : le robot de Google (le "GoogleBot") revisite périodiquement une page en fonction de son PageRank (PR - sa popularité), pour voir si elle a connu des mises à jour et indexer ses nouveaux contenus. Au passage, il enregistre dans son "cache" les pages du site (ces pages sont accessibles en cliquant sur "En cache" dans les résultats d’une recherche Google).

En parallèle, une fois par mois, Google recalcule les PageRanks, donc les nouvelles popularités de toutes les pages [1], pour définir leur nouveau positionnement en fonction du nouveau PageRank et des mots trouvés dans le texte et les balises, qui peuvent être autant de mots-clés recherchés par l’internaute.

Quels sont les critères qu’utilise Google pour, à partir d’un mot saisi dans son moteur par un internaute, proposer votre page en réponse avec le meilleur positionnement possible ?

Voici les critères listés par le site www.webrankinfo.com (NB : le "mot-clé" signifie ici le mot saisi par l’internaute dans Google ; la numérotation des critères veut "donner une idée" de l’importance décroissante des critères) :

1. PageRank (popularité). C’est un indice de popularité créé par Google (son maximum est 10) destiné à éviter - autant que faire se peut - les référencements abusifs basés sur la présence dans les pages de mots-clés trompeurs [2] :

* Nombre total de liens (depuis l’extérieur vers le site)

* Nombre de liens contenant le mot-clé dans le texte du lien

* Rapport entre le nombre de liens et le nombre de liens contenant le mot-clé dans le texte du lien

* PageRank des pages de sites extérieurs qui font des liens

* Nombre de nouveaux liens depuis le dernier calcul du PageRank

2. Balise TITLE de la page
* Présence du mot-clé dans le titre

* Position du mot-clé dans le titre (distance par rapport au début du texte)

* Rapport entre le nombre de mots-clés dans le titre et le nombre total de mots

3. Texte de la page
* Position du mot-clé dans le titre (distance par rapport au début du texte)


* Nombre de caractères dans le texte. La page ne doit pas être trop longue, sous peine de noyer le mot-clé dans une masse de termes. On recommande de ne pas dépasser 20 Ko comme poids de la page sans les images


* Occurrence du mot-clé dans le texte (en dehors de toute balise)

* Indice de densité des mots-clés


* Distance entre les mots-clés

* Ordre des mots-clés


4. URL de la page
* Présence du mot-clé dans l’URL

* Position du mot-clé dans l’URL (distance par rapport à la racine du site)

* Nombre de caractères de l’URL

* Nombre de niveaux de répertoires

5. Fichier de la page
* Date de création (récente/ancienne)
* Fréquence des mises à jour de la page

6. Caractéristiques générales du site
* Taux (ou nombre) de nouvelles pages dans le site depuis le dernier calcul

* Nombre de pages du site


* PageRank de la page d’accueil

7. Balise META description [3]
* Présence du mot-clé

* Position du mot-clé (distance par rapport au début du texte)

* Rapport entre le nombre de mots-clés et le nombre de mots dans la balise


8. Balise META keywords
* Présence du mot-clé

* Position du mot-clé dans le titre (distance par rapport au début du texte)

* Rapport entre le nombre de mots-clés et le nombre de mots dans la balise


9. Balise A (liens hypertextes)
* Occurrence du mot-clé dans le texte de la balise. Par exemple

1. Balises H1 ... H6 (sous-titres)


* Occurrence du mot-clé dans le texte de la balise

2. Balise IMG (images)


* Occurrence du mot-clé dans le texte de la balise

* Présence et imbrication à l’intérieur d’une balise A

3. Autres balises


* Occurrence du mot-clé dans le texte de la balise

4. Pages liantes (qui pointent vers le site), liens internes et externes

* Nombre de domaines différents des pages liantes

* Densité des mots-clés des pages liantes

* Présence et position des mots-clés dans les pages liantes (dans le titre, ou le texte)

* Présence et densité des mots-clés dans les pages liées par les pages liantes (pages similaires)

* Nombre de liens internes (même url - même répertoire)

* Nombre de liens intermédiaires (même nom de domaine mais autres répertoires)

* Nombre de liens externes (autres noms de domaine)

* Rapport entre le nombre de liens externes et le nombre total de liens

* Nombre de liens externes contenant le mot-clé dans le texte des liens

* Rapport entre le nombre de liens externes et le nombre de liens externes contenant le mot-clé dans le texte du lien.

On le voit, l’alchimie qu’opère Google est bien sophistiquée.

Pour résumer, disons que les critères prépondérants pour Google, qu’il s’agit d’optimiser par les gestionnaires du site, sont :

# les PageRanks des pages du site, c’est-à-dire le nombre et la qualité des pages d’autres sites qui pointent vers le site,

# les mots-clés apparaissant dans le titre, le texte et les balises des pages. Le but du jeu est de réussir le grand écart : trouver les mots qui d’une part correspondent bien au contenu du site, et d’autre part qui sont le plus souvent tapés par les internautes dans Google. Une fois que ces mots sont identifiés, les placer au mieux dans le titre et le texte de la page, le plus près possible du début du titre ou du texte. On recommande de ne pas attribuer le même titre à toutes les pages !

# les caractéristiques générales du site : nombre de pages, fréquence de mise à jour, popularité de la page d’accueil.

Pour améliorer son référencement

Améliorer le positionnement de sa page dans Google par rapport à une recherche effectuée par l’internaute à partir de mots-clés, c’est à la fois

# améliorer la présence de ces mots-clés dans la page avec des articles pas trop longs et faisant apparaître des mots-clés - pas toujours les mêmes - dans le titre, dans le texte - le plus près possible du début du texte - et les balises de liens, images et sous-titres... Installer en parallèle un système d’analyse d’audience, qui indique en particulier les mots-clés saisis par les internautes (système Xiti gratuit ou payant ; SPIP et SPIP-Agora intègrent des fonctions d’analyse d’audience),

# améliorer le PageRank de la page,

# améliorer les caractéristiques générales du site comme la fréquence de mise à jour - d’autant que les pages créées ou modifiées bénéficient d’un effet de "prime de fraîcheur", le nombre de pages...

Comment améliorer son PageRank ?

1. par le respect de certaines règles éditoriales
* condenser son texte, éviter de "trop" le parsemer d’humour, d’anecdotes, de mots inutiles...

2. par des actions de référencement par d’autres sites
* se faire référencer (ou d’échanger des liens) par des sites "populaires" : à fort PageRank. Cela peut passer aussi par un partenariat éditorial/échange de liens. Quand vous proposez à un autre site de créer un lien vers le vôtre, proposez-lui un code du type

o ne pas dénigrer les inscriptions sur les autres moteurs ou annuaires (Yahoo, Dmoz.org - Open directory- Free...). Cela améliore les PageRanks de son site,
* par une bonne gestion des liens internes au site (certaines des opérations peuvent s’automatiser avec SPIP ou SPIP-AGORA)

o éviter, surtout sur la page d’accueil, des liens sortant vers d’autres sites. Cela diminue le PageRank transmis depuis la page d’accueil aux pages internes. Préférer, sur la page d’accueil, un lien... vers une rubrique lien !

o créer un lien des pages intérieures vers la page d’accueil (bandeau ou icone) : cela augmente le PageRank de la page d’accueil,

o penser à créer des liens explicites, mentionnant des mots-clés, du type

Ressources :
# www.webrankinfo.com,
# www.abondance.com,
# www.robotstats.com,
# voir aussi http://outils.abondance.com/google.html pour le fonctionnement de Google,
# sur la Google dance (en anglais) : http://dance.efactory.de/,
# plusieurs articles sur le PageRank (en anglais) sur http://pr.efactory.de/.

[1] Cela prend quelques jours, durant lesquels les PageRanks convergent peu à peu vers leur nouveau niveau. Cette période de recalcul des PageRanks est appelée la "Google dance". Dès la fin de la Google dance, Google se remet à balayer le site - et tout le Web - pour indexer les nouvelles mises à jour et calculer à nouveau les PageRanks.

[2] Cet indice de popularité est UN critère important de Google et non pas le seul. Une page de popularité 2 ou 3 pourra apparaître mieux positionnée qu’une page de popularité 6 ou 7 si le mot que recherche l’internaute apparaît plus souvent dans le titre et le texte de la page. Pour voir apparaître les PageRanks lors d’une recherche Google, le mieux est de télécharger la barre Google pour Internet Explorer à http://toolbar.google.com. Par exemple, on voit ci-dessous que la page d’accueil de GénérationCyb a un PR de 5 environ :
(GIF)

[3] Google semble tenir de moins en moins compte des balises META description et keywords, par rapport aux autres critères. Cependant, entre une page qui possède ces balises renseignées d’une façon cohérente avec les autres critères et une autre page qui ne possède pas ces balises, Google attribuera sans doute un meilleur positionnement à la première.