Guide de référencement naturel (SEO) version 1.0

Guide des règles du référencement naturel (SEO) des sites Web de Hervé Chuzeville - version H.C. 1.0 du 05/10/2009
niv. critère v.
Noms de domaine, URL et administration de site Web [ haut ]
1.1 Br. Choisir un nom de domaine significatif et "lisible" pour le site. Il devrait être riche en mots clés séparés par des tirets hauts . Exemple : www.voies-vertes.info. Faire un compromis entre la longueur de l'URL et le nombre de mots clés significatifs. Justification : les moteurs de recherche utilisent les noms de domaine pour le référencement.
1.2 Br. Donner des noms significatifs et "lisibles" (mots clés séparés par des tirets hauts) aux fichiers (pages Web, images, documents, ...) et aux répertoires. Justification : les noms des répertoires et des fichiers apparaissent dans l'URL et sont lus par les référenceurs et les URL servent surtout souvent d'intitulé de lien vers la page aux liens entrants.
1.3 Br. Vérifier l'accès correct à toutes les pages du site : pas de liens brisés, pas d'erreurs 404, pas de sections protégées par mot de passe.
1.4 Br. Utiliser la réécriture d'URL (URL rewriting) pour les URL dynamiques contenant des variables (avec des points d'interrogation). Justification : les moteurs ne référencent pas toujours les URL contenant des variables.
1.5 Br. Utiliser les redirections 301 et 302 rigoureusement (pas de page cible qui ne peut pas être ouverte), avec parcimonie et uniquement pour l'utilisation pour laquelle elles sont prévues (pour ne pas être considérées comme une technique "black hat").
1.6 Ar. Un site ancien est mieux noté par les moteurs de recherche qu'un site récent, car jugé a priori plus pérenne.
1.7 Ar. Un site de grande taille est mieux noté par les moteurs de recherche qu'un site de petite taille.
1.8 Ar. Faire un plan de site soit sous forme d'une page "Plan du site", soit au format Google sitemap. L'important c'est de le tenir à jour.
1.9 Ar. L'instruction noindex appliquée à une portion importante du site via les balises meta ou via le fichier robots.txt entrainera une indexation moins fréquente du reste du site.
1.10 Ar. Ne pas intégrer d'identifiant de session dans un lien. Penser également à enlever un numéro de session dans un lien externe copié collé.
1.11 Or Un site sur un thème unique est mieux noté par les moteurs de recherche qu'un site abordant de nombreux thèmes différents. Justification : les moteurs de recherche accordent un page rank plus élevé à toutes les pages de ce thème.
1.12 Or limiter la profondeur des sous répertoires : les fichiers placés à la racine du site ou le moins profondément dans l'arborescence des sous répertoires sont mieux notés que les fichiers placés dans un niveau de sous répertoires élevé.
1.13 Or Acheter un domaine propre au site plutôt que de prendre un sous domaine (exemple : www.plan-de-commune.fr plutôt que plan-de-commune.free.fr).
1.14 Or Les anciens domaines de premier niveau (TLD) correspondant aux suffixes .com, .net, .org et .edu des noms de domaine ont plus de poids (peut-être encore plus pour les deux derniers) que les domaines de premier niveau récents (.info, .biz, ...).
1.15 Or Les mots dans les URL (noms de domaine, noms de répertoire, noms de fichier) doivent être séparés par des tirets hauts ou "traits d'union" plutôt que concaténés. Justification : amélioration de la lisibilité et meilleure notation par les moteurs de recherche.
1.16 Or Le serveur hébergeant le site doit avoir les taux d'indisponibilité les plus bas (surtout pas plus de 2 à 3%) et le site doit avoir les meilleurs temps de réponse possibles.
1.17 Or Respecter les standards du Web et en particulier la conformité des pages et sites aux normes du W3C (code HTML valide : http://validator.w3.org).
1.18 Or Respecter les critères d'accessibilité des pages et sites Web, par exemple les critères Accessiweb (http://www.chuzeville.com/etudes/liste-synthese-criteres-accessibilite-accessiweb-site-web.php).
1.19 Or Les robots d'indexation préfèrent les URL statiques et explicites aux URL dynamiques.
1.20   La longueur de l'URL n'aurait pas d'influence particulière sauf pour les très longues URL qui peuvent être assimilées au spam. Éviter donc plus de 10 mots dans l'URL (3 ou 4 pour le nom de domaine et 6 ou 7 pour le reste de l'adresse).
1.21   L'adresse IP peut avoir une incidence seulement dans le cas d'un hébergement mutualisé ou d'un hébergement gratuit, si l'IP ou la plage d'adresses IP à laquelle appartient le site à été placée en liste noire.
1.22   L'insertion d'encarts publicitaires Google Adsense n'a aucune influence sur le référencement ou le positionnement d'un site dans les moteurs de recherche.
1.23   L'achat d'encarts publicitaires Google Adwords n'a aucune influence directe sur le référencement ou le positionnement d'un site dans les moteurs de recherche. Cela apporte seulement du trafic ciblé au site.
Mots-clés [ haut ]
2.1 Br. Bien choisir la balise de titre (tag "title") et placer en début les mots et phrases clés les plus importants (mais toujours sous forme d'une phrase lisible
2.2 Br. Les mots clés les plus importants présents dans le titre de la page doivent également apparaître dans l'URL, dans le même ordre. Justification : les URL servent souvent d'intitulé de lien vers la page aux liens entrants.
2.3 Br. Les mots clés doivent apparaître dans les balises d'en-têtes (titres) de paragraphes h1, h2.
2.4 Br. Vérifier la densité des mots clés dans la page : 3 à 7% pour les mots clés majeurs, 1 à 2% pour les mots clés mineurs. Tester la page avec Outiref.
2.5 Br. Ne pas dépasser 10% pour un même mot clé, cette densité pouvant être considérée comme une tentative de référencement abusif (spamdexing).
2.6 Br. Utiliser les mots-clés les plus pertinents dans les intitulés de liens. Justification : surtout pour les liens entrants qui sont considérés comme un vote du site de provenance pour le site de destination, pas seulement en général mais en particulier pour les mots clés de l'intitulé du lien.
2.7 Br. Choisir les mots clés de manière pertinente. Se mettre dans la position du visiteur et réfléchir à de courtes phrases ou associations de mots clés que le visiteur pourrait taper dans un moteur. Par exemple, pour un site de vente de vins, on choisira comme mots-clés plutôt "achat vin" que "vente vin" (ou mieux : mettre les deux).
2.8 Br. Pour le choix des mots clés, faire des statistiques sur les mots qui reviennent le plus souvent ou consulter les statistiques de Google Insight for Search (ex- Google Trends).
2.9 Ar. Placer les mots clés le plus près possible du sommet de la page, par exemple dans une "accroche" ou un paragraphe d'introduction mis en gras, après le titre de premier niveau.
2.10 Ar. Outre les mots clés placés dans les balises h1, h2, ..., les mots clés en gras (entre balises strong) ou sous forme de liens, voire les mots clés placé dans l'attribut alt (des images), ont plus de poids que les mots clés placés dans le texte des paragraphes (voire que ceux en dehors de tout paragraphe ou toute structure).
2.11 Ar. Limiter le nombre de mots clés, particulièrement s'ils n'ont pas de rapport entre eux afin de limiter la dilution des mots clés principaux.
2.12 Or Plus les mots clés sont rapprochés (si possible accolés) dans un texte, plus leur association a de poids.
2.13 Or Essayer d'utiliser des phrases (de mots) clé(e)s qui correspondent à des expressions courantes (et donc à des recherches fréquentes). Néanmoins, plus la phrase est longue moins on de chances qu'elle corresponde à de nombreuses recherches. Limiter donc cette optimisation essentiellement à des "phrases" de 2 ou 3 mots-clés.
2.14 Or Ne pas négliger les mots clés secondaires pour lesquels il y a moins de concurrence que sur les mots clés les plus populaires. Exemple : "hôtel Bretagne" pourrait avoir cent fois moins de clics que "hôtel", mais si la zone de chalandise se limite à la Bretagne, le trafic sera bien mieux ciblé.
2.15 Or Effectuer l'optimisation pour chacun des mots clés de même étymologie s'ils n'ont pas la même signification dans le contexte syntaxique. Exemple : "canin" et "canine" ont certes la même étymologie mais n'ont pas le même sens selon le contexte.
2.16 Or Utiliser des synonymes en plus des mots clés principaux. Justification : les synonymes des mots clés, qui comptent pour les moteurs de recherche, permettent d'augmenter le poids d'une famille de mots clés sans abuser de la densité de chacun des mots clés dans la page. De plus, cela permet d'éviter les répétitions.
2.17 Or Préférer le nombre prépondérant (singulier, en général, ou pluriel) pour les mots clés, en particulier aux endroits stratégiques (titres, liens, ...). Utiliser aussi l'autre forme dans les autres endroits. tester la prépondérance d'une forme sur l'autre avec Google Insight for Search (ex- Google Trends). Justification : si les moteurs présentent des pages avec le mot au singulier comme au pluriel dans leurs résultats, que la recherche porte sur le singulier ou le pluriel, les pages les mieux positionnées sont celles qui correspondent au nombre du mot.
2.18 Or Faire commencer, si possible, le titre de la page par une lettre du début de l'alphabet. Justification : certains répertoires ou annuaires classent les pages par ordre alphabétique.
2.19   Les fautes d'orthographe, de frappe, les inversions de lettres, les plus courantes, sur les mots clés peuvent augmenter le trafic. Mais l'intégration éventuelle de ces mots erronés dans le site doit se faire avec pertinence.
2.20   Les mots clés placés dans des commentaires HTML ne sont plus utilisés par les moteurs de recherche.
Contenu [ haut ]
3.1 Br. Créer un contenu original (sujets et rédaction), différent des autres sites.
3.2 Br. Effectuer des mises à jour du site fréquemment, pas seulement par des actualisations de contenus existants, mais surtout par la mise en ligne de nouvelles informations (création de nouvelles pages).
3.3 Br. Ne pas utiliser du contenu volé sur un autre site ou des contenus illicites ou illégaux, sous peine d'exclusion.
3.4 Br. Ne pas utiliser de texte "invisible" (même couleur de texte et d'arrière plan par exemple) car les moteurs considèrent que le texte ne doit pas être destiné aux moteurs mais d'abord aux internautes.
3.5 Br. Bannir le cloaking qui consiste à présenter aux moteurs une page optimisée différente de la page présentée aux internautes.
3.6 Br. Proscrire les pages satellites (doorway pages) qui consistent à créer des pages spécifiques contenant des liens vers la page cible pour augmenter artificiellement le nombre de liens vers celle-ci et pour optimiser ces liens.
3.7 Br. Bannir le contenu dupliqué (duplicate content) qui consiste à avoir le même contenu sur plusieurs pages (surtout d'un même site). Dans certains cas limités, le contenu dupliqué sur un autre site peut-être autorisé (annuaires d'articles, sites miroirs).
3.8 Ar. Mettre les mots clés en relief en augmentant la taille de la police au même titre que les balises d'en-têtes (titres et sous titres de paragraphes).
3.9 Ar. Ne pas abuser du gras, de l'italique ou des augmentations de taille de police pour les mots clés, sous peine de perdre leur bénéfice.
3.10 Ar. Les documents récents ou mis à jour régulièrement sont favorisés dans leur indexation par les moteurs.
3.11 Ar. Éviter au maximum l'affichage d'un contenu différent (selon l'IP, le navigateur, le moteur, ...) pour une même page, car le moteur ne saura pas quel contenu indexer.
3.12 Ar. Tant le codage que la mise en forme (design, images) du site ne doivent être ni trop pauvres, ni de mauvaise qualité.
3.13 Ar. Pour voir comment les moteurs voient une page lors du référencement, utiliser Lynx .
3.14 Or En général, les longues pages ne sont pas favorisées
3.15 Or Placer de préférence le corps du texte au tout début de la page.
3.16 Or L'idéal serait qu'une page comporte 300 mots minimum (ou au moins 50 mots) et 800 mots maximum.
Liens (internes, entrants, sortants) [ haut ]
4.1 Br. La réputation d'un site externe (par exemple, son Page Rank) qui fait un lien vers le site est primordiale pour le positionnement de celui-ci.
4.2 Br. Il est très utile d'avoir des liens depuis des sites externes de même thématique, ce qui indique que le site est populaire dans la communauté thématique, voire que les "sites concurrents votent pour le site". Faire, avec parcimonie, des échanges de liens avec d'autres sites de même thème.
4.3 Br. Les liens en provenance d'institutions (.gouv.fr, .edu, .gov) ont plus de valeur que les liens depuis les autres sites.
4.4 Br. Plus le nombre de liens entrants (depuis des sites externes) est élevé, meilleur sera le positionnement de la page (sous réserve que les sites externes soient de qualité).
4.5 Br. Ne pas faire de liens vers des fermes de liens ou des sites suspects. Surveiller régulièrement les liens sortants.
4.6 Br. Les croisements de liens peuvent-être considérés comme un échange de liens déguisé et payant et, à ce titre, être pénalisés (exemple : un site A pointe sur un site B qui pointe sur un site C qui pointe sur le site A, mais il peut y avoir des schémas plus complexes).
4.7 Br. Les liens images d'1 pixel ou autres liens invisibles sont considérés comme trompeurs par les moteurs.
4.8 Ar. Mettre des mots clés dans les liens sortants est important (même si cela compte moins que dans les liens entrants).
4.9 Ar. Les textes placés juste avant et après un lien sont également importants car ils donnent des indications sur la pertinence du lien (si celui-ci est artificiel ou s'il s'intègre naturellement dans une phrase du contenu).
4.10 Ar. Plus les liens entrants sont anciens, mieux c'est. Obtenir de nombreux liens nouveaux en peu de temps peut paraître suspect (achat de liens, liens artificiels).
4.11 Ar. Les liens entrants depuis des annuaires de sites Web sont utiles uniquement si leur utilisation est ciblée (annuaires importants comme Yahoo ou DMoz, annuaires thématiques renommés). La présence dans un nombre abusif d'annuaires est sanctionnée par les moteurs. L'inscription dans les annuaires doit être faite manuellement en choisissant de manière pertinente la catégorie de classement du site dans le répertoire ou l'annuaire.
4.12 Or Moins il y a de liens sortants dans une page externe faisant un lien vers le site, plus le lien apparaîtra important.
4.13 Or Utiliser des mots clés pour définir les ancres nommées à l'intérieur d'une page.
4.14 Or Veiller à obtenir des liens entrants provenants de différentes classes d'adresses IP, sinon certains moteurs pourraient considérer l'homogénéité des IP d'origine des liens comme suspecte.
4.15 Or Ne pas placer un trop grand nombre de liens sortants dans une page : se limiter à 100 par page.
4.16 Or Ne pas avoir trop de liens en provenance ou à destination d'un même site (c'est suspect).
4.17   Des liens externes depuis des fermes de liens ou des sites suspects vers le site n'auront aucune d'incidence tant que le site ne fait pas de liens réciproques.
Balises Meta [ haut ]
5.1 Ar. Ne pas utiliser le Meta tag "Refresh" pour effectuer une redirection sur une autre page ou un autre site (mais utiliser plutôt une redirection 301, faite pour cela).
5.2   Le Meta tag "Description" est généralement utilisé par les moteurs comme résumé ou description de la page dans les résultats d'une recherche. Utile pour les pages pour lesquelles on veut forcer le contenu du résumé ou de la description dans les résultats des moteurs (notamment pour une page d'accueil de site), mais, dans ce cas, perte de la présentation par défaut des mots clés recherchés présentés dans leur contexte dans des extraits de la page.
5.3   Le Meta tag "Keywords" n'est généralement plus utilisé par les moteurs.
5.4   Le Meta tag "Language" n'est généralement plus utilisé par les moteurs.
Effets visuels [ haut ]
6.1 Br. Ne pas créer une page tout en Flash, encore moins si c'est une page d'accueil ou un site entier et s'il n'y a pas d'alternative HTML (exemple : Flash dans l'unique frame d'un frameset et texte alternatif dans noframe).
6.2 Br. Prévoir une alternative aux scripts Javascript lorsqu'ils délivrent des informations (affichage de texte, de liens, ...) car les moteurs ne savent pas interpréter les scripts.
6.3 Ar. Ne pas utiliser de frames, en particulier pour une page d'accueil, certains moteurs ne sachant pas référencer les pages avec des frames. Utiliser la balise noframe dans le cas contraire.
6.4 Ar. Ne pas créer une page tout en images, encore moins une page d'accueil ou un site entier, surtout s'il n'y a pas d'alternative textuelle alt.
6.5 Ar. Donner une description textuelle alternative aux images (alt et éventuellement longdesc), pertinente.
6.6 Ar. Donner une description textuelle alternative aux animations Flash, afin que les moteurs prennent en compte leur contenu.
6.7 Ar. Donner une transcription textuelle alternative aux vidéos et podcasts.
6.8 Or Ne pas utiliser de liens sous forme d'image à la place de texte, car même un texte dans l'attribut alt n'aura pas le même poids qu'un texte de lien mis en forme (strong, ...).
6.9 Or Nommer les fichiers images avec des mots clés pertinents décrivant l'image.