Les premiers éléments à mettre en place dans vos pages web sont les métas ou métadonnées. Ces données permettent de définir la page telle qu’elle sera vue par les moteurs de recherche en indiquant son codage, sa description, les fichiers qui lui sont rattachés, et éventuellement des indications pour les robots.
Seules quelques métas sont réellement pertinentes et il est fréquent de voir des pages web utilisant des métas inutiles voire nuisibles pour le référencement.
Revenons rapidement sur ces différentes métadonnées :
Les métas indispensables :
La méta Description :
Cette méta est inutile pour le référencement mais reste indispensable. En effet Google ne prend pas en compte la description pour le référencement, c'est-à-dire qu'utiliser vos mots-clés dans la méta description ne contribuera pas à améliorer votre positionnement sur ces expressions. Cependant ces métas apparaissent directement dans les SERPS et sont donc visibles par les internautes. Il est donc indispensable d'y faire apparaître un message qui donnera plus envie aux internautes de cliquer sur votre site plutôt que sur ceux de vos concurrents. Pour la rendre la plus attractive possible, rédigez des phrases courtes et bien construites plutôt que d'énumérer des mots-clés. Pour être optimale, le nombre de caractère de la Meta description doit varier entre 70 et 160 caractères (espaces compris) afin d’apparaître de façon complète dans les résultats de recherches de Google.
La méta Content type :
Cette méta permet d'indiquer l'encodage de vos pages, c'est-à-dire indiquer le jeu de caractères utilisé. Il est primordial de rester cohérent par rapport à l'encodage défini pour ne pas générer d'erreur d'affichage au niveau des caractères spéciaux.
C’est le cas par exemple d’un encodage utf-8 avec un contenu faisant figurer des caractères spéciaux codés en français, espagnols, etc… (des lettres accentuées, des symboles de type « € », des caractères particuliers de type « œ », etc…)
Pour éviter ces soucis, il faut opter pour une cohérence : soit définir un codage utf-8 et écrire tous les caractères spéciaux sous cette norme (un « é » s’écrira « é ; » par exemple), soit définir un codage régional et utiliser les caractères régionaux (par exemple ISO-8859-5 pour le russe).
A noter qu’en terme de référencement, les contenus écrits sous un codage régional semblent plus pertinents.
Toutefois, le codage utf-8 permet une plus grande universalité de vos contenus.
La méta Content language :
Cette méta permet d'indiquer aux moteurs de recherche le langage utilisé sur vos pages. Même si en général Google est en mesure de déterminer que votre site est en français, il est préférable de s'assurer qu'il ne se trompe pas (surtout si votre site est multilingue).
Les métas polluantes (voire nuisibles) :
La balise Meta "title"
C'est un doublon de la balise <Title> qui n'a aucun intérêt si ce n'est de donner au robot une information qu'il a déjà. Préférez donner aux robots des informations qu'il n'a pas et dont il a besoin. Oubliez donc la méta "title" mais par contre n'oubliez surtout pas la balise <Title>, ce qui serait catastrophique étant donné que le Title est certainement l'élément le plus important d'une page pour le référencement.
La méta Keyword:
Un méta très utilisée et qui fait débat. Pourtant il n'y a plus lieu de débattre sur cette méta parce que Google ne la prend tout simplement plus en compte. Le souci est que cette méta peut être une indication très intéressante pour vos concurrents. Elle permet tout simplement à vos concurrents de connaître en 2 clics les mots-clés sur lesquels vous souhaitez positionner votre site. Nous-mêmes n’hésitons pas à consulter les métas "keyword" des concurrents de nos clients pour nous donner des idées lors de la définition des mots-clés qui entrent dans notre audit de référencement. Supprimez donc cette méta de vos pages et consultez celle de vos concurrents qui ont certainement des idées intéressantes.
La balise "Robots" qui spécifie "index,follow" :
C'est la valeur par défaut, donc inutile de le spécifier. En effet, à la base les robots sont configurés pour indexer les pages de votre site et suivre les liens qu'elles contiennent. Une fois de plus, il est inutile de donner aux robots des informations qu'ils détiennent déjà. Quelques cas particulier nécessitent cependant l'utilisation de la balise "Robots" mais pas pour y spécifier "index,follow" :
Par exemple, si vous souhaitez interdire l’indexation (noindex), le suivi des liens (nofollow) ou la mise en cache (noarchive). Cependant ces cas sont sensé être rares.
La balise "Revisit-after" :
Elle n'a, au mieux, pas d'utilité, et est dangereuse car elle risque de limiter la fréquence de visite des robots. Il est très dommage d'indiquer aux robots de ne visiter votre site que tous les 10 jours alors qu'ils avaient éventuellement prévu de revenir tous les 3 jours. Ne limitez pas les robots car des visites régulières sont un signe de mises à jour régulières de votre site ce qui est parfaitement positif. Ne limitez pas les robots, bien au contraire, n'utilisez pas la balise "Revisit-after".
Parmi les balises polluantes, nous trouvons aussi les balises : "Author", "copyright", "Generator", "Identifier-URL", "Owner" etc….qui n'ont pas d'utilité, même légale.
Pour être sûr de ne pas faire perdre de temps aux robots qui vous font l'honneur de visiter vos sites, n'utilisez que les balises indispensables décrites dans la première partie de cet article et bannissez définitivement les balises polluantes qui n'ont pour la plupart pas d'intérêt, qui alourdissent inutilement le code et qui dans certain cas peuvent nuire à votre site.