Les balises Meta utiles et inutiles pour le référencement

Les balises Meta utiles et inutiles pour le référencement
Tweet about this on Twitter117Share on Facebook0Share on LinkedIn40Email this to someone

(Dossier mis à jour le 26/11/2014)

Les balises Meta sont présentes dans la section <head> des pages web, juste après la déclaration de langues. Leur particularité : elles n’ont aucun poids dans le référencement d’une page mais transmettent pourtant des informations vitales aux moteurs de recherche. L’idée de cet article est venue d’un constat simple : il existe encore beaucoup de mythes à propos des Meta, notamment auprès des webmasters qui ont boudé les sites d’actualités SEO ces dernières années. Ainsi, nous avons tous été au moins une fois les témoins d’une utilisation incorrecte voire hilarante de ces balises; véritables vestiges de l’optimisation d’antan ou simples expressions d’idées reçues ayant la peau dure.

Sommaire du dossier :

Les balises Meta utiles
1. Charset (Content-Type)
2. Site Verification
3. Description
4. Robots
5. Notranslate
6. Refresh
7. Facebook
8. News_keywords
9. Standout
10. Searchbox Google
Les balises Meta inutiles
11. Keywords
12. Revisit-after
13. Index, Follow
14. Les Meta de géolocalisation
15. Author et Copyright
16. Language et Content-language
17. Cache-control, Pragma et Expires
18. Identifier-URL
19. Syndication-source et Original-source

LES BALISES META UTILES

La balise Meta Charset (Content-Type)

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
En HTML5 : <meta charset="UTF-8">

Charset UTF-8Permet de spécifier aux navigateurs le format d’encodage de vos pages web. Il est préférable d’utiliser le format UTF-8 qui supporte une grande variété de langages (même mélangés au sein d’une même page) et prend en compte les caractères spéciaux comme les accents. Vous éviterez la plupart des problèmes d’affichage dans les navigateurs, notamment après un copier-coller un peu agressif.

Il y a d’autres façons de déclarer un charset. La plus pratique reste la solution de Martine : configurer son serveur pour qu’il renvoie l’en-tête HTTP Content-type. Cela vous fera économiser une ligne de code.

En savoir plus ici et .

La balise Meta Site Verification

Google : <meta name="google-site-verification" content="..." />
Bing :   <meta name="msvalidate.01" content="..." />

La mise en place de cette Meta sur votre page d’accueil permet à Google ou à Bing de vérifier que vous êtes le propriétaire légitime et donc apte à gérer ce site via Google Webmaster Tools ou Bing Webmaster Tools. Mais privilégiez plutôt d’autres méthodes de vérification comme le transfert d’un fichier html à la racine de votre site ou l’enregistrement DNS. Cela allègera votre code source d’une ligne, d’autant que le <head> dépend souvent d’un unique template appelé sur toutes les pages. Je pense notamment aux CMS comme WordPress et j’en vois déjà qui rougissent déjà car ils ont cette Meta sur toutes les pages de leur site.

Voir les recommandations de Google et celles de Bing sur la validation de site.

La balise Title

<title>...</title>

Attention il ne s’agit pas d’une Meta à proprement parlé c’est pourquoi elle ne fera pas l’objet d’un traitement dans cet article même si mais elle va souvent de pair avec la Meta Description.

À ne pas confondre avec la Meta Title que l’on croise parfois au hasard d’un code source. Cette dernière est parfaitement inutile en plus d’avoir le don d’énerver Laurent Bourrelly :

Surtout ne pas confondre avec : <meta name="title" content="…">

La balise Meta Description

<meta name="description" content="…" />

Inutile de la bourrer de mots-clés, celle-ci n’a aucune pondération dans l’algorithme de Google comme le montrent de nombreux tests. En d’autres termes, elle n’impacte pas le positionnement dans les moteurs. Faut-il pour autant la négliger? Oh que non. En effet comme chacun le sait Google vient se servir de cette Meta ainsi que de la balise Title pour afficher ses résultats (snippets) même s’il s’autorise parfois des écarts. L’enjeu ici est donc d’informer et de convaincre l’internaute de cliquer sur votre lien : la Meta Description a un rôle incitatif.

Balise Meta Description SERP

Les conseils pour optimiser son taux de clic (click through rate ou CTR) sur la page de résultat :

  • Une description incitative mais pas trop racoleuse pour éviter le look spam. La description doit être rassurante avant d’être attractive.
  • Une description précise de ce que va pouvoir trouver l’internaute si il clique sur votre lien. Ne pas hésiter à lier le contenu de la balise à des paramètres dynamiques de son site tels que le prix ou le nombre de produits disponibles – seulement si cela est à votre avantage bien sûr ! Créer des règles permettant d’éviter le « Voir les 0 résultats disponibles… ».
  • Une longueur de 150 à 250 caractères maximum avec l’essentiel de vos arguments en début de balise car le texte est généralement tronqué par les moteurs à l’affichage.

C’est un process d’achat classique type AIDA : Attention > Interest > Decision > Action (= clic).

Pour attirer l’attention, certains n’hésitent pas à insérer des caractères spéciaux au sein de leurs balises. À utiliser avec parcimonie…

Caractères spéciaux dans la balise Meta Description

La balise Meta Robots

<meta name="robots" content="..., ..." />

GooglebotC’est la balise où spécifier les consignes d’indexation de la page à l’attention des robots des différents moteurs. Il est bon de savoir que par défaut et sans contre-indication de votre part, les moteurs vont suivre les liens et indexer toutes les pages web qu’ils rencontrent au hasard de leur crawl.

Cette balise n’est donc utile que si vous souhaitez interdire l’indexation de certaines pages. Comme pour le fichier robots.txt, il est possible de personnaliser les indications en fonction de chaque robot. Les plus connus : googlebot pour Google et msnbot pour Bing.

 Exemple : <meta name="googlebot" content="..., ..." />

Liste officielle des « content » possibles, à espacer d’une virgule dans la balise :

  • noindex : empêche l’indexation de la page.
  • nofollow : empêche le robot de suivre les liens de cette page.
  • nosnippet : empêche l’affichage d’un extrait dans les résultats de recherche.
  • noodp : empêche l’utilisation d’une description de remplacement tirée des sites ODP/DMOZ.
  • noarchive : empêche Google d’afficher le lien « En cache » associé à une page.
  • unavailable_after:[date] : permet de préciser l’heure et la date exactes auxquelles l’exploration et l’indexation de cette page doivent cesser.
  • noimageindex : permet d’indiquer que vous ne souhaitez pas faire apparaître votre page comme source d’une image apparaissant dans les résultats de recherche Google.

À noter qu’il est désormais possible de transmettre ces consignes directement dans l’en-tête HTTP des pages grâce à l’instruction HTTP X-Robots-Tag. Moins flexible, cette solution permet néanmoins d’alléger le code de quelques lignes.

Voir les recommandations de Google pour :

La balise Meta Notranslate

<meta name="google" content="notranslate" />

Google propose automatiquement de traduire les pages web qui ne sont pas dans la langue choisie par l’internaute. Cela permet d’être lu par un plus grand nombre d’internautes même si les traductions automatiques sont souvent imparfaites. La Meta Notranslate permet d’indiquer à Google que vous ne souhaitez pas qu’il traduise de votre page.

Une balise que l’on rencontre rarement et qui reste l’apanage des ardents défenseurs de la langue de Molière.

La balise Meta Refresh

<meta http-equiv="refresh" content="…;url=…" />
<meta http-equiv="refresh" content="…" />

Cette Meta permet de rafraîchir la page ou de rediriger l’internaute vers une autre URL après un temps donné en secondes. Non prise en compte par tous les navigateurs et considérée comme trompeuse pour l’internaute, elle est fortement déconseillé par le W3C. Si vous souhaitez rediriger vos internautes, Google vous recommande plutôt d’utiliser la bonne vieille redirection 301.

Les balises Meta de partage Facebook

<meta property="og:title" content="Titre" />
<meta property="og:description" content="Description" />
<meta property="og:image" content="URL_image" />

L’implémentation on-page de balises Meta propres à Facebook, dans le cadre de l’Open Graph Protocol, permet de spécifier quelles informations doivent être reprises sur le réseau social. Sans ces balises, Facebook choisit lui-même parmi les informations présentes sur la page, et peut parfois se tromper notamment au niveau des médias à afficher.

Balises Meta Facebook

Les Meta Facebook permettent de spécifier les contenus textes et médias à afficher sur la Timeline

– Consulter les consignes officielles Facebook et la liste des Meta tags disponibles.

– En savoir plus sur l’Open Graph Facebook.

– Tester l’implémentation sur son site : https://developers.facebook.com/tools/debug

La balise Meta News_keywords

<meta name="news_keywords" content="Coupe du Monde, Brésil 2014, football">

Logo Google NewsUne balise lancée en septembre 2012 par Google et réservée uniquement aux membres du cercle très fermé des sites présents dans Google Actualités. (Pour vérifier si vous êtes présents dans Google Actualités allez dans l’onglet Actualités de Google, recherchez votre nom de domaine et voyez si votre site remonte. Normalement l’inclusion est faite sur demande via un formulaire.)

Attention cette balise n’a rien à voir avec la balise Meta Keywords qui, je le répète, n’est pas prise en compte par l’algorithme Google. Il s’agit d’une balise destinée à faciliter la compréhension de vos articles par Google Actualités. Un signal supplémentaire pour le moteur parfois désemparé par certains titrages et tournures journalistiques.

Insérez-y des mots-clés pertinents par rapport à votre article (et non par rapport à votre site) dans la limite de 10 expressions. À noter que les expressions n’ont pas nécessairement besoin de figurer dans l’article. Des solutions existent pour parser le contenu d’une page et en extraire les principaux mots-clés mais il sera préférable de faire remplir cette balise manuellement par le journaliste…. encore faut-il avoir ajouté le champ dans le back-office de son CMS.

En savoir plus : les consignes officielles de Google sur à la balise News_keywords.

La balise Meta Standout

<meta name="standout" content="http://www.exemple.com/alerte-info-article-56203"/>
Ou : <link rel="standout" href="http://www.exemple.com/alerte-info-article-56203"/>

Breaking News

Réservée aux éditeurs présents dans Google Actualités, elle permet de signaler une « breaking news » c’est à dire une information qui, littéralement, « sort du lot » et donc potentiellement de mieux remonter dans Google News.

Quelques conditions sont à respecter pour son utilisation :

  • L’article est la source originelle pour cette information (pas de reprises).
  • L’éditeur a investi des ressources significatives dans le traitement de l’info et la production de l’article.
  • Cet article mérite une reconnaissance particulière.
  • Ne pas utiliser cette balise plus de 7 fois par semaine calendaire.

Plusieurs remarques :

– Attention car en cas d’abus Google pourra décider d’ignorer la balise voire d’exclure le site de Google News.

– L’article peut pointer vers lui-même (auto-citation) mais également vers un autre article ou une source externe pour indiquer l’article originel.

– Possibilité d’utiliser une balise link ou meta pour l’implémentation même si l’on reste toujours dans la section <head> de la page. Voir exemples ci-dessus.

Voir les consignes de Google sur la balise Standout (Anglais).

La Search Box Google

<meta name="google" content="nositelinkssearchbox">

À mettre en place sur la page d’accueil de votre site si vous désirez que Google retire la Search Box interne qui apparaît parfois sur les requêtes liées à votre marque. En effet beaucoup d’éditeurs considéraient que Google détournait une partie leur trafic marque / notoriété via la présence de liens sponsorisés sur les résultats internes. Ils ont finalement eu gain de cause et Google a fait marche arrière mais il ne vous rendra pas la tâche facile pour autant : il affichera la Search Box par défaut pour votre site et comptez plusieurs semaines avant que la balise soit prise en compte (alors que la plupart des Meta sont prises en compte beaucoup plus rapidement en règle générale).  De là à dire que Google traîne la patte…

Search Box Google

À noter que si votre site possède un moteur de recherche interne full text, vous pouvez paramétrer (au lieu de supprimer) la Search Box afin qu’elle pointe directement vers la recherche interne de votre site et non sur Google. Il suffit d’implémenter un marquage schema.org sur votre page d’accueil.

La configuration en détail sur le site Google Developpers.

LES BALISES META INUTILES

Fussent-elles utiles un jour, elles ne le sont plus. Et ce depuis parfois longtemps. Recenser les balises Meta inutiles est une tâche sysiphéenne qui relève parfois de l’archéologie digitale. En voici un extrait.

La balise Meta Keywords

<meta name="keywords" content="mot-clé 1, mot-clé 2, mot-clé 3" />

Soyons clairs : ni Google ni presque aucun moteur de recherche actuel ne prend en compte cette balise dans son algorithme de classement. Elle ne joue donc aucun rôle dans le positionnement des pages web dans les listes de résultats des moteurs (SERP). Cela est dû à la propension au bourrage de mots-clés (keyword stuffing) dont elle a fait l’objet dès sa création. Matt Cutts en personne a indiqué que le moteur ignorait cette Meta et qu’il n’y avait aucune raison pour que cela change. Malgré quelques alertes de temps en temps, il y a donc peu de chances que la balise Meta keywords revienne en grâce un jour auprès des moteurs.

C’est balise n’est pourtant pas complètement inutile! Qu’elle ne soit pas prise en compte pour le ranking ne signifie pas que les moteurs ne la lisent pas. Ainsi il semble avéré que Google l’utilise en vue de mieux contextualiser sa publicité via son réseau Adsense comme le montre ce test d’Abondance, même si cela ne serait évidemment pas son premier critère de choix. Concrètement il choisirait la publicité en s’appuyant sur les mots-clés présents dans la balise Keywords de la page (enrichissement du contexte). Une balise utile donc si vous souhaitez l’inciter à afficher sur votre site des publicités à plus fort CTR (meilleur ciblage) ou à plus fort CPC (rentabilité).

Publicité Google Adsense

La balise Meta Keywords peut améliorer la contextualisation de la publicité Adsense

La Balise Meta Revisit-after

<meta name="REVISIT-AFTER" content="1 day">

Cela aurait pu être sympa mais non, cette balise n’influe pas sur la fréquence de crawl des moteurs. C’est Google qui en décide en fonction de la popularité du site et la fréquence de mise à jour de ses contenus. Si la pertinence du PageRank affiché est de plus en plus discutable, il reste cependant un bon indicateur de la priorité et de la fréquence du crawl.

Statistiques crawl google

Statistiques sur l’exploration livrées dans Google Webmaster tools

La Balise Meta Index, Follow

<meta name="robots" content="index,follow,all">

Cette utilisation de la balise Meta Robots est inutile car, sans indication contraire, Google crawle et indexe par défaut tous les sites qu’il rencontre. Cette règle arbitraire et souvent décriée donne parfois lieu à des résultats cocasses, notamment lorsque certains webmasters ne verrouillent pas suffisamment l’accès à certaines parties confidentielles de leurs sites.

Une balise inutile donc, mais que l’on croise encore beaucoup y compris sur des grands sites.

Les balises Meta de géolocalisation

GéolocalisationLes balises telles que Geo.position, Geo.placename, Geo.region, ICMB ou même Distribution ne sont pas prises en compte par Google mais permettent tout de même de renseigner une localisation géographique en utilisant un format universel.

En savoir plus à ce sujet ici et .

Les balises Meta Author et Copyright

<meta name="author" content="…">
<meta name="copyright" content="…">

Essentiellement dissuasives, ces balises ne sont pas prises en charge par Google. Au mieux elles permettront de prendre la main dans le sac un voleur de contenu très peu précautionneux qui aura fait un copier-coller généreux du code source.

Pour la notion de paternité d’un contenu Google proposait l’utilisation des balises rel=author et rel=me mais il faut désormais associer ses contenus à un profil Google+. C’est habile de la part de Google car cela lui permet de promouvoir son réseau social au passage.

Consultez notre tutoriel sur l’Authorship Google pour connaître le pourquoi du comment et associer facilement vos contenus éditoriaux à votre profil auteur. En plus ça parle d’Author Rank c’est sympa.

Profil Google +

Les balises Meta Language et Content-language

<meta name="content-language" content="fr,fr-fr">
<meta name="language" content="fr,fr-fr">

Des balises aussi inutiles que les conseils SEO de Matt Cutts. La véritable déclaration de langue s’effectue juste avant le <head> et après la déclaration de Doctype au moyen de l’instruction suivante :

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr">


Les Meta Cache-control, Pragma et Expires

<meta http-equiv="Cache-Control" content="no-cache">
<meta http-equiv="Pragma" content="no-cache">
<meta http-equiv="Expires" content="0">

Cache controlBalises anciennement utilisées par le navigateur Internet Explorer pour gérer les instructions de cache. Les instructions ci-dessus forcent le navigateur à recharger la page à chaque fois. Ces directives ne sont pas prises en compte par les moteurs de recherche. Les paramètres de cache doivent désormais être gérés côté serveur via les en-têtes HTTP renvoyées (Protocole HTTP 1.1).

Voir : http://fr.wikipedia.org/wiki/Cache-Control

Voir aussi : le paramétrage SEO-friendly de votre fichier .htaccess (fichier de configuration serveur)

La balise Meta Identifier-URL

<meta http-equiv="Identifier-URL" content="http://www.site.com">

Véritable allégorie de l’inutilité, cette balise placée sur la page d’accueil, permettrait de spécifier l’adresse de référence d’un site via son URL absolue. Pratique au cas où… non je ne vois pas.

Dans le même esprit mais plus utile figure la balise Base href qui permet de spécifier le chemin absolu pour toutes les URL relatives présentes sur la page.  Prise en compte par les navigateurs et les moteurs (en cas de doute), elle peut être utile pour spécifier un répertoire racine ou en cas de cohabitation entre plusieurs domaines ou sous-domaines.

<base href="http://www.site.com">

En savoir plus sur la balise Base ahref

Les balises Meta Syndication-source et Original-source

<meta name="syndication-source" content="URL">
<meta name="original-source" content="URL">

Créées originellement pour Google Actualités et destinées à être implémentées par les éditeurs de contenus, ces balises étaient sensées aider le moteur à retrouver les sources d’informations originales en cas de syndication ou de reprise de contenu. Aveu de faiblesse de Google ? C’est possible, en tout cas ces balises sont restées très peu utilisées et ont été remplacées par la balise rel=canonical.

Ce qu’il ne faut pas faire

Ne jamais sous-estimer la profondeur de la bêtise humaine mais surtout sa capacité à inventer de nouvelles Meta. Voici un exemple représentatif du courant de pensée digitale connu sous le nom de « Dans le doute, je les mets toutes ».

<meta http-equiv="Identifier-URL" content="http://www.professeurparticulier.com">
<meta name="subject" content="prof, professeur">
<meta name="copyright" content="professeurparticulier.com">
<meta name="audience" content="all">
<meta name="content-language" content="fr,fr-fr">
<meta name="robots" content="index,follow,all">
<meta name="expires" content="never">
<meta name="country" content="fr,france">
<meta name="coverage" content="worldwide,fr,france">
<meta name="language" content="fr,fr-fr">
<meta name="location" content="fr,france">
<meta name="author" content="Cours particuliers">
<meta name="owner" content="professeurparticulier.com">
<meta name="classification" content="Education">
<meta name="REVISIT-AFTER" content="1 day">
<meta name="ABSTRACT" content="Professeurparticulier.com, … le portail">

À quoi ressemble un <head> propre?

Je pense que les avis peuvent diverger sur ce sujet mais il reste essentiel de mettre en avant les balises importantes afin de donner rapidement aux navigateurs et aux moteurs de recherche ce qu’ils sont venus chercher. Ainsi il faut éviter de noyer ces éléments dans une multitude de fichiers de script ou de feuilles de style CSS non regroupés ni optimisés.

1. Doctype
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
2. Déclaration de langue
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr">
3. Début de la section <head>
<head>
4. Charset (Content Type)
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
5. Canonical
<link rel="canonical" href="URL_canonique" />
6. Title
<title>Exemple de balise Title</title>
7. Meta Description
<meta name="description" content="Exemple de description" />
8. CSS
<link rel="stylesheet" type="text/css" href="http://site.com/resource/doc.css" />
9. Scripts
<script src="http://site.com/js/fichier.js"></script>
10. Fin de la section <head>
</head>

Ressources

Tweet about this on Twitter117Share on Facebook0Share on LinkedIn40Email this to someone

Par
Référenceur white hat évoluant chez l'annonceur en milieu agile, formé par la SEO Rockstar Laurent Bourrelly. Pour suivre l'actu #SEO (mais pas que) de Slow Lab sur Twitter > @gaujay.