Vous êtes sur la page 1sur 32

Livre blanc | Fvrier 07

Rfrencement : la revanche du contenu

2007 marque une vritable rvolution dans le march du rfrencement. Les principaux moteurs de recherche placent dsormais la qualit du contenu d'un site au cur de son rfrencement naturel, mais aussi payant une volution qui modifie en profondeur les stratgies de liens sponsoriss. Face ces enjeux, les actions de rfrencement traditionnelles, bases sur une approche par mots-cls et l'optimisation des contenus existants, montrent trs vite leurs limites. La solution ? Mettre en uvre une approche ditoriale globale, visant exploiter un univers smantique riche et rgulirement actualis.

Livre Blanc Contenu & Rfrencement

La rvolution "contenu" ........................................................................................................................................ 3 1. La base du rfrencement naturel ................................................................................................................ 3 Pas de rfrencement sans contenu texte................................................................................................... 3 Contenu et popularit ...................................................................................................................................... 3 2. Un impact sur le rfrencement payant ....................................................................................................... 3 La prise en compte de la "qualit" ................................................................................................................. 4 Des contenus plus qualitatifs, une rflexion en amont ............................................................................... 4 3. Le Web 2.0 carbure au contenu ..................................................................................................................... 4 Des mdias naturellement rfrencs ........................................................................................................... 5 Un nouveau champ de veille .......................................................................................................................... 5 Les techniques traditionnelles de rfrencement montrent leurs limites ........................................................ 6 1. Optimisation des pages : Le feriez-vous si Google n'existait pas ? ...................................................... 6 Vivre sans les pages satellites........................................................................................................................... 6 Back to the basics .............................................................................................................................................. 8 2. Requtes de micro-trafic : les limites de l'approche par mots-cls .................................................... 8 Un nombre illimit de combinaisons............................................................................................................... 8 Comment ignorer quatre visites sur cinq ....................................................................................................... 9 Des requtes rares l'origine de la majorit du trafic ..............................................................................10 3. Le netlinking, beaucoup d'efforts, peu d'effets ..........................................................................................11 Moins de liens, mais plus de qualit .............................................................................................................11 De l'change au don ......................................................................................................................................11 Bon pour le lecteur, bon pour le moteur ........................................................................................................... 13 1. Priorit l'internaute ........................................................................................................................................13 2. Structurer l'information ....................................................................................................................................14 Organiser les contenus....................................................................................................................................14 Multiplier les points dentre ..........................................................................................................................15 Limiter la profondeur .......................................................................................................................................16 Respecter la "pyramide inverse" .................................................................................................................16 3. Faire court .........................................................................................................................................................17 4. Exploiter les niveaux de lecture .....................................................................................................................17 Titre de page ....................................................................................................................................................17 Titres et sous-titres .............................................................................................................................................18 Intertitres, gras ...................................................................................................................................................19 5. Soigner les liens .................................................................................................................................................19 Vers le rfrencement global ............................................................................................................................ 21 1. Une approche plus large de l'univers smantique ....................................................................................21 Puiser toutes les sources .............................................................................................................................. 21 Penser en trois dimensions .............................................................................................................................. 22 Varier les formats ..............................................................................................................................................24 2. Une dmarche dynamique ...........................................................................................................................25 Se maintenir au cur du systme ................................................................................................................25 Soutenir l'attention ...........................................................................................................................................25 3. Se fixer des objectifs et vrifier qu'ils sont atteints ......................................................................................26

www.dixxit.fr

Fvrier 2007

2 / 32

Livre Blanc Contenu & Rfrencement

La rvolution "contenu"
Le rle du contenu en matire de rfrencement naturel est connu depuis la naissance des moteurs, mme s'il tait rare de voir un site en tirer pleinement parti. Mais l'indiffrence au contenu n'est plus d'actualit : dsormais, il s'invite dans le rfrencement payant, et se trouve au cur du Web 2.0.

1. La base du rfrencement naturel


Le contenu ditorial est indispensable la bonne indexation d'un site et, par sa richesse, sa varit et sa pertinence, il en conditionne la visibilit. Il joue galement un rle majeur (et trop souvent sous-estim) dans la qualit des liens entrants.

Pas de rfrencement sans contenu texte


Quelle est la premire source d'information des moteurs de recherche ? Le contenu ditorial. Les crawlers, les robots des moteurs de recherche qui parcourent en permanence le Web, ne "voient" ni les images, ni les animations Flash, ni les vidos mais sont friands de contenu texte, qu'ils indexent intgralement. Et seules les pages correctement indexes peuvent tre rfrences par les moteurs, et donc apparatre dans leurs rsultats. Le contenu d'un site constitue donc la base mme de son rfrencement. Avec ce corollaire : plus l'offre ditoriale d'un site est riche et varie, plus sa visibilit sur le Web est grande. Le primtre de votre contenu dtermine ainsi celui de votre territoire sur la toile : devenir un vaste continent, une haute montagne, bref, un point de repre dans le monde en expansion constante du Web, ncessite de dvelopper et d'actualiser des contenus pertinents. Dans le monde rel, la visibilit est avant tout question d'images, sur le Web, c'est une question de mots. Pas de contenu, pas d'indexation. Pas d'indexation, pas de rfrencement naturel.

Contenu et popularit
Une fois les pages d'un site correctement indexes, un autre facteur entre en jeu au moment o le moteur estime leur pertinence par rapport une requte donne (et donc leur positionnement dans sa page de rsultats). Il s'agit de leur "popularit", c'est--dire du nombre et surtout de la qualit des liens pointant vers ces pages. C'est le principe du clbre PageRank de Google. L encore, le contenu des pages a un impact dterminant : il doit tre cohrent avec le lien qui pointe vers lui, sans quoi ce dernier ne sera pris en compte que partiellement par les moteurs. Et surtout, un contenu ditorial de qualit va attirer spontanment des liens entrants, provenant de sites forte notorit, inaccessibles via une politique traditionnelle d'change de liens : mdias, blogs, sites communautaires C'est le principe du contenu viral (ou linkbaiting), qui est en train de remplacer peu peu les politiques traditionnelles d'changes de liens.

2. Un impact sur le rfrencement payant


Jusque dbut 2006, les dmarches de rfrencement naturel et d'achat de liens sponsoriss taient considres, au mieux, comme complmentaires. La premire permettait une visibilit sur le long terme, la seconde des actions de gnration de trafic court terme, et les deux domaines ne s'interpntraient pas vritablement.

www.dixxit.fr

Fvrier 2007

3 / 32

Livre Blanc Contenu & Rfrencement

La prise en compte de la "qualit"


La mise en place par Google de la notion de "Quality Score"1 a boulevers la donne. Dsormais, la "qualit" de la page vers laquelle mne un lien sponsoris peut influencer le positionnement de celui-ci, ou son cot au clic. L'achat de liens n'est plus dconnect du contenu du site ; le contenu des pages relayes devient partie intgrante de toute stratgie "payante".

Une relation sens unique La qualit d'un site influe sur les liens sponsoriss Mais la rciproque n'est pas vraie. Jamais une campagne d'achat de liens n'aura d'impact sur le positionnement naturel d'un site, qui dpend essentiellement de deux facteurs : la qualit des liens entrants, et la pertinence de son contenu.

Cette volution est logique : les moteurs tentent constamment d'amliorer la pertinence de leurs rsultats naturels ; ils appliquent aujourd'hui ces critres aux rsultats sponsoriss. Et elle s'inscrit dans la dure. Panama, la nouvelle plate-forme publicitaire de Yahoo! dvoile dbut 2007, intgre galement sur la notion de qualit des pages. S'il est toujours possible de btir une campagne de liens sponsoriss partir d'un site au contenu minimaliste, cela va donc devenir de moins en moins viable conomiquement, dans un contexte o les marges sont faibles et la concurrence, impitoyable. La qualit des contenus d'un site, qui impactait jusqu'ici essentiellement son rfrencement naturel, est dsormais un facteur essentiel de son rfrencement payant.

Des contenus plus qualitatifs, une rflexion en amont


Les spcialistes des liens sponsoriss ont trs vite pris conscience des enjeux de cette "rvolution du contenu". Ils ont analys la notion de "Quality Score" et en ont dduit la ncessit : d'une intgration trs en amont des stratgies de rfrencement naturel et payant, d'un dveloppement des contenus des sites de leurs clients, en quantit comme en qualit. Sur ce deuxime point, les techniques de rfrencement pratiques aujourd'hui se rvlent trs largement insuffisantes. Les attentes qualitatives des moteurs, relayes par les socits de Search Engine Advertising (SEA), devraient tirer le march vers le haut. Mais les modifications apporter au niveau des sites Web sont encore mal estimes et maladroitement mises en uvre.

3. Le Web 2.0 carbure au contenu


Ces derniers mois ont t le thtre d'une autre rvolution : l'explosion des blogs, l'essor des sites communautaires et d'change, la mise en place de rseaux sociaux regroupant des milliers, voire des millions d'internautes. La porte relle de ce "Web 2.0" ne sera mesurable que sur le long terme, mais son dveloppement rapide influence d'ores et dj le paysage du rfrencement.
1 Le Quality Score a t mis en uvre en deux tapes (11 juillet, puis 6 septembre 2006). Une volution portant uniquement sur le contenu des textes d'annonces ("Content Quality Score") a t mise en place en novembre 2006. Elle prcise notamment : "We [Google] do use a keyword's Quality Score to rank your ads and position them on network pages. Your keyword's Quality Score is based on the relevance of the ad and keywords to a content site, your ad's performance history on the site and similar sites, and the quality of your ad's landing page." (https://adwords.google.com/)

www.dixxit.fr

Fvrier 2007

4 / 32

Livre Blanc Contenu & Rfrencement

Des mdias naturellement rfrencs


Ces nouveaux mdias, dits "CtoC" (Consumer to Consumer), disposent en effet de deux atouts majeurs en termes de rfrencement naturel : Ils produisent des quantits faramineuses de contenu ditorial, d'une qualit qui peut tre quivalente (voire suprieure) celle des sites institutionnels. Ils bnficient d'un rseau de liens trs dvelopp, mme si leur popularit globale reste faible. Ils disposent donc des qualits requises pour se positionner trs efficacement dans les rsultats naturels des moteurs un phnomne de plus en plus visible depuis mi-2006. La comptition pour les meilleures places dans les pages de rsultats n'oppose plus seulement des sites traditionnels, acteurs majeurs de leur secteur. Les mdias CtoC sont de nouveaux concurrents, souvent trs actifs. Il convient d'en tenir compte dans le cadre du rfrencement naturel d'un site.

Un nouveau champ de veille


Il est dsormais ncessaire d'tudier avec soin les mdias issus du "Web 2.0". Et il peut tre intressant d'en dvelopper certains, en parallle de la communication institutionnelle. En se limitant au domaine du rfrencement, l'tude des mdias CtoC doit intervenir : Lors de la dtermination du contexte concurrentiel (ils peuvent constituer une source d'enrichissement des termes employer, des thmatiques aborder...). Lors de la mise en place de la stratgie de liens entrants, en planifiant des interventions sur certains blogs ou sites communautaires soigneusement slectionns. Lors de la production des contenus du site, en intgrant ventuellement un blog, un forum, un espace communautaire au sein mme du site.

Points-cls
Le visage du rfrencement naturel a profondment chang en quelques mois. Le rle du contenu ditorial, reconnu mais jusqu'ici sous-exploit, s'est considrablement renforc. Principales raisons : le dveloppement des mdias CtoC, la notion de qualit des liens entrants, la prise en compte du contenu des sites dans l'efficacit de leurs campagnes de liens sponsoriss.

www.dixxit.fr

Fvrier 2007

5 / 32

Livre Blanc Contenu & Rfrencement

Les techniques traditionnelles de rfrencement montrent leurs limites


A l'heure actuelle, le rfrencement naturel d'un site recouvre des dmarches distinctes : L'optimisation du contenu des pages en fonction de mots-cls considrs comme stratgiques L'obtention de liens entrants, par un systme d'change ou plus rarement d'achat. Ces techniques actionnent les deux leviers fondamentaux du rfrencement naturel (qualit du contenu et popularit), mais de manire trs insuffisante. La raison ? Elles restent centres sur les moteurs, et privilgient la dimension technique. A l'heure du Web 2.0, le rfrencement doit tre centr sur les lecteurs, et privilgier la dimension ditoriale.

1. Optimisation des pages : Le feriez-vous si Google n'existait pas ?


Traditionnellement, l'optimisation des pages d'un site en vue d'amliorer son rfrencement naturel se droule en deux tapes : La dtermination des mots et expressions-cls stratgiques. La cration ou la rcriture de pages Web "optimises", afin d'amliorer le positionnement du site dans les rsultats des moteurs pour ces mots et expressions.

Vivre sans les pages satellites


Le principe de cette "optimisation" est de rcrire les pages du site (ou, si ncessaire, d'en crer) en respectant un certain nombre de paramtres techniques, le principal tant la densit leve en mots-cls. Dans le texte apparent, mais aussi dans le titre des pages, dans certaines balises HTML "invisibles", dans les liens Le principal problme pos par cette mthode est qu'une page "parfaitement" optimise pour les moteurs (c'est--dire truffe de mots et d'expressions-cls, sans souci de logique) risque de devenir rapidement illisible pour un internaute humain.
Densit ou quantit ? Pourquoi cette obsession de la densit ? Parce qu'elle est prise en compte par les moteurs pour dterminer la pertinence d'un mot-cl. La densit d'un mot-cl dsigne le rapport entre le nombre d'occurrences de ce mot dans un contenu (paragraphe, lien, titre de page) et le nombre de mots total de ce contenu. Dans le titre "Vivre sans les pages satellites", la densit du mot "pages" est de 0,25 (le terme "les" n'est pas pris en compte par les moteurs). Cette densit n'est donc pas synonyme de quantit : un mot-cl qui apparat cinquante fois dans un texte trs long sera moins "dense" que s'il apparaissait cinq fois dans un texte beaucoup plus court.

www.dixxit.fr

Fvrier 2007

6 / 32

Livre Blanc Contenu & Rfrencement

Pour contourner cet cueil, il existe deux solutions : La premire est ditoriale, et consiste dvelopper un contenu qui rponde la fois aux attentes des moteurs et celles des lecteurs. La seconde est technique, et c'est de trs loin la plus rpandue. Elle repose sur un raisonnement simple : puisque ces pages sont illisibles, il suffit de les rendre invisibles. Et de crer des pages de contenus destines aux seuls moteurs, qui renvoient automatiquement les lecteurs humains vers une version non optimise dont le contenu peut tre trs diffrent. Ce sont les fameuses pages satellites , qui ont constitu pendant des annes la technique d'optimisation la plus prise2.

Que pense Google des pages satellites ? C'est l'un des secrets les moins bien gards du Web. La page qui runit l'ensemble des conseils techniques et ditoriaux dicts par le clbre moteur pour faciliter l'indexation et le rfrencement des pages Web, est librement accessible : http://books.google.com/webmasters/guidelines.html. Sobrement intitule "Instructions pour les webmasters", elle a t mise en place ds 2001, et a assez peu volu depuis. On y trouve notamment, dans la section "Principes de base" de la rubrique "Qualit", deux paragraphes qui devraient normalement servir de socle toute action de rfrencement : "Crez des pages pour les utilisateurs, pas pour les moteurs. Ne trompez pas vos utilisateurs, et ne prsentez pas un contenu diffrent aux moteurs de recherche et aux utilisateurs []" "Chaque fois que vous crez une page, posez-vous la question : "Est-elle utile pour mes utilisateurs ? Crerais-je cette page si les moteurs de recherche n'existaient pas ?" Depuis cinq ans, le fait que les "pages satellites" sont contraires aux instructions des moteurs est donc inscrit noir sur blanc. Ce qui n'a pas empch de fonder de nombreuses solutions de rfrencement naturel sur cette technique.

Mais cette optimisation "technique" n'est plus d'actualit : 2006 a marqu l'arrt de mort des pages satellites. Aprs quelques annes de tolrance, les principaux moteurs (dont Google) ont dclar la guerre ces contenus cachs3. Pour une raison simple : ils sont contraires au principe mme des moteurs, qui tentent d'offrir aux utilisateurs les rsultats les plus pertinents possibles.

2 La notion de "pages satellites" recouvre plusieurs pratiques : les pages peuvent tre hberges par le rfrenceur ou sur le site de l'diteur ; la redirection peut prendre place lors de la visite de l'internaute ou du robot (on parle alors de cloaking) Toutes sont proscrire. 3 La sanction la plus connue est la suppression de l'index de Google des sites allemands de BMW et de Ricoh. Elle a t opre en fvrier 2006 par la "webspam team" du moteur. (http://www.mattcutts.com/blog/ramping-up-on-international-webspam/)

www.dixxit.fr

Fvrier 2007

7 / 32

Livre Blanc Contenu & Rfrencement

Back to the basics


La mort des pages satellites (effective dans la plupart des pays europens, mais qui se traduit en France par une lente agonie) a l'immense mrite de remettre l'honneur quelques principes simples : 1. Un site n'est pas destin aux moteurs, mais aux lecteurs. 2. Tout doit tre visible. 3. Bref, il faut faire comme si Google n'existait pas Les actions de rfrencement se sont donc recentres sur le contenu "visible" du site, et sur une optimisation moins mcanique des pages mme si la qualit ditoriale des pages optimises peut encore tre nettement amliore. Cependant, le rfrencement traditionnel continue ne s'intresser qu' une poigne de motscls. Face la complexit croissante des requtes saisies par les internautes, c'est se consacrer l'arbre et oublier qu'il cache une fort.

2. Requtes de micro-trafic : les limites de l'approche par mots-cls


Pages satellites ou contenus visibles, l'optimisation traditionnelle repose sur une liste limite de mots et dexpressions-cls considrs comme stratgiques. Leur nombre est en gnral compris entre dix et cinquante, en fonction des mthodes de rfrencement et des budgets. Cette approche est indispensable (il est ncessaire de se positionner sur ce cur de mots-cls), mais elle se rvle trs largement insuffisante. Il suffit de se pencher sur les statistiques de frquentation de votre site pour raliser que chaque mois, des milliers de requtes diffrentes participent au trafic global. Ces "requtes de micro-trafic" reprsentent un gisement de visites potentielles qui chappe une dmarche par mots-cls. Limiter le travail de rfrencement 25 mots-cls, c'est ignorer 80 % du trafic.

Un nombre illimit de combinaisons


Car dsormais les internautes saisissent majoritairement deux ou trois mots dans les moteurs de recherche, et les requtes quatre ou cinq mots, quasi-inexistantes il y a encore deux ans, gagnent du terrain4. Une consquence logique de la croissance exponentielle du nombre de pages Web. Et d'une meilleure matrise des outils de recherche par les utilisateurs. Rsultat : le foss se creuse chaque jour davantage entre le nombre limit de mots et expressions dtermins lors du rfrencement, et le nombre illimit de combinaisons saisies par les internautes.

Fin 2005, une tude ralise par Wysistat montrait dj que les requtes deux et trois termes reprsentaient plus de la moiti des requtes totales, et que les requtes quatre termes dpassaient les 10 %.
4

www.dixxit.fr

Fvrier 2007

8 / 32

Livre Blanc Contenu & Rfrencement

Analyse d'audience : distinguer trafic de notorit et trafic naturel Lorsque vous analysez le trafic issu des moteurs de recherche, il est indispensable de distinguer deux sources : La notorit. La requte saisie correspond au nom de votre socit ou d'une de vos marques. L'efficacit de cette source est lie votre politique de communication globale, pas votre rfrencement naturel. Le trafic naturel. Toutes les autres requtes, non spcifiques vos marques. Pour mesurer prcisment l'efficacit de votre rfrencement naturel, vous devez donc

"soustraire" le trafic de notorit. Certains outils d'analyse vous permettent de le faire


automatiquement.

Comment ignorer quatre visites sur cinq


Une exprience simple consiste utiliser un outil d'analyse d'audience pour afficher, sur une priode donne (un mois, par exemple), les visites issues des moteurs de recherche et les requtes correspondantes. Il suffit ensuite de rpondre deux questions : 1. Quelle est la part des vingt-cinq premires requtes (hors notorit, Cf. encadr) dans le nombre total de visites sur le site ? 2. Combien de requtes diffrentes ont-elles t saisies par les internautes au cours de la priode, et ont gnr au moins une visite ? Rponse la premire question ? En fonction des sites, les vingt-cinq premires requtes reprsentent entre 5 et 15 % des visites. Rponse la deuxime question ? Chaque mois, plusieurs milliers de requtes diffrentes sont l'origine d'au moins une visite5. Optimiser un site partir d'une liste de vingt-cinq expressions-cls revient donc laisser de ct 85 % de son trafic. Au minimum.

Bien sr, sur ces milliers de requtes, certaines ne sont que des combinaisons des 25 expressions-cls stratgiques. Mais la plupart sont totalement indites.
5

www.dixxit.fr

Fvrier 2007

9 / 32

Livre Blanc Contenu & Rfrencement

Diversit des requtes : trois exemples (janvier 2007) Cybermarchand Type de site Site de e-commerce, matriel informatique Grand public 450 000 37 000 Site gnraliste Portail d'information multithmatique Grand public 90 000 19 000 Site spcifique Site BtoB spcialis

Audience Nombre de visites / mois* Nombre de requtes (gnrant au moins une visite) / mois* Part des 25 premires requtes dans les visites totales

Professionnels 10 000 4 800

2,5 %

7,5 %

14 %

Plus un site est gnraliste, plus le pourcentage de visite "ignores" est lev. Les sites BtoB ou trs spcialiss attirent des requtes plus cibles, mais les 25 premiers mots-cls concernent toujours moins de 20 % des visites.

Des requtes rares l'origine de la majorit du trafic


Les internautes saisissent donc une incroyable varit de requtes, dont la plupart sont par consquent trs rares. Mais globalement, ce sont ces requtes "rares" qui fournissent l'essentiel du trafic issu des moteurs de recherche. Une illustration de leffet "Long Tail" mis en lumire par Chris Anderson (voir encadr page suivante) : Trafic

15 %

85 %

25
De par leur nombre lev, les requtes de micro-trafic (moins de 10 visites/mois) gnrent plus de 80% du trafic total

Requtes

Consquence : une dmarche centre sur un nombre rduit de mots-cls est donc, sinon inefficace, du moins inefficiente. Afin de permettre au site de se positionner efficacement, il faut envisager son univers smantique de manire beaucoup plus large.

www.dixxit.fr

Fvrier 2007

10 / 32

Livre Blanc Contenu & Rfrencement

La notion de "Long Tail" En octobre 2004, Chris Anderson, journaliste du magazine en ligne Wired, cre le terme de Long Tail 6 pour dcrire le modle commercial du site Amazon.com. Par cette "longue trane" (Henri Kaufman propose quant lui "queue de la comte"7), Anderson dsigne un phnomne nouveau : la majeure partie du chiffre d'affaire du libraire en ligne provient, non pas de ventes importantes sur une poigne de best-sellers, mais de ventes moyennes ou faibles sur un

nombre extrmement important de rfrences.

3. Le netlinking, beaucoup d'efforts, peu d'effets


Le terme netlinking dsigne l'obtention de liens entrants, synonymes d'une popularit (ou d'un PageRank, pour ne parler que de Google) leve. Il constitue le second levier d'un bon positionnement.

Moins de liens, mais plus de qualit


A une dmarche quantitative (obtenir, par des moyens plus ou moins licites, des milliers de liens entrants provenant de sites n'ayant souvent aucun rapport entre eux) s'est substitue depuis quelques annes une approche plus qualitative. Les moteurs ont fait voluer les mthodes d'valuation de la qualit des liens entrants, notamment en confrant automatiquement des sites "de rfrence" (universits, ministres, mdias) un impact trs fort sur la popularit des sites qu'ils relaient. Cette notion de crdibilit (Google utilise le terme de "TrustRank") renforce progressivement celle de notorit ("PageRank"), trop facile dtourner. Dsormais, l'objectif n'est donc plus d'obtenir un trs grand nombre de liens, mais de privilgier ceux en provenance de sites de rfrence, cohrents avec la page vers laquelle ils pointent.

De l'change au don
La stratgie traditionnelle pour bnficier de tels liens est base sur l'change : l'obtention d'un lien du site A vers le site B est subordonne la mise en place d'un lien du site B vers le site A. Une belle ide, mais qui prsente de nombreux points faibles : Il est de plus en plus difficile de trouver des "partenaires". Plus le domaine est concurrentiel, plus les sites de qualit susceptibles de pointer vers le vtre se font rares. L'change de liens est consommateur de temps. Une fois les liens tablis, il faut en assurer un suivi permanent (pour vrifier qu'ils sont correctement implments sur le site partenaire, et qu'ils ne disparaissent pas sans raison). Et surtout, les fameux sites "de rfrence", non commerciaux, sont pour la plupart compltement inaccessibles par ce biais : inutile d'esprer voir votre offre de produits relaye gratuitement sur le site du quotidien Le Monde

http://www.wired.com/wired/archive/12.10/tail.html. Le principe de la "Long Tail" est une nouvelle dclinaison de la "distribution de Pareto", loi statistique dont les applications sont nombreuses, notamment en conomie et en marketing (avec le clbre principe du "80-20"). 7 http://henrikaufman.typepad.com/et_si_lon_parlait_marketi/2006/07/la_comte_revien.html

www.dixxit.fr

Fvrier 2007

11 / 32

Livre Blanc Contenu & Rfrencement

S'il ne faut pas abandonner l'change de liens, il importe d'en mesurer les limites. Et de raliser qu'une stratgie de cration de contenus ditoriaux de qualit sur votre site peut se rvler beaucoup plus efficace pour gnrer des liens entrants. C'est le principe du "contenu viral" (les anglosaxons utilisent le terme "linkbaiting") : mettre en place des contenus de rfrence, sans connotation commerciale, afin que des sites externes traitant des mmes thmatiques les relaient spontanment. Il peut s'agir de dossiers, d'tudes de cas, d'interviews exclusives La cration de contenu viral pallie efficacement les insuffisances de l'change de liens. Elle est tout aussi consommatrice de ressources, mais ces ressources sont consacres, au-del du rfrencement, amliorer la qualit globale du site. Et surtout, le contenu viral permet d'obtenir des liens depuis n'importe quel site, aussi prestigieux soit-il. Aucune chance, par exemple, de voir une grande universit relayer votre contenu commercial Mais si vous publiez une tude de march exclusive, ou un glossaire spcialis qui fait rfrence, votre site peut apparatre parmi ses liens externes.
Oubliez l'achat de liens Faut-il payer pour un lien ? La rponse est non, pour une raison simple : s'il les moteurs s'en rendent compte, ils vont vous pnaliser. Et ils sont trs vigilants sur ce point Pourquoi ? Parce que la popularit est au cur de leurs algorithmes, et qu'il est donc hors de question de "tricher" avec cette notion. Et surtout parce qu'ils souhaitent conserver

l'exclusivit sur la vente de liens : c'est


leur unique source de revenus ! Conclusion : dans le domaine du lien payant, prfrez les actions classiques de type sponsoring, partenariat ou achat

d'espace.

Points-cls
Les techniques traditionnelles de rfrencement naturel sont confrontes des freins structurels, lis leur dimension essentiellement technique. Essoufflement des changes de lien, disparition des pages satellites, limites de l'approche par mots-

cls ncessitent de mettre en place une dmarche de rfrencement fonde sur une base smantique
beaucoup plus vaste.

www.dixxit.fr

Fvrier 2007

12 / 32

Livre Blanc Contenu & Rfrencement

Bon pour le lecteur, bon pour le moteur


Les limites de l'optimisation "mcanique" des pages Web, consquence d'une approche centre sur les attentes (supposes) des moteurs de recherche, rendent indispensable d'inverser la perspective, et de se placer rsolument du ct du lecteur.

1. Priorit l'internaute
Il existe au moins deux bonnes raisons de privilgier les lecteurs : Ce sont eux qui font le succs d'un site. Ce sont les lecteurs, pas les robots, qui effectuent des achats, ragissent aux messages, tlchargent des documents, s'abonnent une newsletter Un site bien positionn, mais pens uniquement pour les robots, bnficiera d'un fort trafic mais d'un taux de conversion dplorable. Il ne suffit pas d'attirer des utilisateurs, il faut galement satisfaire leurs attentes en matire de contenu. Le comportement des crawlers se rapproche chaque jour un peu plus de celui d'un lecteur "humain". C'est le meilleur moyen pour les moteurs de maintenir la pertinence de leurs rsultats. Et sur les requtes les plus sensibles, Google fait d'ores et dj appel des quipes de validateurs en chair et en os. Il est temps d'oublier les robots ! Consquence : les bonnes pratiques ditoriales destines faciliter l'accs du lecteur au contenu du site, mieux organiser l'information et la dlivrer de manire progressive, seront profitables aux robots des moteurs et ce, sur le long terme. Bon pour le lecteur, bon pour le moteur : vous pouvez amliorer la fois l'exprience de vos utilisateurs, et votre rfrencement naturel. Pour parvenir ce rsultat, il est indispensable de matriser un certain nombre de rgles, touchant la structuration de l'information et l'criture en ligne. Elles sont la cl d'un contenu ditorial efficace, qui fera progresser votre site dans l'estime de vos internautes et dans les pages de rsultats.

www.dixxit.fr

Fvrier 2007

13 / 32

Livre Blanc Contenu & Rfrencement

Bon pour vos lecteurs Structurer l'information Organiser les contenus Multiplier les points d'entres Limiter la profondeur Respecter la "pyramide inverse" Faire court Crer des contenus concis Exploiter les niveaux de lecture Rdiger des titres de page explicites Hirarchiser laide de titres, intertitres... et autres niveaux de lecture Soigner les liens Rdiger des liens signifiants Navigation et reprage facilits Identification rapide de la page, clart des pages de rsultats des moteurs Lecture et comprhension facilites Rapidit de consultation Navigation et reprage facilits Pas d'accs fastidieux, ni d'URLs indigestes Accs rapide aux informations essentielles

Bon pour les moteurs Parcours et indexation des pages plus efficaces Indexation plus rapide et plus frquente Indexation complte des contenus, granularit Efficacit de l'indexation, spcificit des pages Mesure de pertinence de la page, premiers lments du rfrentiel lexical largissement du rfrentiel lexical

Meilleur accs l'information

Mesure de pertinence de la page cible

2. Structurer l'information
Lecteurs comme moteurs souhaitent accder rapidement l'information qu'ils recherchent. Cela ncessite de structurer clairement les pages du site, d'en hirarchiser les contenus et de mettre en uvre des points d'accs multiples.

Organiser les contenus


Une structuration claire des contenus facilite la navigation et le reprage de l'internaute au sein du site. Elle lui permet de savoir tout moment o il se trouve, d'o il vient et o il peut aller. Par ailleurs, la faon dont larchitecture de linformation est perue par les robots des moteurs de recherche impacte l'efficacit du rfrencement. Elle leur permet notamment de parcourir plus ou moins efficacement les pages du site, et de les pondrer en fonction de leur position dans la structure globale. En la matire, une organisation arborescente des rubriques et des contenus est gnralement idale, tant pour les moteurs que pour les utilisateurs : Elle accompagne progressivement la dcouverte des contenus (la page d'accueil propose des contenus gnriques, les pages de niveau 2 des contenus plus prcis, et la spcificit augmente au fur et mesure de la progression dans les niveaux). Elle favorise la contextualisation (chaque lment "parent" participe la dfinition des lments de niveau infrieur). Elle offre une structure adapte nimporte quel niveau de granularit souhait (si un thme doit tre trait dans le dtail, il est toujours possible dajouter un niveau infrieur constitu dun ensemble de pages plus spcifiques).

www.dixxit.fr

Fvrier 2007

14 / 32

Livre Blanc Contenu & Rfrencement

Exemple : Accompagner une dmarche dachat / vente Prenons l'exemple d'un site de e-commerce spcialis "Image & Son", dont le cur est constitu par un catalogue de produits. Il est fondamental que lorganisation des catgories et des produits pouse aussi bien : La progressivit de la formulation des besoins, pour linternaute naviguant partir de la page daccueil. La maturit du besoin tel quil peut sexprimer travers les requtes saisies sur les moteurs de recherche. tapes de la dmarche Dcouverte Maturit Requte-type "acheter", "moins cher", "audio", "vido" "lecteur DVD", "tlviseur LCD", "baladeur MP3"... "lecteur DVD / DivX", "tlviseur LCD 82 cm", "baladeur Creative 4Go"... "Lecteur DVD LG DVX9900H ", "TV LCD SAMSUNG LE32R71", "Creative ZEN V 4Go" Formats de contenus Fonctionnalits Prsentation, Aide en ligne, Conseils, Emagazines Arborescence des catgories (branches) Arborescence des catgories (feuilles) Filtres par marques, caractristiques, prix... Fiche produit, caractristiques complmentaires, contextuelles

Approche "rayon" Approche par besoin, comparaison de produits Produit identifi

Une organisation arborescente des catgories et produits sinscrit parfaitement dans cet objectif.

Multiplier les points dentre


Si elle prsente de nombreuses vertus, larborescence comporte deux inconvnients principaux : Dune part, elle limite les chemins daccs linformation, en ne permettant pas de prendre en compte la diversit des concepts et points de vue qui peuvent mener un contenu, via la navigation ou les requtes saisies sur les moteurs de recherche. Dautre part, elle ne peut tre btie sans choix de classement parfois arbitraires, qui masquent les diffrentes acceptions que peut revtir un thme. Il convient donc de considrer larborescence comme la colonne vertbrale des contenus (autrement dit, le classement principal), laquelle il faut adjoindre des dispositifs permettant de multiplier : Les moyens daccs (par un moteur de recherche interne, par thmes, par marques, par caractristiques, par prix...). Le maillage (tablissement de liens connexes, permettant de naviguer parmi les pages du site de manire transversale).

www.dixxit.fr

Fvrier 2007

15 / 32

Livre Blanc Contenu & Rfrencement

Limiter la profondeur
Pour linternaute, un contenu "profond" signifie un accs fastidieux (plusieurs clics) ou la saisie dune URL peu digeste. Par ailleurs, partir dun certain niveau, la profondeur de larborescence peut constituer un frein lefficacit du rfrencement et de la navigation. Google, par exemple, indexe moins frquemment les contenus les plus "profonds", au-del des niveaux 4 ou 5. Pour cette raison, il est ncessaire de permettre un accs plus rapide aux derniers niveaux de larborescence (tant via la navigation qu travers lURL), voire de "court-circuiter" celle-ci, lorsquil sagit de contenus stratgiques.

Respecter la "pyramide inverse"


La structuration de l'information, fondamentale au niveau global du site, doit galement s'appliquer au niveau spcifique de la page. La "pyramide inverse" est un principe journalistique qui consiste placer les informations importantes en tte dun article, avant de les aborder de manire plus dtaille dans le corps de celui-ci. Cette progression linaire, qui atteint sa plus pure expression dans les journaux anglo-saxons, s'oppose la construction classique des articles de presse crite (accroche, dveloppement plus ou moins hirarchis, "chute"). Elle est particulirement adapte au sein des pages Web, car : Les lecteurs sont presss. Ils souhaitent accder rapidement l'essentiel de l'information, et n'approfondir qu'une fois qu'ils sont srs d'avoir identifi un sujet qui les intresse. Si la plupart des crawlers indexent l'intgralit des contenus texte d'une page Web, ils en surpondrent en gnral les premires lignes : c'est donc l que doivent figurer les informations importantes.
Plus largement, un site qui respecte Accessibilit et rfrencement Il existe une abondante littrature consacre aux solutions de dveloppement les mieux adaptes au rfrencement. Inutile en effet d'initier une stratgie de rfrencement naturel, si pour des raisons techniques (utilisation de frames, dveloppement entirement en Flash) votre site ne peut pas tre correctement index par les robots. Un critre simple permet de savoir si un site est optimis techniquement pour le rfrencement : son accessibilit aux personnes handicapes. Un site adapt aux lecteurs vocaux destins aux malvoyants est idal pour les crawlers. On oublie trop souvent que

les robots sont aveugles

strictement les critres d'accessibilit dicts par le W3C8 bnficiera de la meilleure indexation possible.

http://www.w3.org/WAI/

www.dixxit.fr

Fvrier 2007

16 / 32

Livre Blanc Contenu & Rfrencement

3. Faire court
La lecture est plus difficile sur un cran que sur le papier. Zappeurs compulsifs, les internautes apprcient donc les pages et les textes courts, qu'ils peuvent parcourir rapidement. Sur le Web, la concision est une forme de politesse envers le lecteur. Dans le mme temps, les crawlers privilgiant les premires lignes de texte, une page trop longue ne sera indexe qu'imparfaitement. De plus, des pages courtes permettent une matrise plus fine des thmatiques abordes, et donc du rfrentiel lexical. Consquence : les contenus courts doivent tre privilgis, et lorsqu'il est ncessaire de dvelopper une thmatique, il est conseill de segmenter le texte initial sur plusieurs pages (relayes dans une page de sommaire). La recherche de la concision s'inscrit dans le droit-fil d'une structuration efficace du site, qui a pour consquence des pages brves et spcifiques. Des phrases courtes, regroupes en paragraphes courts, au sein de pages courtes facilitent le parcours des lecteurs, qu'ils soient humains ou robots.

4. Exploiter les niveaux de lecture


Sont regroups sous les termes "niveaux de lecture" l'ensemble des mises en valeur du texte : titres et intertitres, gras Ils facilitent le parcours de la page, en offrant l'internaute des points de repres lorsqu'il la "scanne" en quelques secondes, la recherche d'informations prcises. Et ils sont priss des moteurs, qui, encore une fois, les surpondrent lors de leurs calculs de pertinence. La rdaction d'une page bien structure, offrant de multiples niveaux de lecture hirarchiss et riches de sens, engendrera donc naturellement un code HTML favorable au rfrencement.

Titre de page
Pour le lecteur, le titre de la page (qui s'affiche dans la barre suprieur de la fentre du navigateur) joue un rle dans la manire dont les moteurs de recherche affichent leurs rsultats. Soulign et bnficiant d'une taille de police plus importante, ce titre est le premier niveau d'information affich ; il est gnralement complt par le contenu de la balise de description. Le titre de la page est galement utilis pour la dsigner, lorsque le lecteur la place parmi ses "favoris". Pour les robots, le contenu de cette balise, place dans les premires lignes du code HTML de chaque page, est un des lments dterminants en termes de rfrencement. Stratgique tant pour les moteurs que pour les lecteurs, le titre de la page doit donc tre rdig avec soin, afin de dcrire clairement le contenu de la page et d'en relayer les principaux motscls, tout en restant concis. La spcificit est de mise : un titre de page comme "Produits - toutes nos rfrences" n'apportera aucune information concrte au lecteur, et aucun lment exploitable au crawler. Chaque page du site devra par ailleurs bnficier de son propre titre, rsumant son contenu et incluant des mots-cls spcifiques.

www.dixxit.fr

Fvrier 2007

17 / 32

Livre Blanc Contenu & Rfrencement

Dans ce domaine aussi, une structuration cohrente du site permet d'obtenir des titres efficaces, par "hritage" : Page d'accueil : [Objet du site (champ lexical gnrique)] - [Nom de la socit] Page carrefour : [Objet de la rubrique (champ lexical plus spcifique)] - [Nom de la socit] Page de niveau 2 : [Objet du de la page (champ lexical plus spcifique)] - [Nom de la rubrique] - [Nom de la socit]

Titres et sous-titres
On considre qu'un bon titre doit tre la fois informatif (il doit rsumer en quelques mots le texte qu'il prcde) et incitatif (il doit donner envie de poursuivre la lecture, par l'usage de l'humour, du second degr ou d'une rfrence culturelle). Mais dans une optique de rfrencement naturel, le curseur doit tre rsolument plac du ct de l'informatif. Pourquoi ? Les lecteurs sont presss. Ils scannent les pages, et cherchent en apprhender le contenu en une fraction de seconde. Un titre qui ne se comprend pas immdiatement est donc considr comme un frein. Les crawlers accordent beaucoup d'importance aux titres (lors de l'indexation des pages, ils accordent un "poids" plus importants aux termes compris entre les balises HTML <H1>, <H2>, etc.)... et ils sont totalement impermables au second degr. Les titres ne doivent pas seulement dcrire les contenus qu'ils prcdent, ils doivent galement tre spcifiques, c'est--dire contenir les mots-cls relatifs la page. Et ils doivent tre concis, autant pour mettre en valeur les mots-cls qu'ils contiennent que pour satisfaire le lecteur press. Exemple Sur le site d'un opticien, le titre "Notre gamme" est suffisamment informatif pour l'internaute, qui dduit de l'environnement qu'on va lui prsenter des lunettes. Mais il n'a aucune valeur en rfrencement naturel (le terme "gamme" pouvant difficilement tre considr comme un motcl stratgique) ; il faudra donc lui prfrer "Notre gamme de lunettes", ou "Toutes nos lunettes", plus concis.
Les sites de presse, incitation vs rfrencement Les journaux sont, par tradition, ports aux titres incitatifs (qui sont souvent une vritable marque de fabrique). Mais l'impact croissant du rfrencement naturel sur la frquentation des sites de presse soumet les rdactions un dilemme : doivent-elles dsormais prfrer les

titres informatifs, plus adapts aux


robots d'indexation, au risque d'uniformiser leur discours et de dcevoir leurs lecteurs ? Le dbat est loin d'tre clos, et une

solution mixte est dj teste par


certains sites, comme celui de BBC News : des titres incitatifs en page d'accueil ("Le tourisme de la fertilit"), et plus factuels en pages intrieures ("Tmoignage : une fcondation in vitro Istambul")9 !

Article d'Helen Briggs, dition du 19 dcembre 2006

www.dixxit.fr

Fvrier 2007

18 / 32

Livre Blanc Contenu & Rfrencement

La rdaction de titres efficaces en termes de rfrencement naturel privilgiera donc la spcificit et la concision. Ce n'est qu'une fois ces critres respects qu'il est possible de mettre en uvre des lments incitatifs. "Nos lunettes en un coup d'il", par exemple.

Intertitres, gras
Le texte mis en gras et les niveaux de titre intermdiaires, sont autant d'tapes dans le parcours visuel de l'internaute. Les crawlers estiment que ces termes mis en exergue (c'est--dire situs entre des balises HTML spcifiques) ont plus de valeur que les autres, et ils leurs donnent plus dimportance lors de l'indexation. Il est donc souhaitable de rsumer chaque paragraphe par un intertitre (respectant les principes des titres, voqus plus haut information, spcificit, concision) et d'en mettre en valeur les lments les plus significatifs (et en particulier les mots-cls) en usant du gras.

L'optimisation des PDF : une ncessit ? Dsormais, les principaux moteurs de recherche (Google, Yahoo!, Live Search...) indexent les documents PDF. Sur un site dont le contenu est largement constitu de PDF proposs en tlchargement, il est donc ncessaire : Soit de retravailler le rfrentiel lexical de chacun d'entre eux. Soit de les relayer via une page HTML optimise.

5. Soigner les liens


Les liens constituent le fondement mme du Web. Ils permettent aux internautes de circuler au sein des pages d'un site, ou d'un site vers un autre. lments cls dans le rfrencement d'une page Web, les liens hypertextes sont exploits par les robots pour valuer la pertinence de la page qui les contient et de celle vers laquelle ils pointent. Leur texte doit donc tre cohrent avec le champ lexical de la page qu'ils dsignent. Un bon lien est prdictif : son texte annonce clairement le contenu vers lequel il pointe. Cela vite au lecteur la frustration qu'engendre le fait de cliquer sur un lien peu prcis, puis d'attendre le chargement de la nouvelle page avant de constater que son contenu ne correspond pas ses attentes. Le texte du lien doit, pour tre prdictif, respecter les principes d'information et de concision qui s'appliquent la rdaction des titres. Afin de rdiger des liens courts, il est souvent intressant de les contextualiser, de les thmatiser. Ils peuvent ainsi tre regroups dans une rubrique "Tous les dossiers", ou "Documents tlcharger".

www.dixxit.fr

Fvrier 2007

19 / 32

Livre Blanc Contenu & Rfrencement

Une rgle absolue : viter les "Cliquez ici" sauf si vous considrez que le terme "cliquez" est stratgique pour votre rfrencement naturel10.

Points-cls
Parce que votre site est destin vos internautes, il doit leur offrir une information claire, nettement

hirarchise et facilement accessible.


Ces attentes sont galement celles des robots : le respect de critres structurels et ditoriaux prcis permet donc de satisfaire la fois lecteurs et moteurs.

10 Pour information, le site class en premire position par Google sur la requte "cliquez" est un convertisseur de devises (sur les pages duquel le terme "cliquez" n'apparat qu'une seule fois). La raison ? C'est un outil pratique, relay par plus de 18 000 sites externes Souvent sous la forme d'un lien "Cliquez ici" !

www.dixxit.fr

Fvrier 2007

20 / 32

Livre Blanc Contenu & Rfrencement

Vers le rfrencement global


Le respect des rgles dtailles dans le chapitre prcdent assure au contenu existant de votre site un rfrencement optimal. Mais le vritable enjeu est de voir au-del de cet existant, de dvelopper les contenus du site afin de coloniser un univers smantique plus large. Il existe des continents entiers de requtes qui attendent d'tre conquis.

1. Une approche plus large de l'univers smantique


Chaque jour, la majorit des internautes qui parvient sur votre site a saisi dans les moteurs de recherche des requtes auxquelles vous n'auriez jamais song. Inutile, donc, d'essayer d'optimiser vos pages en fonction d'expressions dfinies. La seule solution est d'tendre au maximum votre univers smantique, pour capter un nombre croissant de ces visiteurs imprvisibles. Premire tape : la dfinition de cet univers, en tudiant de manire trs tendue les attentes de vos internautes ; puis sa traduction sous forme de rfrentiel lexical (systme de mots et d'expressions cls organiss en grandes thmatiques). Deuxime tape : le dveloppement de contenus traitant ces thmatiques, et jouant sur une grande varit de formats.

Puiser toutes les sources


Lors de la dfinition de l'univers smantique d'un site Web (que ce soit lors de sa cration ou de sa refonte), un simple brainstorming ne suffit pas. Pour viser l'exhaustivit, les sources internes sont trs largement insuffisantes. Elles ne dboucheront que sur une parcelle de l'univers smantique, propre l'entreprise, avec un vocabulaire et des codes parfois trs loigns de ceux des internautes et de leurs requtes. Sur le Web, rpondre aux attentes des utilisateurs est une loi cardinale. Il est donc primordial d'exploiter un maximum de sources, internes mais aussi et surtout externes. 1. Moteur de recherche interne Si le site dispose de son propre moteur de recherche, il constitue une vritable mine d'informations sur les attentes des internautes. Il permet notamment de dtecter des "lacunes smantiques" : des requtes saisies rgulirement, mais auxquelles aucune page du site ne correspond. 2. Outils d'analyse de frquentation Les outils d'analyse d'audience (Xiti, Google Analytics) autorisent galement une tude trs fine des requtes relles des internautes. Ils permettent de mettre jour des dcalages entre l'offre en contenu de votre site et les attentes des utilisateurs, par exemple : Une requte trs courante, gnrant un fort trafic sur une page de votre site mal valorise : pas d'incitation, de liens vers d'autres pages ou de documents tlcharger (il est alors primordial d'amliorer le contenu de cette page). Des pages entires de votre site n'enregistrant aucun trafic depuis les moteurs, malgr leur dimension stratgique (il convient de se demander si elles ne sont pas stratgiques uniquement pour l'entreprise, ou si c'est simplement leur champ lexical qui est mal adapt).

www.dixxit.fr

Fvrier 2007

21 / 32

Livre Blanc Contenu & Rfrencement

3. Appels tlphoniques et mails entrants Si vous disposez d'un SAV ou d'un service d'assistance tlphonique, il est souvent intressant d'analyser les requtes les plus courantes et leur formulation afin de vrifier que le site y rpond, et que son champ lexical est adapt au langage employ par les utilisateurs. De mme, si votre site propose un forum, sa consultation peut tre riche d'enseignements. 4. Concurrents Les sites concurrents constituent une source d'inspiration qu'il ne faut pas ngliger. Ils offrent un moyen supplmentaire de rvler des lacunes smantiques (des termes employs sur leur site et pas sur le vtre) ; et un benchmark ditorial peut galement tre intressant lors de l'tape suivante, pour dtecter des formats de contenus innovants ou des thmatiques indites. 5. Contradicteurs Si l'activit de votre site touche des domaines sensibles (environnement, sant publique, scurit alimentaire, proprit intellectuelle), il existe probablement un rseau trs organis, entirement consacr dlivrer un message assez diffrent du vtre. Il est indispensable d'tudier l'univers smantique de ces contradicteurs, d'une part parce qu'il reflte les attentes des internautes, d'autre part parce que vous devez absolument y positionner votre site (voir encadr).
Des contradicteurs bien rfrencs Avec le dveloppement du Web 2.0, le principal rival en termes de rfrencement n'est plus forcment le site du concurrent, identifi et dont les volutions sont prvisibles. Il peut dsormais s'agir d'une multitude d'acteurs isols et incontrlables : le blog d'un ex-employ mcontent, un article publi par le site d'une association et pinglant des pratiques de discrimination au sein de l'entreprise, une vido tourne avec un tlphone portable dmontrant le dysfonctionnement d'un produit11... Les actions de rfrencement inities par les entreprises doivent dsormais tenir compte de ces nouveaux acteurs, ce qui passe notamment par : Le renforcement des contenus institutionnels (pour faire du site un espace de rfrence pour toute information touchant l'entreprise) et une transparence accrue. Une veille permanente sur ces nouveaux mdias. La cration de contenus traitant des sujets conflictuels, afin d'tre rfrenc aussi bien et si possible, mieux que ses adversaires sur ces thmes (notamment en cas de communication de crise). L'exploitation des mdias CtoC, par des interventions cibles, la mise en place d'un blog d'entreprise ou l'implication de blogueurs influents (des actions dlicates mettre en uvre, mais qui peuvent se rvler payantes).

Penser en trois dimensions


Une fois dtermines les attentes de vos utilisateurs, reste extraire de cet univers smantique le rfrentiel lexical du site : une srie d'ides, de mots et d'expressions cls (identifis lors de l'tape de dfinition), organiss en grandes thmatiques. Trois axes permettent d'tendre ce rfrentiel lexical, et de dfinir dans leurs grandes lignes les formats de contenus du site.

L'exemple le plus clbre est celui de Sony, dont les bnfices nets se sont effondrs lors du troisime trimestre 2006 suite un problme survenu avec des batteries pour ordinateur portable fabriques par le constructeur japonais. Relaye par le site YouTube, une vido montrant un portable en flammes a fait le tour du Web. http://www.pcinpact.com/actu/news/32353-SonyNintendo-benefices.htm
11

www.dixxit.fr

Fvrier 2007

22 / 32

Livre Blanc Contenu & Rfrencement

1. Traiter en profondeur Sur votre cur de mtier, vous devez viser l'exhaustivit. Il est donc ncessaire d'approfondir au maximum le rfrentiel lexical correspondant votre offre et vos principaux messages, et de leur consacrer des contenus dtaills. Il peut s'agir de livres blancs, de fiches techniques, d'tudes de cas... A condition de structurer efficacement l'information, vous ne fournirez jamais trop de prcisions sur votre activit.

Exemple : adapter son rfrentiel lexical au cycle de vente Dans le cas d'un site marchand, il est primordial de dvelopper l'univers smantique de l'offre produit en respectant les diffrentes tapes de l'acte d'achat. Il faut toujours tenir compte du fait que l'internaute effectue souvent une srie de recherches successives, de plus en plus spcifiques. Exemples de requtes (l'utilisateur cherche une solution d'affacturage) Affacturage Solution d'affacturage tude de cas affacturage

tape

Dcouverte

Intrt

Consultants affacturage Spcialistes affacturage Cabinets affacturage

Considration

Simulation affacturage BNP affacturage Natexis affacturage

Acquisition

Contrat d'affacturage Contact affacturage Devis affacturage

www.dixxit.fr

Fvrier 2007

23 / 32

Livre Blanc Contenu & Rfrencement

2. tendre le territoire de communication La parfaite matrise de votre domaine d'activit est bien sr indispensable. Mais pour largir au maximum le primtre de votre rfrencement, il est ncessaire de communiquer au-del de vos produits et de votre offre. Et de vous demander sur quelles thmatiques relatives votre activit (mais sans rapport direct avec vos produits et votre discours marketing) vous pouvez communiquer lgitimement. Vous pouvez toujours dvelopper ce type de thmatiques connexes, qu'elles soient issues de votre exprience mtier, de votre veille concurrentielle ou des connaissances de vos collaborateurs. Exemples Un spcialiste de l'lectromnager haut de gamme anime une chronique consacre au design ou lart de vivre. Une banque en ligne commente l'actualit conomique par le biais de ses conseillers financiers. Un site de vente de street wear propose des portraits de rappeurs. Un constructeur automobile consacre un dossier aux biocarburants...

3. Multiplier les angles Une fois le rfrentiel lexical approfondi et tendu, il lui manque encore une dimension : celle qu'apporte la varit des points de vue. En donnant la parole des clients ou des tiers (experts, partenaires...), vous enrichissez le champ lexical, et vous en reformulez les termes sous des formes plus proches des requtes relles des internautes. Une tude de cas illustre par les tmoignages de vos clients, un forum destin aux utilisateurs de vos logiciels, un blog permettant aux internautes de laisser des commentaires sur vos derniers produits... permettent de faire entendre sur votre site une voix diffrente, plus conforme celle de votre audience.

Varier les formats


Le rfrentiel lexical de votre site est parfaitement dfini et exploit ? Les thmatiques abordes sont dtermines ? Reste les traduire sous forme de contenus concrets. Il est ncessaire de respecter un certain nombre de critres ditoriaux (dfinis de manire dtaille dans le chapitre prcdent) : information structure, concision, titres informatifs... Mais vous devez dans le mme temps tirer parti de la multiplicit de format qu'offre le Web : article, dossier, fiche produit, interview, quiz... Cela permet la fois de procurer aux internautes une exprience de lecture riche et varie, et de faire vivre le rfrentiel lexical, en rptant les expressions stratgiques sans redondances. Il faut donc trouver le point d'quilibre entre rigueur structurelle et libert formelle.

www.dixxit.fr

Fvrier 2007

24 / 32

Livre Blanc Contenu & Rfrencement

2. Une dmarche dynamique


L'univers smantique d'un site est amen voluer, pour s'adapter de nouvelles attentes des internautes, aux nouveaux messages de l'entreprise, ou aux mutations du march Et leur impact sur le rfrencement. Le systme doit rester ouvert, en contact permanent avec son environnement ; et tre rgulirement actualis.

Se maintenir au cur du systme


Un site Web doit tre considr dans un contexte plus vaste ; un cosystme avec lequel il interagit en permanence, par le biais, notamment, de liens sortants et entrants. Ces derniers jouent un rle majeur dans le rfrencement naturel, il est ncessaire de favoriser leur obtention, sur le long terme. Pour se positionner en tant qu'acteur prenne de cet cosystme, la proactivit est de mise. Le site doit en particulier : Proposer des contenus de rfrence, utiles tous (c'est le principe du contenu viral, voqu plus haut). Intervenir activement dans la vie du systme (par le biais d'interventions sur des blogs, de posts sur des forums, d'alimentation d'un fil RSS...).

Soutenir l'attention
Autre impratif : l'actualisation rgulire des contenus et la cration de contenus nouveaux. Des contenus rgulirement mis jour permettent : De fidliser les lecteurs et d'amliorer l'image du site (un contenu actualis est l'un des principaux critres qualitatifs cits lors des tests utilisateurs). De maintenir l'attention des moteurs (qui indexent un rythme plus soutenu les sites rgulirement actualiss). D'adapter en permanence le rfrentiel lexical du site et donc son rfrencement. Cette mise jour peut tre effectue des rythmes diffrents ; le taux de renouvellement tant proportionnel la spcificit du rfrentiel lexical :

Formats de contenu Articles de fond, prsentation de l'activit Dossiers, e-magazine... Actualits, communication de crise...

Actualisation Faible Rgulire En temps rel

Rfrentiel lexical Gnrique Spcifique Stratgique

www.dixxit.fr

Fvrier 2007

25 / 32

Livre Blanc Contenu & Rfrencement

3. Se fixer des objectifs et vrifier qu'ils sont atteints


Une fois des contenus couvrant l'ensemble de l'univers smantique mis en place, et leur rythme d'actualisation dtermin... Reste valider leur impact rel sur votre rfrencement. Si l'analyse de ROI est parfaitement intgre lors des campagnes de liens sponsoriss, elle fait encore trop souvent dfaut en rfrencement naturel. C'est pourtant une tape stratgique, qui permet la fois : De valider la pertinence du dispositif ditorial mis en place et du budget allou. De rajuster, si besoin, le rfrentiel lexical. De dvelopper des synergies avec les autres formes de rfrencement ou de communication, online mais aussi offline. Il existe de nombreux outils permettant non seulement de dterminer le trafic issu du rfrencement naturel, mais galement de lier chaque visite l'atteinte d'un objectif, qui peut tre : Commercial : achat, rservation, prise de contact avec un conseiller... Qualitatif : dure de visite, nombre de pages vues, tlchargement d'une brochure, inscription une newsletter... Il est ainsi possible de mesurer la part du rfrencement naturel dans le dveloppement global du site. Les outils d'analyse d'audience permettent galement de dtecter si tous les objectifs assigns au site sont atteints et si des ajustements sont ncessaires. Il peut s'agir de la cration de nouveaux contenus, pour renforcer l'efficacit du rfrencement moyen terme sur un objectif prcis ; ou de la mise en place d'une campagne complmentaire de liens sponsoriss, pour un effet court terme.

Mais la logique du ROI, si elle est indispensable, ne doit pas faire oublier que l'impact d'une approche ditoriale du rfrencement ne se limite pas l'amlioration du chiffre d'affaires. Un contenu de qualit fidlise les internautes (et augmente les taux de conversion), amliore

l'image du site et sa visibilit, permet d'tendre son territoire de marque... Des effets positifs qui
dpassent, de trs loin, le seul domaine du rfrencement.

www.dixxit.fr

Fvrier 2007

26 / 32

Livre Blanc Contenu & Rfrencement

Glossaire
Accessibilit
L'accessibilit d'un site Web dsigne le respect d'un certain nombre de critres techniques (dfinis par le W3C) et ditoriaux destins faciliter l'accs du site aux personnes porteuses de handicap (dficients visuels, notamment). Un site respectant la lettre ces critres bnficie par ailleurs d'une indexation parfaite par les robots, indispensable un rfrencement efficace.

Actualisation / animation ditoriale


La mise jour rgulire d'un site, et notamment la cration de nouveaux contenus ditoriaux, est considre par les internautes comme l'un des principaux critres qualitatifs. Cette actualisation a galement un impact positif sur le rfrencement du site, les robots indexant un rythme plus lev les pages frquemment mises jour.

Algorithme
Dans le domaine du rfrencement, les algorithmes des moteurs de recherche dterminent les rsultats affichs lors de la saisie d'une requte. Tenus secrets, ces algorithmes se basent sur une multitude de critres (plus d'une centaine pour Google) : contenu de la page, liens entrants, URL...

Analyse d'audience / Web Analytics


Les outils d'analyse d'audience mesurent le trafic sur un site Web et fournissent de nombreux indicateurs : origine du trafic, pages vues, requtes saisies... Ils permettent notamment de dterminer la part du rfrencement naturel dans le ROI d'un site.

Backlink
Voir "Lien entrant"

Benchmark ditorial
Analyse comparative des contenus ditoriaux de plusieurs sites d'un mme univers concurrentiel, ce benchmark permet de dtecter les bonnes pratiques et d'enrichir le rfrentiel lexical.

Cloaking
Technique dsormais bannie par les moteurs de recherche, le cloaking ("masquage") permet de fournir aux robots une page Web "optimise", diffrente de celle propose aux lecteurs humains.

Contenu viral
Un moyen efficace d'obtenir spontanment des liens entrants (en parallle du netlinking) consiste mettre en uvre des contenus de rfrence, indits ou polmiques, susceptibles d'tre relays par des mdias, des institutions ou la blogosphre.

Crawler
Voir "Robot"

www.dixxit.fr

Fvrier 2007

27 / 32

Livre Blanc Contenu & Rfrencement

CtoC
Construite sur le mme mode que BtoB et BtoC, cette abrviation de "Customer to Customer" dsigne l'ensemble des mdias participatifs ou communautaires, permettant un change d'informations directement entre les internautes, sans entremise d'un annonceur : blogs, forums, communauts en ligne...

Densit (indice de)


Dans le texte d'une page Web, l'indice de densit d'un terme dsigne le rapport entre l'occurrence de ce terme et le nombre total de mots. C'est l'un des critres utiliss par les moteurs de recherche pour dterminer la pertinence des pages - mais son respect trop strict entrane la rdaction de textes peu attractifs pour les lecteurs.

Granularit
Dans le domaine scientifique, la granularit dsigne la taille du plus petit lment d'un systme, audel de laquelle on ne peut plus dcouper l'information. Dans un site structure arborescente, la granularit dsigne la page de dernier niveau, o se trouve une information trs spcifique.

Indexation
Inscription, par les robots d'un moteur, des pages d'un site dans sa base de donnes (index). L'indexation est le pralable indispensable au positionnement des pages : une page non indexe ne peut pas apparatre dans les rsultats des moteurs.

Lien entrant
Sur une page Web donne, est considr comme "entrant" tout lien provenant d'une autre page, qu'elle appartienne au mme site (lien entrant interne) ou un autre (lien entrant externe). Le nombre de liens entrants d'une page, et plus encore la qualit des pages dont ils proviennent, sont utilises par les moteurs pour en dterminer la popularit et la pertinence.

Lien sponsoris
Lien provenant d'un achat de mot cl auprs d'un moteur de recherche, et qui apparat dans une zone spcifique de la page de rsultats.

Link baiting / Linkbaiting


Voir "Contenu viral"

Long Tail
"Longue trane" ou "queue de la comte", ce terme forg en 2004 par le journaliste Chris Anderson dsigne la structure de vente de certains cybermarchands (Amazon, notamment). Contrairement aux enseignes traditionnelles, dont la majorit du chiffre d'affaire est concentre sur un nombre rduit de rfrences, Amazon ralise plus de la moiti de ses ventes grce un catalogue trs tendu. On retrouve la Long Tail lors de l'analyse du trafic issu des moteurs de recherche : la majorit de celui-ci provient de requtes gnrant peu de visites (micro-trafic), mais dont le nombre est trs lev.

www.dixxit.fr

Fvrier 2007

28 / 32

Livre Blanc Contenu & Rfrencement

Micro-trafic
Plus de 80% du trafic d'un site provient d'un nombre trs lev de requtes "rares", gnrant chacune peu de visites. Ces requtes de micro-trafic constituent un gisement que les techniques traditionnelles de rfrencement naturel (et en particulier l'approche par mot-cl) exploitent trs imparfaitement.

Mot-cl
lment de base des stratgies traditionnelles de rfrencement naturel, le mot (ou l'expression) cl n'offre qu'une visibilit et une pertinence trs limites. Une approche plus large, base sur un rfrentiel lexical, permet de pallier ces limites.

Netlinking
Ensemble des actions visant obtenir des liens entrants : change, achat, inscription dans des annuaires... Il est de plus en plus difficile d'obtenir des liens entrants de qualit (c'est--dire provenant de sites de rfrence) ; la cration de contenu viral s'impose donc souvent comme un complment indispensable au netlinking.

Niveaux de lecture
Titres et intertitres, texte en gras, listes puces... sont autant d'lments qui facilitent la lecture d'une page Web, et l'accs aux informations essentielles. Apprci des internautes, ces niveaux de lecture sont galement surpondrs par les robots lors de l'indexation des pages.

PageRank
Voir "Popularit"

Page satellite
Optimises "mcaniquement" pour le rfrencement, les pages satellites sont des pages Web rserves aux seuls robots (les visiteurs humains sont automatiquement redirigs vers une autre page du site). Destines amliorer de manire totalement artificielle le positionnement du site qui les hberge, elles sont dsormais bannies par les moteurs.

Popularit
La popularit d'une page Web est fonction du nombre de liens pointant vers cette page, et de la propre popularit des pages dont ces liens proviennent. C'est un critre dterminant, utilis par les moteurs de recherche lors de la dtermination du positionnement d'une page dans leurs rsultats. L'indice de popularit le plus clbre est celui de Google, baptis PageRank. (voir aussi "Trustrank")

Positionnement
Le positionnement d'une page Web dsigne son rang dans les rsultats des moteurs de recherche, lors de la saisie d'une requte spcifique. Une page positionne au-del des trente premiers rsultats gnrera un trafic quasi-nul.

Pyramide inverse
Principe d'organisation de l'information consistant placer les lments essentiels "au sommet", puis offrir des niveaux d'information de plus en plus spcifiques. Il s'applique aussi bien au niveau d'une page Web (concentration de l'information dans le titre, le chapeau et les premiers paragraphes) que

www.dixxit.fr

Fvrier 2007

29 / 32

Livre Blanc Contenu & Rfrencement

d'un site dans son ensemble (l'information stratgique est accessible ds la page d'accueil, et devient de plus en plus spcifique mesure que l'on parcourt l'arborescence).

Quality Score
Mis en place par Google en 2006, le Quality Score est une mthode d'valuation de la pertinence des liens sponsoriss, base sur leur intitul et sur le contenu de la page vers laquelle ils pointent. Un systme comparable est mis en uvre dans la plate-forme publicitaire Panama de Yahoo!

Rfrentiel lexical
Le rfrentiel lexical d'un site Web dsigne un systme d'expressions et de termes organiss en grandes thmatiques stratgiques. Beaucoup plus efficace et pertinent qu'une simple liste de motscls, il devrait constituer la base de toute action de rfrencement naturel.

Requte
Ensemble de termes saisis par l'internaute dans un moteur de recherche. Longtemps cantonnes un ou deux termes, les requtes sont dsormais de plus en plus complexes, ce qui limite l'efficacit d'un rfrencement naturel bas sur une simple liste de mots-cls.

Robot
Ce logiciel d'indexation cr par les moteurs de recherche (galement appel crawler ou spider) parcourt le Web en suivant les liens hypertexte et enregistre le contenu texte des pages qu'il rencontre. C'est ce contenu qui permettra de dterminer la pertinence des pages et leur positionnement dans les rsultats des moteurs.

SEA
Le terme de Search Engine Advertising dsigne les actions de rfrencement payant, et notamment l'achat de liens sponsoriss. Le SEA constitue, avec le SEO, les deux versants du SEM.

SEM
Le Search Engine Marketing dsigne un ensemble de mthodes destines augmenter la visibilit d'un site dans les pages de rsultat des moteurs de recherche. Il comporte deux aspects, les liens sponsoriss (SEA, Search Engine Advertising) et les actions de rfrencement naturel (SEO, Search Engine Optimization).

SEO
On regroupe sous le terme de Search Engine Optimization, ou rfrencement naturel, les actions destines amliorer le positionnement d'un site dans les rsultats organiques des moteurs de recherche. et l'obtention de liens entrants. Le SEO constitue, avec le SEA, les deux versants du SEM.

Spider
Voir "Robot"

Titre de page
Dans le code HTML d'une page Web, le titre de page est le texte situ dans la balise spcifique, <title>. Il apparat en haut de la fentre du navigateur et dans les pages de rsultat des moteurs de

www.dixxit.fr

Fvrier 2007

30 / 32

Livre Blanc Contenu & Rfrencement

recherche, et c'est l'un des lments les plus importants lors de l'indexation des pages d'un site. Il doit donc rpondre des critres ditoriaux et structurels prcis.

TrustRank
Ce terme dpos par Google dsigne le rsultat d'un algorithme destin mesurer la crdibilit des pages Web. Contrairement au PageRank, essentiellement quantitatif, le TrustRank est qualitatif et privilgie les liens en provenance de sites considrs comme faisant rfrence.

Web 2.0
Concept aux contours flous, le Web 2.0 dsigne (a minima) une nouvelle gnration d'outils (fils RSS, blogs...) et de pratiques (cration d'espaces communautaires, taggage de contenus...) visant centrer les fonctionnalits d'Internet sur ses utilisateurs. Parce qu'il offre une conception radicalement nouvelle de la cration et de la diffusion des contenus, le Web 2.0 influence fortement les mthodes de rfrencement naturel.

www.dixxit.fr

Fvrier 2007

31 / 32

Livre Blanc Contenu & Rfrencement

Pour en savoir plus :

Tl. : 01 49 66 60 60 E-mail : contact@dixxit.fr 42, rue dArthelon - 92190 Meudon

www.dixxit.fr

www.dixxit.fr

Fvrier 2007

32 / 32

Vous aimerez peut-être aussi