Vous êtes sur la page 1sur 49

Rfrencement

Ce quil faut savoir


dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation
Page 2
PREAMBULE
SMILE
Smile est une socit dingnieurs experts dans la mise en uvre de solutions open source
et lintgration de systmes appuys sur lopen source. Smile est membre de lAPRIL,
lassociation pour la promotion et la dfense du logiciel libre, du PLOSS le rseau des
entreprises du Logiciel Libre en IledeFrance et du CNLL le conseil national du logiciel libre.
Smile compte plus de 600 collaborateurs dans le monde, dont prs de 500 en France (janvier
2012), ce qui en fait le premier intgrateur franais et europen de solutions open source.
Depuis 2000, environ, Smile mne une action active de veille technologique qui lui permet
de dcouvrir les produits les plus prometteurs de lopen source, de les qualifier et de les
valuer, de manire proposer ses clients les produits les plus aboutis, les plus robustes et
les plus prennes.
Cette dmarche a donn lieu toute une gamme de livres blancs couvrant diffrents
domaines dapplication. La gestion de contenus (2004), les portails (2005), la business
intelligence (2006), la virtualisation (2007), la gestion lectronique de documents (2008), les
PGIs/ERPs (2008), les VPN open source (2009), les Firewall et Contrle de flux (2009), les
Middleware orients messages (2009), lecommerce et les Rseaux Sociaux d'Entreprise
(2010) et plus rcemment, le Guide de lopen source et NoSQL (2011). Chacun de ces
ouvrages prsente une slection des meilleures solutions open source dans le domaine
considr, leurs qualits respectives, ainsi que des retours dexprience oprationnels.
Au fur et mesure que des solutions open source solides gagnent de nouveaux domaines,
Smile sera prsent pour proposer ses clients den bnficier sans risque. Smile apparat
dans le paysage informatique franais comme le prestataire intgrateur de choix pour
accompagner les plus grandes entreprises dans ladoption des meilleures solutions open
source.
Ces dernires annes, Smile a galement tendu la gamme des services proposs. Depuis
2005, un dpartement consulting accompagne nos clients, tant dans les phases davant
projet, en recherche de solutions, quen accompagnement de projet. Depuis 2000, Smile
dispose dun studio graphique, devenu en 2007 Smile Digital agence interactive, proposant
outre la cration graphique, une expertise emarketing, rfrencement, ditoriale, et
interfaces riches. Smile dispose aussi dune agence spcialise dans la TMA (support et
lexploitation des applications) et dun centre de formation complet, Smile Training. Enfin,
Smile est implant Paris, Lille, Lyon, Grenoble, Nantes, Bordeaux, Marseille, et
Montpellier. Et prsent galement en Espagne, en Suisse, au Benelux, en Ukraine et au
Maroc.
Rfrencement
Ce quil faut savoir
dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation
Page 3
QUELQUES REFERENCES DE
SMILE
SMILE est fier davoir contribu, au fil des annes, aux plus grandes ralisations Web
franaises et europennes. Vous trouvez cidessous quelques clients nous ayant adress leur
confiance.
Sites Internet
EMI Music, Salon de lAgriculture, Mazars, Areva, Socit Gnrale, Gtes de France, Patrice
Pichet, Groupama, EcoEmballage, CFnews, CEA, Prisma Pub, Volia, NRJ, JCDecaux,
01 Informatique, Spie, PSA, Boiron, Larousse, Dassault Systmes, Action Contre la Faim, BNP
Paribas, Air Pays de Loire, Forum des Images, IFP, BHV, ZeMedical, Gallimard, Cheval Mag,
Afssaps, Beneteau, Carrefour, AG2R La Mondiale, Groupe Bayard, Association de la
Prvention Routire, Secours Catholique, Canson, Bouygues Telecom, CNIL
Portails, Intranets et Systmes dInformation
HEC, Bouygues Telecom, Prisma, Veolia, Arjowiggins, INA, Primagaz, Croix Rouge, Eurosport,
Invivo, Faceo, Chteau de Versailles, Eurosport, Ipsos, VSC Technologies, Sanef, Explorimmo,
Bureau Veritas, Rgion Centre, Dassault Systmes, Fondation dAuteuil, INRA, Gaz Electricit
de Grenoble, Ville de Niort, Ministre de la Culture, PagesJaunes Annonces
ECommerce
Krys, La Halle, Gibert Joseph, De Dietrich, Adenclassifieds, Macif, Furet du Nord, Gtes de
France, Camif Collectivit, GPdis, Projectif, ETS, Bain & Spa, Yves Rocher, Bouygues
Immobilier, Nestl, Stanhome, AVF Primdical, CCI, Pompiers de France, Commissariat
lEnergie Atomique, Snowleader, Darjeeling
ERP et Dcisionnel
Veolia, La Poste, Christian Louboutin, Eveha, SunR, Home Cin Solutions, Pub Audit, Effia,
France 24, Publicis, iCasque, Nomadvantage, Gets, Nouvelles Frontires, Anevia, Jus de Fruits
de Moora, Espace Loggia, Bureau Veritas, Skyrock, Lafarge, Cadremploi,
Meilleurmobile.com, Groupe Vinci, IEDOM (Banque de France), Carrefour, Jardiland,
Trsorerie Gnrale du Maroc, Ville de Genve, ESCP, Sofia, Faiveley Transport, INRA,
Deloitte, Yves Rocher, ETS, DGAC, Generalitat de Catalunya, Gilbert Joseph, Perouse
Mdical
Rfrencement
Ce quil faut savoir
dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation
Page 4
Gestion documentaire
Primagaz, UCFF, Apave, Goservices, Renault F1 Team, INRIA, CIDJ, SNCD, Ecureuil Gestion,
Rgion Centre, Serimax, Volia Propret, NetasQ, Generali, Bureau Veritas, Alstom Power
Services, Mazars, SNCF, HEC
Infrastructure et Hbergement
Agence Nationale pour les Chques Vacances, Pierre Audoin Consultants, Rexel, Motor
Presse, OSEO, Sport24, EcoEmballage, Institut Mutualiste Montsouris, ETS, Ionis, Osmoz,
SIDEL, Atel Hotels, Cadremploi, SETRAG, Institut Franais du Ptrole, Mutualit Franaise,
Ministre de lcologie et du dveloppement durable
Consulter nos rfrences, en ligne, ladresse : http://www.smile.fr/clients.
Rfrencement
Ce quil faut savoir
dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation
Page 5
CE LIVRE BLANC
Cest dessein que ce livre blanc ne sintitule pas Rfrencement secrets dexperts : son
but est bien de prsenter les principes fondamentaux du rfrencement, tant du point de vue
des techniques sousjacentes que des dmarches visant loptimiser.
Avant de faire appel un prestataire spcialis dans loptimisation du rfrencement naturel
(on parlera de SEO tout au long de ce document), il conviendrait que chaque responsable de
site connaisse ce minimum que nous prsentons ici.
Il y a beaucoup dides fausses concernant le SEO. Par exemple, quil suffit de payer un bon
prestataire pour que vos sites/portails soient automatiquement dans les premires pages de
Google, ou qu'il suffit de travailler son SEO pendant le lancement de son site puis de ne plus
rien toucher dans les mois/annes qui suivent.
Un accompagnement SEO est un ensemble dtapes respecter, avant la mise en ligne (ou
refonte), pendant le travail de conception et obligatoirement aprs tout le travail de mise en
place (suivi, optimisations). Tout cela afin que votre projet puisse rcolter le plus de
visibilit possible, avec un trafic le plus qualifi possible.
La premire chose que nous aimerions transmettre dans ce recueil est que le SEO nest pas
une sorte de sorcellerie aux recettes cryptiques et mystrieuses, mais un processus tout fait
raisonn, qui consiste plutt mettre en avant la pertinence relle de votre site plutt qu
faire croire une pertinence quil naurait pas.
Nhsitez pas nous transmettre votre avis ladresse : contact@smile.fr
Rfrencement
Ce quil faut savoir
dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation
Page 6
SOMMAIRE
PREAMBULE................................................................................................ 2
SMILE ...................................................................................................................................................................2
QUELQUES REFERENCES DE SMILE ..............................................................................................................................3
CE LIVRE BLANC.......................................................................................................................................................5
SOMMAIRE ............................................................................................................................................................6
LES BASES ................................................................................................... 8
LE SERVICE AUX INTERNAUTES....................................................................................................................................8
LA DOMINATION DE GOOGLE...................................................................................................................................10
REFERENCEMENT POURQUOI ?................................................................................................................................10
UN JEU SANS FIN...................................................................................................................................................11
LA PYRAMIDE DU SEO............................................................................................................................................12
INDEXATION............................................................................................. 15
LE CRAWLER ........................................................................................................................................................15
LES LIMITES DU CRAWLER .......................................................................................................................................16
TENDEZ VERS UN DEVELOPPEMENT DE BONNE QUALITE.................................................................................................17
ATTENTION AUX LIENS CASSES .................................................................................................................................18
REDIRECTION 301.................................................................................................................................................18
LE FICHIER ROBOTS.TXT..........................................................................................................................................19
GOOGLE SITEMAP.XML..........................................................................................................................................20
PERTINENCE.............................................................................................. 22
LE POIDS DES MOTS ...............................................................................................................................................22
LES URLS............................................................................................................................................................24
TITRES ................................................................................................................................................................25
BALISES META.....................................................................................................................................................26
OPEN GRAPH PROTOCOL........................................................................................................................................27
MICROFORMATS ...................................................................................................................................................28
BALISAGE SEMANTIQUE..........................................................................................................................................29
TEXTE DES LIENS....................................................................................................................................................30
ET LES IMAGES ?...................................................................................................................................................31
LES OUTILS DE GESTION DE CONTENU .......................................................................................................................31
URL STABLES, SIGNIFIANTES ET UNIQUES ..................................................................................................................33
INTERDICTION DU DUPLICATE CONTENT .....................................................................................................................33
Rfrencement
Ce quil faut savoir
dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation
Page 7
NOTORIETE............................................................................................... 36
BACKLINKS...........................................................................................................................................................36
RAPPEL HISTORIQUE : LE PAGERANK.........................................................................................................................37
UN CRITERE DE PLUS EN PLUS DIFFICILE A TROMPER......................................................................................................38
LE PARTAGE, NOUVEL ELDORADO .............................................................................................................................39
LA DEMARCHE .......................................................................................... 41
LA VRAIE PERTINENCE.............................................................................................................................................41
QUELS MOTS POUR ARRIVER A MON SITE ?.................................................................................................................41
QUELS MOTS RECHERCHAIENT MES VISITEURS ? ..........................................................................................................42
QUELS LIENS POINTENT VERS MON SITE ?...................................................................................................................43
LE VOLUME COMPTE..............................................................................................................................................44
LES RUSES ................................................................................................. 46
DES RESEAUX DE PAGES CREUSES..............................................................................................................................46
LES PAGES SPECIALES MOTEUR.................................................................................................................................46
LA PUNITION DES FRAUDEURS..................................................................................................................................48
EN CONCLUSION....................................................................................... 49
Rfrencement
Ce quil faut savoir
dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation
Page 8
LES BASES
LE SERVICE AUX
INTERNAUTES
Mettonsnous un peu la place dun outil de recherche. Son objectif est de servir ses
visiteurs, en les aidants trouver rapidement linformation quils recherchent. Donc de
prsenter les milliards de rsultats de recherche dans lordre de pertinence. Bien sr la
notion de pertinence est trs subjective, et la tche du moteur est prcisment de quantifier
cette pertinence dune manire qui corresponde le plus souvent aux attentes des internautes.
Cette pertinence sest aujourdhui tendue. En effet, ce qui est prsent aux internautes n'est
plus uniquement des rsultats affichant les meilleurs sites web , mais aussi des rsultats
lis la fameuse recherche universelle
1
. Vous trouverez donc des rsultats de recherche
(SERP
2
) complmentaires comme des images, des vidos, des cartes (adresses), des produits,
les rseaux sociaux, des liens sponsoriss...
Par exemple, si vous tapez la requte SNOWBOARD dans un moteur de recherche, il vous
proposera toutes sortes de rsultats en termes de contenus. En effet, sil existe des sites web
pertinents sur cette requte, il existe aussi dautres types de contenus qui font peuttre
partis de votre recherche initiale ? En tapant snowboard , cest peuttre le produit que
vous cherchez plutt que des actualits sur le sport ?
1
Recherche universelle : les moteurs de recherche affichent de plus en plus au sein de leurs pages de rsultats des
lments qui ne sont pas uniquement des pages Internet standard, mais galement des images, des vidos, plans et
fils dactualit.
2
SERP : Search Engine Result Page. Ce qui signifie littralement : rsultats affichs par les moteurs de recherche.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page9
Ilyaquantitdesocitsetsiteswebquiproposentdevendredessnowboards,maisaussides
blogs, des sites d'infos (produits ou plus gnralistes), la fdration de snowboard et tous
ces sites doivent se distinguer parmi les 119 millions de rsultats (nous reviendrons plus loin
surcettenotiondesommedesrsultats).
Google a aussi tendu ses SERP en les personnalisant de plus en plus en se basant sur vos
habitudes et vos contacts. Si vous tes connects votre compte Google, selon les liens
partags par vos contacts ou vousmme via Google+ ou le bouton +1, vos rsultats seront
srementdiffrentsde ceuxde votre voisin.EtcequiestvraiavecGoogle lestaussi avecles
autresprincipauxoutilsderechercheactuels(Bing,Yahoodanslespaysoccidentaux,Baiduen
Chine, Yandex en Russie). Mme si bien sr, chaque march ses spcificits et un
rfrenceur doit prendre en compte les habitudes de recherche spcifiques des internautes
locaux.Sanscompterquepourunmmeoutil,lesoptionsderechercheserontdiffrentesdun
payslautre.Parexemple,lesfonctionnalitssurGooglenesontpaslesmmesenFranceet
enSuisse(pasdeGoogle+1).
LetravaildumoteurderechercheestdeparvenirdistinguerlaFdrationdesnowboardqui
ne parle que de a et les pages ventuellement consacres au snowboard sur un site plus
gnralistecommeskipass.com.
Cetravaildoitobligatoirementtretotalementautomatis,puisquilportesurdesmilliardsde
pages: il est hors de question quun intervenant humain passe 15 secondes valuer la
pertinencedechaquepage.
Enfin, la tche du moteur de recherche est rendue plus difficile encore par le fait que les
gestionnaires de sites ont pour objectif avou de le tromperpour obtenir les meilleurs
rsultats!Lemoteurveuttablirdemanireautomatiquelavraiepertinencedechaquepage,
legestionnairedusiteveutfairecroirequesonsiteestpluspertinentquilnelestrellement.
On adoncune vraie opposition, une guerre interminable, entre moteurset webmasters.Sile
moteurselaissetromperparlessites,ilperdsacrdibilit.Illuifautdonctrouvertoujoursplus
dalgorithmesquinepourronttreabussparleswebmasters.
CelaafaitlarussitedeGoogle,maiscelaataussiunbnficepourlInternetengnral,en
redonnantsaplacelavraiepertinence.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page10
LA DOMINATION DE GOOGLE
Cen'estunsecretpourpersonne,GoogledominelargementsesconcurrentsenEuropedansle
domainedelarecherchesurInternet.
YahooetBing(Microsoft)taientlesprincipauxmoteurspouvanttitillerlegantdeMountain
View, ils viennent pourtant de fusionner leurs rsultats de recherche (Yahoo intgre depuis
aot2011 lesrsultatsdeBing).Etne parlonspasdes outilsfranaiscomme Exalead,Orange
ouautres.IlssontanecdotiquesvisvisdeGooglemaisintressants.Cependant,ilfautgarder
l'esprit que vous n'allez pas optimiser un site pour apparatre uniquement sur Google, les
bonnespratiquesrespectertantsensiblementlesmmespourtouslesoutilsderecherche,
vousallezaussivouspositionnersurcesautresoutils.
Attention, cette domination n'est pas aussi forte partout dans le monde. Aux US, Bing reste
une valeur sure,en Asie Google estlargementderrire des outilscomme Baidu(en Chine, ce
moteurreprsente70%departdemarch).Mmeconstatdanslespaysdel'EstavecYandex
par exemple. Votre stratgie SEO sera donc diffrente sur ces pays qui ont des rgles
diffrentesd'indexation.
REFERENCEMENT
POURQUOI ?
Lesinternautesaccdentunsitedetroismanires:(a)entapantdirectementlURLouenla
slectionnant dans un signet (bookmark), (b) en suivant un lien depuis un autre
site/blog/forum/rseauxsociaux,et(c)parunerecherchesurunoutilderecherche.
Pourtrouverunsite quilsne connaissaientpasauparavant,seulesrestentlesvoies (b)et (c),
etdiffrentestudesestimentquelemoteurderechercheestlamanireutilisedansplusde
80%descaspourdcouvrirunsitequelonneconnaissaitpas.
Lorsquils utilisent un moteur de recherche, il est vident que les internautes ne peuvent
parcourirplusdequelquespagesderponse,etquenconsquenceseulslessitesfigurantsur
lespremirespagesserontvisites.
71,3% des franais seconnectentInternet(Fvrier2011)
9 sur 10 effectuentdesrecherches
90% d'entre eux utilisentGoogle
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page11
Il est donc dune importance primordiale de figurer en bonne place dans les rsultats de
recherchessilonveutattirerdesvisiteursparcecanal.Toutlemondelesait,etcestlaraison
pour laquelle leSEO estdevenu une spcialit partentire dans le monde destechnologies
Internet.
LesanglophonesappellentcetteactivitSearch Engine Optimization,cestdireoptimisation
pour les moteurs de recherche. Ce qui est plus explicite finalement car il ne sagit pas dtre
rfrenc naturellement, mais bien doptimiser au mieux le rfrencement de votre site en
mettantenplacetoutunpaneldinterventions.Ilnyafinalementpasgrandchosedenaturel
danscetteoptiquedoptimisation!
Etantdonn lesmilliards de pagesindexes parun moteur derecherche,ilestnaturellement
difficiledesprerfigurersurlapremirepagepourdesrechercheslarges,commeparexemple
tlvision pour un vendeur de tlvisions. Les sites de marques les plus influents y sont
prsents, et travaillent darrache pied pour rester sur cette page avec normment de
visibilit.Pourlaplupartdessites,ilvautmieuxsefixerdesobjectifsmoinsambitieux,etviser
un bon rang pour des recherches plus cibles, sur des couples ou des triplets de mots. Cette
mthode a le mrite de cibler une audience plus qualifie et intresse par votre contenu.
Attention, nous ne parlons pas ici de longue traine (nous expliquerons ce concept unpeu
plus loin) mais bien de requtes prcises et stratgiques. Et la concurrence nest pas une
excuse pour ne pas tenter de se positionner sur des mots cls trs concurrentiels, il faut
cependantymettrelesmoyenspouresprerpouvoiryfigurer.
De plus en plus, les internautes chevronns savent quune recherche trop vague ne sera pas
utile,etilssaisissentdsledbutunepetitelistedemotscls.Ainsi,lesrecherchesportantsur
3motsseraientpassesde17%en200542%en2010(sourceAdOc)!
UN JEU SANS FIN
Figurerenpremirepageestunpeuunjeudedupe.
Vos10principauxconcurrentsontpayuneagenceSEOdesmilliersdeuroschacunpourtre
en premirepagesur quelquesrequtes donnesetils ysont.Vouspayezvousmmesvotre
detvousvoilenpremirepage,jectantlundevosconcurrentsendeuximepage.Furieux,
celuiciappellelagencechargedesonrfrencement,quiluirefactureunpeu,bricoleunpeu
plussespages/backlinks
3
,etleramnevictorieusementenpremirepage.Vousappelezvotre
agence,dpensezencoreunpeudargent,etainsidesuite
Lamliorationdurfrencementestcequonappelleunjeusommenulle.Plusprcisment,
cestlasommedesgainsdepositionquiestnulle,paslessommesdpenses.Maisleretour
sur investissement dun travail rigoureuxsur lerfrencementnaturelestencore aujourdhui
imbattable.
3
Backlinks:liensexternesvotresiteweb,renvoyantversvotrecontenu.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page12
Et pour autant, personne ne peut se permettre dabandonner le combat. Chaque jour les
positions changent, chaque jour vos concurrents optimisent leur contenu et leur stratgie.
CestpourquoiunsuividansletempsrigoureuxdindicateursclslisauSEOestindispensable.
Nousverronsplusloinquedesoutilsexistentpourcela.
LA PYRAMIDE DU SEO
La pyramide du SEO est rgulirement voque dans les interventions. Cette pyramide
reprsentelesdiffrentestapesncessairesunbonrfrencementnaturel.
Lobjectif:lerenforcementdevotrevisibilit.
Nous partons dindicateurs onsite, c'estdire des leviers quil est possible dactiver
directement sur les dveloppements. Pour arriver ensuite plus ou moins directement aux
indicateurs offsite, soit les optimisations ncessaires en dehors du travail technique sur
votrestratgieWeb.
Labaseestbiensurlindexabilit,cestdirelacompatibilitaveclesmcanismesutiliss
parle moteur pour parcourir etindexerlessites.Unebasetechniquepropreetrespectantla
plupart des indicateurs vous assureradune indexationoptimale dans lesoutilsde recherche.
Etterme,demeilleurespositions.
Nous pouvons citerici lechoixdarborescenceet de structure devotre site, lesoptimisations
On page, la gestion de vos liens internes, laccessibilit (multisupport, balisage
smantique),laconfiancedansvotrecontenu(autoritdudomaine,historiquedescontenus)
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page13
Outrecettebasetechnique,ilvavousfalloirensuitetravaillervotrecontenu.
Cestle nerf dela guerre,sanscontenu, rien indexerdanslesoutilsde recherche etaucune
pertinencesurvotreuniversdemotscls.
Que vous ayez un site corporate, dinformations ou de vente en ligne, votre objectif devra
resterlemme:produireducontenu!
En effet, les outils de recherche et Google en tte naiment pas les pages web avec peu de
texteoudecontenupertinentpourlinternaute.
Nonseulementcecontenudoittrepertinentetabondant,maisildoitaussitreconstruiten
suivantlesbonnespratiquesetensassurantquevostitresparexemplesoientoptimisspour
lerfrencementnaturel.Eneffet,nousvoyonstropsouventdestitresdarticlestudispour
le print, et donc trs marketing, mais pas du tout adapt au web et aux recherches des
internautes.Nousentronsicidanslanotionparallleaucontenu,lesmotscls.
Ce choix de mots cls pour votre contenu est stratgique. Cela va avoir un impact sur
lensemble de votre site: arborescence, contenu des pages, balises META, Tout cela en se
posantune questionsimple:questceque lesinternautes pourraientutilisercomme requte
pourtrouvervotresite?
Parexemple:
Prfrez: Mode demploi <nom de produit> en 5 tapes. A cela: A la dcouverte dun outil
merveilleux.
Afin de rendre visible tout cetravailprparatoire, voicivenultape quifera la diffrencepar
rapportvosconcurrents:la popularit.
En effet, si votre contenu nest pas repris, citourendu populaire parnimporte quel moyen
auprs des internautes, celuici ne sera pas (ou peu) visible sur les outils de recherche (seule
solutionalternative,lesadwords).
Surdesmotsclspeucomptitifs,cettenotiondebacklinksneserapasdterminante,peude
liens pourraient vous permettre darriver en tte des rsultats. Mais sur des requtes trs
populaires (auto, mutuelle, crdit), vous aurez besoin dun nombre trs important de liens
pour pouvoir rendre votre contenu pertinent pour les outils de recherche par rapport vos
concurrents.
Si nous rsumons, lordre de prsentation des rsultats dune recherche dpend de deux
principauxfacteurs:
Lanotorit,quiestunevaleurintrinsquedelapage,unemesurequiassociequalit
desliensentrants(Backlinks)etleurquantit.
La pertinence de la page pour les mots recherchs, cest dire sa plus ou moins
grandecorrespondanceaveccequerecherchelinternaute.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page14
Cesdeuxnotionssonttotalementtransverses,indpendanteslunedelautre.Cesontlesdeux
notionscls quiinterviennentdanslerfrencement,etunchapitrespcifiqueestconsacr
chacunedelles.
La manire dont ces deux facteurs sont combins pour produire lordre de tri des rsultats
nest pas vraimentconnue. Cesalgorithmessontprotgs comme des secrets dtats par ces
socits et les rfrenceurs ne peuvent se baser que sur leur vcuet surlamiseen place de
teststoutaulongdelanne.
Lafigurecidessustraduitlaformule:ordredesortie=pertinencexnotorit
Cependant,nouspouvonsestimerceci:
Acontenugal,lespagesdenotoritplusleveviennententte;
Anotoritgale,lespageslespluspertinentesviennententte.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page15
INDEXATION
LE CRAWLER
A la base du rfrencement il y a le robot dindexation, appel encore Crawler (celui qui
avanceenrampant).Cestunprogramme,quisecomportecommeuninternautequisuivrait
touslesliensquilrencontre.Illitunepage,analyselecontenuetindexelesmotsrencontrs,
puissuittouslesliensdecettepagepourliredautrespages.Etainsidesuite.
Normalement, le crawler devrait dcouvrir ainsi pratiquement tous les sites, puisquil suffit
dunlienversunepagedevotresitepourquilentreetparcourtalorslensembledespages
ensuivantainsitouslesliens.
Principe du Crawler
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page16
Maissivotresiteesttoutneuf,aucunautresitenaencoredelienverslevtre.Ilesttoujours
possible de signaler explicitement lexistence dun nouveau site sur Google. Cependant, il est
plus efficacede signalercette existence parlapublicationdarticlesoude crer cesliensvers
votre site grce vos partenaires/votre groupe. Le moteur ne garantit pas quil viendra le
visiter et lindexer rapidement, mais sous quelques jours voire maintenant heures, il le fera.
Cest donc bien sr la premire tape pour indexer un site que de signaler son existence aux
principaux moteurs de recherche du web.
La frquence de visite du crawler nobit pas des rgles publies. Elle dpend du moins du
taux de mise jour du site: si le crawler voit que les contenus du site sont modifis
frquemment, il revient frquemment. La frquence de visite dpend certainement aussi du
Page Rank
4
, de la notorit du site: le site de Microsoft sera index plus frquemment que
celui des pcheurs de la Marne. Pour autant, il serait tout fait inutile de chercher tre
indexplussouvent,puisquecelanedonneraitenrienunmeilleurrfrencement.
LES LIMITES DU CRAWLER
Le minimum requis pour que toutes les pages dun site soient rfrences est quil soit
crawlable,cestdirequilneprsentepasdimpassepourlefonctionnementducrawler.
Ilfautdoncbiencomprendrecequelecrawlerpeutetnepeutpasfaire.
Il suit trs facilement les liens hypertextes standards (balise <a>). Le crawler suit aussi
maintenant les liens qui rsultent de lexcution dinstructions Javascript ainsi que lAjax
(source : WebRankInfo : http://www.webrankinfo.com/dossiers/indexation/crawljavascript
post). Mais attention, les liens inclus dans un programme Flash ne sont toujours pas suivis,
vitez les sites full flash si vous souhaitez tre visible. En effet, le Flash ntant pas visible
pour le Crawler, vous ne donnerez donc pas de contenu pour tre positionn.
Comme vous pouvez le voir sur le lien prcdent, le crawler peut maintenant franchir
certains formulaires. Maisilestfortementrecommanddefaciliterlindexationdescontenus
etdoncdenepasplacerdeformulaireavantdespagesquivoussemblentimportantes.Ilfaut
donc prvoir dinterdire lindexation de certains contenus de type formulaire afin de ne pas
voirdecontenusdemauvaisequalitsurlesoutilsderecherche.
Au strict minimum, un site doit pouvoir tre visit de manire complte par le crawler.
Pour cela, il faut privilgier les liens html naturels, interdire (ou rduire) les liens rsultant de
javascript ou de Flash, et interdire les formulaires qui seraient le point de passage oblig vers
certaines branches du site.
4
PageRank ou PR:Algorithmed'analysedesliensconcourantausystmedeclassementdespagesWebutilisparle
moteurderechercheGooglepourdterminerl'ordredanslesrsultatsderecherchequ'ilfournit.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page17
TENDEZ VERS UN
DEVELOPPEMENT DE BONNE
QUALITE
Lorsdudveloppementdunsiteweb,etmmesilesprincipauxCMSdumarchrespectentles
bases du rfrencement naturel, il faut sassurer de maximiser cette compatibilit avec les
guidelines desoutils derecherche.Eneffet,labasetechniquedoitpouvoirfaciliterlepassage
des robots de crawling , mais aussi faciliter leur comprhension du contenu et de
lenvironnementwebdevotresiteweb.
Cetteoptimisationtechniqueauraaussipourbutdallerleplusloinpossibledanslacclration
dutempsdechargementduportail.Eneffet,lesoutilsderecherche(etGoogleenparticulier)
suiventceparamtredeplusenplusprcisment.
Pourcela,voiciquelquespointsgarderlespritlorsdudveloppement.
Sparer le contenu (code html) du code de prsentation (css) et du code interactif
(JavaScript).
NepasutiliserdecodecssouJavaScriptdirectementdanslecodesource.
Optimiserlacompressiondesfichiers.
Regrouperlesfichiers.cssdansunefeuilledestyleexterneunique.
Regrouperlesfichiers.jsdansunfichierJavaScriptexterneunique.
Optimiserl'ordreducodepouruntlchargementparallledesressources,appelerles
cssavantleJavaScript.
Optimiserlagestionducache(systmeounavigateur)
RespecterlesnormesW3C.
...
Afin devrifierlanotequeGoogledonneautempsdechargementdevotrepage,ilexisteun
pluginPageSpeedpourFirebugsurFirefoxoudirectementenligne:
http://pagespeed.googlelabs.com/http://pagespeed.googlelabs.com/ (qui fonctionne aussi
pourlesmobiles).
Googleydonneaussiquelquespistesdamliorations.
Ce ne sont bien srque des propositions, dautres bonnespratiques peuvent tre employes
parlesdveloppeurspourallerplusloindansledveloppementdunsiteweb.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page18
ATTENTION AUX LIENS
CASSES
Imaginons que votre site ait conquis une petite notorit. Vous aviez une page passionnante
sur les tapis persans du XVIIme sicle et plusieurs sites spcialiss y ont fait rfrence,
apportant ainsi un peu de leur propre notorit cette page. Et de l, cette notorit se
propage,commeonleverra,lensembledevotresite.
Mais un jour, vous rorganisez tout cela et ladite page change dURL. Ou bien pire, vous
changez de technologie et ce sont toutes vos pages qui changent dURL. Les liens entrants
tombent alors en erreur (NOT FOUND!) et napportent plus leur poids votre site. Aprs
quelquespasses,votreranking seffondre.
Il est fondamental danalyser toutes les erreurs NOT FOUND (404) gnres par votre site et
den faire une chasse implacable.
Celalafoispourleconfortdevosvisiteursconcernantlesliensinternesetpourlaqualit
devotrerfrencement,concernantlesliensentrants.
Il faut conserver la plus grande stabilit dans lorganisation de votre site et ses URLs. Si vous
modifiez une page, elle doit conserver la mme URL. Si une page est supprime, elle doit tre
remplace systmatiquement par une instruction de redirection 301 vers une autre page de
votre site, par exemple laccueil mais plutt vers le contenu le plus proche existant.
REDIRECTION 301
Si les URLs ont chang, alors la seule bonne pratique est de retourner un code HTTP 301 :
moved permanently signifiant le changement dadresse dfinitif de la page.
Cestuneinterventionfortementrecommandequederedirigerunanciencontenulorsdune
refonte par exemple vers ses nouveaux contenus. Cest un point prparer en amont du
dveloppementdusite,lorsdelavalidationdelarborescencefinale,etmettreenplacelors
delamiseenligne.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page19
Ces redirections de type 301 (dfinitives) sont ncessaires afin de conserver les acquis en
terme de positionnement sur les outils de recherche. Nous insistons sur la mthode, cest
obligatoirement des redirections 301 qui doivent tre mises en place, cest la seule
recommandeafindeconserversontraficprovenantduSEO.
Lesautresmthodes(JavaScriptparexemple)vontprovoquerladisparitiondespagesindexes
etdoncuneremisezrodurfrencementnaturelduportail.Lhistoriqueetlanciennetdes
contenustantunpointcldescalculsdesoutilsderecherche,celapourraitdoncavoirunfort
impactsurlerfrencementnatureldevotresite.
Par cettemthode, lesoutilsde recherche serontprvenus de la mise jourdu portailet de
sescontenus,ilstransfrerontalorslescoreSEOdelanciennepageverslanouvelle.
Lorsquunanciencontenunexisteplussurlenouveauportail,ilsuffiradeleredirigersurcequi
seraconsidrcommeunepageprocheougnrique(surlapagedaccueilsincessaire).
En outre, il faudra prvenir certains sites qui possdaient des liens vers le votre afin quils
reprennentune forme correcte,dans lobjectif degarder uneforte pertinence.Celademande
desavoirlesidentifier,cequenousverronsplusloin.
Comme pourles redirectionsde contenus, lesnoms dedomainesdoiventaussitre grsvia
desredirections301pourviterquelesoutilsderechercheendduisentdessitesdiffrents.
PrincipalemententrelURLhttp://www.monurl.fr/etlURLhttp://monurl.fr/.
Outre ce cas de contenu diffrent entre site hberg sous WWW et sans, il faut idalement
redirigerlURLsanslewwwversvotreURLofficielleafindenepasperdredevisiteurs.
LE FICHIER ROBOTS.TXT
Lesrobotscrawlerssontbienlevs.Surtoutceuxdesgrandsmoteursderecherche.
Dune part, ils se signalent au site cestdire quils ne se font pas passer pour un utilisateur
normalutilisantunnavigateurnormal.Ilssefontconnatreenrenseignantdansleursrequtes
unchampparticulier(useragent),quipermetdelesreconnatre.Ainsi,unsitepeutanalyserce
champ, identifier le crawler, et prsenter le cas chant des pages diffrentes de celles que
voient les visiteurs normaux. Nous verrons que cela peut faire partie des techniques visant
optimiserlerfrencement(maisquenousnerecommanderonspasspcialementpournepas
faireprendrederisquesnosclients).
Dautrepart, les robotsrespectentscrupuleusementlesconsignes quileurssontdonnespar
le site visit. Avant de visiter un site, le crawler demande lire unfichiersitu laracine du
site,etnommrobots.txt.Cepetitfichier,lorsquilexiste,donnedesinstructionsaurobot,en
particulier pour lui prciser le rythme dindexation quil doit respecter, afin de ne pas
submergerleserveur,ainsiquelesbranchesdusitequilnedoitpasindexer.
Lesindicationspeuventdistinguerlunetlautredesrobotsvisiteurs.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page20
Parexempleleslignessuivantesinterdisentlesrpertoires/cgibin/et/images/auxrobots.
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Tandisquelalignesuivanteinterditseulementledocumentemail.htmaurobotdeGoogle:
User-agent: googlebot
Disallow: email.htm
Unautreexemple,pourunsitevoulantrestersecret:
User-agent: *
Disallow: /
Autrement dit: tous les robots: nindexez rien!. Cette configuration nest bien sr
pasrecommande!
Pourplusdinformations:http://www.searchengineworld.com/robots/robots_tutorial.htm,
parexemple.
GOOGLE SITEMAP.XML
Googleproposedepuismi2005unnouveauprocddinteraction
de son rfrencement avec les sites internet, appell
SiteMap.xml.GoogleSiteMapsprsenteunnouveaumoyende
demander lindexation des URLs, puis dobtenir des rapports
dtaillssurlavisibilitdespagessurGoogle.
Sonutilisationreposesurlamisedisposition,parleswebmasters,
dun fichier XML contenant les adresses des pages du site
rfrencer, ainsi que quelques infos complmentaires comme la
datedederniremisejour.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page21
Exemple:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Le bnfice pour les webmasters est une meilleure matrise des pages rfrences grce aux
nombreuxoutilsproposssurlinterfaceWebmasterTools(requtes,erreurs,sitelinks.)
Ce format de fichier est aussi reconnu par les autres outils de recherche. Bing proposant lui
aussidesoutilscomparablespourleswebmasters.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page22
PERTINENCE
LE POIDS DES MOTS
Comme on la indiqu prcdemment, deux mcanismes se combinent pour dterminer
lordre des rsultats dune recherche: la pertinence par rapport aux mots recherchs, et la
notoritdespages.
Un premier principe, fondamental, est que les mots nont pas le mme poids selon quils
apparaissent dans le titre dune page, dans un entte, ou dans le corps dun article.
Lordredeprsenceestimauseindelapageestlesuivant:
1. Dans le nom de domaine. Ce nest pas leplus facile travailler lorsdune refonte
parexemple,maiscertainssappliquentdfinirdessousdomainesportantdesmots
clschoisis.
2. DanslURL(rewriting)
3. Dansletitredelapage,ausenshtml(baliseTITLE)
4. Dansdestitresintermdiaires,selonleurimportance(balisagesmantiqueH1,H2,)
5. Encaractresaccentus(gras,oustrong).
6. Lesmotsduhautdepageontunpoidsplusimportantquelesmotsdubasdepage.
Cequiestreprsentsurlafiguresuivante.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page23
Les lments importants dune page bien rfrence
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page24
LES URLS
PourcequiestducasdesURLs,considronsquelquescasdcole:
Celuici,parexemple,achoisiunnomdedomainecorrespondantdirectementauxcritresde
recherchecibls.Ilnestpasraredevoircegenredesitecrerdessousdomainescherchant
sepositionnersurdautresrequtes:
Exemple:achat.parislocationappartements.com
ouvacances.parislocationappartements.com
(Ce sont des exemples, ces sousdomaines nexistent pas)
Lexemple suivant a une URL beaucoup moins parlante, on en conviendra Un exemple ne
passuivre.
LURL rewritingest une mthode de rcriture desURLtechniquesgnrespar lesoutilsde
backoffice(CMSparexemple).CelaconsistetransformeruneURLtechniquecomportantplus
ou moins de paramtres dynamiques par sa traduction en mots cls comprhensibles par un
internaute.
Parexemple,pluttquedevoiruneURLdetype:
http://www.monsite.fr/pid=1234gb43
NouspourrionsrcrirecetteURL:
http://www.monsite.fr/avancementreconstructionmaison.html
Lesoutilsde recherche peuventcependantsuivreet prendre en compteune URLdynamique,
et comme les outils de recherche ne donnent pas beaucoup dimportance aux mots cls
prsents, nous ne sommes pas totalement partisans dune rcriture dURL trop pousse. Ce
choixdoitaussitrefaitpouraiderlinternautenaviguersurvotreportail.Commepourunfil
dAriane.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page25
Attention cependant, pour un choix portant sur une optimisation de ce type, lURL rewriting
doitrespectercertainesrglesetnepastropenfaire.Eneffet,ilnesertriendemultiplierles
mots cls dans ces URL (que ce soit pour le nom des rpertoires ou le nom de la page). Les
outils de recherche ne prendront pas en compte lensemble des mots cls et iront mme
parfois jusqu' pnaliser votre page ou votre portail en entier. Cest un des dfauts des CMS
quiparfoisincluenttouslesmotsdutitredunepagesparspardestiretsdanslURL.Cenest
clairement pas une bonne solution bien que nous ne pensions pas que limpact sur votre
positionnementsoitvident.Ilvautmieuxselimiterauxmotsclsprincipauxdfinissantvotre
contenu.
Nous recommandons de ne pas inclure dans ces URL des mots cls considrs comme
bloquants comme par exemple : le, la, et, ce sont des mots cls qui sont gnralement
appelsstopword.
Une bonne URL sera donc la plus courte possible, rcrite si possible, classe dans un
rpertoire,avecdessparateursvalides(letiretestrecommand)etcomportantdesmotscls
appartenantauchampsmantiquedelapage.
TITRES
Souvent prsente comme une baliseMETA, cestenfaitune balise HTML(<title>)spcifique
qui sert afficher un texte en haut de la fentre de votre navigateur. Mais son optimisation
doitbientreuneprioritdansvotrestratgieSEO.
LetexteindiqudanslabaliseTitleestuntextequin'apparaitpasdanslecontenud'unepage
web. En revanche, il est possible de la voir dans la barre suprieure de la plupart des
navigateursweb.CestgalementletextequiestreprisdanslesSERPdesoutilsderecherche,
cestdoncvotrepremiercontactaveclesinternautes.
Considronsunexemplenepassuivre:
En2005 En2012
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page26
IcilesitedeSagemCommunication(en2005).Etensuitelaversionactuelle.
Le titre(<TITLE>) dela page tait Homepageen 2005: non seulementilne portaitpas de
motscls, mais il ne mentionnait pas mme le nom de lentreprise. Une occasion manque
pour un bon rfrencement naturel. De plus, dans une liste de favoris, ce lien apparatra
commeHomepage,sansplusdinformation.
En 2012, une petite amlioration, Sagemcom apparait dans le titre de la page. Cependant,
accol PORTAIL (encore HOME PAGE sur Google). Bien sur, ces mots cls nont pas
vraiment dintrt en termes de SEO. Le rsultat? La page daccueil du site Sagem
Communicationnapparaitquen 3meposition dansles rsultatsderecherche,etseulement
aprsleurpagepresse&vnementmieuxoptimise.
BALISES META
<meta name="description" content="votre contenu" />
Cettebalise nestpaspriseen comptepar lesoutilsde recherche pour positionner votresite.
Cependantcestlundeslmentsquirenforceraletauxdeclicsurvosrsultatsderecherche
en incitant les internautes cliquer sur vos rsultats. En effet, une description correctement
rdigeferapeuttreladiffrenceaveclesconcurrentsprsentssurunemmerequte.
<meta name="keywords" content="a oublier" />
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page27
Cettebalisenauraaucun impactsurvotrerfrencementnaturel.Eneffet,ellenestplusprise
en compte par les outils de recherche depuis quelques annes. Inutile donc de perdre du
temps optimisercettebalise,sanscompterque vous allezdonnericidesinformationsvos
concurrentssurvotrestratgiedepositionnementfacilementetrapidementrcupres.
<meta name="robots" content="index,follow" />
Cette balise va servir aux outils de recherche pour connaitre vos prfrences sur lindexation
(ou non)de votre page,et ainside savoirsilfautcontinuer suivre lesliensprsentsdansla
page.
Elle nest pas vraiment indispensable, les robots de crawling vont forcment prendre en
compte votre pageweb.Nousconsidronslutilisationdurobots.txtplusefficace.Cependant,
lerespectdesguidelinesnousimposesaprsence.Ilexistebiendautresvaleurspossiblesdans
cette balise, nous citerons uniquement noodp qui permet de prvenir le robot de ne pas
utiliserlesdonnesvenantdelannuaireDMOZ.
Autresbalisesncessairesourecommandes:
Labaliserel="canonical":cettebaliseestmaintenantpriseencompteparGoogle.Ellepermet
de donner aux outils de recherche lURL du contenu original si jamais il devait tre reproduit
ailleurs sur votre site (spcialement efficace pour un site marchand par exemple). La page
dupliquedoitdonccomportercettebalise.Cependant,nousrecommandonsbiensrdviter
tout prix le duplicate content sur votre site web. Une rubrique spcifique du livre blanc en
parleraplusloin.
OPEN GRAPH PROTOCOL
LOPENGRAPHPROTOCOLatlancparFacebookmaisestmaintenantaussireconnuparle
rseau social concurrent Google+. Ce nouveau protocole permet dajouter du sens vos
contenus pour le partage sur les rseaux sociaux principalement. Cest un pas de plus vers le
websmantique.Celarendlepartagedevospageswebsurlesrseauxsociauxplusefficaceet
amlioreparlammeoccasionleurrfrencementnaturel.
ExempledequelquesbalisesOG:
<meta property="og:title" content="Titre de la page et du contenu"/>
<meta property="og:type" content="article"/>
<meta property="og:url" content="http://monsite.fr/article.html"/>
<meta property="og:site_name" content="texte a insrer ici"/>
<meta property="fb:page_id" content="on"/>
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page28
Ces balises vont permettre vos pages web davoir des liens gnrs sur Facebook (via les
boutons jaime ) beaucoup plus parlant et percutant. En effet, linformation est mise en
valeuretvouspermettradercuprerdutraficsurvotresiteweb.Vulapuissancedupartage
des contenus sur les rseaux sociaux, prsenter vos contenus de faon ludique et efficace
(image/vido + description + URL) semble tre aujourdhui indispensable tout
dveloppement.
Ces balises ne sont cependant pas forcment ncessaires sur tous les contenus de votre
portail,maisvospageswebcomportantdesvidos,desgaleriesphotosouarticlespourraient
bnficier decesbalisesspcifiques comme des microformatsdontnousallonsparlerdansle
pointsuivant.
Plusdinformationssurceprotocole:http://ogp.me/
MICROFORMATS
Comme pour lOpen Graph protocol, il est possible depuis quelques temps de rajouter des
balises spcifiques sur votre contenu pour amliorer les rsultats de recherche. Ici nous
parlonsdimpactsurlarechercheuniverselledeGoogle.
Ce balisage supplmentaire vous permet dafficher des rsultats de recherche diffrents. Par
exemple dans le cas dun produit, dafficher une image, les votes des internautes, une
description
Unbelexempledecequepeutvouspermettrelesmicroformatspeuttrevuenactionsurune
recherchesurlarequteNHL.
En effet, le site officiel de la
NHLauxEtatsUnisautilisles
microformats pour afficher
directement dans les outils de
recherche le calendrier des
matchs passs (avec un lien
vers un rcapitulatif, les
highlights ainsi que le logo de
chaque quipe) ou matchs
venir.
Laffichagedesrsultatsderechercheviadesmicroformatsnestcependantpassystmatique.
Cestmmepluttalatoireencorepourlemoment.Maislesoutilsderecherchelesprennent
deplusenplusencompte.Cestunbalisagedavenir.
Plusdinformationssurlesmicroformats:http://schema.org/
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page29
BALISAGE SEMANTIQUE
Une autre consquence importante de cette pondration des mots dans la page est la
suivante:
Il faut utiliser les vraies indications de titres du html (H1, H2, ) plutt que des styles
spcifiques.
Les outils de recherche parcourent et analysent le code HTML de votre portail avant de
gnrerleursclassements.Cesmoteursdoiventcomprendrelesensd'undocumentafindele
classerconvenablementetdeproposerainsidesrsultatspertinentsleursutilisateurs.Cest
pourquoi ils donnent une grande importance la structuration des contenus via ce type de
balises.
Les balises du langage HTML sont les allies des moteurs dans leur qute de pertinence.
Lorsquecesbalisessontutilisesjudicieusement,ellespermettentd'analyserplusfinementla
structured'undocumentainsiquedepondrerplusfacilementl'importanced'uneinformation
oudunniveaudelecture.
Mais dployer un balisage smantique prsente aussi de multiples intrts notamment pour
l'accessibilit.
Parexemple,voiciunearborescenceHntype:
<h1> TITRE DE LARTICLE/DU CONTENU </ h1>
<h2> Introduction ventuelle de larticle</ h2>
<h3> sous titre 1</ h3>
<p> Paragraphe et contenu de larticle</ p>
<h3> sous titre 2</ h3>
<p> Paragraphe et contenu de larticle</ p>

Attention, en gnral lesCMSgrentcettearborescenceHn (etsouventH1 estliau logo).Il
estdoncncessairederevoirlecodesurlensembleduportailetdegarderlammestructure
Hnsurlensembleducontenu.
Desstylesspcifiquesaurontpeuttreun rendude titres,maisnepourrontpastrecompris
commedestitresparlerobotdindexation.
Cestdire quil faut dfinir <H1>Le Rfrencement</H1> plutt que <font face=>, ou
encore <p style=>. Dans le premier cas on nonce clairement que lexpression le
rfrencement a un rle de titre de chapitre de premier niveau, un rle important donc.
Danslescasdemiseenformedirecte,cenestpasaussiclairpourlerobot.
Bienentendu,onutiliseraunefeuilledestylepourdfinirlamiseenformeassocieauxtitres
H1,H2,H3
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page30
TEXTE DES LIENS
Les mots intervenant dans les liens qui pointent vers cette page ont galement une forte
pondration. Cest un point souvent mconnu, quil est important de souligner car cest la
seuleinformationextrieure la pageellemme,quiinfluencefortementsonrfrencement.
On suppose que si une pageBcomporte unlien vers la pageAet que ce lien mentionne le
framework Symfony, cela signifie que pour lditeur de la page B, la page A tait
particulirementpertinenteenrapportaveccethme.
On auraitpudire quecejugementestdautantplusvalablequelapageBappartiendraitun
autresite,ouunautrenomdedomaine,carlapprciationdepertinenceseraitplusobjective.
Mmesicestunechosesurlaquelleilestfaciledetricher(spamblogparexemple)etdontles
moteurs de recherche font une chasse impitoyable, les liens entrants venant de lextrieur
restentlundesprincipauxmoyensdejugerdelapertinencedunepageweb.
Ainsi, au sein mme de votre site, il est important de choisir vos mots pour crer des liens
internes.
Le texte des liens pointant vers une page est considr comme partie intgrante de la page,
avec une pondration importante.
Ilfautdoncviterlesliensdetypegnriquetelsquevoirlarticleoucliquezici.
Parexemple:
En savoir plus sur les lentilles vertes du Puys et la sant
[http://monsite.com/lentilles.html]
Associe le mot sant aux lentilles vertes du Puy , apportant ce mot comme contenu
complmentairelapage.
Tandisque
...Les lentilles vertes du Puys sont un trsor de sant, (voir larticle)
Napportequelesmotsvoiretarticledanslindexationdelapagecite.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page31
ET LES IMAGES ?
Avant toutes choses, il faut viter de grer les liens de votre site web uniquement sur des
images,celaestprobablementmoinspertinentetefficacequunsimplelientexte.
Il faut systmatiquement accompagner vos images dune balise ALT qui dcrit limage.
Cetteoptimisationdesimagesvouspermettraderajouterdelapertinencevotrepage.Mais
aussidepositionnervosimagesdanslesrecherchesspcifiquesimagesetdoncdercolterun
traficnonngligeable.Noubliezpasquelenomdevotreimageestelleaussiimportante!Par
exemple,prfrezuneimagenommelogomasociete.jpgpluttque159GF93.jpg
LES OUTILS DE GESTION DE
CONTENU
Les sites web modernes sappuient gnralement sur des outils de gestion de contenus, ou
content management systems (CMS),et il estdoncnatureldesinterrogersurlacompatibilit
decesoutilsavecunbonrfrencement.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page32
Sivous ntespasdjfamiliersdesprincipesde la gestionde contenuetdesmeilleursoutils
en la matire, nous vous recommandons les livres blancs de Smile intituls Gestion de
contenus : le meilleur des solutions open source ou 200 questions pour choisir un CMS .
Dans un site statique, les pages que voit linternaute sont des fichiers placs dans une
arborescence de rpertoires. Le chemin daccs indiqu dans lURL est le reflet fidle des
rpertoiresconduisantaufichier.
Dans un site dynamique, et en particulier un site construit au moyen dun CMS, les pages
nexistentpassurleserveur,ellessontconstruitesaufuretmesurequellessontdemandes.
Les contenus, cestdire les textes, images ou documents composant le site, sontplacs
engnraldansunebasededonnes,doilssontobtenuspourfabriquerlespages.
Celatant,le crawler luine sintresse pas la manire dontlespagessontfabriques: il les
demandeparunerequtehttp,commeleferaitunsimpleinternaute,lesobtientetleslit.Bien
sr dans certains cas, en regardant la forme dune URL on peut deviner de quelle manire la
pageatproduite.
Maisilfautbiensesouvenirdupointsuivant:
Le crawler ne fait pas de discrimination, les pages dynamiques ne sont pas moins prcieuses
ses yeux que les pages statiques.
Ilrestemalgrtoutquelquesdiffrencesdontilfautseproccuper:
lURLgnredoitpermettredidentifierchaquecontenu;certainsCMSutilisentdans
ce but une technique appele URL rewriting (rcriture dadresse) permettant
dutiliserletitredesarticlesetdeleurrubrique,commeadressedelapage;
On entend dire aussi quil faut viter les paramtres dynamiques dans lURL, que
Google napprcierait pas, car ils sont souvent utiliss pour passer des variables de
sessions. Cependant, il ny a aucun problme allant contre ces URL. Elles sont bien
prisesencompteparGooglemmesicenestpaslameilleuredessolutions.
le nombre de paramtres figurantdans ladresse doit tre le plus petitpossible (il est
conseilldenepasdpasser3paramtres);
les balises META (Titre, description) doivent tre rendues variables en fonction de
chaque article;dans lecascontraire,lesmoteurs derecherchepourraientconsidrer
toutes les pages gnres comme tant trop similaires et en consquence nen
conserverquune.
LescontraintesquimposelutilisationdunCMSpeuventalorstretransformesenavantages,
commeparexemplelaugmentationdelavarianceducontenudesarticles.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page33
URL STABLES, SIGNIFIANTES
ET UNIQUES
Audel mmedelaproblmatiquederfrencement,lastabilitdesURLsestunprincipede
baseduweb,maisunprincipequecertainsoutilsnerespectentpas.
A une URL doit correspondre une page donne de contenu. La mme URL utilise le
lendemain doit fournir la mme page.
Loutil de CMS, oulapplication servantles pages,ne doit pasinsrer dans lURLdes donnes
techniques variables qui ne sontpaspertinentes pourrfrencerlapageconcerne:nijeton
desession,niinformationdecontexte.
A linverse, le CMS ne doit pas non plus utiliser dinformation de contexte implicite (i.e. ne
figurantpas danslURL)pourdterminerlapageprsenter.
Une autre exigencesimple satisfaireparle CMS estquildoitpermettrededfinir desURLs
signifiantes, cestdire intelligibles, du type: /www.monsite.com/societe/resultats.html et
non/www.monsite.com/cmstool?Id=1294.
Certains CMS sauront utiliser directement le titre de la page pour constituer lURL, dautres
permettront dindiquer soimme lURL dsire. Mais ceux qui nont que des URLs reprenant
des paramtres dynamiques sont carter si possible mme si ce nest pas bloquant pour
votresiteetsonpositionnementdanslesoutilsderecherche.
Une autre considration, moinsconnue, estla rciproque de laprcdente: une mme page
ne doit pas correspondre plusieurs URLs diffrentes. Car dans ce cas, Google flaire la
multiplication artificielle des pages. On a vu ainsi des sites qui utilisaient plusieurs noms de
domaine, par exemple www.monsite.com et www.monsite.fr, en servant les mmes pages
souslunetlautre.Cest une chose ne pas faire, il faut plutt mettre une instruction de 301
REDIRECT de lun vers lautre.
INTERDICTION DU DUPLICATE
CONTENT
Cestsrementlun despointsles plusimportants suivre toutau longdelavie de votre
portail:NEPASDUPLIQUERVOTRECONTENU!(maisaussilestitles,descriptions)
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page34
Google et les autres outils de recherche font une chasse impitoyable au contenu dupliqu.
Surtout depuis lanne 2011 et la publication de la srie dalgorithmes nomms PANDA chez
Google.CestunenjeuconsidrablelorsquelonindexedesmilliardsdURLmaisquelondoit
faire le tri entre ce qui est pertinent et le spam. Les internautes attendent des rsultats
pertinentsenquelquessecondes,etvousnavezque10rsultatsenpremirepage
Les outils de recherche n'indexent donc pas toutes les URL qu'ils trouvent, tout simplement
parce que beaucoup de contenus nont aucun intrt ou sont dtects comme contenu dj
existant(dupliqu).
Lesoutilsderecherchepeuventdciderdeplusieurspnalitslorsquilsdtectentducontenu
dupliqu.Selonlagravitdelerreurouduspamralis,lasanctionpourraittre:
Lepire:tredsindex(disparaitre)desrsultatsderecherche
Etremoinssouventcrawlvosmisesjourneserontpasdtectesrapidement.
Perdre des positions dans les rsultats et tre plac dans un index secondaire plus
rarementinterrogetdoncplusrarementconsultparlesinternautes.
Danstouslescas,vousrisquezdoncdtremoinsvisiblesurInternet
Surquoilesoutilsderecherchesebasentilspourdciderduncontenudupliqu?Etavecquoi
comparentilscesrsultats?
UnmmecontenusurplusieursURLdiffrentes.
Comparaisons des contenus dupliqus avec la popularit de la page et lautorit du
site.Quiauraitcopiqui?
Un contenuidentique, ok. Mais est ce quil existe la prsence d'un lien vers la
source(citation)?
La date de publication des contenus, la source la plus rcente est forcment celle en
quilesoutilsderechercheaurontleplusconfiance.
Ladatedelapremireindexation,ladatedepublicationtantaismentfalsifiable,les
outilsderecherchevrifientdepuisquandcecontenuestprsentdansleurindex.
La rgle est simple : une page web = un contenu unique = une seule URL
Pourvousassurercontrelecontenudupliqu,voiciquelquesconseilssuivre.Toutdabordles
erreurslesplusfrquentesentermesdeSEO:
Contenuaccessibleavecetsanswww.Attentionvosredirections301
Des liens internes diffrents vers un mme contenu (attention vos fiches produits
prsentesdansplusieurscatgories!)
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page35
Vos pages avec une faible qualit. Par exemple 2 fiches produits trs proches, et se
retrouvantavecdesdescriptionsidentiquesetaucuncontenudiffrentiant
Attention vos liens entrants contenant des paramtres (de tracking de campagnes
parexemple)
Utilisez vos fichiers robots.txt et sitemap.xml pour cacher les pages risques (peude
qualit) et surtout celles que vous ne voulez pas voir indexes (par exemple votre
backoffice).
Miseenplaced'unmetarobotnoindexsurcespagesoudattributnofollowsur
lesliens
SuppressionssystmatiquesdevosURLprimes(404)ouindexesparerreur.Loutil
GoogleWebmasterToolsvousaiderapourcela(maisdautresoutilsexistent).
Bien sr,la cause du contenu dupliqu nestpas toujours interne, ellepeuttre externe avec
des voleurs de contenu . Ces contenus externes dupliqus pourraient aussi vous pnaliser
mme sivous avez commeavantage lanciennet deleurmiseenligne.Maispourvitertout
problme, il est ncessaire de vrifier de temps en temps si vos contenus ne seraient pas
prsentssurdautressitesweb.
Mais surtout ninterdisez pas vos visiteurs de se servir du clic droit en pensant par cela,
empcher la fonction du copier/coller. La seule consquence cela sera de perdre vos
visiteurs,maispasdempcherleplagiatventuel.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page36
NOTORIETE
BACKLINKS
Lagestiondesliensentrantsversvotrecontenuseraunpoint cl de votre positionnement.En
effet, depuis les dbuts du rfrencement naturel, ce point est tout particulirement pris en
compteparlesoutilsderecherche.Cestsrementletravailquivouspermettradercolterle
plusdersultats,maisquivousprendraaussileplusdetemps.
Obtenirdenouveauxlienspointantverssonsitewebconsisteaugmenterartificiellementsa
popularit. Google n'apprcie pas spcialement ce type d'activit, comme tout ce qui est
artificiel...commetoutcequis'loignedunaturel...
Cette gestion des backlinks doit tre continue. Les outils de recherche prenant en compte
lanciennet des liens, si votre travail date de quelques mois voir annes, il perdra de son
influence. Surtout depuis les dernires mises jour de Google qui donnent beaucoup
dimportanceaucontenurcent.
Ces backlinks doivent comporter des mots cls pertinents lis votre activit et au contenu
prsent.Parexemple(lorsquecestpossibledelengocier),prfrezunlienavecuntextede
ce type: Le leader de la vente du produit X (ainsi quavec la balise ALT remplie que lon
appelleaussiancre)pluttquuniquement:Cliquezici.
Ne crez pas trop de backlinks en mme temps.En effet,si lesoutils de recherche dtectent
unevaguedeliensversvotresitetropimportantesurunlapsdetempstrscourt,alorsquela
moyenne est trs basse dhabitude, ils pourraient en dduire une tentative de spam. Etalez
votrestratgiedansletempsafindviterceproblme.Mmesicettemassedeliensentrants
peutaussitreliuneactualitrepriselargementsurdautressites,ilfautresterprudent.
Lesstratgiesderseauxdesitessonttrspuissantesetprsententdenombreuxavantages:
Maitrisedevotreenvironnementetdessiteswebsources
Choixdesancrestextes(queltexterenvoieversvotrecontenu)
Prennit des supports, vous savez si un site va disparaitre, mais vous savez aussi si
vousdevezymodifiervoslienslorsdunerefonte.
Votrerseauautourdevousestunterrainidalpouravoirunnombredeliensentrantsassez
efficace.Cesticique vous devezcommencerle travailenngociantdes liens depuiscessites
web.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page37
Attention,iciaussiladuplicationdecontenuestfortementdconseille!Travaillezletexteli
vos liens. La notion de qualit est importante ici aussi. Le lien doit tre prsent sur un site
pertinent par rapport votre contenu, il doit luimme tre considr comme important par
Google(PageRank)
Lidal selon votre secteur tant de russir trouverdespossibilits de liens depuis des sites
dugouvernementouavecunnomdedomaineen.gov,.edu...Cessitesontunpoidsentermes
derfrencementnatureltrsimportant.
RAPPEL HISTORIQUE : LE
PAGERANK
En 1998, Larry Page et Sergey Brin, tudiants Stanford University, crent le moteur de
rechercheGooglesurlabasedelalgorithmequilsontmisaupoint:Page Rank(PR).
LeprincipeduPageRank,estlesuivant.Onconsidrequelorsquunepageduwebcontientun
lienversuneautrepage,celasignifiequelauteurdelapremireaccordaitunpeudevaleur
lauteur de la seconde puisquil jugeait pertinent dy faire rfrence. Ainsi, si des milliers de
sites de lInternet contiennent des liens vers la page du site drupal.org consacre au CMS
Drupal,cestquecettepageaquelqueintrtauxyeuxdetousceuxquiyontfaitrfrence.
CestdonccelaquifaitquelesiteDrupal.orgarriveraenttedevotrerecherche:desmilliers
de sites y font rfrence tandis quune plus petite partie ferait rfrence une page du site
Smiletraitantdummesujet,alorsqueSmileaaussisapartdepertinencesurcetterecherche.
Demanireplusprcisedonc:
Linternet, la toile , constitue un immense rseau de pages, relies entre elles par
deslienshypertexte.
Chaque page P
1
qui contient un lien hypertextevers une page P apporte une voix,un
vote,enfaveurdecettepage.
Chaquepagerpartit sesvotesentretouteslespagesverslesquellesellepointe.Siune
page porte 10 liens vers 10 autres pages, alors chacun de ces liens napporte quun
diximeduvotedelapage.
Lesvotes dune page sontpondrsparlePage Rankde cettepage.Unliendepuisle
sitewww.cnn.com(PR9)versvotresiteluiapportebeaucoupplusquunliendepuisle
sitelalentillevertedupuy.com(PR3).
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page38
Revenonssur cedernierpoint.LesPage Rank de Google sontrestitussurune chelle de0
10. Mais ce PR affich est une reprsentation logarithmique du PR calcul. La base du
logarithme nest pas connue, et varie dans le temps, puisque cest par dfinition celle qui
permetlapagelaplusrfrencedtrelavaleur10.Imaginonsquelelogarithmesoiten
base10.CelasignifiequunlienvenantdunepagenotePR5 vautautantque10liensvenant
dunepagePR4,etautantque100liensdepagesPR3.
Uneautremaniredexprimercelaestquilfaudrait10
10
liensdepagessansvaleur(PR0)pour
apporter autantquun seulliendepuislapagedaccueildusiteW3C(lundesquelqueshappy
fewquiavaientdespagesPR10).
Ilfautsavoirque toutecettemcanique porte surdespagesetnondessites.Cenestpasun
site dans sa globalit qui est plus ou moins bien not, cest chacune de ses pages. Il peut y
avoiruneimportantedisparitdenotesentrelespagesdunmmesite.
Il faut comprendre galement que les liens internes un site sont pris en compte, au mme
titre que les liens externes. Cela tant, les mcanismes de pondration et de rpartition des
votes font que les liens internes ne peuvent seuls remonter la notation dun site dans son
ensembleoutrspeu.Enrevanche,ilsontpoureffetsoitdeconcentrerlanotesurcertaines
pages, soit au contraire de rpartir la note. Schmatiquement, un site comportant beaucoup
de liens internes aura tendance propager et moyenner ses notes vers lensemble de ses
pages.
UN CRITERE DE PLUS EN PLUS
DIFFICILE A TROMPER
Lundeseffetsdecettevaluationparvote(onpeutestimerquunbacklinkestunvotepositif
pourvotresite)estquelleestdeplusenplusdifficiletromper.Certesilesttoujourspossible
de crer des tas de pages qui pointeront vers votre site, mais Google (suite sa mise jour
nomme PANDA) fait une chasse impitoyable ce genre de liens estims tre du spam.
Noublions pas que la crationde liens pour amliorer lepositionnementde sonsite Internet
estformellementinterditparGoogle.Mmeentresitesdummegroupe.
Cettevoiedetricherieresteouverteparrapportauxalgorithmesdevote:enconstruisantdes
dizaines de milliers de pages pointant vers votre accueil, vous apportez effectivement autant
de microvotes, qui finissent par peser. Ctait la technique utilise par la plupart des
comparateurs de prix et ses semblables, qui bien souvent polluent les rsultats de vos
recherches en multipliant les noms de domaines pour le mme contenu et les liens croiss
entreeux.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page39
LamiseajourPANDAestprincipalementdestineacegenredesitesweb,maisnesoyonspas
naf,destinaussiprotgerlespropresoutilsdecomparaisondeGoogle.
LE PARTAGE, NOUVEL
ELDORADO
Une traduction simple de lalgorithme PageRank est quil est bon que dautres sites pointent
vers votre site, cestdire contiennent un ou plusieurs liens hypertexte en direction de vos
pages.Etceladautantplusquecessitessonteuxmmesconnus.
Encore une fois, avant dessayer de tromper ce mcanisme en construisant des liens
trompeurs, il est largement prfrable dessayer de jouer le jeu, et dobtenir de vrais liens,
partantdevraissites.
Si le contenu de votre site est intressant et que vousfaites leffortde le partagerautourde
vous,alorsvousverrezquelesliensviendronttousseuls,cardautrestrouverontopportunde
faire rfrence votre site. Si votre site contient un contenu unique sur lhistoire du stylo
bille,alorstouslessitesvoquantcesujetvoudrontfairerfrencecettepage.
Ensuite, vous pouvez bien sr demander vos partenaires de tous ordres de bien vouloir
placer des liens vers votre site. Si vous commercialisez des produits, alors ce pourra tre les
sitesdevosdistributeurs.
Si votre entreprise appartient un groupe, alors il est intressant que les sites du groupe
placent des liens croiss vers les autres sites du groupe. Ce nest pas une faon naturelle de
gnrerdubacklinkbiensr,maiscelaseraitdommagedenepasseservirdecettebasepour
crerdulienentrantversvotrecontenu.Surtoutquelessitesdevotregroupesontpertinents
pourvousciter.
Lalimitedecettetechniqueestdanslenombre:tropdeliensdiluelapportdechacun.Aussi
l encore la qualit prime sur la quantit: privilgiez ceux avec vos partenaires et/ou des
acteurspertinentsdevotredomaine.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page40
Depuisquelquestemps,nousvoyonsapparaitreunnouveautypedepartage,
le social. Cest particulirement vrai depuis le dbut de lanne 2012 avec
lapparition de loption de recherche sociale chez Google. Ce nouveau type
de rsultats de recherche appele Search, + your world. Littralement,
la recherche, + votre monde a pour objectif de vous proposer les
contenus partags par vos contacts sur Google+ lis votre recherche. De nombreuses
critiquesontsuiviescettemiseenligne(uniquementauxUSpourlemoment),eneffet,estce
que vos contacts sont les plus pertinents pour vous proposer des contenus en relation avec
votrerecherche?
Cette nouvelle option a aussi pour but de mettre en avant et dimposer le rseau social de
Google, en concurrence avec Facebook ou Twitter. Do les nombreuses critiques actuelles
puisqueGooglenesebasequesursonproprerseau.
Cependant, lapparition de ce type doption doit vous faire prendre conscience quune
stratgie de partage de vos contenus (et danimation) sur les rseaux sociaux devient
indispensable.
Nouvelle prsentation des rsultats par Google.com (Search+ your world). En rouge, les
rsultats par vos contacts compars au nombre de rsultat global. En jaune, les images lies
votre compte Google+ et vos cercles (contacts). En vert, loption active ou dsactive.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page41
LADEMARCHE
LAVRAIEPERTINENCE
Lune des premires choses retenir pour un bon rfrencement est la suivante: avant
dessayerdetromperlemoteur,essayezdelesatisfaire.Considrezunpeulerfrencement
comme de la sduction: avant dessayer davoir lair subtil, spirituel et attentionn, soyezle
vraiment!
Ce sera peuttre la meilleure des recettes, et cela pour deux raisons: la premire, cestque
vous obtiendrez un bon rfrencement sans faire des choses compliques ou tordues, et la
seconde cest que vos visiteurs en profiteront directement puisquils trouveront des
informationspluspertinentessurvotresite.
Faciledire?Certes,maispasimpossiblefaire.Lavraierecettetientenpeudemots:placez
survotresitedelinformationintressanteetabondantetraitantdesthmescorrespondant
lindexationsouhaite.Votresitevenddesfournituresdebureau?Etbientrouvezdeschoses
intelligentes dire sur les fournitures de bureau. Vous devez en tre capables, cest votre
mtier aprs tout, les fournitures!Citez des marques,desmodles,des catgories,lhistoire
dustylotraverslesges,lesqualitsdepapier,toutestbon.Attention,pasdeslistesdemots
placsctecte:non,ducontenu,duvrai,nonseulementintelligible,maismmeintelligent
sipossible.
Ensuite,organiseztoutcelaensections,soussections,ajoutezdesliensinternesdenavigation,
etvoil.Sansmmetricher,vousavezfaitlamoitidutravail,etvotrerfrencementestdj
assezbon.Alorsimaginezenoptimisantunpeu!
Ilvautparfoismieuxpayerquelquuncrerducontenuintelligentpourvotresitequepayer
quelquunfairecroirequececontenuestintelligent.
QUELSMOTSPOURARRIVER
AMONSITE?
Cest toujours lune des premires questions se poser: pour quelsensembles de mots cls
estcequejesouhaitetrebienpositionn? Sijaideschosesvendre,alorsquerecherchent
mesclients?Etplusprcisment,commentmesclientsexprimerontilsleurrecherche?
Cest la premire question quil faut se poser, et il faut se la poser avant de commencer
crire pour son site: Comment mes visiteurs exprimerontils leur recherche? Quels mots
utiliserontils?
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page42
Commeonlavu,lesinternautessaventdeplusenplusquilleurfautciblerleurrechercheen
combinant plusieurs mots. Cest donc aussi pour diffrents groupes de mots quil conviendra
dapparatreenbonneplace.
Lepremierexerciceestdoncdelistercesmotsetgroupesdemotsparcrit,loccasiondune
sancederflexiondetypebrainstorming.
Ensuite, on sassurera que ces mots sont bien prsents dans vos pages. Il arrive couramment
que rdaction et rfrencement soient deux processus disjoints: on essaye a posteriori
dassocier des motscls des articles dj crits. Mais il est largement prfrable que les
textesdusiteutilisenteffectivementlesensemblesdemotschoisis.
Attentiongalementauxsynonymesouvariantes.DanslecasdusiteduCNLL(ConseilNational
du Logiciel Libre) par exemple, les visiteurs peuvent saisir opensource ou bien open
source ou encore logiciel libre, et dautres quivalents encore. Il est difficile dutiliser
systmatiquementtouscesmotsdansunarticle,etlesoucidunstyleclairamneraitplutt
choisir une formulation unique. Mais pour la qualit du rfrencement, il pourra tre
prfrableaucontrairedevarierlesexpressions.Varierlesexpressionsdessein,certes,mais
toutenvitantlesvariantesdepurstyle,quiaucontrairepollueraientlaperception.
Soyonsclairstoutefois:silevocabulaire,pour les thmes fondamentaux,doittretudiavec
soin,ilnesagitsurtoutpasdcrire pour le rfrencement,cestdiredefairedesphrasesqui
nauraientpasdautrefinalitquelerfrencement.Ellesgneraientlelecteur,sansapporter
le bnfice attendu. La notion de qualit doit rester lune des plus importantes lors de la
construction de votre contenu. En effet, un contenu de qualit sera partag et donc mieux
rfrenc!
QUELSMOTS
RECHERCHAIENTMES
VISITEURS?
La rflexion amont, voque ciavant, doit tre valide par une analyse en aval: quels mots
avaientsaisimesvisiteurslorsquilssontparvenussurmonsiteparunmoteurderecherche?
Les outils de suivi daudience tels que Google Analytics, Analyser (AT Internet, anciennement
XiTi)permettentdeconnatrelesmotsclsquavaientsaisilesvisiteursdevotresite,sicest
au moyen dun tel moteur que linternaute est arriv. En effet, les motscls recherchs sont
inscritsdanslURLappelante,oureferer.
Il est important de consulter rgulirement cette liste des motscls ayant conduit votre
site,pratiquementdanstoutesontendue.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page43
Cestcequipermettradevalideroudajusterlesmotsquevousmmevousutilisezpourvotre
rfrencement.Peuttrequevosvisiteursavaientunemaniredeformulerleurrecherchequi
ntaitpas ce quoi vous vousattendiez.Peuttre aussiquecertainsvisiteurs parviennent
votresiteparerreur,avecdesmotsclsquinecorrespondentpaslafinalitdevotresite.A
moins que vous ne recherchiez laudience tout prix, ces erreurs de routages impliqueront
galementunrajustementdesmotsutilisspourlerfrencement.
Lesmmesoutils,desuividaudience,vousdonnerontuneautreinformationessentielle:la
part de vos visiteurs qui sont arrivs sur votre site par lintermdiaire dun moteur de
recherche.Ilestessentieldelaconnatreetdelasuivre.
Si votre site connat une chute daudience par exemple, estce d un problme dans son
rfrencementouuneautresourcedevisites?Ilestfondamentaldepouvoirrpondrecette
question. Bien dautres facteurs peuventtre considrs: un site concurrentdraine dutrafic,
un problme enhbergementa ralentivotresite etfaitfuirdesvisiteurs,unsitepartenairea
retir un lien qui amenait des visiteurs, ou tout simplement lintrt de vos informations a
baiss.
Attention aussi cette notion de mots cls saisis par les internautes. Google cache cette
information pour ses inscrits connects leur compte depuis mars 2012 (https). C'estdire
que lorsque vous serez connect votre compteGoogle,votrenavigationserachiffre.Etles
sites web que vous visiterez via une recherche sur son moteur web ne pourront plus
enregistrerquellerecherchevousavezfaitepourarriverchezeux.
Ce qui va faire apparaitre une nouvelle donne dans vos listesde mots cls, cette ligne
sappellera par exemple sur Google Analytics : not provided. Elle est dailleurs dj
prsentedansvosrsultatsaujourdhui,maisdansunepetiteproportion(environ8%constat
surcertainssites).
Celaimpliquedoncquunepartiedevotreanalysedetraficneseraplusexploitablepourvotre
stratgieSEO.
Google estime 15/20% de trafic cach dans lavenir sur vos statistiques. Mais cest une
donneimportantesuivredanslesmoisvenir.
QUELSLIENSPOINTENTVERS
MONSITE?
On a vu toute limportance des liens entrants vers votre site, surtout en provenance de sites
euxmmes forte notorit. Il est donc bien sr intressant de connatre ces liens que
dautresontdfinisversvospages.
Il existe une fonction de Google qui rpondra cette question: il suffit de saisir dans la
commandederecherche:
Link : www.monsite.com
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page44
EtGooglelisteralespages,dontilaconnaissance,rfrenantvotresite.
Cependantnousvousconseillonspluttdepasserdesoutilsenlignecommeahrefs.comou
majesticseo.com par exemple qui vous donneront normment dinformations sur vos liens
entrants. En effet, non seulement Google ne vous donne pas dinformations qualitatives
proposdecesliens,maiscenestplusunecommandedeconfianceaujourdhui.
LEVOLUMECOMPTE
Lenombredepagesdunsiteest,ensoi,unfacteurdebonrfrencement.
Onacoutumedeprivilgierlaqualitsurlaquantit,etilestclairquepourunvisiteur,ilserait
prfrable davoir 20 pages synthtiques et pertinentes plutt que 200 pages dilues et
redondantes.
Le service du visiteur et les besoins du rfrencement seraientils, pour une fois,
contradictoires? Pas vraiment: il suffit de mettre en lignes 200 pagestoutessynthtiques et
pertinentes!
Non,cenestpassisimplebiensr.Maisretenonsjusteceprincipe:levolumecompte.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page45
Pour les sites qui prsentent, au moyen dapplications spcifiques, des contenus issus dune
base de donnes, par exemple des petites annonces demploi ou dimmobilier, ou bien des
produits issus dun catalogue, il y a une consquence toute simple: la totalit des pages de
contenusdoittrerfrence.Cestdirequilfautfaireensortedamnageruncheminpour
lecrawlerquimneverschacunedespagesdedtail.
Lorsquon est un site dannonce tel que Cadremploi.fr par exemple, avec 15000 offres
demploi en base de donnes, donner accs ces 15000 pages de contenus pertinents pour
lindexation, par rapport aux quelques centaines de pages de contenus ditoriaux, peut faire
unenormediffrence.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page46
LESRUSES
DESRESEAUXDEPAGES
CREUSES
Le summum du dtournement de pertinence est peut tre atteint avec un site de type
comparateur en ligne, qui fabrique des milliers de pages vides de sens, correspondant aux
pairesdemotsclsrecherchesparlesvisiteurs.Ilsuffitquuninternautetapevoltourisme
Italie pour que le site fabrique une page vol_tourisme_Italie.html. Cette page contient le
rsultatdunerecherchesurcesmotscls,cestdireuncontenuquisemblepertinent,mais
na en fait aucune valeur ajoute vraie. Les comparateurs de prix, comme Twenga et ses
semblables procdent de manire identique: quels que soient les mots, ils ont toujours des
pagesmettreenface.Ainsi,lesitesoumetGoogledesmilliersdepagesvides,dontleseul
contenuestluimme issudune recherche, peuttre surGoogle soimme! Aquoi serttout
ce vide? Sans doute crer de laudience en se servant outrance de la longue trane
5
,
puisque ce type de pages a provisoirement russi tromper le moteur de pertinence de
Google,etsortentdoncfrquemmentenhautdeclassement.Etunpeudaudience,permetun
peu de pub et de juteux bnfices. Mais mme les publicitaires devraient se mfier de telles
pratiques,quiassocientleursmarquesunetromperie.
La technique est donc clairement dconseiller: la fois trs lourde mettre en place, et
assez risque. Surtoutdepuislanne 2011 et lapublication de lalgorithmePanda,justement
faitpourtraquercegenredersultats.
Sanscompterque fabriquer une tellepollution grande chelle surlewebestprofondment
incivique.
LESPAGESSPECIALES
MOTEUR
Comme on la dit, les robots indexeurs sont bien levs: dune part ils respectent les
instructionsdufichierrobots.txtetdautrepart,ilsnecherchentpassefairepasserpourun
internautequelconque,ilssidentifientclairement,aumoyenduparamtreuseragentquiest
dfinidanschacunedesrequteshttp.
5
Longuetrane:faitrfrenceauxmotsclsquiattirentsparmentpeudevisiteurssurunsiteInternet.Lecumul
decesmotsclsfaibletraficpeutalorsreprsenterunepartnonngligeabledutrafictotald'unsite.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page47
Useragent permet gnralement didentifier le navigateur, et certains sites lutilisent pour
adresserdespagesdiffrentesselonlespossibilitsdunavigateurcible.
Ainsi, le robot Google sidentifie en indiquant useragent=googlebot dans chacune de ses
requtes.
IlestdoncpossibledutiliserceparamtrepourservirGoogledespagesspciales,diffrentes
decellesquiserontserviesauxinternautes.
Cette technique a t beaucoup utilise aux dbuts du rfrencement, pour servir chaque
moteur dindexation des pages correspondant ses caractristiques. Yahoo aimait les
keywords, on lui en donnait, Altavista voulait des <H1> mais ne supportait pas le
bourragedekeywords,onluidonnaitsatisfactionaussi.
Cest une technique complexe, qui demande un travail considrable, pour des rsultats
aujourdhuiassezfaibles.
Cependant elle a encore ses adeptes aujourdhui, spcialement pour la suroptimisation des
pagessatellites.Pourvoirunexemple,tapezparexemplelouerappartementsurGoogle,et
regardez les premiers rsultats. Dont celuici: http://www.acheter
louer.fr/location_appartement.html
Commevouspouvezlevoir,lemotclrecherchestprsentdanslURLmaisaussipartoutsur
lapage.Souslaformedeliens,dumotclengras,dimages
Cettetechniquedepagessatellitesfonctionneencoredonctrsbien.Cependant,cesiteatout
demmefaitleschosesbienenintgrantdevraiesannoncesdanscespagesquipeuventtre
dfiniescommedespagesdersultatsderecherchesinternesausite.Maiscelaredirigeaussi
versuntripar arrondissement,etc.Un maillageinterne quisemble efficaceau vu de saplace
surGoogle.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page48
LAPUNITIONDES
FRAUDEURS
On la dit, le rfrencement est une guerre sans merci. Mais dans cette guerre, les moteurs
disposentde larme atomique etpasvous: ledrfrencementou blacklisting.Sile moteur
de recherche dcle une tentative de tricherie, il peut blacklister le site dans son ensemble,
cestdire que plus aucune recherche ne restituera des pages de ce site, pas mme en
1000
me
position.LesitenexistepluspourGoogle.
Cestune punitionsvre,qui peut durer plusieurs mois. Et comme toutcelaestrgipardes
algorithmes,sansintervention humaine, il esttrs difficiledallersupplier unretour engrce.
Le cas nest pasthorique etnombre de prestatairesen rfrencementun peu trop inventifs
sy sont dj brl les doigts. BMW, Castorama, Ricoh, ou bien mme Netbooster, en savent
quelquechose.
Bien que depuis quelques temps il semble que Google ne supprime plus les sites qui
trichent de son index,maisdvalue simplementleur PR,celareste une raison suffisante pour
nepasessayerdesyrisquer.
Maiscommenouslavonssoulignplushaut,laprincipaleraisonestailleurs:viserunmeilleur
rfrencement sans tricher, cest aussi mieux servir vos visiteurs, en leur offrant une vraie
pertinencedescontenus.
Rfrencement
Ce quil faut savoir
ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation
Page49
ENCONCLUSION
Aprsplusieursannesdexpriencedesacteursdecedomaine,etlobservationdelvolution
desmoteurs,ilapparatquelaqualitdufond(richessedecontenu,pertinence,organisation,
spcialisationdes pages)et delaforme(simplicit, respect des normes, applicationdergles
simplesdorganisationducontenu)restentlesvaleurssres:unsitebienpens,bienralis,
et bien suivi, devrait dans la grande majorit des cas obtenir et conserver un bon
positionnement.
Duct desmoteurs,lhgmoniedeGoogleapermisdestimulerlewebpourenaugmenter
la qualit. Linternaute doit toutefois rester vigilant et critique carcelapourraitentranerdes
drivesetexcs,etaprstout,lesrsultatsdunerechercheneconstituentquunseulpointde
vue.
Ensomme,quelonsoitductdeswebmastersouductdesinternautes,leplussrestde
conserversonbonsens.
Sivousavezdesbesoinsenrfrencement,vouspouvezcontacterSmileDigital,l'agence
numriquedeSmile,spcialisteenstratgieonline,SEO,conceptiongraphiqueet
ergonomique...ladresse:contact@smile.fr

Vous aimerez peut-être aussi