dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation Page 2 PREAMBULE SMILE Smile est une socit dingnieurs experts dans la mise en uvre de solutions open source et lintgration de systmes appuys sur lopen source. Smile est membre de lAPRIL, lassociation pour la promotion et la dfense du logiciel libre, du PLOSS le rseau des entreprises du Logiciel Libre en IledeFrance et du CNLL le conseil national du logiciel libre. Smile compte plus de 600 collaborateurs dans le monde, dont prs de 500 en France (janvier 2012), ce qui en fait le premier intgrateur franais et europen de solutions open source. Depuis 2000, environ, Smile mne une action active de veille technologique qui lui permet de dcouvrir les produits les plus prometteurs de lopen source, de les qualifier et de les valuer, de manire proposer ses clients les produits les plus aboutis, les plus robustes et les plus prennes. Cette dmarche a donn lieu toute une gamme de livres blancs couvrant diffrents domaines dapplication. La gestion de contenus (2004), les portails (2005), la business intelligence (2006), la virtualisation (2007), la gestion lectronique de documents (2008), les PGIs/ERPs (2008), les VPN open source (2009), les Firewall et Contrle de flux (2009), les Middleware orients messages (2009), lecommerce et les Rseaux Sociaux d'Entreprise (2010) et plus rcemment, le Guide de lopen source et NoSQL (2011). Chacun de ces ouvrages prsente une slection des meilleures solutions open source dans le domaine considr, leurs qualits respectives, ainsi que des retours dexprience oprationnels. Au fur et mesure que des solutions open source solides gagnent de nouveaux domaines, Smile sera prsent pour proposer ses clients den bnficier sans risque. Smile apparat dans le paysage informatique franais comme le prestataire intgrateur de choix pour accompagner les plus grandes entreprises dans ladoption des meilleures solutions open source. Ces dernires annes, Smile a galement tendu la gamme des services proposs. Depuis 2005, un dpartement consulting accompagne nos clients, tant dans les phases davant projet, en recherche de solutions, quen accompagnement de projet. Depuis 2000, Smile dispose dun studio graphique, devenu en 2007 Smile Digital agence interactive, proposant outre la cration graphique, une expertise emarketing, rfrencement, ditoriale, et interfaces riches. Smile dispose aussi dune agence spcialise dans la TMA (support et lexploitation des applications) et dun centre de formation complet, Smile Training. Enfin, Smile est implant Paris, Lille, Lyon, Grenoble, Nantes, Bordeaux, Marseille, et Montpellier. Et prsent galement en Espagne, en Suisse, au Benelux, en Ukraine et au Maroc. Rfrencement Ce quil faut savoir dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation Page 3 QUELQUES REFERENCES DE SMILE SMILE est fier davoir contribu, au fil des annes, aux plus grandes ralisations Web franaises et europennes. Vous trouvez cidessous quelques clients nous ayant adress leur confiance. Sites Internet EMI Music, Salon de lAgriculture, Mazars, Areva, Socit Gnrale, Gtes de France, Patrice Pichet, Groupama, EcoEmballage, CFnews, CEA, Prisma Pub, Volia, NRJ, JCDecaux, 01 Informatique, Spie, PSA, Boiron, Larousse, Dassault Systmes, Action Contre la Faim, BNP Paribas, Air Pays de Loire, Forum des Images, IFP, BHV, ZeMedical, Gallimard, Cheval Mag, Afssaps, Beneteau, Carrefour, AG2R La Mondiale, Groupe Bayard, Association de la Prvention Routire, Secours Catholique, Canson, Bouygues Telecom, CNIL Portails, Intranets et Systmes dInformation HEC, Bouygues Telecom, Prisma, Veolia, Arjowiggins, INA, Primagaz, Croix Rouge, Eurosport, Invivo, Faceo, Chteau de Versailles, Eurosport, Ipsos, VSC Technologies, Sanef, Explorimmo, Bureau Veritas, Rgion Centre, Dassault Systmes, Fondation dAuteuil, INRA, Gaz Electricit de Grenoble, Ville de Niort, Ministre de la Culture, PagesJaunes Annonces ECommerce Krys, La Halle, Gibert Joseph, De Dietrich, Adenclassifieds, Macif, Furet du Nord, Gtes de France, Camif Collectivit, GPdis, Projectif, ETS, Bain & Spa, Yves Rocher, Bouygues Immobilier, Nestl, Stanhome, AVF Primdical, CCI, Pompiers de France, Commissariat lEnergie Atomique, Snowleader, Darjeeling ERP et Dcisionnel Veolia, La Poste, Christian Louboutin, Eveha, SunR, Home Cin Solutions, Pub Audit, Effia, France 24, Publicis, iCasque, Nomadvantage, Gets, Nouvelles Frontires, Anevia, Jus de Fruits de Moora, Espace Loggia, Bureau Veritas, Skyrock, Lafarge, Cadremploi, Meilleurmobile.com, Groupe Vinci, IEDOM (Banque de France), Carrefour, Jardiland, Trsorerie Gnrale du Maroc, Ville de Genve, ESCP, Sofia, Faiveley Transport, INRA, Deloitte, Yves Rocher, ETS, DGAC, Generalitat de Catalunya, Gilbert Joseph, Perouse Mdical Rfrencement Ce quil faut savoir dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation Page 4 Gestion documentaire Primagaz, UCFF, Apave, Goservices, Renault F1 Team, INRIA, CIDJ, SNCD, Ecureuil Gestion, Rgion Centre, Serimax, Volia Propret, NetasQ, Generali, Bureau Veritas, Alstom Power Services, Mazars, SNCF, HEC Infrastructure et Hbergement Agence Nationale pour les Chques Vacances, Pierre Audoin Consultants, Rexel, Motor Presse, OSEO, Sport24, EcoEmballage, Institut Mutualiste Montsouris, ETS, Ionis, Osmoz, SIDEL, Atel Hotels, Cadremploi, SETRAG, Institut Franais du Ptrole, Mutualit Franaise, Ministre de lcologie et du dveloppement durable Consulter nos rfrences, en ligne, ladresse : http://www.smile.fr/clients. Rfrencement Ce quil faut savoir dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation Page 5 CE LIVRE BLANC Cest dessein que ce livre blanc ne sintitule pas Rfrencement secrets dexperts : son but est bien de prsenter les principes fondamentaux du rfrencement, tant du point de vue des techniques sousjacentes que des dmarches visant loptimiser. Avant de faire appel un prestataire spcialis dans loptimisation du rfrencement naturel (on parlera de SEO tout au long de ce document), il conviendrait que chaque responsable de site connaisse ce minimum que nous prsentons ici. Il y a beaucoup dides fausses concernant le SEO. Par exemple, quil suffit de payer un bon prestataire pour que vos sites/portails soient automatiquement dans les premires pages de Google, ou qu'il suffit de travailler son SEO pendant le lancement de son site puis de ne plus rien toucher dans les mois/annes qui suivent. Un accompagnement SEO est un ensemble dtapes respecter, avant la mise en ligne (ou refonte), pendant le travail de conception et obligatoirement aprs tout le travail de mise en place (suivi, optimisations). Tout cela afin que votre projet puisse rcolter le plus de visibilit possible, avec un trafic le plus qualifi possible. La premire chose que nous aimerions transmettre dans ce recueil est que le SEO nest pas une sorte de sorcellerie aux recettes cryptiques et mystrieuses, mais un processus tout fait raisonn, qui consiste plutt mettre en avant la pertinence relle de votre site plutt qu faire croire une pertinence quil naurait pas. Nhsitez pas nous transmettre votre avis ladresse : contact@smile.fr Rfrencement Ce quil faut savoir dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation Page 6 SOMMAIRE PREAMBULE................................................................................................ 2 SMILE ...................................................................................................................................................................2 QUELQUES REFERENCES DE SMILE ..............................................................................................................................3 CE LIVRE BLANC.......................................................................................................................................................5 SOMMAIRE ............................................................................................................................................................6 LES BASES ................................................................................................... 8 LE SERVICE AUX INTERNAUTES....................................................................................................................................8 LA DOMINATION DE GOOGLE...................................................................................................................................10 REFERENCEMENT POURQUOI ?................................................................................................................................10 UN JEU SANS FIN...................................................................................................................................................11 LA PYRAMIDE DU SEO............................................................................................................................................12 INDEXATION............................................................................................. 15 LE CRAWLER ........................................................................................................................................................15 LES LIMITES DU CRAWLER .......................................................................................................................................16 TENDEZ VERS UN DEVELOPPEMENT DE BONNE QUALITE.................................................................................................17 ATTENTION AUX LIENS CASSES .................................................................................................................................18 REDIRECTION 301.................................................................................................................................................18 LE FICHIER ROBOTS.TXT..........................................................................................................................................19 GOOGLE SITEMAP.XML..........................................................................................................................................20 PERTINENCE.............................................................................................. 22 LE POIDS DES MOTS ...............................................................................................................................................22 LES URLS............................................................................................................................................................24 TITRES ................................................................................................................................................................25 BALISES META.....................................................................................................................................................26 OPEN GRAPH PROTOCOL........................................................................................................................................27 MICROFORMATS ...................................................................................................................................................28 BALISAGE SEMANTIQUE..........................................................................................................................................29 TEXTE DES LIENS....................................................................................................................................................30 ET LES IMAGES ?...................................................................................................................................................31 LES OUTILS DE GESTION DE CONTENU .......................................................................................................................31 URL STABLES, SIGNIFIANTES ET UNIQUES ..................................................................................................................33 INTERDICTION DU DUPLICATE CONTENT .....................................................................................................................33 Rfrencement Ce quil faut savoir dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation Page 7 NOTORIETE............................................................................................... 36 BACKLINKS...........................................................................................................................................................36 RAPPEL HISTORIQUE : LE PAGERANK.........................................................................................................................37 UN CRITERE DE PLUS EN PLUS DIFFICILE A TROMPER......................................................................................................38 LE PARTAGE, NOUVEL ELDORADO .............................................................................................................................39 LA DEMARCHE .......................................................................................... 41 LA VRAIE PERTINENCE.............................................................................................................................................41 QUELS MOTS POUR ARRIVER A MON SITE ?.................................................................................................................41 QUELS MOTS RECHERCHAIENT MES VISITEURS ? ..........................................................................................................42 QUELS LIENS POINTENT VERS MON SITE ?...................................................................................................................43 LE VOLUME COMPTE..............................................................................................................................................44 LES RUSES ................................................................................................. 46 DES RESEAUX DE PAGES CREUSES..............................................................................................................................46 LES PAGES SPECIALES MOTEUR.................................................................................................................................46 LA PUNITION DES FRAUDEURS..................................................................................................................................48 EN CONCLUSION....................................................................................... 49 Rfrencement Ce quil faut savoir dition Mars 2012 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation Page 8 LES BASES LE SERVICE AUX INTERNAUTES Mettonsnous un peu la place dun outil de recherche. Son objectif est de servir ses visiteurs, en les aidants trouver rapidement linformation quils recherchent. Donc de prsenter les milliards de rsultats de recherche dans lordre de pertinence. Bien sr la notion de pertinence est trs subjective, et la tche du moteur est prcisment de quantifier cette pertinence dune manire qui corresponde le plus souvent aux attentes des internautes. Cette pertinence sest aujourdhui tendue. En effet, ce qui est prsent aux internautes n'est plus uniquement des rsultats affichant les meilleurs sites web , mais aussi des rsultats lis la fameuse recherche universelle 1 . Vous trouverez donc des rsultats de recherche (SERP 2 ) complmentaires comme des images, des vidos, des cartes (adresses), des produits, les rseaux sociaux, des liens sponsoriss... Par exemple, si vous tapez la requte SNOWBOARD dans un moteur de recherche, il vous proposera toutes sortes de rsultats en termes de contenus. En effet, sil existe des sites web pertinents sur cette requte, il existe aussi dautres types de contenus qui font peuttre partis de votre recherche initiale ? En tapant snowboard , cest peuttre le produit que vous cherchez plutt que des actualits sur le sport ? 1 Recherche universelle : les moteurs de recherche affichent de plus en plus au sein de leurs pages de rsultats des lments qui ne sont pas uniquement des pages Internet standard, mais galement des images, des vidos, plans et fils dactualit. 2 SERP : Search Engine Result Page. Ce qui signifie littralement : rsultats affichs par les moteurs de recherche. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page9 Ilyaquantitdesocitsetsiteswebquiproposentdevendredessnowboards,maisaussides blogs, des sites d'infos (produits ou plus gnralistes), la fdration de snowboard et tous ces sites doivent se distinguer parmi les 119 millions de rsultats (nous reviendrons plus loin surcettenotiondesommedesrsultats). Google a aussi tendu ses SERP en les personnalisant de plus en plus en se basant sur vos habitudes et vos contacts. Si vous tes connects votre compte Google, selon les liens partags par vos contacts ou vousmme via Google+ ou le bouton +1, vos rsultats seront srementdiffrentsde ceuxde votre voisin.EtcequiestvraiavecGoogle lestaussi avecles autresprincipauxoutilsderechercheactuels(Bing,Yahoodanslespaysoccidentaux,Baiduen Chine, Yandex en Russie). Mme si bien sr, chaque march ses spcificits et un rfrenceur doit prendre en compte les habitudes de recherche spcifiques des internautes locaux.Sanscompterquepourunmmeoutil,lesoptionsderechercheserontdiffrentesdun payslautre.Parexemple,lesfonctionnalitssurGooglenesontpaslesmmesenFranceet enSuisse(pasdeGoogle+1). LetravaildumoteurderechercheestdeparvenirdistinguerlaFdrationdesnowboardqui ne parle que de a et les pages ventuellement consacres au snowboard sur un site plus gnralistecommeskipass.com. Cetravaildoitobligatoirementtretotalementautomatis,puisquilportesurdesmilliardsde pages: il est hors de question quun intervenant humain passe 15 secondes valuer la pertinencedechaquepage. Enfin, la tche du moteur de recherche est rendue plus difficile encore par le fait que les gestionnaires de sites ont pour objectif avou de le tromperpour obtenir les meilleurs rsultats!Lemoteurveuttablirdemanireautomatiquelavraiepertinencedechaquepage, legestionnairedusiteveutfairecroirequesonsiteestpluspertinentquilnelestrellement. On adoncune vraie opposition, une guerre interminable, entre moteurset webmasters.Sile moteurselaissetromperparlessites,ilperdsacrdibilit.Illuifautdonctrouvertoujoursplus dalgorithmesquinepourronttreabussparleswebmasters. CelaafaitlarussitedeGoogle,maiscelaataussiunbnficepourlInternetengnral,en redonnantsaplacelavraiepertinence. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page10 LA DOMINATION DE GOOGLE Cen'estunsecretpourpersonne,GoogledominelargementsesconcurrentsenEuropedansle domainedelarecherchesurInternet. YahooetBing(Microsoft)taientlesprincipauxmoteurspouvanttitillerlegantdeMountain View, ils viennent pourtant de fusionner leurs rsultats de recherche (Yahoo intgre depuis aot2011 lesrsultatsdeBing).Etne parlonspasdes outilsfranaiscomme Exalead,Orange ouautres.IlssontanecdotiquesvisvisdeGooglemaisintressants.Cependant,ilfautgarder l'esprit que vous n'allez pas optimiser un site pour apparatre uniquement sur Google, les bonnespratiquesrespectertantsensiblementlesmmespourtouslesoutilsderecherche, vousallezaussivouspositionnersurcesautresoutils. Attention, cette domination n'est pas aussi forte partout dans le monde. Aux US, Bing reste une valeur sure,en Asie Google estlargementderrire des outilscomme Baidu(en Chine, ce moteurreprsente70%departdemarch).Mmeconstatdanslespaysdel'EstavecYandex par exemple. Votre stratgie SEO sera donc diffrente sur ces pays qui ont des rgles diffrentesd'indexation. REFERENCEMENT POURQUOI ? Lesinternautesaccdentunsitedetroismanires:(a)entapantdirectementlURLouenla slectionnant dans un signet (bookmark), (b) en suivant un lien depuis un autre site/blog/forum/rseauxsociaux,et(c)parunerecherchesurunoutilderecherche. Pourtrouverunsite quilsne connaissaientpasauparavant,seulesrestentlesvoies (b)et (c), etdiffrentestudesestimentquelemoteurderechercheestlamanireutilisedansplusde 80%descaspourdcouvrirunsitequelonneconnaissaitpas. Lorsquils utilisent un moteur de recherche, il est vident que les internautes ne peuvent parcourirplusdequelquespagesderponse,etquenconsquenceseulslessitesfigurantsur lespremirespagesserontvisites. 71,3% des franais seconnectentInternet(Fvrier2011) 9 sur 10 effectuentdesrecherches 90% d'entre eux utilisentGoogle Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page11 Il est donc dune importance primordiale de figurer en bonne place dans les rsultats de recherchessilonveutattirerdesvisiteursparcecanal.Toutlemondelesait,etcestlaraison pour laquelle leSEO estdevenu une spcialit partentire dans le monde destechnologies Internet. LesanglophonesappellentcetteactivitSearch Engine Optimization,cestdireoptimisation pour les moteurs de recherche. Ce qui est plus explicite finalement car il ne sagit pas dtre rfrenc naturellement, mais bien doptimiser au mieux le rfrencement de votre site en mettantenplacetoutunpaneldinterventions.Ilnyafinalementpasgrandchosedenaturel danscetteoptiquedoptimisation! Etantdonn lesmilliards de pagesindexes parun moteur derecherche,ilestnaturellement difficiledesprerfigurersurlapremirepagepourdesrechercheslarges,commeparexemple tlvision pour un vendeur de tlvisions. Les sites de marques les plus influents y sont prsents, et travaillent darrache pied pour rester sur cette page avec normment de visibilit.Pourlaplupartdessites,ilvautmieuxsefixerdesobjectifsmoinsambitieux,etviser un bon rang pour des recherches plus cibles, sur des couples ou des triplets de mots. Cette mthode a le mrite de cibler une audience plus qualifie et intresse par votre contenu. Attention, nous ne parlons pas ici de longue traine (nous expliquerons ce concept unpeu plus loin) mais bien de requtes prcises et stratgiques. Et la concurrence nest pas une excuse pour ne pas tenter de se positionner sur des mots cls trs concurrentiels, il faut cependantymettrelesmoyenspouresprerpouvoiryfigurer. De plus en plus, les internautes chevronns savent quune recherche trop vague ne sera pas utile,etilssaisissentdsledbutunepetitelistedemotscls.Ainsi,lesrecherchesportantsur 3motsseraientpassesde17%en200542%en2010(sourceAdOc)! UN JEU SANS FIN Figurerenpremirepageestunpeuunjeudedupe. Vos10principauxconcurrentsontpayuneagenceSEOdesmilliersdeuroschacunpourtre en premirepagesur quelquesrequtes donnesetils ysont.Vouspayezvousmmesvotre detvousvoilenpremirepage,jectantlundevosconcurrentsendeuximepage.Furieux, celuiciappellelagencechargedesonrfrencement,quiluirefactureunpeu,bricoleunpeu plussespages/backlinks 3 ,etleramnevictorieusementenpremirepage.Vousappelezvotre agence,dpensezencoreunpeudargent,etainsidesuite Lamliorationdurfrencementestcequonappelleunjeusommenulle.Plusprcisment, cestlasommedesgainsdepositionquiestnulle,paslessommesdpenses.Maisleretour sur investissement dun travail rigoureuxsur lerfrencementnaturelestencore aujourdhui imbattable. 3 Backlinks:liensexternesvotresiteweb,renvoyantversvotrecontenu. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page12 Et pour autant, personne ne peut se permettre dabandonner le combat. Chaque jour les positions changent, chaque jour vos concurrents optimisent leur contenu et leur stratgie. CestpourquoiunsuividansletempsrigoureuxdindicateursclslisauSEOestindispensable. Nousverronsplusloinquedesoutilsexistentpourcela. LA PYRAMIDE DU SEO La pyramide du SEO est rgulirement voque dans les interventions. Cette pyramide reprsentelesdiffrentestapesncessairesunbonrfrencementnaturel. Lobjectif:lerenforcementdevotrevisibilit. Nous partons dindicateurs onsite, c'estdire des leviers quil est possible dactiver directement sur les dveloppements. Pour arriver ensuite plus ou moins directement aux indicateurs offsite, soit les optimisations ncessaires en dehors du travail technique sur votrestratgieWeb. Labaseestbiensurlindexabilit,cestdirelacompatibilitaveclesmcanismesutiliss parle moteur pour parcourir etindexerlessites.Unebasetechniquepropreetrespectantla plupart des indicateurs vous assureradune indexationoptimale dans lesoutilsde recherche. Etterme,demeilleurespositions. Nous pouvons citerici lechoixdarborescenceet de structure devotre site, lesoptimisations On page, la gestion de vos liens internes, laccessibilit (multisupport, balisage smantique),laconfiancedansvotrecontenu(autoritdudomaine,historiquedescontenus) Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page13 Outrecettebasetechnique,ilvavousfalloirensuitetravaillervotrecontenu. Cestle nerf dela guerre,sanscontenu, rien indexerdanslesoutilsde recherche etaucune pertinencesurvotreuniversdemotscls. Que vous ayez un site corporate, dinformations ou de vente en ligne, votre objectif devra resterlemme:produireducontenu! En effet, les outils de recherche et Google en tte naiment pas les pages web avec peu de texteoudecontenupertinentpourlinternaute. Nonseulementcecontenudoittrepertinentetabondant,maisildoitaussitreconstruiten suivantlesbonnespratiquesetensassurantquevostitresparexemplesoientoptimisspour lerfrencementnaturel.Eneffet,nousvoyonstropsouventdestitresdarticlestudispour le print, et donc trs marketing, mais pas du tout adapt au web et aux recherches des internautes.Nousentronsicidanslanotionparallleaucontenu,lesmotscls. Ce choix de mots cls pour votre contenu est stratgique. Cela va avoir un impact sur lensemble de votre site: arborescence, contenu des pages, balises META, Tout cela en se posantune questionsimple:questceque lesinternautes pourraientutilisercomme requte pourtrouvervotresite? Parexemple: Prfrez: Mode demploi <nom de produit> en 5 tapes. A cela: A la dcouverte dun outil merveilleux. Afin de rendre visible tout cetravailprparatoire, voicivenultape quifera la diffrencepar rapportvosconcurrents:la popularit. En effet, si votre contenu nest pas repris, citourendu populaire parnimporte quel moyen auprs des internautes, celuici ne sera pas (ou peu) visible sur les outils de recherche (seule solutionalternative,lesadwords). Surdesmotsclspeucomptitifs,cettenotiondebacklinksneserapasdterminante,peude liens pourraient vous permettre darriver en tte des rsultats. Mais sur des requtes trs populaires (auto, mutuelle, crdit), vous aurez besoin dun nombre trs important de liens pour pouvoir rendre votre contenu pertinent pour les outils de recherche par rapport vos concurrents. Si nous rsumons, lordre de prsentation des rsultats dune recherche dpend de deux principauxfacteurs: Lanotorit,quiestunevaleurintrinsquedelapage,unemesurequiassociequalit desliensentrants(Backlinks)etleurquantit. La pertinence de la page pour les mots recherchs, cest dire sa plus ou moins grandecorrespondanceaveccequerecherchelinternaute. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page14 Cesdeuxnotionssonttotalementtransverses,indpendanteslunedelautre.Cesontlesdeux notionscls quiinterviennentdanslerfrencement,etunchapitrespcifiqueestconsacr chacunedelles. La manire dont ces deux facteurs sont combins pour produire lordre de tri des rsultats nest pas vraimentconnue. Cesalgorithmessontprotgs comme des secrets dtats par ces socits et les rfrenceurs ne peuvent se baser que sur leur vcuet surlamiseen place de teststoutaulongdelanne. Lafigurecidessustraduitlaformule:ordredesortie=pertinencexnotorit Cependant,nouspouvonsestimerceci: Acontenugal,lespagesdenotoritplusleveviennententte; Anotoritgale,lespageslespluspertinentesviennententte. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page15 INDEXATION LE CRAWLER A la base du rfrencement il y a le robot dindexation, appel encore Crawler (celui qui avanceenrampant).Cestunprogramme,quisecomportecommeuninternautequisuivrait touslesliensquilrencontre.Illitunepage,analyselecontenuetindexelesmotsrencontrs, puissuittouslesliensdecettepagepourliredautrespages.Etainsidesuite. Normalement, le crawler devrait dcouvrir ainsi pratiquement tous les sites, puisquil suffit dunlienversunepagedevotresitepourquilentreetparcourtalorslensembledespages ensuivantainsitouslesliens. Principe du Crawler Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page16 Maissivotresiteesttoutneuf,aucunautresitenaencoredelienverslevtre.Ilesttoujours possible de signaler explicitement lexistence dun nouveau site sur Google. Cependant, il est plus efficacede signalercette existence parlapublicationdarticlesoude crer cesliensvers votre site grce vos partenaires/votre groupe. Le moteur ne garantit pas quil viendra le visiter et lindexer rapidement, mais sous quelques jours voire maintenant heures, il le fera. Cest donc bien sr la premire tape pour indexer un site que de signaler son existence aux principaux moteurs de recherche du web. La frquence de visite du crawler nobit pas des rgles publies. Elle dpend du moins du taux de mise jour du site: si le crawler voit que les contenus du site sont modifis frquemment, il revient frquemment. La frquence de visite dpend certainement aussi du Page Rank 4 , de la notorit du site: le site de Microsoft sera index plus frquemment que celui des pcheurs de la Marne. Pour autant, il serait tout fait inutile de chercher tre indexplussouvent,puisquecelanedonneraitenrienunmeilleurrfrencement. LES LIMITES DU CRAWLER Le minimum requis pour que toutes les pages dun site soient rfrences est quil soit crawlable,cestdirequilneprsentepasdimpassepourlefonctionnementducrawler. Ilfautdoncbiencomprendrecequelecrawlerpeutetnepeutpasfaire. Il suit trs facilement les liens hypertextes standards (balise <a>). Le crawler suit aussi maintenant les liens qui rsultent de lexcution dinstructions Javascript ainsi que lAjax (source : WebRankInfo : http://www.webrankinfo.com/dossiers/indexation/crawljavascript post). Mais attention, les liens inclus dans un programme Flash ne sont toujours pas suivis, vitez les sites full flash si vous souhaitez tre visible. En effet, le Flash ntant pas visible pour le Crawler, vous ne donnerez donc pas de contenu pour tre positionn. Comme vous pouvez le voir sur le lien prcdent, le crawler peut maintenant franchir certains formulaires. Maisilestfortementrecommanddefaciliterlindexationdescontenus etdoncdenepasplacerdeformulaireavantdespagesquivoussemblentimportantes.Ilfaut donc prvoir dinterdire lindexation de certains contenus de type formulaire afin de ne pas voirdecontenusdemauvaisequalitsurlesoutilsderecherche. Au strict minimum, un site doit pouvoir tre visit de manire complte par le crawler. Pour cela, il faut privilgier les liens html naturels, interdire (ou rduire) les liens rsultant de javascript ou de Flash, et interdire les formulaires qui seraient le point de passage oblig vers certaines branches du site. 4 PageRank ou PR:Algorithmed'analysedesliensconcourantausystmedeclassementdespagesWebutilisparle moteurderechercheGooglepourdterminerl'ordredanslesrsultatsderecherchequ'ilfournit. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page17 TENDEZ VERS UN DEVELOPPEMENT DE BONNE QUALITE Lorsdudveloppementdunsiteweb,etmmesilesprincipauxCMSdumarchrespectentles bases du rfrencement naturel, il faut sassurer de maximiser cette compatibilit avec les guidelines desoutils derecherche.Eneffet,labasetechniquedoitpouvoirfaciliterlepassage des robots de crawling , mais aussi faciliter leur comprhension du contenu et de lenvironnementwebdevotresiteweb. Cetteoptimisationtechniqueauraaussipourbutdallerleplusloinpossibledanslacclration dutempsdechargementduportail.Eneffet,lesoutilsderecherche(etGoogleenparticulier) suiventceparamtredeplusenplusprcisment. Pourcela,voiciquelquespointsgarderlespritlorsdudveloppement. Sparer le contenu (code html) du code de prsentation (css) et du code interactif (JavaScript). NepasutiliserdecodecssouJavaScriptdirectementdanslecodesource. Optimiserlacompressiondesfichiers. Regrouperlesfichiers.cssdansunefeuilledestyleexterneunique. Regrouperlesfichiers.jsdansunfichierJavaScriptexterneunique. Optimiserl'ordreducodepouruntlchargementparallledesressources,appelerles cssavantleJavaScript. Optimiserlagestionducache(systmeounavigateur) RespecterlesnormesW3C. ... Afin devrifierlanotequeGoogledonneautempsdechargementdevotrepage,ilexisteun pluginPageSpeedpourFirebugsurFirefoxoudirectementenligne: http://pagespeed.googlelabs.com/http://pagespeed.googlelabs.com/ (qui fonctionne aussi pourlesmobiles). Googleydonneaussiquelquespistesdamliorations. Ce ne sont bien srque des propositions, dautres bonnespratiques peuvent tre employes parlesdveloppeurspourallerplusloindansledveloppementdunsiteweb. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page18 ATTENTION AUX LIENS CASSES Imaginons que votre site ait conquis une petite notorit. Vous aviez une page passionnante sur les tapis persans du XVIIme sicle et plusieurs sites spcialiss y ont fait rfrence, apportant ainsi un peu de leur propre notorit cette page. Et de l, cette notorit se propage,commeonleverra,lensembledevotresite. Mais un jour, vous rorganisez tout cela et ladite page change dURL. Ou bien pire, vous changez de technologie et ce sont toutes vos pages qui changent dURL. Les liens entrants tombent alors en erreur (NOT FOUND!) et napportent plus leur poids votre site. Aprs quelquespasses,votreranking seffondre. Il est fondamental danalyser toutes les erreurs NOT FOUND (404) gnres par votre site et den faire une chasse implacable. Celalafoispourleconfortdevosvisiteursconcernantlesliensinternesetpourlaqualit devotrerfrencement,concernantlesliensentrants. Il faut conserver la plus grande stabilit dans lorganisation de votre site et ses URLs. Si vous modifiez une page, elle doit conserver la mme URL. Si une page est supprime, elle doit tre remplace systmatiquement par une instruction de redirection 301 vers une autre page de votre site, par exemple laccueil mais plutt vers le contenu le plus proche existant. REDIRECTION 301 Si les URLs ont chang, alors la seule bonne pratique est de retourner un code HTTP 301 : moved permanently signifiant le changement dadresse dfinitif de la page. Cestuneinterventionfortementrecommandequederedirigerunanciencontenulorsdune refonte par exemple vers ses nouveaux contenus. Cest un point prparer en amont du dveloppementdusite,lorsdelavalidationdelarborescencefinale,etmettreenplacelors delamiseenligne. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page19 Ces redirections de type 301 (dfinitives) sont ncessaires afin de conserver les acquis en terme de positionnement sur les outils de recherche. Nous insistons sur la mthode, cest obligatoirement des redirections 301 qui doivent tre mises en place, cest la seule recommandeafindeconserversontraficprovenantduSEO. Lesautresmthodes(JavaScriptparexemple)vontprovoquerladisparitiondespagesindexes etdoncuneremisezrodurfrencementnaturelduportail.Lhistoriqueetlanciennetdes contenustantunpointcldescalculsdesoutilsderecherche,celapourraitdoncavoirunfort impactsurlerfrencementnatureldevotresite. Par cettemthode, lesoutilsde recherche serontprvenus de la mise jourdu portailet de sescontenus,ilstransfrerontalorslescoreSEOdelanciennepageverslanouvelle. Lorsquunanciencontenunexisteplussurlenouveauportail,ilsuffiradeleredirigersurcequi seraconsidrcommeunepageprocheougnrique(surlapagedaccueilsincessaire). En outre, il faudra prvenir certains sites qui possdaient des liens vers le votre afin quils reprennentune forme correcte,dans lobjectif degarder uneforte pertinence.Celademande desavoirlesidentifier,cequenousverronsplusloin. Comme pourles redirectionsde contenus, lesnoms dedomainesdoiventaussitre grsvia desredirections301pourviterquelesoutilsderechercheendduisentdessitesdiffrents. PrincipalemententrelURLhttp://www.monurl.fr/etlURLhttp://monurl.fr/. Outre ce cas de contenu diffrent entre site hberg sous WWW et sans, il faut idalement redirigerlURLsanslewwwversvotreURLofficielleafindenepasperdredevisiteurs. LE FICHIER ROBOTS.TXT Lesrobotscrawlerssontbienlevs.Surtoutceuxdesgrandsmoteursderecherche. Dune part, ils se signalent au site cestdire quils ne se font pas passer pour un utilisateur normalutilisantunnavigateurnormal.Ilssefontconnatreenrenseignantdansleursrequtes unchampparticulier(useragent),quipermetdelesreconnatre.Ainsi,unsitepeutanalyserce champ, identifier le crawler, et prsenter le cas chant des pages diffrentes de celles que voient les visiteurs normaux. Nous verrons que cela peut faire partie des techniques visant optimiserlerfrencement(maisquenousnerecommanderonspasspcialementpournepas faireprendrederisquesnosclients). Dautrepart, les robotsrespectentscrupuleusementlesconsignes quileurssontdonnespar le site visit. Avant de visiter un site, le crawler demande lire unfichiersitu laracine du site,etnommrobots.txt.Cepetitfichier,lorsquilexiste,donnedesinstructionsaurobot,en particulier pour lui prciser le rythme dindexation quil doit respecter, afin de ne pas submergerleserveur,ainsiquelesbranchesdusitequilnedoitpasindexer. Lesindicationspeuventdistinguerlunetlautredesrobotsvisiteurs. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page20 Parexempleleslignessuivantesinterdisentlesrpertoires/cgibin/et/images/auxrobots. User-agent: * Disallow: /cgi-bin/ Disallow: /images/ Tandisquelalignesuivanteinterditseulementledocumentemail.htmaurobotdeGoogle: User-agent: googlebot Disallow: email.htm Unautreexemple,pourunsitevoulantrestersecret: User-agent: * Disallow: / Autrement dit: tous les robots: nindexez rien!. Cette configuration nest bien sr pasrecommande! Pourplusdinformations:http://www.searchengineworld.com/robots/robots_tutorial.htm, parexemple. GOOGLE SITEMAP.XML Googleproposedepuismi2005unnouveauprocddinteraction de son rfrencement avec les sites internet, appell SiteMap.xml.GoogleSiteMapsprsenteunnouveaumoyende demander lindexation des URLs, puis dobtenir des rapports dtaillssurlavisibilitdespagessurGoogle. Sonutilisationreposesurlamisedisposition,parleswebmasters, dun fichier XML contenant les adresses des pages du site rfrencer, ainsi que quelques infos complmentaires comme la datedederniremisejour. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page21 Exemple: <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset> Le bnfice pour les webmasters est une meilleure matrise des pages rfrences grce aux nombreuxoutilsproposssurlinterfaceWebmasterTools(requtes,erreurs,sitelinks.) Ce format de fichier est aussi reconnu par les autres outils de recherche. Bing proposant lui aussidesoutilscomparablespourleswebmasters. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page22 PERTINENCE LE POIDS DES MOTS Comme on la indiqu prcdemment, deux mcanismes se combinent pour dterminer lordre des rsultats dune recherche: la pertinence par rapport aux mots recherchs, et la notoritdespages. Un premier principe, fondamental, est que les mots nont pas le mme poids selon quils apparaissent dans le titre dune page, dans un entte, ou dans le corps dun article. Lordredeprsenceestimauseindelapageestlesuivant: 1. Dans le nom de domaine. Ce nest pas leplus facile travailler lorsdune refonte parexemple,maiscertainssappliquentdfinirdessousdomainesportantdesmots clschoisis. 2. DanslURL(rewriting) 3. Dansletitredelapage,ausenshtml(baliseTITLE) 4. Dansdestitresintermdiaires,selonleurimportance(balisagesmantiqueH1,H2,) 5. Encaractresaccentus(gras,oustrong). 6. Lesmotsduhautdepageontunpoidsplusimportantquelesmotsdubasdepage. Cequiestreprsentsurlafiguresuivante. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page23 Les lments importants dune page bien rfrence Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page24 LES URLS PourcequiestducasdesURLs,considronsquelquescasdcole: Celuici,parexemple,achoisiunnomdedomainecorrespondantdirectementauxcritresde recherchecibls.Ilnestpasraredevoircegenredesitecrerdessousdomainescherchant sepositionnersurdautresrequtes: Exemple:achat.parislocationappartements.com ouvacances.parislocationappartements.com (Ce sont des exemples, ces sousdomaines nexistent pas) Lexemple suivant a une URL beaucoup moins parlante, on en conviendra Un exemple ne passuivre. LURL rewritingest une mthode de rcriture desURLtechniquesgnrespar lesoutilsde backoffice(CMSparexemple).CelaconsistetransformeruneURLtechniquecomportantplus ou moins de paramtres dynamiques par sa traduction en mots cls comprhensibles par un internaute. Parexemple,pluttquedevoiruneURLdetype: http://www.monsite.fr/pid=1234gb43 NouspourrionsrcrirecetteURL: http://www.monsite.fr/avancementreconstructionmaison.html Lesoutilsde recherche peuventcependantsuivreet prendre en compteune URLdynamique, et comme les outils de recherche ne donnent pas beaucoup dimportance aux mots cls prsents, nous ne sommes pas totalement partisans dune rcriture dURL trop pousse. Ce choixdoitaussitrefaitpouraiderlinternautenaviguersurvotreportail.Commepourunfil dAriane. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page25 Attention cependant, pour un choix portant sur une optimisation de ce type, lURL rewriting doitrespectercertainesrglesetnepastropenfaire.Eneffet,ilnesertriendemultiplierles mots cls dans ces URL (que ce soit pour le nom des rpertoires ou le nom de la page). Les outils de recherche ne prendront pas en compte lensemble des mots cls et iront mme parfois jusqu' pnaliser votre page ou votre portail en entier. Cest un des dfauts des CMS quiparfoisincluenttouslesmotsdutitredunepagesparspardestiretsdanslURL.Cenest clairement pas une bonne solution bien que nous ne pensions pas que limpact sur votre positionnementsoitvident.Ilvautmieuxselimiterauxmotsclsprincipauxdfinissantvotre contenu. Nous recommandons de ne pas inclure dans ces URL des mots cls considrs comme bloquants comme par exemple : le, la, et, ce sont des mots cls qui sont gnralement appelsstopword. Une bonne URL sera donc la plus courte possible, rcrite si possible, classe dans un rpertoire,avecdessparateursvalides(letiretestrecommand)etcomportantdesmotscls appartenantauchampsmantiquedelapage. TITRES Souvent prsente comme une baliseMETA, cestenfaitune balise HTML(<title>)spcifique qui sert afficher un texte en haut de la fentre de votre navigateur. Mais son optimisation doitbientreuneprioritdansvotrestratgieSEO. LetexteindiqudanslabaliseTitleestuntextequin'apparaitpasdanslecontenud'unepage web. En revanche, il est possible de la voir dans la barre suprieure de la plupart des navigateursweb.CestgalementletextequiestreprisdanslesSERPdesoutilsderecherche, cestdoncvotrepremiercontactaveclesinternautes. Considronsunexemplenepassuivre: En2005 En2012 Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page26 IcilesitedeSagemCommunication(en2005).Etensuitelaversionactuelle. Le titre(<TITLE>) dela page tait Homepageen 2005: non seulementilne portaitpas de motscls, mais il ne mentionnait pas mme le nom de lentreprise. Une occasion manque pour un bon rfrencement naturel. De plus, dans une liste de favoris, ce lien apparatra commeHomepage,sansplusdinformation. En 2012, une petite amlioration, Sagemcom apparait dans le titre de la page. Cependant, accol PORTAIL (encore HOME PAGE sur Google). Bien sur, ces mots cls nont pas vraiment dintrt en termes de SEO. Le rsultat? La page daccueil du site Sagem Communicationnapparaitquen 3meposition dansles rsultatsderecherche,etseulement aprsleurpagepresse&vnementmieuxoptimise. BALISES META <meta name="description" content="votre contenu" /> Cettebalise nestpaspriseen comptepar lesoutilsde recherche pour positionner votresite. Cependantcestlundeslmentsquirenforceraletauxdeclicsurvosrsultatsderecherche en incitant les internautes cliquer sur vos rsultats. En effet, une description correctement rdigeferapeuttreladiffrenceaveclesconcurrentsprsentssurunemmerequte. <meta name="keywords" content="a oublier" /> Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page27 Cettebalisenauraaucun impactsurvotrerfrencementnaturel.Eneffet,ellenestplusprise en compte par les outils de recherche depuis quelques annes. Inutile donc de perdre du temps optimisercettebalise,sanscompterque vous allezdonnericidesinformationsvos concurrentssurvotrestratgiedepositionnementfacilementetrapidementrcupres. <meta name="robots" content="index,follow" /> Cette balise va servir aux outils de recherche pour connaitre vos prfrences sur lindexation (ou non)de votre page,et ainside savoirsilfautcontinuer suivre lesliensprsentsdansla page. Elle nest pas vraiment indispensable, les robots de crawling vont forcment prendre en compte votre pageweb.Nousconsidronslutilisationdurobots.txtplusefficace.Cependant, lerespectdesguidelinesnousimposesaprsence.Ilexistebiendautresvaleurspossiblesdans cette balise, nous citerons uniquement noodp qui permet de prvenir le robot de ne pas utiliserlesdonnesvenantdelannuaireDMOZ. Autresbalisesncessairesourecommandes: Labaliserel="canonical":cettebaliseestmaintenantpriseencompteparGoogle.Ellepermet de donner aux outils de recherche lURL du contenu original si jamais il devait tre reproduit ailleurs sur votre site (spcialement efficace pour un site marchand par exemple). La page dupliquedoitdonccomportercettebalise.Cependant,nousrecommandonsbiensrdviter tout prix le duplicate content sur votre site web. Une rubrique spcifique du livre blanc en parleraplusloin. OPEN GRAPH PROTOCOL LOPENGRAPHPROTOCOLatlancparFacebookmaisestmaintenantaussireconnuparle rseau social concurrent Google+. Ce nouveau protocole permet dajouter du sens vos contenus pour le partage sur les rseaux sociaux principalement. Cest un pas de plus vers le websmantique.Celarendlepartagedevospageswebsurlesrseauxsociauxplusefficaceet amlioreparlammeoccasionleurrfrencementnaturel. ExempledequelquesbalisesOG: <meta property="og:title" content="Titre de la page et du contenu"/> <meta property="og:type" content="article"/> <meta property="og:url" content="http://monsite.fr/article.html"/> <meta property="og:site_name" content="texte a insrer ici"/> <meta property="fb:page_id" content="on"/> Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page28 Ces balises vont permettre vos pages web davoir des liens gnrs sur Facebook (via les boutons jaime ) beaucoup plus parlant et percutant. En effet, linformation est mise en valeuretvouspermettradercuprerdutraficsurvotresiteweb.Vulapuissancedupartage des contenus sur les rseaux sociaux, prsenter vos contenus de faon ludique et efficace (image/vido + description + URL) semble tre aujourdhui indispensable tout dveloppement. Ces balises ne sont cependant pas forcment ncessaires sur tous les contenus de votre portail,maisvospageswebcomportantdesvidos,desgaleriesphotosouarticlespourraient bnficier decesbalisesspcifiques comme des microformatsdontnousallonsparlerdansle pointsuivant. Plusdinformationssurceprotocole:http://ogp.me/ MICROFORMATS Comme pour lOpen Graph protocol, il est possible depuis quelques temps de rajouter des balises spcifiques sur votre contenu pour amliorer les rsultats de recherche. Ici nous parlonsdimpactsurlarechercheuniverselledeGoogle. Ce balisage supplmentaire vous permet dafficher des rsultats de recherche diffrents. Par exemple dans le cas dun produit, dafficher une image, les votes des internautes, une description Unbelexempledecequepeutvouspermettrelesmicroformatspeuttrevuenactionsurune recherchesurlarequteNHL. En effet, le site officiel de la NHLauxEtatsUnisautilisles microformats pour afficher directement dans les outils de recherche le calendrier des matchs passs (avec un lien vers un rcapitulatif, les highlights ainsi que le logo de chaque quipe) ou matchs venir. Laffichagedesrsultatsderechercheviadesmicroformatsnestcependantpassystmatique. Cestmmepluttalatoireencorepourlemoment.Maislesoutilsderecherchelesprennent deplusenplusencompte.Cestunbalisagedavenir. Plusdinformationssurlesmicroformats:http://schema.org/ Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page29 BALISAGE SEMANTIQUE Une autre consquence importante de cette pondration des mots dans la page est la suivante: Il faut utiliser les vraies indications de titres du html (H1, H2, ) plutt que des styles spcifiques. Les outils de recherche parcourent et analysent le code HTML de votre portail avant de gnrerleursclassements.Cesmoteursdoiventcomprendrelesensd'undocumentafindele classerconvenablementetdeproposerainsidesrsultatspertinentsleursutilisateurs.Cest pourquoi ils donnent une grande importance la structuration des contenus via ce type de balises. Les balises du langage HTML sont les allies des moteurs dans leur qute de pertinence. Lorsquecesbalisessontutilisesjudicieusement,ellespermettentd'analyserplusfinementla structured'undocumentainsiquedepondrerplusfacilementl'importanced'uneinformation oudunniveaudelecture. Mais dployer un balisage smantique prsente aussi de multiples intrts notamment pour l'accessibilit. Parexemple,voiciunearborescenceHntype: <h1> TITRE DE LARTICLE/DU CONTENU </ h1> <h2> Introduction ventuelle de larticle</ h2> <h3> sous titre 1</ h3> <p> Paragraphe et contenu de larticle</ p> <h3> sous titre 2</ h3> <p> Paragraphe et contenu de larticle</ p>
Attention, en gnral lesCMSgrentcettearborescenceHn (etsouventH1 estliau logo).Il estdoncncessairederevoirlecodesurlensembleduportailetdegarderlammestructure Hnsurlensembleducontenu. Desstylesspcifiquesaurontpeuttreun rendude titres,maisnepourrontpastrecompris commedestitresparlerobotdindexation. Cestdire quil faut dfinir <H1>Le Rfrencement</H1> plutt que <font face=>, ou encore <p style=>. Dans le premier cas on nonce clairement que lexpression le rfrencement a un rle de titre de chapitre de premier niveau, un rle important donc. Danslescasdemiseenformedirecte,cenestpasaussiclairpourlerobot. Bienentendu,onutiliseraunefeuilledestylepourdfinirlamiseenformeassocieauxtitres H1,H2,H3 Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page30 TEXTE DES LIENS Les mots intervenant dans les liens qui pointent vers cette page ont galement une forte pondration. Cest un point souvent mconnu, quil est important de souligner car cest la seuleinformationextrieure la pageellemme,quiinfluencefortementsonrfrencement. On suppose que si une pageBcomporte unlien vers la pageAet que ce lien mentionne le framework Symfony, cela signifie que pour lditeur de la page B, la page A tait particulirementpertinenteenrapportaveccethme. On auraitpudire quecejugementestdautantplusvalablequelapageBappartiendraitun autresite,ouunautrenomdedomaine,carlapprciationdepertinenceseraitplusobjective. Mmesicestunechosesurlaquelleilestfaciledetricher(spamblogparexemple)etdontles moteurs de recherche font une chasse impitoyable, les liens entrants venant de lextrieur restentlundesprincipauxmoyensdejugerdelapertinencedunepageweb. Ainsi, au sein mme de votre site, il est important de choisir vos mots pour crer des liens internes. Le texte des liens pointant vers une page est considr comme partie intgrante de la page, avec une pondration importante. Ilfautdoncviterlesliensdetypegnriquetelsquevoirlarticleoucliquezici. Parexemple: En savoir plus sur les lentilles vertes du Puys et la sant [http://monsite.com/lentilles.html] Associe le mot sant aux lentilles vertes du Puy , apportant ce mot comme contenu complmentairelapage. Tandisque ...Les lentilles vertes du Puys sont un trsor de sant, (voir larticle) Napportequelesmotsvoiretarticledanslindexationdelapagecite. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page31 ET LES IMAGES ? Avant toutes choses, il faut viter de grer les liens de votre site web uniquement sur des images,celaestprobablementmoinspertinentetefficacequunsimplelientexte. Il faut systmatiquement accompagner vos images dune balise ALT qui dcrit limage. Cetteoptimisationdesimagesvouspermettraderajouterdelapertinencevotrepage.Mais aussidepositionnervosimagesdanslesrecherchesspcifiquesimagesetdoncdercolterun traficnonngligeable.Noubliezpasquelenomdevotreimageestelleaussiimportante!Par exemple,prfrezuneimagenommelogomasociete.jpgpluttque159GF93.jpg LES OUTILS DE GESTION DE CONTENU Les sites web modernes sappuient gnralement sur des outils de gestion de contenus, ou content management systems (CMS),et il estdoncnatureldesinterrogersurlacompatibilit decesoutilsavecunbonrfrencement. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page32 Sivous ntespasdjfamiliersdesprincipesde la gestionde contenuetdesmeilleursoutils en la matire, nous vous recommandons les livres blancs de Smile intituls Gestion de contenus : le meilleur des solutions open source ou 200 questions pour choisir un CMS . Dans un site statique, les pages que voit linternaute sont des fichiers placs dans une arborescence de rpertoires. Le chemin daccs indiqu dans lURL est le reflet fidle des rpertoiresconduisantaufichier. Dans un site dynamique, et en particulier un site construit au moyen dun CMS, les pages nexistentpassurleserveur,ellessontconstruitesaufuretmesurequellessontdemandes. Les contenus, cestdire les textes, images ou documents composant le site, sontplacs engnraldansunebasededonnes,doilssontobtenuspourfabriquerlespages. Celatant,le crawler luine sintresse pas la manire dontlespagessontfabriques: il les demandeparunerequtehttp,commeleferaitunsimpleinternaute,lesobtientetleslit.Bien sr dans certains cas, en regardant la forme dune URL on peut deviner de quelle manire la pageatproduite. Maisilfautbiensesouvenirdupointsuivant: Le crawler ne fait pas de discrimination, les pages dynamiques ne sont pas moins prcieuses ses yeux que les pages statiques. Ilrestemalgrtoutquelquesdiffrencesdontilfautseproccuper: lURLgnredoitpermettredidentifierchaquecontenu;certainsCMSutilisentdans ce but une technique appele URL rewriting (rcriture dadresse) permettant dutiliserletitredesarticlesetdeleurrubrique,commeadressedelapage; On entend dire aussi quil faut viter les paramtres dynamiques dans lURL, que Google napprcierait pas, car ils sont souvent utiliss pour passer des variables de sessions. Cependant, il ny a aucun problme allant contre ces URL. Elles sont bien prisesencompteparGooglemmesicenestpaslameilleuredessolutions. le nombre de paramtres figurantdans ladresse doit tre le plus petitpossible (il est conseilldenepasdpasser3paramtres); les balises META (Titre, description) doivent tre rendues variables en fonction de chaque article;dans lecascontraire,lesmoteurs derecherchepourraientconsidrer toutes les pages gnres comme tant trop similaires et en consquence nen conserverquune. LescontraintesquimposelutilisationdunCMSpeuventalorstretransformesenavantages, commeparexemplelaugmentationdelavarianceducontenudesarticles. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page33 URL STABLES, SIGNIFIANTES ET UNIQUES Audel mmedelaproblmatiquederfrencement,lastabilitdesURLsestunprincipede baseduweb,maisunprincipequecertainsoutilsnerespectentpas. A une URL doit correspondre une page donne de contenu. La mme URL utilise le lendemain doit fournir la mme page. Loutil de CMS, oulapplication servantles pages,ne doit pasinsrer dans lURLdes donnes techniques variables qui ne sontpaspertinentes pourrfrencerlapageconcerne:nijeton desession,niinformationdecontexte. A linverse, le CMS ne doit pas non plus utiliser dinformation de contexte implicite (i.e. ne figurantpas danslURL)pourdterminerlapageprsenter. Une autre exigencesimple satisfaireparle CMS estquildoitpermettrededfinir desURLs signifiantes, cestdire intelligibles, du type: /www.monsite.com/societe/resultats.html et non/www.monsite.com/cmstool?Id=1294. Certains CMS sauront utiliser directement le titre de la page pour constituer lURL, dautres permettront dindiquer soimme lURL dsire. Mais ceux qui nont que des URLs reprenant des paramtres dynamiques sont carter si possible mme si ce nest pas bloquant pour votresiteetsonpositionnementdanslesoutilsderecherche. Une autre considration, moinsconnue, estla rciproque de laprcdente: une mme page ne doit pas correspondre plusieurs URLs diffrentes. Car dans ce cas, Google flaire la multiplication artificielle des pages. On a vu ainsi des sites qui utilisaient plusieurs noms de domaine, par exemple www.monsite.com et www.monsite.fr, en servant les mmes pages souslunetlautre.Cest une chose ne pas faire, il faut plutt mettre une instruction de 301 REDIRECT de lun vers lautre. INTERDICTION DU DUPLICATE CONTENT Cestsrementlun despointsles plusimportants suivre toutau longdelavie de votre portail:NEPASDUPLIQUERVOTRECONTENU!(maisaussilestitles,descriptions) Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page34 Google et les autres outils de recherche font une chasse impitoyable au contenu dupliqu. Surtout depuis lanne 2011 et la publication de la srie dalgorithmes nomms PANDA chez Google.CestunenjeuconsidrablelorsquelonindexedesmilliardsdURLmaisquelondoit faire le tri entre ce qui est pertinent et le spam. Les internautes attendent des rsultats pertinentsenquelquessecondes,etvousnavezque10rsultatsenpremirepage Les outils de recherche n'indexent donc pas toutes les URL qu'ils trouvent, tout simplement parce que beaucoup de contenus nont aucun intrt ou sont dtects comme contenu dj existant(dupliqu). Lesoutilsderecherchepeuventdciderdeplusieurspnalitslorsquilsdtectentducontenu dupliqu.Selonlagravitdelerreurouduspamralis,lasanctionpourraittre: Lepire:tredsindex(disparaitre)desrsultatsderecherche Etremoinssouventcrawlvosmisesjourneserontpasdtectesrapidement. Perdre des positions dans les rsultats et tre plac dans un index secondaire plus rarementinterrogetdoncplusrarementconsultparlesinternautes. Danstouslescas,vousrisquezdoncdtremoinsvisiblesurInternet Surquoilesoutilsderecherchesebasentilspourdciderduncontenudupliqu?Etavecquoi comparentilscesrsultats? UnmmecontenusurplusieursURLdiffrentes. Comparaisons des contenus dupliqus avec la popularit de la page et lautorit du site.Quiauraitcopiqui? Un contenuidentique, ok. Mais est ce quil existe la prsence d'un lien vers la source(citation)? La date de publication des contenus, la source la plus rcente est forcment celle en quilesoutilsderechercheaurontleplusconfiance. Ladatedelapremireindexation,ladatedepublicationtantaismentfalsifiable,les outilsderecherchevrifientdepuisquandcecontenuestprsentdansleurindex. La rgle est simple : une page web = un contenu unique = une seule URL Pourvousassurercontrelecontenudupliqu,voiciquelquesconseilssuivre.Toutdabordles erreurslesplusfrquentesentermesdeSEO: Contenuaccessibleavecetsanswww.Attentionvosredirections301 Des liens internes diffrents vers un mme contenu (attention vos fiches produits prsentesdansplusieurscatgories!) Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page35 Vos pages avec une faible qualit. Par exemple 2 fiches produits trs proches, et se retrouvantavecdesdescriptionsidentiquesetaucuncontenudiffrentiant Attention vos liens entrants contenant des paramtres (de tracking de campagnes parexemple) Utilisez vos fichiers robots.txt et sitemap.xml pour cacher les pages risques (peude qualit) et surtout celles que vous ne voulez pas voir indexes (par exemple votre backoffice). Miseenplaced'unmetarobotnoindexsurcespagesoudattributnofollowsur lesliens SuppressionssystmatiquesdevosURLprimes(404)ouindexesparerreur.Loutil GoogleWebmasterToolsvousaiderapourcela(maisdautresoutilsexistent). Bien sr,la cause du contenu dupliqu nestpas toujours interne, ellepeuttre externe avec des voleurs de contenu . Ces contenus externes dupliqus pourraient aussi vous pnaliser mme sivous avez commeavantage lanciennet deleurmiseenligne.Maispourvitertout problme, il est ncessaire de vrifier de temps en temps si vos contenus ne seraient pas prsentssurdautressitesweb. Mais surtout ninterdisez pas vos visiteurs de se servir du clic droit en pensant par cela, empcher la fonction du copier/coller. La seule consquence cela sera de perdre vos visiteurs,maispasdempcherleplagiatventuel. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page36 NOTORIETE BACKLINKS Lagestiondesliensentrantsversvotrecontenuseraunpoint cl de votre positionnement.En effet, depuis les dbuts du rfrencement naturel, ce point est tout particulirement pris en compteparlesoutilsderecherche.Cestsrementletravailquivouspermettradercolterle plusdersultats,maisquivousprendraaussileplusdetemps. Obtenirdenouveauxlienspointantverssonsitewebconsisteaugmenterartificiellementsa popularit. Google n'apprcie pas spcialement ce type d'activit, comme tout ce qui est artificiel...commetoutcequis'loignedunaturel... Cette gestion des backlinks doit tre continue. Les outils de recherche prenant en compte lanciennet des liens, si votre travail date de quelques mois voir annes, il perdra de son influence. Surtout depuis les dernires mises jour de Google qui donnent beaucoup dimportanceaucontenurcent. Ces backlinks doivent comporter des mots cls pertinents lis votre activit et au contenu prsent.Parexemple(lorsquecestpossibledelengocier),prfrezunlienavecuntextede ce type: Le leader de la vente du produit X (ainsi quavec la balise ALT remplie que lon appelleaussiancre)pluttquuniquement:Cliquezici. Ne crez pas trop de backlinks en mme temps.En effet,si lesoutils de recherche dtectent unevaguedeliensversvotresitetropimportantesurunlapsdetempstrscourt,alorsquela moyenne est trs basse dhabitude, ils pourraient en dduire une tentative de spam. Etalez votrestratgiedansletempsafindviterceproblme.Mmesicettemassedeliensentrants peutaussitreliuneactualitrepriselargementsurdautressites,ilfautresterprudent. Lesstratgiesderseauxdesitessonttrspuissantesetprsententdenombreuxavantages: Maitrisedevotreenvironnementetdessiteswebsources Choixdesancrestextes(queltexterenvoieversvotrecontenu) Prennit des supports, vous savez si un site va disparaitre, mais vous savez aussi si vousdevezymodifiervoslienslorsdunerefonte. Votrerseauautourdevousestunterrainidalpouravoirunnombredeliensentrantsassez efficace.Cesticique vous devezcommencerle travailenngociantdes liens depuiscessites web. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page37 Attention,iciaussiladuplicationdecontenuestfortementdconseille!Travaillezletexteli vos liens. La notion de qualit est importante ici aussi. Le lien doit tre prsent sur un site pertinent par rapport votre contenu, il doit luimme tre considr comme important par Google(PageRank) Lidal selon votre secteur tant de russir trouverdespossibilits de liens depuis des sites dugouvernementouavecunnomdedomaineen.gov,.edu...Cessitesontunpoidsentermes derfrencementnatureltrsimportant. RAPPEL HISTORIQUE : LE PAGERANK En 1998, Larry Page et Sergey Brin, tudiants Stanford University, crent le moteur de rechercheGooglesurlabasedelalgorithmequilsontmisaupoint:Page Rank(PR). LeprincipeduPageRank,estlesuivant.Onconsidrequelorsquunepageduwebcontientun lienversuneautrepage,celasignifiequelauteurdelapremireaccordaitunpeudevaleur lauteur de la seconde puisquil jugeait pertinent dy faire rfrence. Ainsi, si des milliers de sites de lInternet contiennent des liens vers la page du site drupal.org consacre au CMS Drupal,cestquecettepageaquelqueintrtauxyeuxdetousceuxquiyontfaitrfrence. CestdonccelaquifaitquelesiteDrupal.orgarriveraenttedevotrerecherche:desmilliers de sites y font rfrence tandis quune plus petite partie ferait rfrence une page du site Smiletraitantdummesujet,alorsqueSmileaaussisapartdepertinencesurcetterecherche. Demanireplusprcisedonc: Linternet, la toile , constitue un immense rseau de pages, relies entre elles par deslienshypertexte. Chaque page P 1 qui contient un lien hypertextevers une page P apporte une voix,un vote,enfaveurdecettepage. Chaquepagerpartit sesvotesentretouteslespagesverslesquellesellepointe.Siune page porte 10 liens vers 10 autres pages, alors chacun de ces liens napporte quun diximeduvotedelapage. Lesvotes dune page sontpondrsparlePage Rankde cettepage.Unliendepuisle sitewww.cnn.com(PR9)versvotresiteluiapportebeaucoupplusquunliendepuisle sitelalentillevertedupuy.com(PR3). Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page38 Revenonssur cedernierpoint.LesPage Rank de Google sontrestitussurune chelle de0 10. Mais ce PR affich est une reprsentation logarithmique du PR calcul. La base du logarithme nest pas connue, et varie dans le temps, puisque cest par dfinition celle qui permetlapagelaplusrfrencedtrelavaleur10.Imaginonsquelelogarithmesoiten base10.CelasignifiequunlienvenantdunepagenotePR5 vautautantque10liensvenant dunepagePR4,etautantque100liensdepagesPR3. Uneautremaniredexprimercelaestquilfaudrait10 10 liensdepagessansvaleur(PR0)pour apporter autantquun seulliendepuislapagedaccueildusiteW3C(lundesquelqueshappy fewquiavaientdespagesPR10). Ilfautsavoirque toutecettemcanique porte surdespagesetnondessites.Cenestpasun site dans sa globalit qui est plus ou moins bien not, cest chacune de ses pages. Il peut y avoiruneimportantedisparitdenotesentrelespagesdunmmesite. Il faut comprendre galement que les liens internes un site sont pris en compte, au mme titre que les liens externes. Cela tant, les mcanismes de pondration et de rpartition des votes font que les liens internes ne peuvent seuls remonter la notation dun site dans son ensembleoutrspeu.Enrevanche,ilsontpoureffetsoitdeconcentrerlanotesurcertaines pages, soit au contraire de rpartir la note. Schmatiquement, un site comportant beaucoup de liens internes aura tendance propager et moyenner ses notes vers lensemble de ses pages. UN CRITERE DE PLUS EN PLUS DIFFICILE A TROMPER Lundeseffetsdecettevaluationparvote(onpeutestimerquunbacklinkestunvotepositif pourvotresite)estquelleestdeplusenplusdifficiletromper.Certesilesttoujourspossible de crer des tas de pages qui pointeront vers votre site, mais Google (suite sa mise jour nomme PANDA) fait une chasse impitoyable ce genre de liens estims tre du spam. Noublions pas que la crationde liens pour amliorer lepositionnementde sonsite Internet estformellementinterditparGoogle.Mmeentresitesdummegroupe. Cettevoiedetricherieresteouverteparrapportauxalgorithmesdevote:enconstruisantdes dizaines de milliers de pages pointant vers votre accueil, vous apportez effectivement autant de microvotes, qui finissent par peser. Ctait la technique utilise par la plupart des comparateurs de prix et ses semblables, qui bien souvent polluent les rsultats de vos recherches en multipliant les noms de domaines pour le mme contenu et les liens croiss entreeux. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page39 LamiseajourPANDAestprincipalementdestineacegenredesitesweb,maisnesoyonspas naf,destinaussiprotgerlespropresoutilsdecomparaisondeGoogle. LE PARTAGE, NOUVEL ELDORADO Une traduction simple de lalgorithme PageRank est quil est bon que dautres sites pointent vers votre site, cestdire contiennent un ou plusieurs liens hypertexte en direction de vos pages.Etceladautantplusquecessitessonteuxmmesconnus. Encore une fois, avant dessayer de tromper ce mcanisme en construisant des liens trompeurs, il est largement prfrable dessayer de jouer le jeu, et dobtenir de vrais liens, partantdevraissites. Si le contenu de votre site est intressant et que vousfaites leffortde le partagerautourde vous,alorsvousverrezquelesliensviendronttousseuls,cardautrestrouverontopportunde faire rfrence votre site. Si votre site contient un contenu unique sur lhistoire du stylo bille,alorstouslessitesvoquantcesujetvoudrontfairerfrencecettepage. Ensuite, vous pouvez bien sr demander vos partenaires de tous ordres de bien vouloir placer des liens vers votre site. Si vous commercialisez des produits, alors ce pourra tre les sitesdevosdistributeurs. Si votre entreprise appartient un groupe, alors il est intressant que les sites du groupe placent des liens croiss vers les autres sites du groupe. Ce nest pas une faon naturelle de gnrerdubacklinkbiensr,maiscelaseraitdommagedenepasseservirdecettebasepour crerdulienentrantversvotrecontenu.Surtoutquelessitesdevotregroupesontpertinents pourvousciter. Lalimitedecettetechniqueestdanslenombre:tropdeliensdiluelapportdechacun.Aussi l encore la qualit prime sur la quantit: privilgiez ceux avec vos partenaires et/ou des acteurspertinentsdevotredomaine. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page40 Depuisquelquestemps,nousvoyonsapparaitreunnouveautypedepartage, le social. Cest particulirement vrai depuis le dbut de lanne 2012 avec lapparition de loption de recherche sociale chez Google. Ce nouveau type de rsultats de recherche appele Search, + your world. Littralement, la recherche, + votre monde a pour objectif de vous proposer les contenus partags par vos contacts sur Google+ lis votre recherche. De nombreuses critiquesontsuiviescettemiseenligne(uniquementauxUSpourlemoment),eneffet,estce que vos contacts sont les plus pertinents pour vous proposer des contenus en relation avec votrerecherche? Cette nouvelle option a aussi pour but de mettre en avant et dimposer le rseau social de Google, en concurrence avec Facebook ou Twitter. Do les nombreuses critiques actuelles puisqueGooglenesebasequesursonproprerseau. Cependant, lapparition de ce type doption doit vous faire prendre conscience quune stratgie de partage de vos contenus (et danimation) sur les rseaux sociaux devient indispensable. Nouvelle prsentation des rsultats par Google.com (Search+ your world). En rouge, les rsultats par vos contacts compars au nombre de rsultat global. En jaune, les images lies votre compte Google+ et vos cercles (contacts). En vert, loption active ou dsactive. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page41 LADEMARCHE LAVRAIEPERTINENCE Lune des premires choses retenir pour un bon rfrencement est la suivante: avant dessayerdetromperlemoteur,essayezdelesatisfaire.Considrezunpeulerfrencement comme de la sduction: avant dessayer davoir lair subtil, spirituel et attentionn, soyezle vraiment! Ce sera peuttre la meilleure des recettes, et cela pour deux raisons: la premire, cestque vous obtiendrez un bon rfrencement sans faire des choses compliques ou tordues, et la seconde cest que vos visiteurs en profiteront directement puisquils trouveront des informationspluspertinentessurvotresite. Faciledire?Certes,maispasimpossiblefaire.Lavraierecettetientenpeudemots:placez survotresitedelinformationintressanteetabondantetraitantdesthmescorrespondant lindexationsouhaite.Votresitevenddesfournituresdebureau?Etbientrouvezdeschoses intelligentes dire sur les fournitures de bureau. Vous devez en tre capables, cest votre mtier aprs tout, les fournitures!Citez des marques,desmodles,des catgories,lhistoire dustylotraverslesges,lesqualitsdepapier,toutestbon.Attention,pasdeslistesdemots placsctecte:non,ducontenu,duvrai,nonseulementintelligible,maismmeintelligent sipossible. Ensuite,organiseztoutcelaensections,soussections,ajoutezdesliensinternesdenavigation, etvoil.Sansmmetricher,vousavezfaitlamoitidutravail,etvotrerfrencementestdj assezbon.Alorsimaginezenoptimisantunpeu! Ilvautparfoismieuxpayerquelquuncrerducontenuintelligentpourvotresitequepayer quelquunfairecroirequececontenuestintelligent. QUELSMOTSPOURARRIVER AMONSITE? Cest toujours lune des premires questions se poser: pour quelsensembles de mots cls estcequejesouhaitetrebienpositionn? Sijaideschosesvendre,alorsquerecherchent mesclients?Etplusprcisment,commentmesclientsexprimerontilsleurrecherche? Cest la premire question quil faut se poser, et il faut se la poser avant de commencer crire pour son site: Comment mes visiteurs exprimerontils leur recherche? Quels mots utiliserontils? Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page42 Commeonlavu,lesinternautessaventdeplusenplusquilleurfautciblerleurrechercheen combinant plusieurs mots. Cest donc aussi pour diffrents groupes de mots quil conviendra dapparatreenbonneplace. Lepremierexerciceestdoncdelistercesmotsetgroupesdemotsparcrit,loccasiondune sancederflexiondetypebrainstorming. Ensuite, on sassurera que ces mots sont bien prsents dans vos pages. Il arrive couramment que rdaction et rfrencement soient deux processus disjoints: on essaye a posteriori dassocier des motscls des articles dj crits. Mais il est largement prfrable que les textesdusiteutilisenteffectivementlesensemblesdemotschoisis. Attentiongalementauxsynonymesouvariantes.DanslecasdusiteduCNLL(ConseilNational du Logiciel Libre) par exemple, les visiteurs peuvent saisir opensource ou bien open source ou encore logiciel libre, et dautres quivalents encore. Il est difficile dutiliser systmatiquementtouscesmotsdansunarticle,etlesoucidunstyleclairamneraitplutt choisir une formulation unique. Mais pour la qualit du rfrencement, il pourra tre prfrableaucontrairedevarierlesexpressions.Varierlesexpressionsdessein,certes,mais toutenvitantlesvariantesdepurstyle,quiaucontrairepollueraientlaperception. Soyonsclairstoutefois:silevocabulaire,pour les thmes fondamentaux,doittretudiavec soin,ilnesagitsurtoutpasdcrire pour le rfrencement,cestdiredefairedesphrasesqui nauraientpasdautrefinalitquelerfrencement.Ellesgneraientlelecteur,sansapporter le bnfice attendu. La notion de qualit doit rester lune des plus importantes lors de la construction de votre contenu. En effet, un contenu de qualit sera partag et donc mieux rfrenc! QUELSMOTS RECHERCHAIENTMES VISITEURS? La rflexion amont, voque ciavant, doit tre valide par une analyse en aval: quels mots avaientsaisimesvisiteurslorsquilssontparvenussurmonsiteparunmoteurderecherche? Les outils de suivi daudience tels que Google Analytics, Analyser (AT Internet, anciennement XiTi)permettentdeconnatrelesmotsclsquavaientsaisilesvisiteursdevotresite,sicest au moyen dun tel moteur que linternaute est arriv. En effet, les motscls recherchs sont inscritsdanslURLappelante,oureferer. Il est important de consulter rgulirement cette liste des motscls ayant conduit votre site,pratiquementdanstoutesontendue. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page43 Cestcequipermettradevalideroudajusterlesmotsquevousmmevousutilisezpourvotre rfrencement.Peuttrequevosvisiteursavaientunemaniredeformulerleurrecherchequi ntaitpas ce quoi vous vousattendiez.Peuttre aussiquecertainsvisiteurs parviennent votresiteparerreur,avecdesmotsclsquinecorrespondentpaslafinalitdevotresite.A moins que vous ne recherchiez laudience tout prix, ces erreurs de routages impliqueront galementunrajustementdesmotsutilisspourlerfrencement. Lesmmesoutils,desuividaudience,vousdonnerontuneautreinformationessentielle:la part de vos visiteurs qui sont arrivs sur votre site par lintermdiaire dun moteur de recherche.Ilestessentieldelaconnatreetdelasuivre. Si votre site connat une chute daudience par exemple, estce d un problme dans son rfrencementouuneautresourcedevisites?Ilestfondamentaldepouvoirrpondrecette question. Bien dautres facteurs peuventtre considrs: un site concurrentdraine dutrafic, un problme enhbergementa ralentivotresite etfaitfuirdesvisiteurs,unsitepartenairea retir un lien qui amenait des visiteurs, ou tout simplement lintrt de vos informations a baiss. Attention aussi cette notion de mots cls saisis par les internautes. Google cache cette information pour ses inscrits connects leur compte depuis mars 2012 (https). C'estdire que lorsque vous serez connect votre compteGoogle,votrenavigationserachiffre.Etles sites web que vous visiterez via une recherche sur son moteur web ne pourront plus enregistrerquellerecherchevousavezfaitepourarriverchezeux. Ce qui va faire apparaitre une nouvelle donne dans vos listesde mots cls, cette ligne sappellera par exemple sur Google Analytics : not provided. Elle est dailleurs dj prsentedansvosrsultatsaujourdhui,maisdansunepetiteproportion(environ8%constat surcertainssites). Celaimpliquedoncquunepartiedevotreanalysedetraficneseraplusexploitablepourvotre stratgieSEO. Google estime 15/20% de trafic cach dans lavenir sur vos statistiques. Mais cest une donneimportantesuivredanslesmoisvenir. QUELSLIENSPOINTENTVERS MONSITE? On a vu toute limportance des liens entrants vers votre site, surtout en provenance de sites euxmmes forte notorit. Il est donc bien sr intressant de connatre ces liens que dautresontdfinisversvospages. Il existe une fonction de Google qui rpondra cette question: il suffit de saisir dans la commandederecherche: Link : www.monsite.com Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page44 EtGooglelisteralespages,dontilaconnaissance,rfrenantvotresite. Cependantnousvousconseillonspluttdepasserdesoutilsenlignecommeahrefs.comou majesticseo.com par exemple qui vous donneront normment dinformations sur vos liens entrants. En effet, non seulement Google ne vous donne pas dinformations qualitatives proposdecesliens,maiscenestplusunecommandedeconfianceaujourdhui. LEVOLUMECOMPTE Lenombredepagesdunsiteest,ensoi,unfacteurdebonrfrencement. Onacoutumedeprivilgierlaqualitsurlaquantit,etilestclairquepourunvisiteur,ilserait prfrable davoir 20 pages synthtiques et pertinentes plutt que 200 pages dilues et redondantes. Le service du visiteur et les besoins du rfrencement seraientils, pour une fois, contradictoires? Pas vraiment: il suffit de mettre en lignes 200 pagestoutessynthtiques et pertinentes! Non,cenestpassisimplebiensr.Maisretenonsjusteceprincipe:levolumecompte. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page45 Pour les sites qui prsentent, au moyen dapplications spcifiques, des contenus issus dune base de donnes, par exemple des petites annonces demploi ou dimmobilier, ou bien des produits issus dun catalogue, il y a une consquence toute simple: la totalit des pages de contenusdoittrerfrence.Cestdirequilfautfaireensortedamnageruncheminpour lecrawlerquimneverschacunedespagesdedtail. Lorsquon est un site dannonce tel que Cadremploi.fr par exemple, avec 15000 offres demploi en base de donnes, donner accs ces 15000 pages de contenus pertinents pour lindexation, par rapport aux quelques centaines de pages de contenus ditoriaux, peut faire unenormediffrence. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page46 LESRUSES DESRESEAUXDEPAGES CREUSES Le summum du dtournement de pertinence est peut tre atteint avec un site de type comparateur en ligne, qui fabrique des milliers de pages vides de sens, correspondant aux pairesdemotsclsrecherchesparlesvisiteurs.Ilsuffitquuninternautetapevoltourisme Italie pour que le site fabrique une page vol_tourisme_Italie.html. Cette page contient le rsultatdunerecherchesurcesmotscls,cestdireuncontenuquisemblepertinent,mais na en fait aucune valeur ajoute vraie. Les comparateurs de prix, comme Twenga et ses semblables procdent de manire identique: quels que soient les mots, ils ont toujours des pagesmettreenface.Ainsi,lesitesoumetGoogledesmilliersdepagesvides,dontleseul contenuestluimme issudune recherche, peuttre surGoogle soimme! Aquoi serttout ce vide? Sans doute crer de laudience en se servant outrance de la longue trane 5 , puisque ce type de pages a provisoirement russi tromper le moteur de pertinence de Google,etsortentdoncfrquemmentenhautdeclassement.Etunpeudaudience,permetun peu de pub et de juteux bnfices. Mais mme les publicitaires devraient se mfier de telles pratiques,quiassocientleursmarquesunetromperie. La technique est donc clairement dconseiller: la fois trs lourde mettre en place, et assez risque. Surtoutdepuislanne 2011 et lapublication de lalgorithmePanda,justement faitpourtraquercegenredersultats. Sanscompterque fabriquer une tellepollution grande chelle surlewebestprofondment incivique. LESPAGESSPECIALES MOTEUR Comme on la dit, les robots indexeurs sont bien levs: dune part ils respectent les instructionsdufichierrobots.txtetdautrepart,ilsnecherchentpassefairepasserpourun internautequelconque,ilssidentifientclairement,aumoyenduparamtreuseragentquiest dfinidanschacunedesrequteshttp. 5 Longuetrane:faitrfrenceauxmotsclsquiattirentsparmentpeudevisiteurssurunsiteInternet.Lecumul decesmotsclsfaibletraficpeutalorsreprsenterunepartnonngligeabledutrafictotald'unsite. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page47 Useragent permet gnralement didentifier le navigateur, et certains sites lutilisent pour adresserdespagesdiffrentesselonlespossibilitsdunavigateurcible. Ainsi, le robot Google sidentifie en indiquant useragent=googlebot dans chacune de ses requtes. IlestdoncpossibledutiliserceparamtrepourservirGoogledespagesspciales,diffrentes decellesquiserontserviesauxinternautes. Cette technique a t beaucoup utilise aux dbuts du rfrencement, pour servir chaque moteur dindexation des pages correspondant ses caractristiques. Yahoo aimait les keywords, on lui en donnait, Altavista voulait des <H1> mais ne supportait pas le bourragedekeywords,onluidonnaitsatisfactionaussi. Cest une technique complexe, qui demande un travail considrable, pour des rsultats aujourdhuiassezfaibles. Cependant elle a encore ses adeptes aujourdhui, spcialement pour la suroptimisation des pagessatellites.Pourvoirunexemple,tapezparexemplelouerappartementsurGoogle,et regardez les premiers rsultats. Dont celuici: http://www.acheter louer.fr/location_appartement.html Commevouspouvezlevoir,lemotclrecherchestprsentdanslURLmaisaussipartoutsur lapage.Souslaformedeliens,dumotclengras,dimages Cettetechniquedepagessatellitesfonctionneencoredonctrsbien.Cependant,cesiteatout demmefaitleschosesbienenintgrantdevraiesannoncesdanscespagesquipeuventtre dfiniescommedespagesdersultatsderecherchesinternesausite.Maiscelaredirigeaussi versuntripar arrondissement,etc.Un maillageinterne quisemble efficaceau vu de saplace surGoogle. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page48 LAPUNITIONDES FRAUDEURS On la dit, le rfrencement est une guerre sans merci. Mais dans cette guerre, les moteurs disposentde larme atomique etpasvous: ledrfrencementou blacklisting.Sile moteur de recherche dcle une tentative de tricherie, il peut blacklister le site dans son ensemble, cestdire que plus aucune recherche ne restituera des pages de ce site, pas mme en 1000 me position.LesitenexistepluspourGoogle. Cestune punitionsvre,qui peut durer plusieurs mois. Et comme toutcelaestrgipardes algorithmes,sansintervention humaine, il esttrs difficiledallersupplier unretour engrce. Le cas nest pasthorique etnombre de prestatairesen rfrencementun peu trop inventifs sy sont dj brl les doigts. BMW, Castorama, Ricoh, ou bien mme Netbooster, en savent quelquechose. Bien que depuis quelques temps il semble que Google ne supprime plus les sites qui trichent de son index,maisdvalue simplementleur PR,celareste une raison suffisante pour nepasessayerdesyrisquer. Maiscommenouslavonssoulignplushaut,laprincipaleraisonestailleurs:viserunmeilleur rfrencement sans tricher, cest aussi mieux servir vos visiteurs, en leur offrant une vraie pertinencedescontenus. Rfrencement Ce quil faut savoir ditionMars2012CopyrightSmileOpenSourceSolutionsToutereproductioninterditesansautorisation Page49 ENCONCLUSION Aprsplusieursannesdexpriencedesacteursdecedomaine,etlobservationdelvolution desmoteurs,ilapparatquelaqualitdufond(richessedecontenu,pertinence,organisation, spcialisationdes pages)et delaforme(simplicit, respect des normes, applicationdergles simplesdorganisationducontenu)restentlesvaleurssres:unsitebienpens,bienralis, et bien suivi, devrait dans la grande majorit des cas obtenir et conserver un bon positionnement. Duct desmoteurs,lhgmoniedeGoogleapermisdestimulerlewebpourenaugmenter la qualit. Linternaute doit toutefois rester vigilant et critique carcelapourraitentranerdes drivesetexcs,etaprstout,lesrsultatsdunerechercheneconstituentquunseulpointde vue. Ensomme,quelonsoitductdeswebmastersouductdesinternautes,leplussrestde conserversonbonsens. Sivousavezdesbesoinsenrfrencement,vouspouvezcontacterSmileDigital,l'agence numriquedeSmile,spcialisteenstratgieonline,SEO,conceptiongraphiqueet ergonomique...ladresse:contact@smile.fr