Académique Documents
Professionnel Documents
Culture Documents
Avant-propos
a composante la plus connue de linternet est le World Wide Web : une toile mondiale o des milliards dinformations sont changes chaque jour entre des milliards
dtres humains dans le monde. Si le web apparat vritablement en 1989, cest
au dbut des annes 1990 avec les apparitions successives du standard HTML et du
protocole HTTP quil prend progressivement le visage quon lui connat aujourdhui :
en 2010, on estimait plus de 2 milliards le nombre de sites existants. Devant cette immense masse dinformations, une entreprise amricaine, Google, se donne pour mission
dorganiser ces informations lchelle mondiale, pour les rendre facilement accessibles
tous. Ceci est concrtis par lavnement du moteur de recherche Google, aujourdhui
en situation de quasi-monopole sur le web : plus de 100 milliards de recherches sont
effectues chaque mois.
Ds lors, la grande problmatique du webmaster sera doptimiser son site afin damliorer son positionnement dans les rsultats de recherche de Google. Avoir un site ressortant en premire position du moteur de recherche, cest sassurer que celui-ci sera
visit. Lensemble des techniques visant amliorer la faon dont Google positionne
votre site se nomme le rfrencement . Lobjectif de cet ouvrage est simple : vous
initier la science du rfrencement. Aprs avoir lu ce livre, vous comprendrez mieux
le fonctionnement de Google, vous serez ainsi capables de construire vos sites de telle
sorte que ceux-ci ressortent dans les premires positions sur la page de rsultats du
moteur de recherche. De cette manire, vous serez capables de gnrer du trafic sur
votre site, et donc de donner vie vos contenus. Tout ce dont vous avez besoin pour
lire ce livre est de possder un site web, en local ou en production, et une connaissance
de base des standards HTML et CSS.
CHAPITRE 0. AVANT-PROPOS
2. Optimisez vos pages web pour le rfrencement : nous aborderons ensuite
le gros du sujet. Nous verrons ici comment construire un site internet obissant aux standards du web. Il sera ici question de vous apprendre produire
du code HTML propre et doptimiser vos temps de chargement ct client (programmation en JavaScript) et ct serveur (programmation en PHP/ASP/JEE/MySQL...). Nous parlerons galement de web 3.0, de smantique, de maillage interne, dURL... Une partie assez riche, qui vous focalisera sur votre propre force :
vos contenus.
3. La notorit de votre site sur le web : en 2013, vous ne pouvez plus vous
permettre de ne compter que sur votre propre force, il faut aussi composer avec
les autres sites pour amliorer son rfrencement ! Dans cette partie, nous verrons
les notions de backlink, dannuaire, de rseau social... Ce sera dailleurs loccasion
dacqurir un peu de culture web !
4. Profitez de la suite Google pour webmasters : travailler son rfrencement
est une tche longue et complexe, et Google le sait. Cest pourquoi lentreprise
nous propose une suite doutils qui nous aideront. Nous apprendrons les utiliser ici : Google Analytics, Google Webmaster Tools et Google Insights sont au
programme. Ce sera galement loccasion daborder des services de montisation
comme Google Adsense ou Google Adwords.
5. Annexes et autres ressources : nous finirons en beaut avec dautres sujets ne
pouvant sinscrire dans le cheminement du cours mais prsentant tout de mme
un intrt. Cest ici que nous utiliserons pour la premire fois Lynx Browser, et
que nous parlerons des autres moteurs de recherche.
REMERCIEMENTS
du Zro pour tre automatiquement redirig vers un site web sans avoir en recopier
ladresse.
Pour utiliser les codes web, rendez-vous sur la page suivante :
http://www.siteduzero.com/codeweb
Un formulaire vous invite rentrer votre code web. Faites un premier essai avec le code
ci-dessous :
Tester le code web
B
Code web : 123456
Ces codes web ont deux intrts :
ils vous redirigent vers les sites web prsents tout au long du cours, vous permettant
ainsi dobtenir les logiciels dans leur toute dernire version ;
ils vous permettent de tlcharger les codes sources inclus dans ce livre, ce qui vous
vitera davoir recopier certains programmes un peu longs.
Ce systme de redirection nous permet de tenir jour le livre que vous avez entre les
mains sans que vous ayez besoin dacheter systmatiquement chaque nouvelle dition.
Si un site web change dadresse, nous modifierons la redirection mais le code web
utiliser restera le mme. Si un site web disparat, nous vous redirigerons vers une page
du Site du Zro expliquant ce qui sest pass et vous proposant une alternative.
En clair, cest un moyen de nous assurer de la prennit de cet ouvrage sans que vous
ayez faire quoi que ce soit !
Remerciements
Je tiens enfin remercier les personnes qui mont aid de prs ou de loin mener
bien cet ouvrage :
ma famille, qui ma beaucoup soutenu dans ce projet ;
les membres de lassociation Neokan et du site Pokmon Trash, particulirement
Claude Vial, Anthony Dugois, Sami Messadi, Laurent Cardon, Samy Senhadji sans
qui cet ouvrage naurait pas vu le jour ;
un grand merci galement aux membres du Site du Zro pour leur aide prcieuse
et lquipe de Simple IT : Sbastien de la Marck pour son norme travail de
validation et Anna Schurtz pour son immense patience devant ma forte tendance
la procrastination ;
enfin, un petit clin dil toute la 5e compagnie de rserve du 19e rgiment du gnie
de Besanon... parce que, oui, on promet beaucoup de choses dans leuphorie dun
premier tir russi au Famas 200 mtres.
iii
CHAPITRE 0. AVANT-PROPOS
iv
Sommaire
Avant-propos
ii
Remerciements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iii
Introduction au rfrencement
1 Parlons de rfrencement. . .
Lavant et laprs-Google
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
16
17
II
21
22
22
27
29
SOMMAIRE
Un site web, du code HTML . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
33
38
43
44
46
48
50
55
56
58
63
67
68
72
74
77
81
82
84
86
9 La smantique et le rfrencement
89
La smantique et le rfrencement . . . . . . . . . . . . . . . . . . . . . . . .
90
92
94
97
98
SOMMAIRE
III
105
107
113
121
127
IV
139
141
161
SOMMAIRE
17 Montisez votre site web avec Google Adsense
169
183
189
195
197
205
viii
Premire partie
Introduction au rfrencement
Chapitre
Parlons de rfrencement. . .
Difficult :
e suis content de voir que vous mavez suivi dans cette aventure. On va donc pouvoir commencer parler de rfrencement de manire srieuse. Savez-vous ce dont il
sagit ? Dans ce chapitre, nous nallons pas commencer toucher aux codes sources
qui composent votre site, mais plutt nous allons vous mettre en tte les ides fondatrices
du rfrencement.
Cest simplement parce que le mot rfrencement sest vite impos par abus de langage comme un terme gnrique pour dsigner rfrencement et positionnement .
Pour parler aussi bien de la prsence de son site dans lindex que de sa position, on a
vite commenc nutiliser que le mot rfrencement . Nhsitez donc pas parler
du rfrencement de votre site sur des forums ou dans une conversation ; cest le mot
qui sera le plus compris.
Le terme anglais est trs prcis. Les Anglais parlent de Search Engine Optimisation : le SEO. Cette expression est aussi trs utilise en France.
Exemple de rfrencement
Ce que nous souhaitons obtenir pour votre site
Ce point de vocabulaire pass, voici ce que lon souhaite obtenir pour votre site web.
Prenons lexemple du vidoclub prsent en figure 1.1.
4
Le positionnement
Si vous regardez la mme image, vous devriez voir quun film est mis en avant sur
la gauche. Il est spar des autres films, et en plus il bnficie dune petite affiche
qui retiendra probablement votre regard lorsque vous passerez dans ce rayon. Ceci
caractrise le positionnement. Par abus de langage, on peut aussi dire quil est bien
rfrenc , comprenez bien positionn .
Ce que nous souhaitons obtenir pour votre site, cest exactement la mme chose que le
film qui est sur cette affiche : quil soit mis en valeur et visible, mais sur Google. tre
bien rfrenc sur Google signifie tre dans les premiers sites sur la page de rsultats.
Vous verrez tout au long de ce cours que ce nest pas une mince affaire. Il va falloir
peut-tre rapprendre totalement concevoir vos sites web, mais ne vous en faites pas,
on est l pour apprendre tout cela.
Figure 1.2 La Google Search Bar possde aussi ses petits secrets
Par exemple, si je souhaite vrifier si le Site du Zro est rfrenc sur Google, jouvre
la page daccueil de Google (http://www.google.fr), et je tape la recherche qui suit
dans le moteur de recherche.
1
tant donn que le Site du Zro existe dans lindex de Google, le moteur de recherche
me retourne toutes les pages du Site du Zro quil possde. En revanche, si je refais le
mme test avec un site nexistant pas dans lindex de Google, par exemple :
1
Google indique bien quil ne connat pas ce site, celui-ci nest donc pas rfrenc. Nallez
pas rserver le nom de domaine aucunresultat.com exprs pour me faire mentir.
Notez bien que vous ne devez pas renseigner le protocole HTTP (http :// ),
Google nen a pas besoin. Contentez-vous de lui indiquer le nom de domaine
prcd de site: et il saura travailler tout seul.
Figure 1.3 Eye Tracking men par Miratech sur la SERP (Search Engine Results
Page) de Google !
Quelques chiffres
Dune manire gnrale, un site web gnre son trafic grce aux moteurs de recherche.
En moyenne, 85 % de ses visiteurs viennent des moteurs de recherche, Google en tte.
Pour le reste, 10 % accdent au site par un accs direct (favoris, barre dadresse) et 5
% par un lien entrant trouv ailleurs sur le web (voir la figure 1.4).
Jespre vous avoir fait comprendre que vous navez vraiment pas le choix : il va falloir
travailler fond votre rfrencement et arriver entrer dans le triangle dor, sans quoi
votre site ne gnrera jamais le trafic dont vous rvez.
8
LAVANT ET LAPRS-GOOGLE
Lavant et laprs-Google
Le web est immense et, depuis sa cration, des moteurs de recherche se sont donn
pour objectif de permettre aux internautes de trouver linformation rapidement dans
cette masse de contenu. Dans un article de lEuromag, Ryan Franck propose trs justement une division de lhistoire du rfrencement en deux priodes : lavant-Google et
laprs-Google. Je vais galement suivre cette ide et diviser cette prsentation historique de cette faon. Vous comprendrez mieux pourquoi nous allons beaucoup parler
de Google.
Lire larticle
B
Code web : 214588
Laprs-Google
Le rfrencement devient trs complexe
En 1995, deux tudiants de luniversit de Stanford, Larry Page et Serge Brin, font
quipe sur un projet quils baptisent Backrub . Lide des deux hommes est de
crer un nouveau moteur de recherche plus performant quAltavista. Ils parviennent
raliser un nouvel algorithme rvolutionnaire, capable de dterminer la pertinence
dun site en fonction du nombre de liens entrants vers celui-ci et de leur qualit. Tout
a chang ce moment-l : le bourrage de mots-cls dans les meta du site ne suffisait
plus, il fallait maintenant que dautres sites fassent des liens vers le ntre pour quil
soit reconnu comme pertinent, et donc bien rfrenc.
10
LAVANT ET LAPRS-GOOGLE
Google tait n (il prendra son nom dfinitif trois ans plus tard, en 1998).
Tout de suite, cest lexplosion. Ce systme rvolutionnaire runit un nombre dutilisateurs colossal, et dtrne sans grande difficult Altavista.
Altavista ayant sombr face Google, le moteur de recherche est rachet par
une entreprise nomme Overture, puis par Yahoo !.
Vous laurez compris, ce qui a fait le succs de Google, cest son algorithme. Lre
des meta est rvolue avec la chute dAltavista et nous sommes entrs ce moment-l
dans lre du contenu qui est, depuis, llment cl de chaque page web. Par la suite,
Google na jamais cess sa croissance exponentielle, et il est aujourdhui en situation
de quasi-monopole sur le march des moteurs de recherche.
Nimaginez pas que faire beaucoup de liens entrants suffit vous garantir un
bon rfrencement. Ce serait beaucoup trop facile. . . et ce cours naurait pas
de raison dtre.
En effet, si Google a su trouver la cl de son succs, celle-ci na pas cess de senrichir
et de se complexifier au fil du temps. Depuis, de nouveaux algorithmes ont t crs et
ajouts Google. Ceux-ci tiennent compte de la qualit de votre code HTML, de votre
prsence sur les rseaux sociaux et de beaucoup dautres lments. Le rfrencement
na donc pas cess de se complexifier et crer des liens ne suffit plus : Google se base
aujourdhui sur plus de 200 critres de pertinence pour dterminer le positionnement
des sites dans son index. Cest donc sur plus de 200 critres quil va falloir travailler
pour se dmarquer des autres sites.
Chez Google, sachez par ailleurs quun dpartement de dveloppement appel
Search Quality est compos de dveloppeurs et dingnieurs chargs uniquement de mener des recherches et damliorer constamment lalgorithme
dindexation. Les choses bougent toujours, et elles nont jamais t aussi
complexes quaujourdhui !
Vous aurez donc tout gagner vous concentrer essentiellement sur Google, car celuici tient littralement le march des moteurs de recherche dans sa main, tant il est en
situation de monopole. Un trs lger pourcentage des internautes se partage dautres
moteurs de recherche tels que Bing et Yahoo !, mais lorsquon sait que leurs systmes
sont trs inspirs de ceux de Google, pratiquement aucune conversion ne sera ncessaire.
Ainsi, mme si ce cours portera essentiellement sur Google, ce que vous apprendrez sera
rutilisable sur la trs grande majorit des moteurs de recherche. Vous ne ngligerez
ainsi aucune source de trafic pour votre site.
11
Pas vraiment, et moi-mme, je ne connais pas ces critres de manire exacte. Le fait
est, que si Google ne communique pas, des centaines de milliers de tests ont t effectus ces dernires annes sur des points particuliers pour comparer la manire dont le
moteur positionne les contenus. partir des rsultats de ces tests, on est capable de
connatre assez prcisment le comportement de Google, et de l, on sait ce quil faut
faire pour quun site soit bien rfrenc. On sait donc aujourdhui comment crer des
contenus SEO-Friendly. Le but de ce cours va tre de vous initier ces techniques de
rfrencement : vous verrez que lon va avoir beaucoup faire !
En rsum
Le rfrencement consiste optimiser son site pour obtenir une meilleure place dans
les moteurs de recherche.
Votre trafic et la survie de votre site dpendent de votre place dans les rsultats de
la SERP de Google.
Nous nous concentrerons dans ce cours sur Google, car il monopolise le march des
moteurs de recherche.
12
LAVANT ET LAPRS-GOOGLE
Google vous propose une suite doutils qui vous aideront dans votre tche doptimisation : crez un compte Google !
13
14
Chapitre
15
Le navigateur web
Quel est le meilleur navigateur web pour le SEO ?
Disons quil ny a pas vraiment de meilleur navigateur mais quil y a plutt plusieurs
navigateurs qui sont excellents. vrai dire, tout navigateur peut tre trs bien pour le
rfrencement : on na pas vraiment besoin dun navigateur qui sache faire le caf pour
le coup ! On ne demande quune seule chose au navigateur : quil soit jour au niveau
des standards. Un navigateur capable dafficher correctement les technologies qui font
le web sera un bon navigateur pour rfrencer vos sites.
Par ailleurs, lorsque vous avez appris HTML et CSS, on vous a dit de toujours
utiliser plusieurs navigateurs pour tester la compatibilit : ce conseil vaut
toujours.
Voici une liste des principaux navigateurs web daujourdhui. Vous pouvez les utiliser
pour suivre ce cours, et pour travailler le rfrencement de votre site. En principe, tous
sont gratuits, sauf Internet Explorer qui ncessite lachat dune licence Windows.
Internet Explorer : le navigateur de Microsoft, qui quipe tous les PC
Windows. Je lutilise frquemment pour tester mes sites web.
Compatibilit : Windows
Code web : 577078
Mozilla Firefox : le navigateur de la fondation Mozilla, clbre et rput.
Je lutilise frquemment pour tester mes sites web.
Compatibilit : Windows, Linux et Mac
Code web : 882142
Google Chrome : le navigateur de Google, simple demploi et trs rapide.
Cest le navigateur que jutilise au quotidien.
Compatibilit : Windows, Linux et Mac
Code web : 901626
16
En arrivant sur ce site, vous pouvez apercevoir une barre de recherche intgre. Vous
pouvez lutiliser si vous savez exactement quel type dextension vous recherchez. Pour
notre part, nous voulons des extensions utiles pour le rfrencement web.
Vous avez de la chance : comme je suis sympa, je vais vous donner une liste des exten17
Attention ! Plus vous ajouterez dextensions votre navigateur, plus celui-ci sera gourmand en mmoire ! La ractivit de votre systme en sera donc sensiblement rduite.
Web Developper : cest une extension Firefox qui se caractrise par lajout
dune toolbar votre navigateur. Elle permet facilement de dsactiver les
feuilles de styles, les images, les codes JavaScript. . . Bientt, vous ne pourrez
plus vous en passer.
Code web : 943800
Firebug : il complte Firefox en lui ajoutant des outils de dveloppement
web. Il vous sera notamment utile pour reprer des erreurs dans vos codes
Javascript, mais aussi pour mettreen vidence les blocs qui composent votre
page web. Appuyez sur la touche F12 pour ouvrir ces nouveaux outils.
Code web : 818933
User Agent Switcher : du mme auteur que Web Developper, cette extension Firefox vous permettra de modifier facilement votre User-Agent.
Nous verrons au chapitre suivant ce quest un User-Agent et pourquoi il est
important de savoir le modifier.
Code web : 638703
WebRank Toolbar : une barre doutils qui vous donne un aperu complet
de ce que vaut le site ouvert dans Firefox, en matire de rfrencement.
Code web : 202638
KGen : il sagit dune extension Firefox qui sera capable de vous fournir
une liste de mots-cls pertinents pour la page web que vous visitez.
Code web : 470130
Vous devez trs certainement vous demander quoi vont servir ces extensions pour
votre navigateur, et cest normal. Vous prendrez conscience ds le prochain chapitre de
lutilit de ces extensions !
18
Un bon point pour Google Chrome par rapport Firefox : lajout dextensions ne requiert gnralement aucun redmarrage du navigateur. Vous allez donc pouvoir utiliser
vos nouvelles extensions plus rapidement. Comprenez bien que le fait que vous soyez
sous Google Chrome ou Chromium ne change strictement rien. Le Chrome Web Store
est fonctionnel pour Chrome comme pour Chromium.
Bien ! limage de ce que lon a fait pour Firefox un peu plus haut, voyons les extensions
intressantes que lon va pouvoir utiliser avec Google Chrome pour le rfrencement.
Pour Google Chrome, on va avoir besoin dun peu moins dextensions que pour Firefox.
Par exemple, Firefox a besoin de lextension Firebug afin de pouvoir grer plus doutils
de dveloppement, alors que Google Chrome propose des outils similaires en natif. Jen
ai quand mme retenu deux qui pourront vous servir.
Les extensions Google Chrome ne sont videmment pas les mmes que les
extensions Firefox.
Page Rank Status : il sagit dune extension Google Chrome qui va vous
permettre dafficher dans le navigateur le Page Rank ainsi que beaucoup
dautres informations comme le rang Alexa de la page que vous tes en
train de visiter.
Code web : 624754
SEO Site Tools : SEO Site Tools est une extension Google Chrome incontournable qui va vous fournir des informations trs pousses sur la page
web que vous tes en train de visiter. Elle va notamment vous permettre de
lister les headings (<h1>,<h2>,. . .) ainsi que beaucoup dautres choses.
Code web : 985245
Sans vouloir animer de dbats, ma prfrence personnelle va Firefox, car il est considr depuis vraiment longtemps comme lami des dveloppeurs. La somme dextensions
quil propose, ses performances ainsi que sa communaut en font vraiment un alli de
choix pour toute tche de dveloppement (au sens large) sur le web. Je ne peux donc
que vous conseiller de vous quiper de ce navigateur web au quotidien.
19
En rsum
Utilisez un navigateur web jour.
Une suite dextensions pour navigateur web a pour but de vous simplifier la vie.
20
Chapitre
Ne sautez en aucun cas ce chapitre, sinon vous ne comprendrez vraiment rien la suite de
ce cours !
21
Le fonctionnement de Googlebot
Un programme en plusieurs tapes
Googlebot a t programm par Google selon plusieurs critres. Il est trs perfectionn,
et comprendre son fonctionnement est lune des cls pour bien russir son rfrencement. Nous allons donc voir ici le comportement que Googlebot adoptera au moment
o il verra votre site web.
1. Googlebot arrive sur votre site web : son arrive sur votre site web,
Googlebot va commencer par analyser votre page web, en regardant son code
source HTML. Il enregistre ce code source, et le fait parvenir Google.
2. Googlebot explore les liens <a></a> : Googlebot ne va pas sarrter l. Il
va reprer tous vos liens et les explorer, de la mme manire quun utilisateur
cliquerait dessus.
3. Googlebot arrive sur de nouvelles pages web : de la mme manire que
prcdemment, il va rcuprer les codes HTML de ces nouvelles pages et les faire
parvenir Google.
4. Googlebot explore nouveaux les liens : Googlebot va encore explorer tous
les liens prsents, avant denregistrer les codes HTML des pages quil atteindra. . .
et ainsi de suite.
Voil exactement comment Googlebot fonctionne. Vous pouvez le comparer un utilisateur qui ouvrirait tous les liens en enregistrant vos pages HTML, il ne fait rien
dautre. Quelques heures plus tard, Google aura index ces pages, et elles seront accessibles sur simple recherche Google. Nous verrons plus tard quil est bien sr possible
dimposer des restrictions Googlebot.
23
En rsum
Les robots sont des programmes automatiss arpentant le web tous les jours et remplissant une tche prcise.
25
26
Deuxime partie
27
Chapitre
Lorsque vous dveloppez votre site, ne le faites jamais la vue de Google. En effet, nous
savons depuis le chapitre prcdent que le rflexe de Googlebot est de traiter votre contenu
de manire lindexer. . . Si la version en dveloppement de votre site est accessible sur
Google, elle sera bien sr positionne, ce qui est trs ngatif pour les raisons que vous
imaginez. Agissez donc toujours en amont de votre projet, et ne dployez que lorsque votre
site est tout beau, car il est plus difficile aprs de redresser la barre.
29
Le langage HTML
Baliser, cest aider le Googlebot
Le HTML ressemble beaucoup au XML, et pour cause ! Son rle est simplement de
vous aider crer du contenu web cohrent. Nous savons que le code HTML sera lu
par Googlebot et quil aura une importance capitale ; il faut donc produire un beau
code. Lorsque vous avez appris HTML, on vous a forcment fait un topo sur lhistoire de
la validit du code des pages web sur le W3C validator. En effet, un code valide est un
code qui se rfrence bien. Produire un beau code source garantit une lecture optimale
pour le Googlebot, qui sera plus mme de reprer les informations importantes de
vos pages web. Commencez donc par crer un site qui soit propre dans son code, et
ne vous lancez pas dans la cration de sites web si vous navez pas de bases solides en
HTML et CSS. Heureusement, le Site du Zro propose un cours sur ces langages !
Lire le cours
B
Code web : 317261
Les balises HTML ne signifient pas toutes la mme chose
Chaque balise a sa signification, et chacune permet de comprendre la page web. Une
certaine balise peut reprsenter un titre, une autre une image. De la mme manire que
les balises ne signifient pas toutes la mme chose, les informations quelles contiennent
ne sont pas les mmes, et elles nauront pas le mme impact sur la manire dont
Googlebot va indexer votre contenu. Par exemple, il comprendra que ce quil y a dans
<strong> reprsente un texte plus important quun texte dans une balise <span>.
Ainsi, Google sera plus mme de faire apparatre votre site web plus haut pour la
recherche tarte aux pommes si cette expression se trouve dans une balise <strong>
plutt que dans une balise <span> qui, elle, na pas vraiment de signification. Ceci dit,
a, cest vraiment dans labsolu. . .
Les balises de titre
Ces balises sont certainement les plus importantes de toutes, et vous devrez travailler
leur contenu le plus possible. Vous les connaissez, il sagit des balises <h1> <h6>.
Dans votre stratgie de rfrencement, vous ne devrez jamais ngliger limportance de
30
Les cas <strong> et <em>
Les balises <strong> et <em> sont galement dune importance capitale dans votre code
HTML, simplement parce quelles permettent de mettre en exergue des expressions que
vous jugez importantes, et qui constituent par extension lintrt de votre page web.
Utilisez ces balises avec modration, et ne mettez pas en valeur 95 % de vos textes avec
celles-ci. Googlebot est trs perfectionn : sil voit une balise <strong>, il va considrer
linformation quelle contient comme importante. Ne faites donc pas nimporte quoi
avec ces balises.
Ces balises servent UNIQUEMENT indiquer que le texte quelles encadrent
est important. En aucun cas elles ne signifient mettre en gras ou en italique , car ceci se gre en CSS. Cependant, noubliez pas que Googlebot se
moque perdument de la mise en forme de votre page : il ne la voit pas.
33
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
Ce modle de base est celui que lon a tendance enseigner partout. Ainsi, le cours
de HTML5 du Site du Zro vous enseignera galement cette mise en page de
base, de la mme manire que le site W3Schools, une sorte de Site du Zro anglais.
Les quelques innovations qui ont t apportes ce modle de base au fil des ans se
comptent sur les doigts dune main. La plus connue est probablement celle de lajout
dun menu horizontal proximit du header du site, uniquement permise par les avances technologiques en matire dcrans qui ne cessent de sagrandir et de proposer de
34
37
Google met disposition des dveloppeurs loutil Google Pagespeed. Vous
pourrez ainsi avoir un retour trs complet sur les performances de votre site
web.
Figure 4.2 Les sprites CSS de plusieurs grands sites, dont Google
hauteur de la <div> sur laquelle vous travaillez. Ainsi, ce nest plus 100 requtes
HTTP qui vont servir rcuprer toutes vos images, mais une seule. Des conomies
normes pour votre serveur.
Il existe un cours trs bien ralis sur le Site du Zro pour vous aider apprhender les sprites CSS. Vous verrez que ce nest franchement pas complexe
mettre en uvre.
Lire le cours
B
Code web : 810016
Pour information, le Bootstrap Twitter a t construit grce aux sprites CSS. En effet,
il est compos de classes CSS3 trs dveloppes qui donnent un excellent rendu, et les
quelques petites icnes que le framework propose sont gres par des sprites.
Il constitue en cela une bonne base pour commencer un site.
Placez convenablement vos codes JavaScript !
JavaScript est un langage gnralement utilis pour les pages web. Malgr des ides
reues, JavaScript est un langage vraiment puissant qui vaut le dtour. Il sexcute ct
client, ce qui signifie que votre serveur na pas linterprter. Cest dj un
bon point : cest au moteur JavaScript de votre navigateur de le grer.
JavaScript est puissant, mais il est gnralement mal utilis. Vous pouvez choisir soit
den mettre directement dans votre page web, ce qui est bien souvent une mauvaise solution pour la lisibilit de votre code source par Google et vous-mmes, soit de le placer
dans un fichier qui portera lextension .js que vous prendrez soin de rattacher
votre page web grce la balise script :
1
< script src = " fichier . js " > </ script >
Vous devez inclure un JavaScript soit au tout dbut de votre page, dans la balise
40
Cest tout fait exact ! Votre site nest plus le simple code source HTML et les 50
lignes de CSS quil pouvait tre autrefois. Aujourdhui, cest une vritable machine
intelligente qui fonctionne silencieusement tous les jours de lanne. Quel que soit le
langage employ, cest tout un univers de variables et de fonctions qui sarticulent. . .
mais aussi de requtes SQL.
On commence plutt bien se connatre vous et moi, aussi je pense que vous avez
commenc remarquer que jadore les statistiques et les chiffres. Savez-vous quun site
web utilisant une base de donnes est en moyenne 5 fois plus lent quun site uniquement
construit sur des fichiers ? a parat fou, et pourtant. . . Si lon peut difficilement se
passer de bases de donnes, tant elles sont importantes pour avoir un site un minimum
intressant, on peut toujours rduire les temps de chargements en diminuant le nombre
de requtes SQL, en les optimisant, et en fournissant des index aux tables.
Couplez tous ces conseils avec toutes les indications sur lergonomie que je vous ai
donnes prcdemment, et cela devrait donner quelque chose de convenable en termes
de temps de chargement.
Un utilitaire nomm Minify cod en PHP commence se faire une bonne
rputation dans la communaut ; son principe est de nettoyer automatiquement vos codes sources en plaant correctement vos JavaScript ou en
fusionnant vos CSS en une seule. Pour lavoir essay, je le trouve plutt bon.
Cest peut-tre susceptible de vous intresser. En revanche, ne lutilisez vraiment que lorsque vous savez prcisment ce que vous faites. . . son utilisation
pourrait avoir des effets pervers et se retourner contre vous en ayant exactement leffet inverse sur votre site.
41
Google et lempathie
Pensez vos visiteurs, pas aux robots
Google donne pour conseil aux webmasters de ne pas chercher travailler le rfrencement mais de toujours proposer un contenu et un site qui plaisent aux visiteurs, avant
de chercher plaire au robot. Gardez toujours cette ide en tte, mais noubliez jamais
dintgrer une dimension SEO vos dveloppements (au sens large) de sites web.
Je ne cherche par ailleurs vous imposer aucune mise en page ou contrainte. Cest
votre site et vous en faites ce que vous voulez. Retenez simplement quun carrousel
en header est plus beau quun logo, mais quil demande aussi plus de code HTML,
code que Googlebot considre comme relativement peu intressant ct de votre vrai
contenu. En outre, cela va lui compliquer la vie plus quautre chose, en plus de faire
baisser votre ratio code/contenu.
En rsum
Un site web se conoit en HTML avant tout, et de prfrence en HTML5. Vous avez
intrt avoir le code le plus propre possible.
Ne ngligez jamais vos balises de titre et jouez sur limportance de vos expressions
pour faire ressortir lintrt de votre contenu.
Un mot en haut de page est plus important quun mot en bas de page.
Dans la mesure du possible, optez pour un site web fond sur le modle ergonomique
de base !
Un site qui se charge vite est un site qui plat.
42
Chapitre
Pour communiquer avec Googlebot et lui donner ces infos, il va falloir passer par le contenu
de la section <head> de votre page web. Il ny aura pas 36 solutions, nous allons devoir
passer par les balises <meta />. Oui ! Ces balises qui taient totalement indispensables
pour rfrencer son site dans les annes 1990 sont toujours l !
43
Figure 5.1 La SERP de Google est mise en page grce la balise <title>
Nous pouvons voir assez facilement que chacun des rsultats sur cette page est prsent
selon un mme pattern. En effet, chaque fois on trouve un titre avec un lien qui est
fait vers une page web. On aura galement lURL de cette page juste en dessous
dans une police verte, et en troisime position, nous avons une courte description de
44
4
5
Le contenu de ce qui se trouve dans <title> est rutilis par Google pour former le
lien qui mnera vers votre page. Vous pouvez comparer le code source ci-dessus, avec
le visuel de la page de rsultats pour vous en rendre compte. Vous devez maintenant
comprendre que la balise <title> est dune importance vraiment capitale dans votre
rfrencement. Il faudra travailler vraiment vos <title>.
META description
Dcrivez votre contenu !
La balise <meta name="description" /> a, elle aussi, son petit rle jouer dans
lindexation de votre page web. Vous laviez peut-tre remarqu, le contenu de cette
balise va galement safficher dans les rsultats de recherche sur Google, juste en dessous
de lURL du site web, en troisime position, comme vous pouvez le voir sur la figure
5.2.
Figure 5.2 La balise meta description est utilise dans le rsultat de recherche sur
Google
Cette balise est l pour que vous puissiez dcrire plus facilement votre contenu au
Googlebot afin que celui-ci indexe mieux votre page web. Comme dhabitude, il faut
que cette description soit riche en mots-cls, tout en tant attractive pour le visiteur
pour vous dmarquer des autres pages. Cette description obit galement quelques
codes. Sil est gnralement conseill de ne pas dpasser les 60 caractres pour son
<title>, pour la description, la limite est 200 caractres. vous dtre prcis !
Comment je la place cette description, moi ?
Elle se place exactement comme la balise <title>, dans la balise <head>. Ouvrez simplement une balise <meta /> avec les attributs name="description" et content="votre
description" comme ceci :
1
< meta name = " description " content = "C ' est la description de ma
page ! " / >
Vous pouvez par exemple placer cette ligne juste en dessous de votre balise <title>.
Celle-ci peut vous faire gagner des points au niveau du rfrencement, et elle est galement l pour jouer un rle daccroche pour linternaute qui regardera les rsultats de
recherche Google.
META keywords
Les mots-cls de votre page !
Cest LA balise qui a t la plus grande perdante de ces dix dernires annes. lpoque dAltavista, elle tait aussi importante que votre contenu peut ltre
aujourdhui. Les gens qui soccupaient du rfrencement de leur site se contentaient
47
< meta name = " keywords " content = " mots - cl s " / >
lintrieur, vous avez simplement indiquer des mots-cls, en les sparant par une
virgule. Le Site du Zro utilise encore la balise meta keywords. Vous pouvez prendre
exemple sur lui afin de construire la vtre. Voici la balise meta keywords de la page
daccueil du Site du Zro.
1
< meta name = " keywords " content = " Cours , tutoriel , didacticiel ,
informatique , programmation , c , c ++ , php , ... " / >
Encore une fois, si vous souhaitez placer de bons keywords dans cette balise <meta />,
il faudra attendre encore quelques chapitres.
Voil comment vont sarticuler vos balises <meta /> ainsi que votre balise <title>
afin de permettre au Googlebot danalyser votre site un peu plus facilement, et de vous
assurer quelques points supplmentaires pour votre site au niveau du rfrencement.
Question utilit ?
Ces balises ne servent pas ou peu
Meta description : la balise meta description est encore relativement intressante
puisque son contenu apparat dans la page de rsultats de Google. Vous devriez y
renseigner quelques mots-cls et tenter davoir une belle accroche pour votre visiteur.
Nanmoins, lorsquelle nest pas utilise, Google est capable didentifier dautres lments de votre page ;
Meta keywords : lpoque Altavista est termine, mes amis ! Cette balise ne sert
rien, mais il peut tre quand mme intressant de la renseigner. vous de voir. . .
mais on ne vous tiendra jamais rigueur de la non-utilisation de cette balise.
< meta name = " robots " content = " Instruction1 , Instruction2 " / >
Voil par exemple le type dinstruction que lon va pouvoir utiliser dans le meta robots.
1
< meta name = " robots " content = " index , follow " / >
Index, follow signifie que lon va pouvoir autoriser Google indexer notre contenu
ET suivre les liens prsents sur la page.
Cest le comportement que Googlebot adopte par dfaut si vous ne dfinissez
pas de meta robots.
Ainsi, avec cette configuration, Googlebot va, dans un premier temps, rcuprer les
informations sur votre site dans le but de lindexer et va, en plus de cela, suivre les
liens <a href="page.html"></a> prsents sur votre page. Il va ensuite vrifier dans
cette nouvelle page sil peut lindexer ou non. Pour info, to follow signifie suivre
dans la langue de Shakespeare. Nous, ce que lon veut, ce nest pas a. On veut que le
Googlebot nindexe pas notre page, et ne suive pas les liens prsents sur celle-ci. Pour
cela, on va trs simplement lui indiquer linformation noindex, nofollow.
1
< meta name = " robots " content = " noindex , nofollow " / >
<a href = " une - page . html " rel = " follow " / > Une page <a > <! -Googlebot va suivre ce lien ! -- >
<a href = " autre - page . html " rel = " nofollow " / > Une autre page <a > <!
-- Il ne suivra pas celui - ci ! -- >
Cest facile, non ? Admettons que vous ayez un lien qui mne vos pages dadministration sur votre site. Vous souhaiteriez que ce lien ne soit pas suivi par Googlebot.
Faites simplement :
1
<a href = " admin . html " rel = " nofollow " > Admin </ a >
De plus, dans admin.html, il faudra bien que vous pensiez marquer la page en noindex
(au moins) dans le meta robots.
Jespre quand mme que vous avez dj le rflexe de cacher ce genre de
liens avec du PHP ou autre. . .
robots.txt de Google
B
Code web : 160961
crire son robots.txt
Gnralement, on commence son robots.txt en indiquant le User-agent qui est vis.
Le User-agent est un nom qui va vous permettre didentifier un robot par rapport un
autre. Par exemple, voici le User-agent de Googlebot.
Googlebot/2.1 (+http ://www.google.com/bot.html)
Ainsi, pour commencer crire votre robots.txt, vous allez devoir renseigner dans un
premier temps le User-agent.
1
User - agent : Googlebot / 2 . 1 (+ http :// www . google . com / bot . html )
Toutes les instructions qui vont suivre vont concerner le Googlebot et pas les autres
robots. On peut galement dcider de viser tous les robots avec le signe *.
1
User - agent : *
L, ce sont tous les robots qui seront touchs. Ensuite, vous pouvez utiliser les instructions Allow : et Disallow :, en les faisant suivre du lien du fichier ou rpertoire afin
dautoriser ou non son indexation.
1
2
3
User - agent : *
Allow : / index . php
Disallow : / admin
51
Bonne pratique
Renseigner un robots.txt dans tous les cas
Les robots chercheront toujours obtenir le fichier robots.txt qui se trouve la racine
de votre site web. Une bonne pratique consiste donc toujours fournir ce fichier mme
si vous dcidez de ninclure aucune rgle dindexation particulire lintrieur. Vous
devrez donc crer le fichier robots.txt et y placer le contenu suivant.
1
2
User - agent : *
Disallow :
Vous remarquez que rien nest plac derrire la directive Disallow. En effet, on fait
simplement le choix ici de ne rien interdire. Les robots vont ensuite grer les pages web
de votre site au cas par cas, selon ce que vous avez renseign dans votre balise <meta
52
En rsum
Utilisez la balise <meta /> robots pour interdire lindexation de certains contenus.
La balise <title> et la balise <meta />description ne sont ngliger sous aucun
prtexte.
La balise <meta /> keywords ne prsente plus grand intrt aujourdhui.
Ces donnes doivent tre charges de mots-cls. Vous apprendrez les construire
correctement plus tard.
Le fichier robots.txt se veut tre lquivalent de la balise <meta /> robots, mais
lchelle du site entier.
Le fichier robots.txt se place la racine de votre site, et nulle part ailleurs.
53
54
Chapitre
55
56
Sous-domaine ou rpertoire ?
Vous devez forcment vous demander quel type de dcoupage est le plus recommand
pour un site web : doit-on utiliser des sous-domaines, ou des rpertoires sur le domaine
principal ? Voici le format que vos URL prendront dans les deux cas, lorsque nous
souhaitons accder une page de profil par exemple.
Avec sous-domaine
membre.votresite.com/profil.html
Avec rpertoire
votresite.com/membre/profil.html
Cest simple : le sous-domaine viendra se greffer avant le nom de domaine avec un point
( . ) comme sparateur. Avant 2007, les sous-domaines semployaient de manire totalement diffrente. En effet, pour Googlebot, un sous-domaine reprsentait carrment
un nouveau site compltement diffrent du domaine principal, qui ne profitait donc pas
de son rfrencement dj construit.
Fin 2007, Google a fait une mise jour de son algorithme. Dsormais, Googlebot
considre un sous-domaine comme un rpertoire du domaine principal. Il ny a donc,
aujourdhui, que des diffrences trs minimes entre utiliser un sous-domaine plutt
quun rpertoire, et inversement.
60
Redir ectPerma nent / ancienne - url . html http :// www . site . com /
nouvelle - url . html
Grce ce bout de code plac dans votre fichier .htaccess, toutes les requtes demandant
le fichier ancienne-url.html seront automatiquement rediriges vers nouvelle-url.html.
Ainsi, votre URL aura t dplace correctement, Google la prendra son tour en
compte, et vous nencaisserez pas de pnalits.
Si vous tes amens changer le nom de domaine de votre site, sachez quil est
possible de le signaler Google dune manire spcifique via les Webmasters
Tools. Nous verrons cela en temps voulu.
61
Redir ectPermanent / ancienne - url . html http :// www . site . com /
nouvelle - url . html
Dautres serveurs HTTP existent, tels que NGinx qui est lui aussi trs utilis. Cependant, jai une mauvaise nouvelle : les fichiers .htaccess nexistent pas sous NGinx, et
les redirections 301 se ralisent diffremment.
Il vous faut ouvrir le fichier /etc/nginx/nginx.conf, et y ajouter les liens qui suivent
dans la section server{}.
1
2
3
62
302 Found
Effet
Redirection que lon utilise pour indiquer quune ressource a t dplace de manire permanente. Cest
celle que lon a utilise.
Ce code indique au client que la ressource demande a t temporairement dplace vers un nouvel
endroit.
Le code 303 nindique pas que la ressource demande
a t dplace, mais elle renvoie en fait une autre
adresse o la ressource peut tre trouve.
Le code 307 indique quant lui que la ressource demande est temporairement disponible une autre
adresse. Elle indique galement ladresse en question
qui est retourne au client. Le code 307 est trs semblable au code 302, car il a t fait partir du code
302 afin den faire une version moins ambigu.
Un problme dURL
Des URL gnres dynamiquement
Ces URL laides gres dynamiquement possdent des variables dans leur construction.
Voici par exemple une URL qui aurait pu tre gnre par PHP.
http ://www.site.com/page.php ?id=1&ion=le-site&titre=ouverture- !
Ce type dURL est assez mdiocre, vous ne trouvez pas ? Pour le Googlebot, pas de
problme, il saura lindexer, mais pour votre visiteur, vous ne trouvez pas que cest
dommage de le laisser se bagarrer avec beaucoup de variables pour savoir ce que va
contenir la page web ? Il serait quand mme bien de nettoyer un peu ces URL pour
aider le visiteur identifier le contenu de votre page partir de lURL. Dans le mme
style, voici un exemple dURL encore plus mauvais.
63
La solution
LURL Rewriting
La solution ce problme dURL laides se met gnralement en place via des fichiers
.htaccess (dans le cas dun serveur Apache) pour mettre au point des URL dynamiques mais propres. Cette technique se nomme l URL Rewriting , ou la rcriture dURL . Cest quelque chose dassez difficile mettre en place tant donn que
cest trs technique et que tout le monde ne sait pas forcment manipuler les fichiers
.htaccess correctement. Grce lURL Rewriting, on peut effectuer ce genre de modifications sur les URL.
1
2
Une URL par PHP http :// www . site . com / page . php ? id = 1 & ion = le - site &
titre = ouverture -!
M me URL par PHP avec rewrite http :// www . site . com / le - site /1 ouverture -!. html
Cette URL est quand mme beaucoup plus propre en termes de confort pour votre
visiteur : le contenu est structur et hirarchis. Vous devez maintenant savoir que ce
64
En rsum
Votre nom de domaine est un choix trs important.
Optez pour un nom de domaine possdant un mot-cl en rapport avec votre thmatique.
Votre nom de domaine apparatra pour chaque page de votre site.
Plus vous aurez de pages, plus vous devrez diviser votre arbo.
Mme si Google est maintenant tout fait capable de traiter des URL contenant des
paramtres, optez pour des rcritures propres.
Les erreurs 404 sont trs mal vues par Google. Un changement dadresse = une
redirection.
65
66
Chapitre
dfaut de se lancer dans lagroalimentaire, Google nous offre encore tout un concept de
rfrencement, que lon va devoir dcortiquer ensemble, car le connatre sera lune des cls
du succs de votre rfrencement.
67
Le Google Juice est vraiment un concept trs important en SEO, et ne pas le connatre
pourrait vous coter quelques points en SEO. Heureusement, nous sommes ici pour
lapprendre. Vous allez voir, ce nest pas bien compliqu.
Avant de commencer expliquer ce quest le Google Juice, vous devez savoir
quun autre nom existe. On lappelle le plus souvent Link Juice , et sur
les forums franais jai mme vu lexpression jus de lien , alors ne soyez
pas surpris si vous voyez ces termes sur le web. Ils sont aussi trs utiliss.
Cette petite prcision tant faite, rpondons la question que vous vous posez certainement depuis le dbut de ce chapitre.
Mais cest quoi le Google Juice ? !
Pour bien comprendre le Google Juice, nous allons devoir comparer votre site web
un ensemble de gobelets dans lequel coule un liquide : le Google Juice. Chaque page
de votre site constitue un petit gobelet diffrent dun autre. Ainsi, vous avez autant
de gobelets que vous avez de pages web sur votre site. Voici la figure 7.1 une image
dans laquelle le gros gobelet qui se trouve tout en haut est la page daccueil de votre
site web. Essayez de projeter cette image sur votre site, bien que je sais que ce nest
pas trs vident.
Ces gobelets ne vont pas rester vides trs longtemps. Google va y verser du jus, du
Google Juice pour tre exact. Cependant, Google a toujours le souci de la prcision et
il ne va pas le faire nimporte o. En fait, il ne va pas chercher bien loin et va tout
de suite voir que le gobelet le plus lev est votre page dindex : / . Ainsi, tout
btement, Google va verser tout son jus de rfrencement ici, comme dans la figure 7.2.
Cest trs bien, mais nos autres gobelets sont un peu vides, non ? Cest votre site, donc
vos gobelets. Vous tes donc libres de faire des petits trous dans votre page daccueil,
pour laisser le jus couler vers un autre gobelet. Et puisque cest ce quil faut faire, on
va jouer le jeu fond et faire des trous un peu partout pour laisser le jus couler partout
sur notre site (voir la figure 7.4).
Lidal est que chaque page web reoive une partie du jus. Lun des gobelets a t
volontairement mis lcart : aucun jus ny coule pour vous montrer que cest vous qui
choisissez o vous voulez faire couler votre jus.
68
69
Figure 7.2 Google verse son jus dans la page daccueil de votre site web
70
Figure 7.3 A vous de faire en sorte que le jus de Google scoule dans lensemble de
votre site web
71
Figure 7.4 Aucun lien ne mne vers le gobelet tout en bas droite.
Une trs mauvaise rpartition du jus est de crer un lien vers chacune de ses
pages directement sur la page dindex. Cest encore une fois une trs grosse
erreur ne pas faire.
En somme, nayez pas la main trop lourde sur les liens. vous de voir comment vous
73
Figure 7.5 Le jus tombe ici dans le vide, il est dfinitivement perdu
75
Vous gardez ainsi toujours la main sur votre rfrencement. Si vous ne voulez pas
que vos membres aient la possibilit dinfluer sur votre Google Juice, nhsitez pas
programmer quelque chose qui ajoutera un rel="nofollow" aux liens sur vos forums.
Pour des sites o le contenu est gnr 100 % par la communaut, le problme sera
quand mme plus dlicat traiter. vous de trouver les solutions en fonction de votre
site.
Ce dont vous devez vous souvenir, cest que chaque lien cre un trou et que
le Google Juice schappe par ce trou, que chaque rel="nofollow" peut
boucher. Dans le cas des 404, vous ntes en aucun cas dispenss de les
corriger.
76
77
Figure 7.8 Le jus est quitablement revers chacune des deux pages
Cas particulier
Cas particulier du rel= nofollow
Le rel="nofollow" constitue un cas particulier que vous devez connatre. Plus haut,
je vous ai dit que vous deviez utiliser un rel="nofollow" pour boucher les trous.
Vous empchez ainsi le jus de passer. Cette technique est donc intressante utiliser
dans plusieurs cas de figure. Je citais tout lheure lexemple des membres qui crent
des liens sur les messages des forums : la solution est dajouter de manire automatique un rel="nofollow" afin que le jus reste concentr sur les pages de votre forum,
et que vos membres ne puissent pas influer sur votre manire de grer votre Google
Juice. Cest intressant me direz-vous, mais il faut galement savoir ce que va faire le
78
Figure 7.9 La page B ne reoit plus de jus, par contre, C en reoit bien 50% et pas
100%
En effet, un rel="nofollow" ne signifie pas que le jus sera rinvesti dans les autres liens
prsents sur la page. Cela signifie simplement que le lien sur lequel le rel="nofollow"
est plac ne transmettra pas de jus. Saisissez bien cette nuance, car cest essentiel pour
bien comprendre laction du rel="nofollow". Si vous souhaitez transmettre un jus le
plus concentr possible, le mieux est de ne pas crer de liens tout va. Chaque balise
<a>, quelle soit en rel="nofollow" ou non, divisera le jus transmis par la page.
Par le pass, le jus des liens en rel="nofollow" tait rinvesti dans les autres
liens de la page. Comme nous lavons vu dans ce chapitre, ce nest plus le cas
aujourdhui, et ce depuis deux ans. Faites donc attention en crant des liens
sur vos pages !
79
En rsum
80
Chapitre
81
En plus, si le tout se trouve dans les 600 premiers pixels de vos pages web, cest parfait.
Bien sr, vous devrez incorporer vos mots-cls partout o vous avez la possibilit dinclure du texte. Les balises <strong> et <em> sont l pour vous aider faire ressortir
des mots-cls dans votre contenu.
Lorsque je dis incorporer vos mots-cls, il ne sagit pas de les intgrer sous
une forme de liste vos pages web. . . Ils doivent sintgrer naturellement
votre texte et le visiteur nest pas cens les remarquer au cours de sa lecture.
Cest facile si vous avez choisi des mots-cls en rapport avec votre site, comme
je vous lai expliqu.
Analysons les tendances de recherche
Nous allons ici nous mettre dans la peau dun internaute qui sintresse linformatique. Nous allons donc taper simplement informatique dans la barre de recherche
de Google Insights. Le terme informatique tant purement franais, nous allons devoir recadrer cette recherche sur la France. Cest trs facile en utilisant le formulaire !
Premire chose agrable constater, Google Insights est capable de nous renvoyer un
classement des rgions franaises qui tapent informatique sur Google, comme vous
pouvez le voir sur la figure 8.1.
En rsum
Choisir de bons mots-cls est capital pour russir son rfrencement ; crez une liste
et aidez-vous de Google Insights.
Intgrez vos mots-cls de manire naturelle vos pages web.
Effectuez un suivi de vos mots-cls pour analyser le succs de votre rfrencement.
Produisez beaucoup de contenu pour que la longue trane senclenche.
88
Chapitre
La smantique et le rfrencement
Difficult :
89
La smantique et le rfrencement
Le pari de la smantique
Lhistoire du web
Le web est g dune vingtaine dannes tout au plus et, depuis sa cration, il na cess
dvoluer une vitesse folle. Pour sy retrouver, on sest mis vouloir distinguer les
grandes priodes de lhistoire du web par des numros de version . Vous avez donc
forcment entendu parler de web 2.0 ou de web communautaire . Voyons un peu
de quelle manire le web a volu ces dernires annes.
Le web 2.0 dit communautaire - Fin des annes 1990 et annes 2000
La fin des annes 1990 correspond une norme volution dans le web. En effet, nous
sommes passs ce moment-l au web 2.0 , un web communautaire o le visiteur
est maintenant acteur. Cest pendant cette priode que des choses qui ne nous quittent
plus aujourdhui sont apparues :
les flux RSS ;
les rseaux sociaux ;
les sites de partage.
Chaque visiteur est dsormais acteur du web. On lui propose des solutions pour interagir
trs facilement avec les autres visiteurs, et tout le monde se sent bien en communaut
en participant la vie du site. Le Site du Zro est typiquement un site web 2.0 .
Avec le web 2.0, un nouveau problme se pose. Puisque tout le monde sur le web devient
acteur et peut produire du contenu, il est dans le mme temps de plus en plus difficile
de suivre lvolution dun thme ou dune information sur le web. En effet, tout le
monde cre du contenu via des forums, des blogs, des rseaux sociaux. . . Le volume
dinformation avec lequel il faut jongler a ainsi considrablement augment. On fait
actuellement voluer le web vers une nouvelle version, le web 3.0 .
90
LA SMANTIQUE ET LE RFRENCEMENT
Le web 3.0 dit smantique - De nos jours. . .
Il existe un dbat concernant le fait de savoir si, oui ou non, nous sommes aujourdhui
dans le web smantique. Certains disent que oui, certains disent que non, et certains
disent quon est entre le web communautaire et le web smantique, autant vous dire
que cest un peu compliqu et que personne ne risque vraiment de tomber daccord.
Nanmoins, le web smantique reste le grand pari du W3C pour les annes venir.
Mais concrtement, le web smantique, cest quoi ?
Le web daujourdhui nest rien dautre quun ensemble de pages HTML, dont les
moteurs de recherche arrivent dfinir le thme par une suite de mots-cls prsents.
Par exemple, on arrive dfinir le Site du Zro comme un site de tutoriels, parce que
le terme tutoriel est prsent un peu partout sur le site. Le problme, cest que si
un humain sait ce quest un tutoriel, une machine, elle, ne sait absolument pas ce que
cest.
Lide est donc de permettre lutilisation de nouvelles balises HTML (notamment avec
HTML5) pour permettre aux internautes de ne plus crer de simples informations textuelles sur le web, mais des donnes qui ont du sens pour une machine. Prenons
un exemple apparu avec HTML5. Smantiquement, pour dfinir un menu en XHTML,
vous passiez par exemple par une div portant lid menu : <div id= menu >. Aujourdhui, en HTML5, on a la balise <nav>. Concrtement, les machines comprennent
que <nav> est un lment de navigation sur le site, alors que la balise <div> nest rien
dautre. . . quun lment HTML block !
Dans le web 3.0 (smantique), on va quand mme un tout petit peu plus loin que cela,
car on va avoir suffisamment de balises pour couvrir tous les types de donnes que lon
peut trouver sur le web. Voil un petit extrait, vous imaginez que la liste est vraiment
trs longue :
Vous ne comprenez pas trop lutilit du web smantique ? Cest normal, car jai omis
de vous parler dun facteur trs important ! Sachez que de nouveaux langages sont
envisags par le W3C. Ces langages seront adopts comme standards au mme titre
que le HTML. Parmi ces langages, nous aurons une sorte de langage de requte trs
puissant (comme le SQL !) pour obtenir des donnes prsentes sur les sites web. . . et
les utiliser dans des programmes ! Imaginez le potentiel de ces technologies venir, il
est quasiment illimit.
Bien sr, nous ne sommes pas totalement entrs dans le web smantique, mais il faut
comprendre que nous arriverons dans une situation o le web sera devenu intelligent,
les machines seront capables de comprendre les donnes, au lieu de ne voir que du
texte. Nous obtiendrons les informations plus facilement que jamais : cest le web qui
viendra nous !
91
Figure 9.1 Le Site du Zro met en forme ses rsultats de recherche grce aux microformats
En effet, vous pouvez voir quune donne est dfinie dans ce rsultat de recherche. Les
notes sur le tutoriel de Java ont t repres par Google grce un microformat :
le moteur de recherche a donc t capable dafficher des toiles, la note /4 ainsi que
le nombre de votants. Bien sr, dans quelques annes, quand le web smantique sera
parfaitement adopt, tout cela ira bien plus loin et stendra bien au-del des moteurs
de recherche. En attendant, il y a bien dautres donnes que nous pouvons dfinir sur
notre site. Google peut sen servir afin de mettre en forme nos rsultats de recherche
(voir la figure 9.2). Nous pouvons par exemple afficher un fil dAriane la place de
lURL de la page, le prix dun produit que nous vendons dans le cas dun site decommerce, ou encore la photo et le nom de lauteur dun article !
Pour le moment, tout cela va nous servir inciter linternaute visiter notre site une
93
Figure 9.2 Nous pouvons ajouter un Fil dAriane la place de lURL grce aux
micro-donnes !
fois quil verra notre lien sur Google, tant donn que nous avons loccasion dafficher
plus dinformations que dhabitude.
1
2
3
4
name : pour renseigner le nom de la personne ;
addressLocality : pour renseigner ladresse de la personne ;
affiliation : pour dire si la personne fait partie dune cole, ou dune quipe ;
email : lemail de la personne ;
...
Bref ! il y en a vraiment des tonnes et vous devriez consulter les documentations pour
vous faire une ide plus complte sur la question. . . Pour le moment, nous devons finir
de baliser notre code. Pour cela, nous allons faire simple et utiliser le nom et lemail ;
ce sera bien suffisant pour complter la prsentation de Jacques sur son blog. Pour
dfinir les proprits, je vous conseille dutiliser des balises <span>. Utilisez lattribut
itemprop pour renseigner les attributs.
1
2
< div itemscope itemtype = " http :// schema . org / Person " >
<p > Je suis l ' auteur de ce blog . Mon nom est < span itemprop =
" name " > Jacques </ span >. </ p >
95
<p > Mon adresse email est : < span itemprop = " email " >
jacques@monblog . com </ span > </ p >
</ div >
Et cest tout ! Voil ce que donne un code balis smantiquement ! Bien sr, lintrt
aujourdhui est trs limit et vous ne devez srement pas comprendre lutilit que tout
ceci peut avoir. Cest simplement de lanticipation, car demain on ne fera plus que a,
vous devriez donc prendre lhabitude tout de suite dutiliser les micro-donnes dans
vos codes source. Retenez simplement que les microformats constituent lavenir du
web, et que lon pourra plus tard utiliser a de manire bien plus pousse quen 2012.
Le tout est de prendre lhabitude de le faire ds maintenant ! Si vous avez compris ce
concept, alors vous avez tout compris : pour le reste, je vous conseille daller lire la
documentation de schema.org, ainsi que la FAQ de Google pour webmasters ce sujet.
Lire la FAQ de Google
B
Code web : 330366
Notez que les balises structurantes de HTML5 dont on a dj parl reprsenteront un rel enjeu dun point de vue smantique. Je vous conseille
nouveau de les utiliser ds maintenant pour structurer vos pages web !
En rsum
La smantique reprsente lavenir du web.
Consultez les dfinitions sur schema.org.
Prenez ds maintenant lhabitude de baliser vos contenus grce aux micro-donnes.
96
Chapitre
10
Nous parlerons aussi dans ce chapitre des sites web fonctionnant grce Flash, une technologie signe Adobe et largement diffrente de HTML. Les sites en Flash se rfrencent
diffremment des sites en HTML, il serait donc dommage de ne pas en parler.
97
la ligne 6, nous utilisons la balise <link rel="canonical" />. Cette balise sert
indiquer Googlebot quil sagit dune page mineure. Dans lattribut href de cette
balise, nous indiquons le lien de la page favorite que Googlebot devra considrer en
priorit. Selon Matt Cutts, mme si cette mthode est relativement propre, vous perdrez
quand mme un peu de Google Juice au passage. Cest pourquoi lidal est de ne jamais
avoir de contenu dupliqu.
Cest tout ce que vous deviez savoir sur les duplicate content, et sinon, noubliez pas
que rien nest plus efficace quun bon <meta name="robots" content="noindex" />.
Cest l que le premier problme va se poser pour le robot, car une ancre ne signifie
pas une nouvelle page. Dans un site orient contenu cest une vraie catastrophe.
URL
show_article.html#mes-vacances-au-japon
show_article.html#la-naissance-de-monpetit-frere
show_article.html#mon-nouvel-ordinateur
Titre darticle
Mes vacances au Japon.
La naissance de mon petit frre.
Mon nouvel ordinateur.
Vous voyez tout de suite le problme. Il serait quand mme particulirement gnant
que vos trois articles, qui parlent de sujets totalement diffrents, soient accessibles la
mme adresse par les robots. Il va donc falloir trouver le moyen de donner aux robots
un instantan HTML de vos pages web.
Cest trs simple comprendre : il faut envoyer vos robots le code HTML de votre
page, au moment prcis o tel ou tel article est affich. Google obtiendra ainsi le code
HTML de votre article Mes vacances au Japon de manire dissocie et indpendante du
code de votre article Mon nouvel ordinateur. Ainsi, le robot sera capable de comprendre
quil sagit bien de pages diffrentes qui constituent rellement deux entits diffrentes
rfrencer.
101
Flash et le rfrencement
Flash et le rfrencement
Quest-ce que Flash ?
Flash est une technologie cre par Adobe, une entreprise amricaine ditant des logiciels assez chers mais de grande qualit. Ils sont trs utiliss dans le monde professionnel.
Parmi eux, on peut citer Photoshop, Dreamweaver ou encore AfterEffect. Ce sont tous
des produits signs Adobe dont vous avez au moins entendu le nom ! Parmi ces logiciels,
il en existe un autre baptis Adobe Flash . Ce logiciel et le langage quil propose,
lActionScript, permettent de crer une multitude de choses complexes. laide de
Flash, vous pouvez notamment crer :
des
des
des
des
des
lecteurs audio ;
lecteurs vido ;
bannires animes ;
applications compltes ;
jeux vido.
Si Flash est suffisamment puissant pour crer toutes ces choses, il permet aussi de crer
des sites web complets et fonctionnels orients contenu.
Flash vs HTML
Si vous optez pour Flash (pourquoi pas ?) il va bien falloir vous dbrouiller pour rfrencer vos sites, car Flash est vraiment diffrent de HTML. Le web se fait en HTML,
cest un standard que le W3C impose , de mme que le CSS pour la mise en forme.
Ainsi, tout le monde est cens utiliser HTML et CSS pour faire des sites web. Google
le sait trs bien, et Googlebot a t cr de telle sorte quil soit parfaitement adapt
lindexation des contenus HTML. Tout a, vous le savez dj.
Le fait est que lon peut aussi utiliser Flash pour faire un site web. Cependant, avec
Flash, il ny a pas de code source, le contenu nest pas balis. Faites lessai et naviguez
sur gaara-fr.com. On voit bien que cela pourrait faire office de site web orient contenu.
Cest divis en sections et il y a beaucoup de contenus
textuels. Si vous essayez dafficher
le code source HTML de ces pages en appuyant sur Ctrl + U . . . rien ne saffiche, car
comme je vous lai dit Flash ne fonctionne pas comme a ! La question que vous devez
donc vous poser, cest comment rfrencer un site qui nest pas compos de HTML.
gaara-fr.com
B
Code web : 930535
La collaboration Google/Yahoo !/Adobe
Google et Yahoo ! ont compris quils ne pouvaient pas se permettre de ne pas savoir
indexer du contenu en Flash tant ils sont nombreux sur le web. Cela a pourtant t
longtemps le cas, tel point que Flash sest constitu une trs mauvaise rputation
102
FLASH ET LE RFRENCEMENT
lorsquil sagissait de parler rfrencement. On prfrait tout simplement passer Flash
sous silence et ne penser quen HTML et CSS. Aujourdhui ce nest plus tellement le
cas, et officiellement, on arrive maintenant rfrencer du contenu Flash pour peu que
celui-ci soit bien conu. En effet, Google, Yahoo ! et Adobe collaborent depuis 2008
afin doptimiser Flash pour le rendre SEO-Friendly . Google a dailleurs annonc
avoir implment Flash ; il serait maintenant capable de lindexer au mieux. Mme
si les sites Flash ne proposent pas de contenu HTML, les robots dindexation sont
aujourdhui capables didentifier le contenu au sein mme des animations Flash ! La
prsence dun contenu HTML ne serait donc pas indispensable dans lindexation.
Je suis pour ma part incapable de vous expliquer prcisment comment construire des
sites SEO-Friendly en Flash, car jai toujours utilis les standards HTML et CSS.
Nanmoins, le procd reposerait sur lemploi de certaines fonctions en ActionScript
pour dterminer quel contenu correspond quoi, laide notamment dURL et dancres.
Au lieu de vous faire une bte traduction des informations officielles fournies par Adobe,
je vous redirige directement vers leur FAQ qui semble complte ce sujet, et surtout,
vers un tutoriel de rfrencement en Flash.
Lire la FAQ
B
Code web : 388982
Lire le tutoriel
B
Code web : 482161
Faut-il utiliser Flash ?
Il faut quand mme savoir que Flash reste plus lourd que HTML/CSS et JavaScript.
Connaissez-vous les Google Doodle ? Il sagit de logos anims que Google propose souvent sur son moteur de recherche la place du logo habituel. Ces logos anims sont
entirement composs en JavaScript laide du framework jQuery. Google doit rpondre plus dun milliard de requtes chaque jour. Dites-vous que ce nest pas un
hasard si la firme se refuse toujours les proposer en Flash.
Aprs mtre document sur le sujet, mon sentiment est que malgr tous les efforts
dAdobe, de Google et de Yahoo !, jai du mal croire que le Flash se rfrence aussi
bien que le HTML. Nanmoins, je pense que, contrairement au pass, il ne faut pas
tomber dans la bte diabolisation du Flash, car il semble lui aussi possder plus dun
atout dans sa manche. Alors, pourquoi ne pas apprendre Flash ? Le site du Zro en
propose justement un !
Lire le cours Flash
B
Code web : 270994
En rsum
Interdisez lindexation de vos pages faibles en contenu pour favoriser vos pages riches
en contenu.
Mfiez-vous des duplicate content, ne plagiez pas les autres sites et ne proposez pas
103
104
Troisime partie
105
Chapitre
11
e rfrencement ne peut plus se limiter votre propre site : il va falloir travailler main
dans la main avec les autres pour faire de votre site un site bien rfrenc. Voyons ici
les tenants et les aboutissants du rfrencement lextrieur.
Notez que ce chapitre servira seulement dintroduction gnrale au rfrencement lextrieur. Nous rentrerons dans le dtail dans les chapitres suivants.
107
La mission de Google !
Au tout dbut de ce cours, je vous avais parl un tout petit peu de la mission que
Google stait donne : rendre linformation facilement accessible pour tous. Google
rfrence donc des millions de sites web et dresse une liste de rsultats la plus pertinente
possible pour la recherche que vous tapez. Tout cela, vous le savez. Ce que vous ne savez
probablement pas, cest que pour Google il existe aussi une relation entre les diffrents
sites web qui existent dans son index. . .
Cette relation prend tout son sens avec la notion de lien hypertexte. En effet, nous
avons vu au sujet des liens dans la partie prcdente quil ne sagissait pas dun simple
confort de navigation pour linternaute, mais dun rel enjeu pour le rfrencement. Ce
sont vos liens qui alimentent vos pages web en Google Juice. Ainsi, plus il y a de liens
menant vers une page A, plus la page A psera lourd dans la balance lorsque Google
lindexera.
Toutefois, nous pouvons aussi crer des liens vers dautres sites web, et ces mmes sites
web peuvent aussi crer des liens vers nous. Tout cela reprsente rellement quelque
chose aux yeux de Google, qui se forge une image de la notorit et de la rputation
dun site en fonction du nombre de liens entrants vers celui-ci et de la qualit de ces
liens.
108
un site
un site
un site
un site
un site
un site
...
Si votre site web retient toutes ces qualits, il a de fortes chances de gagner une forte
notorit au fil du temps, aussi bien chez les internautes que chez Google. . . Prenons
par exemple le site Wikipedia, qui comporte un certain nombre de ces qualits et
qui fait partie des meilleurs sites web au monde au niveau du rfrencement. Si vous
vous intressez limage de Wikipedia, vous remarquerez globalement quelle est trs
positive. Notez que par image , jentends rellement rputation sur le web. Vous
constaterez vite que Wikipedia est cit quasiment partout sur le web et quil dispose
de liens entrants un peu partout. Ce doit tre votre travail majeur lorsque vous vous
rfrencez sur dautres sites. Votre but est dentretenir limage que votre site possde
auprs des autres, tout en les incitant crer un maximum de liens entrants.
En rsum
Le rfrencement in-page vous sert crer un site de qualit.
Se focaliser sur son propre site ne suffit plus garantir un bon rfrencement.
Vous devez faire en sorte que les autres sites crent des liens vers votre site.
111
112
Chapitre
12
Les backlinks
Difficult :
Derrire les liens se cache le concept de Google Juice. Cependant, jusqu prsent nous
nous sommes contents dacheminer du jus dans nos propres pages. Nous allons voir que
lorsquon parle des autres sites, le Google Juice prend une tout autre dimension. Ce sera
galement pour nous loccasion de parler du PageRank.
113
114
Le link ninja
Le link ninja est sans aucun doute la manire la plus directe et concrte de faire en
sorte que les autres sites crent des liens vers vos propres pages. Pourquoi cela ? Tout
simplement parce que cest vous-mmes qui allez crer votre lien sur les sites des autres.
Pour cela, vous avez plusieurs possibilits. Prenons lexemple dun blog qui propose
ses lecteurs de commenter les articles. Rien de trs surprenant, mais voyons un peu le
formulaire de contact quun tel blog peut vous proposer (figure 12.1).
115
Le link baiting
Le link baiting est une autre manire de crer des liens vers votre site travers le web.
Le link baiting repose en fait sur votre contenu. Le tout est de vous dbrouiller pour
produire un contenu de grande qualit qui va susciter de lintrt chez les internautes.
Votre contenu doit donc avoir une relle valeur ajoute qui incite crer un lien vers
lui. Prenons lexemple du Site du Zro qui est parvenu expliquer aux dbutants, de
manire trs adapte, un sujet aussi complexe que la programmation. Vous pouvez trs
bien conseiller le Site du Zro par un backlink une personne qui souhaite apprendre
la programmation.
Link baiting signifie pche aux liens . Vous allez donc devoir produire du contenu
rellement pertinent afin dinciter les webmasters crer des liens vers vous. Pour cela,
vous pouvez ajouter de petites options en fin darticle afin de partager vos contenus.
Une bonne ide est de crer la possibilit de relayer la page web sur des forums en
fournissant un lien rapidement copiable au bas de larticle. Cest vous de construire
le reste !
Je vous conseille de lire un article propos par agence-csv.com. Il vous propose 10
exemples de link baiting russis. Vous verrez que lon ne peut pas faire grand-chose
dautre que de proposer du contenu pertinent et intelligent, ou alors de suivre les buzz
du moment.
Lire larticle
B
Code web : 395502
Il existe srement autant de mthodes de netlinking diffrentes quil existe
de fonctions en langage C, et je ne peux bien sr pas toutes les dtailler
ici. . . Cherchez sur Google et vous devriez trouver un certain nombre de sites
qui traitent du rfrencement et qui vous expliqueront dautres mthodes de
netlinking. Vous pouvez aussi imaginer vos propres solutions. Comment faire
en sorte dinciter les autres faire des liens vers mon site ? Vous trouverez
certainement vous-mmes la rponse cette question.
117
Un indice : le PageRank
Mesurer lindice de confiance dun site
Le PageRank
Depuis le dbut de cette partie, jai introduit de nouvelles ides propres aux sites
web : la popularit, la confiance, la notorit. . . Lorsque nous parlions de rfrencement
purement in-page , il ntait pas question de parler de ces ides. Avec lintroduction
des backlinks, il nest plus possible de faire limpasse sur ces nouvelles notions.
Pour Google, un site nest pas seulement un ensemble de pages HTML lies entre elles,
cest aussi un vritable cosystme qui jouit dune image plus ou moins bonne. Or, cette
image a un impact rel sur la manire dont Google indexe les contenus. Pour valuer
limage, la rputation et la notorit dun site, Google a mis au point, ses dbuts, un
indice quil a baptis PageRank . Cet indice prend la forme dune note allant de 0
10. Plus cette note est leve, plus votre site jouit dune bonne rputation sur le web.
Le PageRank tient son nom du PDG actuel de Google, Larry Page. Comme
nous lavons vu dans le tout premier chapitre de ce cours, Larry Page est
galement le cofondateur de Google.
Le PageRank volue trs lentement. Lorsque vous lancez votre site, son PageRank est
directement mis 0 ds que Google lindexe. Au fil du temps, et selon la qualit des
backlinks que vous recevez, votre PageRank a tendance monter. Cependant, croyezmoi, cela ne se fait pas du jour au lendemain ! Voici les PageRank de quelques sites que
vous connaissez.
Nom
Google
Facebook
Site du Zro
PageRank
10/10
9/10
6/10
Le PageRank sapplique une page web et non pas un site web complet.
Deux pages du mme site peuvent avoir deux PageRank diffrents. Cest
logique, car les sites ne sont rien dautre que des pages web lies entre elles.
UN INDICE : LE PAGERANK
PageRank status sous Chrome. Nhsitez pas analyser certains sites web que
vous connaissez pour connatre leur PageRank. Des applications web vous proposent
galement dentrer une adresse afin de vous retourner le PageRank du site vis. Cest
le cas de http://www.pagerank.fr par exemple.
Lorsquun
PageRank
de mettre
PageRank
site web est trop rcent ou pas encore index par Google, son
peut ne pas tre dfini. Ne vous inquitez donc pas si vous venez
votre site en ligne pour la premire fois et que vous voyez un
ngatif.
En rsum
Les backlinks sont des liens entrants vers votre site.
Ceux-ci ont une importance capitale dans votre stratgie de rfrencement.
Vous devez inciter les autres webmasters crer des liens vers votre site, cest le
netlinking.
119
120
Chapitre
13
i vous vous intressez un petit peu au rfrencement, ce qui est certainement le cas si
vous lisez ces lignes, il y a fort parier que vous soyez un jour confronts la notion
d annuaire .
Nous allons voir ce que sont les annuaires et quoi ils servent sur le web.
121
Sinscrire la main
Cette mthode dinscription est trs simple. On vous propose une page dote dun
formulaire pour inscrire votre site. Vous devez gnralement y renseigner plusieurs
informations concernant votre site, telles que son nom ou son URL. Voil le type
dinformation que lon vous demandera systmatiquement :
nom du site web ;
URL du site web ;
thmatique du site web.
Certains annuaires vous demanderont dautres informations. Jai dj vu des annuaires
qui demandaient une estimation du trafic du site web ou encore si celui-ci proposait des
publicits ou non. Bref, vous verrez que lon peut vous demander toutes sortes dinformations selon lannuaire sur lequel vous souhaitez vous inscrire, et que cest rarement
similaire dun annuaire lautre ! Par la suite, votre site sera trs probablement analys
par une quipe et sera ajout ou non lindex de lannuaire.
Linscription la main est gnralement le mode dinscription choisir, pour la
simple et bonne raison que ce mode dinscription vous donne un contrle sur votre
rfrencement par les annuaires. Je vous encourage donc choisir de prfrence des
annuaires qui vous permettent de vous inscrire la main.
123
Un site de notorit
DMOZ jouit dune forte rputation. Y tre prsent et y avoir un lien vers son site peut
tre rellement apprci par Google, qui peut booster votre rfrencement si votre site
se trouve dans cet index. Un autre intrt est que DMOZ est un site ouvert. Tout le
monde est autoris rutiliser lindex de lannuaire. tre prsent sur DMOZ signifie
galement tre prsent sur tous les sites utilisant lindex de DMOZ. Bon ou mauvais
point ?, me direz-vous. voir.
Google Directory
Lannuaire de Google, supprim depuis 2011
Pour votre culture personnelle, sachez quavant 2011, Google proposait lui aussi son
propre annuaire appel Google Directory. Cet annuaire ntait en fait rien dautre
quune recherche Google base sur une version optimise de lindex de DMOZ. Depuis
lt 2011, cet annuaire a t supprim par Google, la firme souhaitant concentrer ses
efforts sur lamlioration de son moteur de recherche (voir la figure 13.1).
125
En rsum
Les annuaires sont des sites qui rfrencent dautres sites.
Ils peuvent tre vus comme des alternatives aux moteurs de recherche, mais ils sont
surtout des sources de backlinks.
Ne vous inscrivez que sur des annuaires ayant beaucoup de PageRank et qui crent
des liens directs.
vitez tout prix les sites qui proposent de vous inscrire automatiquement sur
beaucoup dannuaires.
DMOZ est un annuaire ouvert ; il est maintenu bnvolement par des contributeurs
du monde entier.
126
Chapitre
14
ur le web, il est difficile aujourdhui de ne pas entendre parler des rseaux sociaux.
Facebook, Twitter et Google+, ces rseaux sociaux sont sans doute les plus connus,
et ils runissent chacun plusieurs millions dutilisateurs.
Depuis que nous parlons du rfrencement lextrieur, nous avons vu que notre principale
tche consistait entretenir la rputation de notre site sur le web, afin dencourager les
autres sites faire des backlinks. En parlant dentretien de rputation, il va tre trs difficile
de faire limpasse sur les rseaux sociaux dune manire gnrale !
127
Tout cela pour vous dire que Google est toujours plus sensible lexistence des rseaux
sociaux, et quils sont eux aussi utiliss dans les algorithmes du moteur de recherche
pour positionner les sites web. Vous navez rellement pas le choix : soyez actifs sur les
rseaux sociaux !
129
132
135
Google+ et le bouton +1
Google+, le rseau social de Google
Google+, un rseau social trs proche de Facebook
Comme son nom lindique, Google+ est le rseau social lanc par Google au cours
de lanne 2011, aprs les checs dOrkut, de Google Wave, et de Google Buzz.
linverse de Twitter, Google+ est un rseau social trs proche de Facebook, dont le
fonctionnement est presque identique.
La liste damis que vous avez sur Facebook est ici remplace par des cercles. Retenez
bien ce vocabulaire pour la suite de ce chapitre. Votre flux de nouvelles est remplac
par le stream . Concrtement, Google+ permet chacun dobtenir un profil afin
de partager photos, vidos et statuts. Linscription sur Google+ est accessible toute
personne possdant un compte Google. Je vous avais conseill den crer un lors du
tout premier chapitre de ce cours. Je renouvelle ce conseil, car dans la prochaine partie
de ce cours il sera obligatoire de possder un compte Google afin de pouvoir suivre.
Crez un compte Google
B
Code web : 705154
Les pages Google+
De la mme manire que Facebook ou Twitter, Google+ vous permet de crer un profil
pour promouvoir votre site web. Je pense que je nai pas besoin de vous rexpliquer
le fonctionnement : cest le mme que sur Facebook. En tant actifs, sur Google+
vous avez la possibilit dlargir vos sources de visiteurs. Par exemple, le Site du Zro
propose une page Google+ o des posts sont rgulirement ajouts. Le principe est
vraiment identique Facebook, cest pourquoi je ne mattarde que trs peu.
Le bouton +1
La plus grande force de Google+ est le bouton +1. Je vous recommande dabord de
regarder une vido dintroduction au bouton +1 de Google.
Regarder la vido
B
Code web : 644724
On peut avoir limpression quil sagit tout simplement du bouton Jaime de Facebook, revisit par Google. . . Cependant, le concept a t un peu boost par Google
qui a su profiter de toute sa galaxie de services et du monopole de son moteur de
136
GOOGLE+ ET LE BOUTON +1
recherche, afin de donner un impact plus concret au bouton +1. Il va donc falloir que
je vous rvle une atroce vrit que vous aurez du mal entendre : la SERP de Google
et Google+ sont lis par le bouton +1.
Concrtement, le bouton +1 de Google permet un visiteur de votre site de le recommander aux contacts prsents dans ses cercles. Pour cette raison, il est donc important
dajouter le bouton +1 sur votre site. Vous allez devoir vous rendre sur le site ddi aux
dveloppeurs qui va vous permettre de gnrer un code JavaScript qui fera apparatre
un bouton +1 sur votre site web. Ajouter le bouton +1 nest donc pas plus difficile que
dajouter le bouton Jaime de Facebook ou le bouton Twitter : il suffit dajouter
le code JavaScript fourni lendroit o vous souhaitez faire apparatre le bouton dans
vos templates HTML.
Google+ pour les dvelopB peurs
Code web : 970220
Maintenant que ce bouton est en place sur votre site, les visiteurs connects leur
compte Google et Google+ pourront cliquer sur le bouton +1. Ceci fera apparatre
un post sur leur page Google+ indiquant quils recommandent ceci aux contacts se
trouvant dans leurs cercles. Jusque-l, rien de bien nouveau. Le fonctionnement est vritablement calqu sur celui de Facebook et de son bouton Jaime . L o cela prend
des proportions intressantes, cest que le rfrencement prend une relle orientation
sociale puisque Google+ et le moteur de recherche Google sont lis.
Je mexplique : si vous tes connects votre compte Google, et que vous avez dans
vos cercles un contact qui a recommand une page web, il faut savoir que lorsque vous
effectuerez une recherche, cette page aura tendance ressortir dans les premires places
de la SERP. La seule chose qui est comprendre, cest que si vos contacts ont aim
une page et lont recommande, Google vous incitera la visiter en la faisant ressortir
dans les premires positions du moteur de recherche. Dans le cas de votre site, il faut
donc ajouter un bouton +1 et inciter vos visiteurs recommander vos contenus, afin
que leurs contacts connects eux aussi leur compte puissent voir votre site dans les
premires places des rsultats de recherche.
Nous pouvons voir sur cette capture dcran que lorsquun contact sur Google+ recommande ce contenu, une notification est ajoute sous le rsultat du moteur de recherche
dans la SERP. Ce rsultat a donc tendance ressortir vers la premire place sur Google
pour lutilisateur connect.
Ceci na dimpact que si beaucoup de vos visiteurs possdent un compte Google et
lutilisent frquemment. . . Mais comme vous le savez, un rfrenceur se doit de ne
ngliger aucune source de trafic sur son site. Cest pourquoi, dans le doute, je vous
encourage ajouter un bouton +1, dautant quil est trs possible que Google utilise le
nombre de +1 de votre site comme critre dindexation, ainsi que le sous-entend Matt
Cutts dans sa vido.
137
En rsum
Le rfrencement naturel (SEO) est diffrent du rfrencement social (SMO) ;
Vous vous devez dexister sur les rseaux sociaux pour crer toujours plus de sources
de visiteurs pour votre site ;
Il est conseill dtre prsent au moins sur Facebook, Twitter et Google+ ;
Il est trs possible que Google utilise des informations manant des rseaux sociaux
comme critre dindexation part entire afin daffiner le positionnement de votre
site web ;
Ne tombez pas dans labus dutilisation des widgets sociaux sur votre site, car ceux-ci
ralentissent le temps de chargement de vos pages.
138
Quatrime partie
139
Chapitre
15
Google sait quil est difficile de travailler le rfrencement dun site web. Pour cela, une
suite doutils destination des webmasters a t mise en place par le moteur de recherche.
Ces outils sont incontournables, nous verrons dans ce chapitre quoi ils vont nous servir
et nous en profiterons galement pour dcouvrir la notion trs importante de sitemap.
141
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
Cest sympathique tout cela, non ? Je pense que vous pouvez dj sentir que vous ne
pourrez bientt plus vous passer des outils pour webmasters. . . En effet, nous avons
dj commenc parler de limportance du suivi de votre rfrencement et, vu laide
norme que reprsentent ces outils, il serait bte de ne pas les exploiter.
Maintenant que vous tes au point au niveau du rfrencement in-page et off-page, les
outils pour webmasters sont un bon moyen pour voir si vous avez bien appris votre
leon, ou si au contraire vous avez fait nimporte quoi.
Vous tes accueillis par un bref texte introductif, ainsi que par une vido qui prsente
143
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
elle aussi les outils pour webmasters et que je vous conseille de regarder. . . enfin, pour
peu que vous matrisiez langlais. La premire chose faire est de reprer le petit
formulaire situ tout en bas de la page. On vous demande dajouter un site. La raison
en est trs simple : vous devez renseigner le site dont vous voulez effectuer lanalyse.
Ds lors, le site que vous ajouterez sera en quelque sorte li votre compte Google, et
vous pourrez commencer obtenir des rapports sur les outils pour webmasters. Notez
bien sr que votre site doit tre en production pour tre analysable.
Mais alors. . . tout le monde peut obtenir des rapports de nimporte quel site ?
Mes concurrents peuvent donc obtenir mes stats ?
La question mrite dtre pose, mais je vous rassure tout de suite : la rponse est
non. Remplissez le formulaire en indiquant lURL de votre site web, vous allez trs vite
comprendre pourquoi.
Une fois le nom de domaine valid, vous pouvez voir que Google vous redirige sur une
nouvelle page. . . o il vous demande de confirmer que vous tes bel et bien le propritaire du site que vous tentez danalyser. Cest la scurit qui empche quiconque de
voir les statistiques dun site qui ne lui appartient pas. Google vous propose quatre mthodes diffrentes pour que vous puissiez lui prouver que vous tes bien le propritaire
du site que vous tentez danalyser :
ajouter un enregistrement de type TXT vos DNS ;
uploader un fichier HTML fourni par Google sur votre serveur FTP ;
ajouter une balise META fournie par Google dans le code HTML de la page daccueil
de votre site web ;
utiliser le code JavaScript fourni par Google Analytics.
La premire mthode ncessite que vous ayez accs un panneau de contrle chez
144
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
de choisir le site pour lequel vous souhaitez obtenir les rapports. Attardons-nous sur le
menu de cette page daccueil (voir la figure 15.3).
Figure 15.4 John Resig, le crateur de jQuery, est ici identifi comme lauteur de
larticle
Vous vous en souvenez ? La page Statistiques de lauteur vous permet donc dobtenir
des statistiques sur toutes les pages du web dont vous tes reconnus comme auteur. Notez que ces pages peuvent tout fait se trouver sur des sites qui ne vous appartiennent
pas (voir la figure 15.5).
Bien sr, vous venez normalement dactiver votre compte sur Google Outils pour les
webmasters, il ne faut donc pas vous attendre des statistiques mirobolantes. Attendez
un peu, cela montera au fur et mesure. Un dernier menu existe : Autres ressources .
Ce dernier menu nest pas vraiment intressant, il sagit surtout dune ouverture vers
dautres produits Google tels que Google Adresses.
147
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
Configuration
Comme vous pouvez le voir, la premire option qui nous est propose est Messages.
Cette option, vous la connaissez. Elle tait dj prsente dans le menu de la page daccueil, mais elle sappelait Tous les messages. Cette fois-ci, au lieu de vous renvoyer
tous les messages communs tous vos sites, elle vous renvoie seulement les messages
concernant le site dont vous visitez le tableau de bord. Nous navons pas grand-chose
de plus dire ici, alors continuons explorer ce menu. Si vous cliquez sur le menu
droulant Configuration, vous verrez ces nouvelles options apparatre :
Paramtres
Liens de site
Paramtres dURL
Changement dadresse
Utilisateurs
Associs
148
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
Configuration > Paramtres dURL
Cette page vous permet dindiquer Google comment vous souhaitez quil indexe les
paramtres de vos URL. Il sagit ici des variables se trouvant aprs le point dinterrogation ? dans vos URL.
tat de sant
tat de sant est le deuxime menu droulant propos dans le tableau de bord des
outils pour les webmasters (voir la figure 15.8).
Nous allons dtailler ensemble toutes ces nouvelles notions qui vous sont proposes.
150
Figure 15.8 Menu tat de sant des outils pour les webmasters
tat de sant > Erreurs dexploration
Erreurs dexploration vous propose une page qui liste toutes les erreurs dexploration que Googlebot a rencontres au cours de ses visites sur votre site. Seules les
erreurs leves au cours des trois derniers mois (une priode de 90 jours) sont listes.
Cest par exemple ici que sont rapportes les erreurs 404. Visitez frquemment cette
page et, surtout, corrigez les erreurs au fur et mesure quelles apparaissent. Noubliez
pas que vous pouvez marquer les erreurs comme corriges, et donc signaler Google
que vous avez bien tenu compte de son rapport.
tat de sant > Statistiques sur lexploration
Statistiques sur lexploration correspond une page o lon vous propose des
rapports sur lactivit de Googlebot sur votre site. Trois graphiques sont proposs. Le
premier concerne le nombre de pages que Googlebot visites, le second concerne le
nombre de kilo-octets que Googlebot a tlchargs sur votre site, et le troisime vous
informe sur le temps de tlchargement dune page. Cest grce ce troisime graphique
que vous pouvez avoir une ide des performances de votre site web, et donc tenter de
vous amliorer en optimisant les temps de chargement. Les statistiques donnes ici sont
encore une fois releves sur les trois derniers mois. Des donnes chiffres sont proposes
sur la droite de la page.
tat de sant > URL bloques
URL bloques est une page dadministration de votre robots.txt. Si vous en avez renseign, ce que je vous encourage faire si vous avez des rpertoires dont vous voulez
interdire lindexation, les rpertoires bloqus seront lists ici.
tat de sant > Explorer comme Google
Explorer comme Googlebot prsente une page vous permettant deffectuer une analyse de votre site web, comme Googlebot le ferait. Ne vous y trompez pas, vous ne
verrez pas votre page safficher comme sil agissait dun lecteur dcran version web. . .
151
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
Cest plutt un moyen de vous assurer que Googlebot visite bien toutes les pages de
votre site, et deffectuer des modifications sur votre code si vous vous apercevez que
Googlebot manque certaines pages. Faites attention, car vous tes limits 500 explorations. Noubliez pas de vous rfrer lannexe de ce cours parlant de Lynx Browser
(page 197). Vous y apprendrez rellement visiter votre site comme le fait Googlebot.
tat de sant > tat de lindexation
tat de lindexation vous propose une courbe listant tout simplement le nombre
de pages de votre site web que Google a index au cours de lanne prcdente. Cest
trs utile pour savoir si beaucoup de pages sont indexes. Noubliez pas que plus vous
avez de contenu sur Google, plus cest positif pour vous.
tat de sant > Logiciels malveillants
Logiciels malveillants vous indique si des logiciels malveillants ont t reprs sur
votre site web. Cest trs rare, mais il faut quand mme venir visiter cette page de
temps autre, histoire de navoir aucune mauvaise surprise.
Trafic
Le prochain menu droulant (voir figure 15.9) de ce tableau de bord se nomme trafic
et comme son nom lindique, il dispose de quelques options qui vont vous donner des
informations sur le trafic de votre site.
Dans le chapitre suivant, nous parlerons dune autre application web de Google baptise
Google Analytics. Elle va vous servir avoir des informations extrmement prcises
sur les statistiques de votre site.
Pour le moment, considrez ce menu des outils pour les webmasters comme une version
light de Google Analytics.
Optimisation
Optimisation est le dernier menu droulant du tableau de bord des outils pour les
webmasters. Ce menu vous propose quelques conseils damliorations que vous allez
pouvoir effectuer sur votre site. Il sagit, de loin, du menu droulant le plus intressant
de ce tableau de bord.
Optimisation > Sitemaps
Sitemaps est une page dadministration des plans de votre site. Nous navons pas
encore vu cette notion, et elle est suffisamment importante pour mriter une sous-partie
complte. Nous allons pour le moment continuer explorer les autres sous-menus, et
nous reviendrons sur les sitemaps et ce quils sont en ralit un peu plus loin.
Optimisation > URL supprimer
URL supprimer correspond aussi une page trs importante. Google a index une
page que vous ne souhaitiez pas voir indexe ? Demandez ici Google la suppression
de cette page dans son index. Notez que pour effectuer une demande de suppression
Google, vous devez tre le propritaire dun site, ou au moins tre un utilisateur avec
un accs total au tableau de bord des outils pour les webmasters.
153
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
Vous devez galement raliser une opration de votre ct afin que la demande de
suppression soit bien accepte par Google. Pour cela, vous pouvez au choix :
renvoyer un code HTTP 404 ou 410 lorsque cette page est demande ;
bloquer le contenu de cette page laide dun robots.txt ;
bloquer lindexation de cette page laide dune balise <meta name="robots"
content="noindex" />.
Si lune de ces actions est ralise, Google acceptera normalement de supprimer la
page voulue dans votre index. Si vous souhaitez supprimer un rpertoire complet de
lindex de Google, assurez-vous que celui-ci ne soit plus accessible, en plus dajouter
une ligne dans votre robots.txt. Enfin, si votre contenu a t index par Google et
quune copie en cache a t cre, vous devez ajouter une balise <meta name="robots"
content="noarchive" />. Notez bien le noarchive, car cest une nouveaut dont je
nai pas parl avant. Elle sert simplement indiquer Google quil ne doit pas crer
de copie en cache pour cette page web.
Optimisation > Amliorations HTML
La page Amliorations HTML est, elle aussi, trs sympathique. Si Googlebot a du mal
indexer vos contenus, car votre code HTML est trs sale ou trs mauvais, on vous
indiquera ici quelques ides damliorations de vos codes HTML. Noubliez pas : dans
lidal votre code doit tre simple, propre et pur.
Optimisation > Mots-cls de contenu
Cette page Mots-cls de contenu est trs importante. Cest ici que vous pouvez voir
quels mots-cls Google associe vos pages. En dautres termes, cest ici que vous
pourrez voir comment Google interprte vos contenus. Concrtement, cette page vous
prsentera une liste de mots-cls. Chaque mot-cl est associ une valeur dimportance
et, lorsque vous cliquerez sur lun de ces mots-cls, vous pourrez voir quelles sont les
pages qui y correspondent.
Optimisation > Donnes structures
La page Donnes structures indique si Googlebot a trouv ou non des contenus
hirarchiss laide des micro-donnes sur votre site. Relisez le chapitre sur la smantique si vous avez un trou de mmoire, il sagit simplement des balises HTML un peu
spciales que lon utilise pour donner du sens son contenu. . . Vous navez pas dj
oubli quand mme !
Optimisation > Autres ressources
Enfin, la page Autres ressources est la mme que sur la page daccueil des outils pour
les webmasters. Elle nest ici que pour faire la promotion dautres produits Google.
154
crire son sitemap.xml
crivons ds maintenant notre sitemap.xml. Pour commencer, ouvrez votre diteur de
texte favori, et basculez sur une coloration syntaxique XML. Enregistrez ds maintenant
le fichier sur lequel vous allez commencer travailler et nommez-le sitemap.xml pour
plus de simplicit.
155
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
linverse du fichier robots.txt, le plan du site nobit pas une rgle de
nommage prcise. Vous pouvez donc lappeler comme vous le voulez. La
seule obligation est que lextension du fichier soit bien .xml.
Commencez par placer cette ligne de code en tte de votre fichier.
1
<? xml version = " 1 . 0 " encoding = " UTF - 8 " ? >
Cette ligne est un peu lquivalent du DOCTYPE en HTML. Il sagit tout simplement
dune ligne servant expliquer lordinateur que nous travaillons bien en XML. Ensuite, nous allons utiliser des balises. Je vous lai dit plus haut, HTML et XML sont
des langages cousins, les deux emploient des balises dans leurs syntaxes. Au sein dun
sitemap.xml, nous nallons utiliser que quatre balises, qui sont <urlset>, <url>, <loc>
et <changefreq>. Ces quatre balises permettent elles seules de dcrire votre site
Google. Pour commencer, il faut placer la balise <urlset>. Cest la balise principale
de votre fichier sitemap, un peu comme la balise <html> en HTML.
1
2
3
4
5
6
<? xml version = " 1 . 0 " encoding = " UTF - 8 " ? >
< urlset
xmlns = " http :// www . sitemaps . org / schemas / sitemap / 0 . 9 "
xmlns : xsi = " http :// www . w3 . org / 2001 / XMLSchema - instance "
xsi : schemaLocation = " http :// www . sitemaps . org / schemas /
sitemap / 0 . 9
http :// www . sitemaps . org / schemas / sitemap / 0 . 9 / sitemap
. xsd " >
7
8
Cette balise prend trois paramtres qui servent simplement dfinir le fichier comme
un sitemap. <urlset> tant une balise unique, il ne peut pas y avoir deux <urlset>
dans un mme fichier sitemap.xml. Cest comme pour la balise <html>, ne loubliez
pas ! Nous allons maintenant utiliser les balises <url>, <loc> et <changefreq>. Les
balises <loc> et <changefreq> sutilisent au mme niveau, cest--dire dans la balise
<url>. <loc> sert indiquer lURL de la page que vous souhaitez lister, alors que
<changefreq> sert indiquer quelle frquence cette page est mise jour. Voici un
exemple de sitemap valide et complet :
1
2
3
4
5
6
7
8
9
10
11
<? xml version = " 1 . 0 " encoding = " UTF - 8 " ? >
< urlset
xmlns = " http :// www . sitemaps . org / schemas / sitemap / 0 . 9 "
xmlns : xsi = " http :// www . w3 . org / 2001 / XMLSchema - instance "
xsi : schemaLocation = " http :// www . sitemaps . org / schemas /
sitemap / 0 . 9
http :// www . sitemaps . org / schemas / sitemap / 0 . 9 / sitemap
. xsd " >
< url >
< loc > http :// www . site . com / index . php </ loc >
< changefreq > weekly </ changefreq >
</ url >
< url >
156
< loc > http :// www . site . com / index . php </ loc >
< changefreq > weekly </ changefreq >
</ url >
< url >
< loc > http :// www . site . com / index . php </ loc >
< changefreq > weekly </ changefreq >
</ url >
</ urlset >
Je pense que cet exemple vous parle. Faites attention la balise <changefreq>. Elle
ne peut prendre que 7 valeurs :
La balise <changefreq> est facultative. La seule balise obligatoire au sein dun bloc
<url> est la balise <loc>. Deux balises supplmentaires existent, il sagit de <lastmod>
et <priority>. Ces deux balises sont, elles aussi, facultatives, tout comme la balise
<changefreq>. Pour plus de simplicit, nous nallons pas trop nous attarder sur ces
deux balises, dautant que les valeurs quelles reprsentent sont aujourdhui facilement
identifiables par Googlebot.
Vous savez maintenant crire un sitemap. Pour chaque page que vous devrez lister,
vous allez devoir ajouter une balise <url> et la remplir avec, au minimum, la balise
<loc> contenant lURL de la page lister.
Mon site est vraiment gros, je vais mettre des heures et des heures crire
un sitemap avec toutes les pages que jai. . . Comment faire ?
Bonne remarque ! Je dois en fait vous avouer que je vous ai fait prendre loption difficile : celle de taper vous-mmes votre sitemap la main. Je voulais simplement vous
apprendre comment faire, mais sachez que beaucoup dlguent lcriture des sitemaps
des programmes ddis. Personnellement je ne le fais pas. Le fonctionnement de ces
programmes est gnralement assez simple : ils ne font que crawler votre site web
comme le fait Googlebot, en explorant les liens, avant de compiler toutes les URL des
pages trouves dans un fichier XML. Cest bien et a fonctionne, mais lune des utilits
du sitemap est de signaler Google des pages que Googlebot na potentiellement pas
vues lors de son passage. Lintrt dutiliser ces outils savre donc trs limit, pour ne
pas dire inexistant. En plus, ces programmes sont parfois payants. . .
Pour ma part, jai pris lhabitude de modifier directement le sitemap.xml des sites
sur lesquels je travaille via le langage utilis ct serveur, PHP par exemple. Chaque
157
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
fois quune nouvelle page est cre, je lajoute au sitemap automatiquement. Cest le
genre de petites ides que je vous conseille de mettre en place sur votre site web si
vous voulez toujours garder un sitemap propre et jour. vous ensuite de lamliorer
en supprimant du sitemap les pages supprimes du site, et en dmarrant un nouveau
sitemap2.xml ds que les 50 Mo (ou les 50 000 URL) sont franchis. Cela ne prend QUE
quelques lignes de code et le rsultat est garanti.
<? xml version = " 1 . 0 " encoding = " UTF - 8 " ? >
< sitemapindex xmlns = " http :// www . sitemaps . org / schemas / sitemap
/0.9">
< sitemap >
< loc > http :// www . site . com / sitemap . xml </ loc >
</ sitemap >
6
7
8
9
10
11
12
13
Une autre balise, baptise <lastmod>, existe. Elle permet de renseigner la date de
dernire modification, mais elle est facultative.
Autre prcision : si votre site est vraiment immense et que vous avez des
milliers de sitemaps dessus, sachez que vous pouvez envoyer 500 fichiers dindex de sitemaps Google. Enfin, si vous souhaitez plus dinformations sur les
sitemaps, vous pouvez les trouver dans la FAQ officielle des outils pour les
webmasters.
FAQ officielle
B
Code web : 735462
158
En rsum
Google Outils pour les webmasters est une application web cre par Google dans le
but de faciliter le suivi de votre rfrencement.
Cette application fournit normment de statistiques et dinformations intressantes
sur votre site et sur la manire dont Google le rfrence.
Cette application vous permet aussi denvoyer un sitemap Google : un plan de
votre site crit en langage XML.
159
CHAPITRE 15. GREZ VOTRE SITE AVEC GOOGLE OUTILS POUR LES
WEBMASTERS
160
Chapitre
16
Pour peu que vous ayez install un outil de mesure daudience directement sur votre serveur
ou bien que vous consultiez tout simplement les logs de votre site, vous devriez tre capables
davoir quelques statistiques. . . mais connaissez-vous Google Analytics ? Il sagit dun outil
extrmement puissant mis disposition de tous les webmasters par Google. Son utilit :
fournir des rapports statistiques trs complets et trs prcis aux webmasters.
161
162
Entrez des informations valides pour pouvoir profiter pleinement de Google Analytics.
Toutes ces informations vont servir gnrer un code JavaScript que Google vous
demandera de placer sur toutes les pages web qui composent votre site juste aprs
louverture de la balise <body>. Certes, cest en principe quelque chose quil faut viter
de faire en HTML afin de conserver une certaine propret dans le code. . . mais nous
dirons que cest la seule exception.
Placer ce code JavaScript dans toutes vos pages peut tre vritablement pnible si
tous vos contenus ont t crits la main et ne sont pas grs dynamiquement. . .
Google vous suggre dajouter le code JavaScript fourni dans un fichier PHP et de
linclure dans toutes vos pages HTML. Je vous conseille dadapter ce type de solutions
pour votre structure : je vous rappelle simplement que le code JavaScript de Google
Analytics doit apparatre aprs louverture du bloc <body> dans vos templates HTML.
Ds lors, Google Analytics est actif sur votre site web, et commence dj gnrer des
163
Figure 16.2 Page dajout dun nouveau site web sur Google Analytics
164
En rsum
Google Analytics est un outil danalyse daudience propos par Google.
Il vous permet de gnrer des rapports statistiques sur laudience de votre site web.
Google Analytics est un outil incontournable pour effectuer un suivi de son rfrencement.
Des alternatives Google Analytics existent : XiTi et Piwik en font partie.
167
168
Chapitre
17
Maintenant que vous tes webmaster (et un webmaster sachant bien rfrencer son site
en plus de a !), vous vous posez peut-tre ces questions. Nous allons y rpondre dans ce
chapitre et nous sortirons un peu du thme du rfrencement. Ceci dit, comme je vous lai
dj dit, webmarketing et rfrencement sont des ides indissociables aujourdhui.
169
Bref ! On a un peu de tout. Mais ce qui nous intresse, cest surtout de savoir pourquoi
elle est l. La rponse est en fait trs simple : si les sites web diffusent de la publicit,
cest pour gagner de largent. Vous tes vous aussi webmasters, et vous allez tt ou
tard devoir vous poser la question de la publicit, surtout si votre site commence
grossir et avoir un vrai potentiel.
Donc, je vais pouvoir moi aussi gagner de largent grce mon site web avec
de la publicit ?
Oui ! Vous pouvez vous aussi gagner de largent par le biais de la publicit sur votre site
web, pour peu que celui-ci soit dj en ligne et accessible. Cest en fait les deux seules
conditions pour pouvoir diffuser de la publicit sur votre site et commencer gagner
de largent. Si votre site est en production, vous pouvez ds maintenant commencer y
mettre de la publicit. Bien sr, les publicits que vous diffuserez ne vous rapporteront
pas des millions si votre site ne fait que deux ou trois visites par jour. Cest normal
puisque vous dbutez, mais cest lide.
Pour vous rmunrer ! Concrtement, chaque fois quun visiteur cliquera sur un bandeau
publicitaire affich sur votre site, vous gagnerez de largent. Une fois que vos gains
atteindront un certain seuil, Google vous adressera un chque par voie postale, chque
que vous pourrez encaisser auprs de votre banque. Il faudra donc penser renseigner
une adresse postale correcte, afin que vos chques vous parviennent.
Cependant, nous nen sommes pas encore l. Il va dabord falloir proposer votre site web
Google Adsense. Cliquez sur le bouton Oui, se connecter avec un compte Google
et connectez-vous. Vous voil maintenant arrivs ltape numro 2 de linscription
de votre site Adsense. Cest lheure de proposer votre site web Google. Pour cela,
Google veille vous rappeler les cinq points principaux de son programme Adsense
(voir figure 17.2).
Comprenez bien ces cinq points avant de proposer votre site. Plus haut, on vous propose
un formulaire avec deux champs remplir :
lURL de votre site web.
la langue principale de votre site web.
Cliquez ensuite sur le bouton Continuer pour accder la troisime et dernire
tape de linscription de votre site Google Adsense. Pour cette dernire tape, on
vous propose un formulaire un peu plus fourni remplir. Il vous demande notamment
votre nom complet, votre adresse et votre numro de tlphone. Noubliez pas que ces
informations seront utilises par Google pour vous envoyer vos paiements, entrez donc
des donnes valides. Une fois que vous tes prts, cliquez sur le bouton Envoyer ma
demande pour faire parvenir la demande Google Adsense.
175
Dimension
300x250
336x280
728x90
160x600
Google Adsense vous demande ensuite le type de publicit que vous souhaitez afficher.
Vous pouvez dcider dafficher soit une publicit 100 % textuelles, soit une publicit
100 % rich media (image, son, vido. . .), soit une publicit textuelle et rich media.
Enfin, Google Adsense vous proposera une fonction afin de personnaliser laffichage de
votre publicit. Comme nous en reparlerons plus tard dans ce chapitre, je vous conseille
de recopier ici la palette de couleur prsente dans votre CSS afin que votre publicit
sintgre le mieux possible votre site web.
Google Adsense vous propose ensuite de sauvegarder votre publicit. Une fois votre
publicit sauvegarde, Google Adsense gnre automatiquement un code JavaScript
placer dans votre site web. Une fois le code plac, votre annonce apparat et vous
pouvez commencer gagner de largent grce Adsense.
Je vous conseille daller jeter un il aux vidos de la chane officielle de Google
Adsense sur Youtube. Elles sont susceptibles de vous intresser.
Chane officielle de Google
B Adsense
Code web : 710944
Comme je vous lai dit, un bannissement de Google Adsense est un bannissement vie
et nominatif. Vous ne pourrez donc plus rintgrer le programme.
Sachez que vous tes galement libres de contacter directement Google Adsense pour
avoir des informations supplmentaires quant votre bannissement. . . cependant, sachez que lon ne vous donnera aucun dtail. En effet, Google se refuse de communiquer
sur ses outils de reprage des comptes frauduleux. Vous naurez donc quune rponse
de politesse mais qui ne vous donnera aucune information supplmentaire sur votre
bannissement. Google voque gnralement des activits de clics frauduleux. Comprenez par l quon vous reproche davoir cliqu vous-mmes sur vos propres annonces, ou
bien que vous avez invit vos amis visiter votre site uniquement pour le faire. Ds lors
vous naurez pas la possibilit de dfendre votre position : lchange est gnralement
clos par cette rponse de Google.
Alors non seulement je suis banni, mais on ne me donne aucun motif, je ne
peux pas me dfendre, et je ne peux pas rintgrer le programme ?
Cest exactement a, cest trs dictatorial, mais cest le fonctionnement de Google Adsense. Peut-tre que vous navez pas faut, mais Google vous a reprs comme propritaires dun compte frauduleux, et vous avez t bannis. Cest triste mais cest comme
a, et personne ne peut faire en sorte que vous rintgriez le programme. Cest un peu
comme une grosse machine grise, bien huile, et implacable : vous tes bannis, et il faut
laccepter. Si vous lisez attentivement les rgles compltes de Google Adsense, vous
acceptez en vous inscrivant au programme que Google vous bannisse tout moment
sans donner dexplications. . .
Si je vous avertis, cest pour vous inciter ds maintenant ne pas faire lerreur que
beaucoup de webmasters trop presss font : inviter ses amis cliquer sur ses publicits,
ou le faire soi-mme. Si vous tes reprs, la sanction est trs lourde. Sachez galement
que tout largent que vous tiez en train dengranger sur votre compte Google avant
votre bannissement vous est retir et revers aux annonceurs : vous naurez aucun
moyen de rcuprer cet argent.
Nallez pas faire nimporte quoi et ne jouez surtout pas avec le feu. Une fois que vos
annonces sont en place, laissez-les bien dans leur coin et ne cliquez pas dessus, mme
pour les tester.
178
Je naime pas Google Adsense, ai-je la possibilit dutiliser une autre rgie ?
Oui, bien sr, cest votre site et vous faites comme vous voulez. Cependant, sachez
que Google Adsense est en situation de monopole sur le march des rgies publicitaires
sur le web. Il nexiste presque aucune autre alternative srieuse Google Adsense.
Vous pouvez peut-tre opter pour AdFever qui est une autre rgie publicitaire dont le
fonctionnement est proche de Google, mais pour ne lavoir jamais test, je ne peux pas
vous renseigner.
Figure 17.3 La page daccueil du Site du Zro avec une publicit prsente dans les
600 premiers pixels encadre en rouge
Figure 17.4 Une publicit dispose en fin de contenu sur le Site du Zro
181
En rsum
Google Adsense est une rgie publicitaire vous permettant de gagner de largent en
affichant de la publicit sur votre site.
Google Adsense rmunre au clic : chaque fois quun visiteur cliquera sur une publicit
affiche sur votre site, vous gagnerez de largent.
Ne cliquez jamais sur lune de vos publicits, mme pour les tester, car Google
Adsense est capable de reprer les clics frauduleux.
Google sanctionne les clics frauduleux par un bannissement vie et nominatif.
Naffichez jamais plus de trois annonces publicitaires par page, et favorisez les bons
emplacements qui ne sont pas intrusifs.
182
Chapitre
18
183
Je nai pas envie de dpenser de largent. . . Google Adwords ne me servira
rien alors ?
Si vous ne voulez pas dpenser de largent pour crer des campagnes de publicit sur
Adwords, cest votre droit. Dailleurs, normment de webmasters sen passent. Gardez
rellement en tte que Google Adwords et SEO ne sont pas lis et, partant de cela,
vous pouvez dj conclure que vous pouvez passer ct de Adwords. an Il est vrai que
Google Adwords ne vous servira presque rien si vous ne souhaitez pas dpenser de
largent. En effet, crer des campagnes publicitaires reprsente un cot, et on ne peut
pas faire abstraction de cela. Cependant, vous devez savoir quil est frquent quau
185
Une fois connects votre compte Adwords, vous pouvez directement dcouvrir linterface trs intuitive du service, ou bien crer votre premire annonce. Nous allons opter
pour cette seconde solution qui est celle qui nous intresse le plus.
Pour crer votre premire annonceuse Adwords, cliquez sur le bouton Crer ma premire campagne qui est visible sur le haut de la page daccueil de Google Adwords.
Dans un premier temps, il va falloir donner un nom votre annonce. Vous pouvez choisir un nom de manire totalement arbitraire, cela ne pose aucun problme. Ensuite,
Google Adwords vous demande de configurer les options de ciblage de votre nouvelle
annonce. Par dfaut, Google Adwords est configur sur la France entire, mais vous tes
libres de modifier cette zone gographique. Un petit formulaire est galement prsent
pour vous permettre dentrer manuellement les zones que vous souhaitez cibler.
Google Adwords vous indique ensuite les rseaux sur lesquels votre annonce pourra ressortir. Le rseau de recherche comprend Google ainsi que ses autres sites de recherche,
tels que Google Shopping ou encore Google Maps. Le rseau Display quant lui correspond aux autres sites dont Google est le propritaire. Ainsi, il correspond aux services
YouTube, GMail, etc. en plus du rseau de recherche.
Vous pourrez ensuite configurer la gestion des appareils. Vous pourrez par exemple
faire en sorte que vos annonces soient proposes uniquement aux internautes utilisant
un ordinateur de bureau, en imposant une restriction aux internautes utilisant des
186
Figure 18.2 Un petit test que Google vous propose au sujet des annonces Adwords
Une fois que vous avez pris connaissance de ces quelques conseils, vous pouvez com187
Sachez galement que vous devez grouper vos annonces en groupes dannonces . Ces groupes dannonces doivent contenir gnralement trois ou
quatre annonces et sont rgis par des mots-cls similaires. Les groupes permettent de mieux structurer lensemble des annonces que vous allez crer sur
Google Adwords.
Une fois que vos informations bancaires auront t saisies, vos annonces seront diffuses
via Google Adwords, notamment sur la SERP de Google. Le but est de faire votre
promotion : cest une autre faon de faire exister votre site sur la SERP de Google !
Enfin, noubliez pas que ce chapitre, dj relativement fourni, ne peut reprsenter
quune trs brve introduction Adwords et son fonctionnement. En effet, crer des
campagnes Adwords et les optimiser idalement demande un vritable savoir-faire, et
cela reprsente souvent un mtier complet au sein dune entreprise. Cependant, vous
savez maintenant comment fonctionne Google Adwords dans les grandes lignes, et
ctait lobjectif de ce chapitre. vous maintenant de vous perfectionner !
En rsum
Google Adwords est un programme publicitaire de Google.
Il permet aux annonceurs de crer des annonces publicitaires et de les diffuser sur
les diffrents services de Google.
Google Adwords ntant pas gratuit, vous allez devoir dbourser une certaine somme
dargent pour pouvoir diffuser vos annonces.
188
Chapitre
19
189
Bien sr, Google ne vous dira pas tout de ses algorithmes dindexation. Noubliez pas que ceux-ci sont secrets et plutt bien gards par la firme. Cependant, si cette FAQ nest pas une documentation absolument complte, elle
constitue un bon point de dpart pour qui veut aller encore plus loin dans le
rfrencement. Vous pourrez par exemple apprendre dans cette FAQ vous
rfrencer sur des sites comme Google Actualits.
Loutil Browsersize
Nous en avons dj trs brivement parl au tout dbut de ce cours : je profite de
ce chapitre pour vous rappeler lexistence de cet outil. Browsersize est un outil cr
par Google dans le but de vous aider optimiser votre site web dun point de vue
ergonomique. En entrant lURL dun site web dans le formulaire prsent dans len-tte
de la page, vous pourrez tester la mise en page de celui-ci, et ainsi voir quel pourcentage
de visiteurs pourront voir telle ou telle partie dun site web en fonction de sa rsolution
190
En rsum
Webmaster Academy est un guide propos par Google qui vous permettra de faire
un point sur ce que vous avez appris sur le rfrencement dans ce cours.
Utilisez la FAQ des outils pour les webmasters afin den savoir un peu plus sur le
192
193
194
Cinquime partie
195
Chapitre
20
os amis robots tels que Googlebot travaillent darrache-pied pour remonter le plus
dinformations possible sur vos sites web, afin de permettre au moteur de recherche
de fournir une indexation la plus pertinente qui soit.
Ces robots, extrmement nombreux parcourir le web tous les jours, voient la toile dune
autre manire que nous, humains. Nous allons dcouvrir dans cette annexe un programme
nomm Lynx Browser qui permet tout le monde, pendant quelques instants, de se
plonger en immersion totale (ou presque) dans la vie passionnante dun robot.
197
Lynx : un navigateur !
Pour ceux qui nont pas trop ide de ce que peut tre le Lynx Browser, je prfre le
leur dire tout de suite : Lynx Browser est un navigateur web, au mme titre que des
programmes tels que Mozilla Firefox ou Google Chrome !
Utilisez Lynx !
Lynx Browser est un navigateur sans interface visuelle. Si vous utilisez beaucoup Linux,
vous utilisez trs probablement sa console bien connue. Justement, Lynx Browser ressemble trs fortement une console Linux. Et pour cause, sous Linux on lutilise
uniquement en mode console. Voici par exemple en figure 20.1 une capture dcran du
Site du Zro visit sous Lynx Browser, ralis sous un systme Windows XP.
Comme vous vous en doutez, la souris ne vous servira pas grand-chose ici.
Tout va se grer au clavier !
Vous pouvez voir que Lynx Browser est un navigateur qui va rcuprer des pages web
et vous les afficher comme si celles-ci ntaient relies aucune feuille de style, ne
possdaient aucun JavaScript et ne possdaient non plus aucune image. Exactement
comme Googlebot !
198
LYNX : UN NAVIGATEUR !
199
Pour tre exact, Lynx fait partie dune famille de logiciels que lon appelle des
lecteurs dcran .
Jen parle volontairement dans ce cours, car Lynx savre notamment trs utile pour
pouvoir consulter un site internet tout moment de la mme manire que le ferait un
Googlebot sans aucune limitation. Vous avez donc un programme trs bien fait, robuste
et lger, disponible tout moment sur votre machine.
Tlcharger et installer Lynx Browser
Lynx Browser est souvent difficile installer pour les dbutants, notamment parce
quil requiert une compilation, qui est une manipulation complexe si vous navez pas
de bases en programmation. En outre, le lecteur dcran est uniquement disponible
sous les anciennes versions de Windows. Notez que Windows Vista et Windows Seven
ne sont pour le moment pas supports.
Heureusement, le site Csant.info met la disposition de tous un installateur compil
pour les utilisateurs de Windows 9x/NT/2000/XP. Pour les utilisateurs de Windows
Seven, le mode de compatibilit XP devrait suffire. Une fois le programme install sur
votre machine, lancez-le. Vous devriez arriver lcran daccueil de Lynx Browser.
Tlcharger linstallateur
B
Code web : 956947
Voyons maintenant comment visiter notre premire page web sous Lynx.
On vous dit ici dutiliser les flches de votre clavier pour vous
dplacer, de taper sur la
touche Q si vous voulez quitter le navigateur et de taper <- pour vous rendre la
200
On vous demande lURL que vous souhaitez ouvrir dans Lynx Browser. Tapez donc
www.siteduzero.com .
Par dfaut, Lynx Browser utilise le protocole HTTP. Vous navez donc pas
renseigner http :// au dbut des adresses que vous souhaitez ouvrir.
Le systme tant sensible la casse, vous devez taper exactement lURL du site que
vous souhaitez visiter. Si vous vous trompez, Lynx nest pas capable de vous fournir
une liste de sites dont ladresse ressemble ce que vous avez tap. Faites donc bien
attention ce que vous crivez. Les prochains messages vous demanderont si vous
souhaitez accepter les cookies que le Site du Zro veut crire sur votre ordinateur.
Donnez votre accord en tapant sur Y .
Un cookie nest pas nocif pour votre machine.
ce moment-l, vous allez arriver sur la page sur laquelle nous tions tout lheure, la
page daccueil du Site du Zro telle quelle sera vue par le Googlebot ! Observez plutt
la figure 20.2.
Comme vous le savez, vous ne pouvez pas utiliser votre souris sur Lynx Browser. Tout
ce que vous pouvez utiliser pour interagir, cest le clavier.
Mettez-y un peu de bonne volont et dites-vous que dans les annes 80 les
gens qui utilisaient des ordinateurs utilisaient toujours leur clavier. Les belles
interfaces avec fond dcran anim et effets 3D au passage de la souris, cest
quelque chose de trs rcent lchelle de linformatique. :-
202
Figure 20.3 La page de connexion au Site du Zro vue sous Lynx Browser !
Lide est ici de proposer un navigateur qui peut remplir toutes les tches usuelles que
les autres navigateurs peuvent remplir, mais en mode pur texte. Vous vous rendez un
peu mieux compte de ce que fait Googlebot maintenant. Grce ce navigateur, vous
allez pouvoir vraiment peaufiner ce qui se passe sur les pages que va voir le Googlebot.
Cela vous aidera par exemple mieux choisir la position dans laquelle vous souhaitez
placer vos mots-cls !
Vous pouvez bien sr quitter tout moment le logiciel en tapant sur la touche Q .
203
En rsum
Lynx Browser est un lecteur dcran. Ce sont des programmes qui sont trs utiliss,
notamment par les internautes non-voyants.
Lynx Browser vous permet de naviguer sur le web de la mme manire que Googlebot,
de manire illimite.
204
Chapitre
21
Cependant, dautres moteurs de recherche existent sur le web et il est intressant den parler.
Cest pourquoi, dans cette annexe, nous parlerons de trois autres moteurs de recherche :
Bing, Yahoo ! et Qwant !
205
de la
de la
de la
de la
...
recherche
recherche
recherche
recherche
sur le web ;
dimages ;
de vidos ;
sur des cartes (Bing Maps) ;
Yahoo ! est, historiquement, une entreprise trs importante sur le web. Au dpart,
Yahoo ! tait un annuaire, un peu comme DMOZ. Lentreprise fut fonde en 1995,
soit trois ans avant Google, ce qui reprsente une ternit lchelle du web. Pour
tre bref et en grossissant vritablement le trait, Yahoo ! sassocia un temps avec la
jeune entreprise Google afin de faire voluer son annuaire web en vritable moteur de
recherche. Yahoo ! gagnant vritablement en popularit, dcida de dvelopper tout un
ensemble de services tels que Yahoo ! Mail, tout en en rachetant dautres afin de se
doter dun vritable portail web.
Par la suite, Yahoo ! abandonna lutilisation des technologies de Google pour revenir
ses propres algorithmes, se positionnant comme un concurrent direct de Google, devenu
entre-temps la premire entreprise web au monde. Comme nous lavons vu, Yahoo ! sest
rcemment associ Bing. Ce dernier quipe ainsi tous les portails de Yahoo !.
Vous navez donc pas penser une stratgie particulire pour tre bien rfrencs sur
Yahoo !. Bing quipant Yahoo !, soyez bien rfrencs sur Bing, et vous aurez galement
des internautes provenant de Yahoo ! sur votre site web.
207
Qwant propose ensuite, pour chacune de ces colonnes, un petit formulaire permettant
daffiner la recherche. Pour reprendre lexemple ci-dessus, si je tape Site du Zro
dans la barre de recherche principale du site, Qwant me retourne les quatre colonnes
prcites, remplies avec des informations inhrentes au Site du Zro. Si je me focalise
maintenant sur la colonne Shopping, et que je tape PHP dans la barre de recherche
qui sy retrouve, la colonne Shopping sactualisera en AJAX pour me proposer un
lien me dirigeant vers la page dachat du livre Concevez votre site web avec PHP et
MySQL issu du Site du Zro. Sur le haut de la page, Qwant vous propose galement
des rsultats de recherche de vidos et de photos. Comprenez bien que lobjectif du
moteur de recherche est de vous proposer quelque chose de diffrent de Google. Cest
pourquoi tous les rsultats de recherche sont vraiment centraliss sur une mme page.
208
209
Certainement pas. Sil est novateur, Qwant reste un moteur de recherche trs jeune,
avec des ressources serveur et une puissance de calcul et dindexation bien infrieures
ce que Google peut dployer. Concurrencer des mastodontes comme Bing ou Google
qui sont sur le march depuis plusieurs annes nest vraiment pas chose facile. Qwant ne
se positionne dailleurs pas comme un concurrent direct de Google, mais plutt comme
un nouveau moteur de recherche souhaitant simplement proposer quelque chose de
diffrent.
Par ailleurs, plusieurs critiques virulentes ont t mises sur Qwant. On lui a notamment
reproch de simplement indexer les rsultats de recherche de Bing pour les fournir tels
quels sur son propre site. . . Toujours est-il que seul le temps pourra donner des rponses
sur lavenir du moteur de recherche qui, je vous le rappelle, nexiste que depuis fvrier
2013 et na pas encore connu de premire version stable.
En rsum
Google est en situation de quasi-monopole sur le web, mais dautres moteurs de
recherche existent.
Bing est un moteur de recherche sign Microsoft qui est trs utilis.
Bing a sign un accord avec Yahoo ! afin de concurrencer Google.
Bing est le moteur de recherche qui quipe les diffrents portails de Yahoo !.
Qwant est un nouveau moteur de recherche fond en 2013.
La particularit de Qwant est quil prsente une SERP diffrente des autres moteurs
de recherche.
210
Index
A
Adwords . . . . . . . . . . . . . . . . . . . . . . . . 183
Adsense . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
Analytics . . . . . . . . . . . . . . . . . . . . . . . . 161
Adwords . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
Insights. . . . . . . . . . . . . . . . . . . . . . . . . . .84
AJAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Juice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
Trends . . . . . . . . . . . . . . . . . . . . . . . . . . 191
anchor text . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Webmasters Tools . . . . . . . . . . . . . . . 143
annuaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Google+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
arborescence . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Googlebot. . . . . . . . . . . . . . . . . . . . . . . . . . . . .23
GWT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
B
backlinks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
H
Backrub . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
HTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
balise
HTML5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
<h1> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
<meta /> . . . . . . . . . . . . . . . . . . . . . . . . . 10
I
<title> . . . . . . . . . . . . . . . . . . . . . . . . . . 44
indexation
.
.
.
. . . . . . . . . . . . . . . . . . . . . . 48, 50
Bing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
Insights . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
D
Directory Mozilla . . . . . . . . . . . . . . . . . . . . 124
L
DMOZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 link baiting . . . . . . . . . . . . . . . . . . . . . . . . . . 117
duplicate content . . . . . . . . . . . . . . . . . . . . . . 99 link ninja . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
longue trane . . . . . . . . . . . . . . . . . . . . . . . . . . 86
E
Lynx browser . . . . . . . . . . . . . . . . . . . . . . . . 197
ergonomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
erreur 404 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
M
extension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
meta description . . . . . . . . . . . . . . . . . . . . . . 47
meta keywords . . . . . . . . . . . . . . . . . . . . . . . . 47
F
Facebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 meta robots . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Flash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 micro-donne. . . . . . . . . . . . . . . . . . . . . . . . . .94
microformat. . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Minify . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
G
montisation . . . . . . . . . . . . . . . . . . . . . . . . . 169
Google
Adsense . . . . . . . . . . . . . . . . . . . . . . . . . 169 mot-cl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
211
INDEX
N
navigateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
netlinking . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
nom de domaine . . . . . . . . . . . . . . . . . . . . . . 56
P
pagerank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Piwik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
publicit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
Q
Qwant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
R
redirection 301 . . . . . . . . . . . . . . . . . . . . . . . . 62
rfrencement . . . . . . . . . . . . . . . . . . . . . . . . . . 4
rseaux sociaux . . . . . . . . . . . . . . . . . . . . . . 127
robot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
S
Search Quality . . . . . . . . . . . . . . . . . . . . . . . . 11
smantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
SERP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
sitemap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
SMO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128
Social Media Optimization . . . . . . . . . . . 128
sous-domaine . . . . . . . . . . . . . . . . . . . . . . . . . 60
sprite CSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . 161
T
Trends . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
triangle dor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Twitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
U
URL dynamique . . . . . . . . . . . . . . . . . . . . . . 63
URL rewriting . . . . . . . . . . . . . . . . . . . . . . . . 64
User-agent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
X
XiTi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
212
Mentions lgales
Conception couverture : Fan Jiyong et Alexandra Persil
Illustrations chapitres : Fan Jiyong et Alexandra Persil