Vous êtes sur la page 1sur 13

Cours de référencement : le

PageRank
Mise à jour du 25 janvier 2010

Rémi Bachelet
Dernière version de ce cours de
cours sur le PageRank

Cours distribué sous licence


Creative Commons, selon les
conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image

École Centrale de Lille


Rémi Bachelet – Ecole- Centrale
Cité Scientifique BP 48 de Lille Villeneuve d’Ascq Cedex
F-59651 25 janv. 2010 Image
Utilisation ou copie interdites : Source
sans citation
1
Comment utiliser ce
cours :
1. Mettre les diapos en format plein écran en cliquant sur
2. Faire défiler l’animation en cliquant sur les diapositives
(attention : cliquer sur une image ou un lien ouvre la page web correspondante)

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
2
Chapitre 1/1

Algorithmes de classement
des pages

1. Le PageRank
• Modalités de calcul
• Fiabilité : Le TrustRank
• Ordre de présentation : Le SERP Rank
1. Ce que voit un indexeur

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
3
Le PageRank
• « vote » d’une page pour
une autre
• Un processus récursif
• Échelle logarithmique 0-10.
– PR (C) > PR (E), même avec
moins de liens !
– Damping factor de 90%.

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Image : Source


Utilisation Wikimedia
ou copie Commons
interdites sans citation
4
Ranking : études de cas

• http://freemind.sourceforge.net/wiki/index.php/Main_Page
• http://freemind.sourceforge.net/wiki/index.php/Talk:Main_Page
• https://sourceforge.net/projects/freemind/files/freemind-unstable/
• http://www.google.fr/search?hl=fr&q=achat+fleurs

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
5
Un secret bien gardé

• Un nombre important de facteurs sont pris


en compte dans le PageRank.
– Ces facteurs sont nombreux (plus de 200
d'après Google).
– Par exemple
• Age du domaine (expiration = perte du PR)
• Chemin d’accès
– Leur nature et leur pondération sont secrets
pour limiter les chances de manipulations

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
6
Le SERP Rank

• C’est le résultat retourné lorsque l’on entre des


mots-clé dans un moteur de recherche
 Une liste ordonnée de liens vers des pages web,
associés à des textes courts (snippets)
• Le SERP rank est fonction du PageRank, mais
aussi d’un grand nombre de facteurs
– On parle aussi de « Google Love »
• SERP = Search Engine Results Page

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
7
Le TrustRank
• Méthode semi-automatique de classification "spam ou pas spam".
• Principe : une page « propre » ne propose pas de liens vers des
pages de spam.

1. Liste de pages de référence « propres »


– après une analyse manuelle faite par un humain. Par propagation et
analyse des liens entre pages,
– Pas forcément une grande liste (200 sites).
1. Suivi récursif des liens
2. Degré de confiance que l'on peut attribuer à la page : un indice
– Son TrustRank (TR).
– Entre 0 (spam) et 1 (page de référence)

• Le TrustRank peut être utilisé :


– pour filtrer l'index d'un moteur de recherche,
– pour classer les résultats d'une recherche.

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
8
La Google Dance
• Période durant laquelle Google change
son algorithme et met à jour le classement
des pages référencées.
– Variation de position d'une page sur un mot
clé,
– Nouveau PageRank
– Variation du nombre de pages d’un site
indexées.
• La Google Dance n'existe plus !

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
9
Ce que voit un indexeur
– “Onpage”
• Code : non visible sur la page
• Texte : visible sur la page
– “Onsite”
• Fichiers spéciaux : Robots.txt, Sitemap.xml
• Vitesse de chargement de page
• Liens internes entre les pages du site
– “Offsite”
• Backlinks
• Social bookmarking

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
10
Questions ?

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
11
Rémi BACHELET

Enseignant-chercheur,
Ecole Centrale de Lille

Mes principaux cours à Centrale


Gestion de projet, sociologie des organisations, recueil, analyse et traitement de données,
prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de résolution
de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki, formation au
coaching pédagogique et à l'encadrement, référencement et SEO

Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
12
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
13

Vous aimerez peut-être aussi