Académique Documents
Professionnel Documents
Culture Documents
PageRank
Mise à jour du 25 janvier 2010
Rémi Bachelet
Dernière version de ce cours de
cours sur le PageRank
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
2
Chapitre 1/1
Algorithmes de classement
des pages
1. Le PageRank
• Modalités de calcul
• Fiabilité : Le TrustRank
• Ordre de présentation : Le SERP Rank
1. Ce que voit un indexeur
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
3
Le PageRank
• « vote » d’une page pour
une autre
• Un processus récursif
• Échelle logarithmique 0-10.
– PR (C) > PR (E), même avec
moins de liens !
– Damping factor de 90%.
• http://freemind.sourceforge.net/wiki/index.php/Main_Page
• http://freemind.sourceforge.net/wiki/index.php/Talk:Main_Page
• https://sourceforge.net/projects/freemind/files/freemind-unstable/
• http://www.google.fr/search?hl=fr&q=achat+fleurs
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
5
Un secret bien gardé
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
6
Le SERP Rank
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
7
Le TrustRank
• Méthode semi-automatique de classification "spam ou pas spam".
• Principe : une page « propre » ne propose pas de liens vers des
pages de spam.
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
8
La Google Dance
• Période durant laquelle Google change
son algorithme et met à jour le classement
des pages référencées.
– Variation de position d'une page sur un mot
clé,
– Nouveau PageRank
– Variation du nombre de pages d’un site
indexées.
• La Google Dance n'existe plus !
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
9
Ce que voit un indexeur
– “Onpage”
• Code : non visible sur la page
• Texte : visible sur la page
– “Onsite”
• Fichiers spéciaux : Robots.txt, Sitemap.xml
• Vitesse de chargement de page
• Liens internes entre les pages du site
– “Offsite”
• Backlinks
• Social bookmarking
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
10
Questions ?
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
11
Rémi BACHELET
Enseignant-chercheur,
Ecole Centrale de Lille
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
12
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010 Utilisation ou copie interdites sans citation
13