Vous êtes sur la page 1sur 46

ANALYSE DE LOGS,

INTERVENTION SEO ET
INTERPRETATION
PAR GOOGLE

#seocamp 1
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Julie Chodorge
Consultante SEO OnSite Korleon’Biz
- Gestion d’un portefeuille de clients sur diverses thématiques

#seocamp 2
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse de logs,
Oui mais ?

#seocamp 3
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Comment se déroule
l’analyse de logs ?

Analyse des hits de Googlebot


1 Comprendre comment est crawlé et interprété le site

Identifier les facteurs bloquants :


• Codes réponse
• Pages SEO orphelines
• Hits sur des pages générées par thème/extensions

Analyser la répartition des dépenses du budget de crawl

#seocamp 4
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Comment se déroule
l’analyse de logs ?

Intervention SEO
2 Corriger les facteurs bloquants identifiés lors de l’analyse de logs

Mettre en place au fur et à mesure les corrections pour optimiser


le crawl

Attribuer le budget de crawl aux pages travaillées pour le SEO

> Maximiser ainsi leur indexation et donc leur référencement

#seocamp 5
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Comment se déroule
l’analyse de logs ?

Interprétation par Google


3 Mais après, que se passe-t-il ? Quelles optimisations sont vraiment
impactantes pour le crawl ?

Comment GoogleBot interprète les consignes données par le SEO,


et surtout sont-elles bien respectées ?

Retour sur les différentes manières d’influencer le crawl et les


impacts réels sur le budget de crawl

#seocamp 6
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Mise en place de l’expérience

Analyse de logs menée sur 6 mois sur 12 sites :


▪ Blogs, sites vitrines et institutionnels, sites e-commerce…
▪ Taille moyenne : 16.700 URLs/site – de 300 à 80.000 URLs/site

En tout, panel de 202.404 URLs et 7.063.530 hits


(GoogleBot exclusivement, mobile et desktop)

#seocamp 7
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Outils Utilisés

Screaming Frog &


Oncrawl SEOLyzer Log File Analyzer SEO Tools for Excel

Crawler SEO et Analyseur de logs Crawler SEO et Analyseur de logs Crawleur SEO et Analyseur de logs Crawleur SEO
Payant : à partir de 199€/mois Gratuit Payant : £149.00/an + £99/an Payant : à partir de 99€
https://fr.oncrawl.com/ https://seolyzer.io/fr/ https://www.screamingfrog.co.uk/ https://seotoolsforexcel.com/

#seocamp 8
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse
de logs

#seocamp 9
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Quelles données influencent le crawl d’un site ?

Contenu :

▪ Nombre de mots

Netlinking :
Technique :
▪ Liens externes
▪ Temps de chargement

Référencement naturel :
Structure :
▪ Mots-clés top 10
▪ Niveau de profondeur

▪ Liens internes

#seocamp 10
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse des hits par nombre de mots

▪ Plus de hits sur les pages comprenant


entre 2000 et 3500 mots

▪ Plus de trafic sur les pages comprenant


entre 500 et 3000 mots

> Privilégiez les contenus de plus de 500


mots

#seocamp 11
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse des hits par temps de chargement

▪ Plus de hits sur les pages se chargeant


entre 1 et 3 secondes

▪ Plus de trafic sur les pages se chargeant


en 1 seconde

> Soignez le temps de chargement,


encore plus pour les positions que pour
le crawl

#seocamp 12
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse des hits par profondeur

▪ Plus les pages sont profondes, moins


elles sont hitées

▪ Plus de trafic sur les pages ayant une


profondeur de 1 à 2

> Attention à la profondeur des pages,


en général ne mettez pas vos pages SEO
à plus de 3 clics de la home

#seocamp 13
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse des hits par liens internes

▪ Plus les pages ont de liens internes, plus


elles sont hitées

▪ Plus de trafic sur les pages ayant entre


1 et 100 liens internes et plus de 400
liens internes

> Maillez bien vos pages SEO

#seocamp 14
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse des hits par liens externes

▪ Plus de hits sur les pages ayant plus de


60 liens externes

> Une réelle stratégie de netlinking doit


être mise en place pour vos pages SEO

#seocamp 15
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse des hits par mots-clés top 10

▪ Plus de hits sur les pages ayant plus de


20 mots-clés dans le top 10

▪ Plus de trafic sur les pages ayant plus


de 50 mots-clés dans le top 10

> Un bon référencement naturel


permettra plus de crawl de votre site
par Googlebot

#seocamp 16
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Comment optimiser le crawl de son site ?
Dans un but d’optimiser le crawl de ses pages SEO :

▪ Le contenu doit faire plus de 500 mots

▪ La page doit se charger en 1 seconde

▪ Ne pas avoir trop de niveau de profondeur

▪ Avoir un maximum de liens internes

▪ Elaborer une stratégie de netlinking (plus de 60 backlinks)

> Ceci est un cercle vertueux : plus vous optimiserez votre référencement naturel,

plus votre site obtiendra de budget de crawl

#seocamp 17
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse
du comportement de GoogleBot

#seocamp 18
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Quels méthodes pour influencer le crawl ?

Changement et
suppression d’URLs Blocage d’indexation Blocage de crawl

• Redirections 301 et 302 • Balisage Meta Robot Noindex • Fichier robots.txt


• Erreurs 404 et 410 • X-robots-tag Noindex
• Balises canonical

#seocamp 19
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Changement et
suppression d’URLs
Codes réponse en 300 et 400

#seocamp 20
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Redirections 301 37,3%
DES PAGES TOTALES
En cas de modification d’une URL, une redirection définitive en 301
permet de notifier le changement aux robots des moteurs de recherche.

▪ 5 hits par redirection 301


▪ Hitées plus de 6 mois après leur mise en place

5,3%
Redirections 301 : 5 fois moins hitées que 200
indexables

> Impact sur la durée, à utiliser avec modération


DES HITS TOTAUX

* 24 hits par page en 200 indexable

#seocamp 21
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Redirections 301

#seocamp 22
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Redirections 302 1,4%
DES PAGES TOTALES
En cas de modification momentanée d’une URL, une redirection
temporaire en 302 ou 307 permet de notifier le changement aux robots.

▪ 21 hits par redirection 302

Redirections 302 : 4 fois plus hitées que 301

0,8%
Redirections 302 : presque autant hitées que 200
indexables

> Importance de bien les contrôler


DES HITS TOTAUX

* 24 hits par page en 200 indexable

#seocamp 23
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Redirections 302

#seocamp 24
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Erreurs 404 4,0%
DES PAGES TOTALES
En cas de modification ou suppresion d’une URL, si aucune redirection
n’est mise en place, l’URL va répondre en erreur 404.

▪ 21 hits par erreur 404

Erreurs 404 autant hitées que 302

2,4%
Erreurs 404 presque autant hitées que 200
indexables

> Veiller à ne pas avoir de 404, aucune utilité en


DES HITS TOTAUX
SEO

* 24 hits par page en 200 indexable

#seocamp 25
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Erreurs 404

> Traiter les erreurs 404


> Ne pas conserver de liens internes et externes vers des 404
#seocamp 26
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Erreurs 410 0,7%
DES PAGES TOTALES
En cas de suppression definitive d’une URL, la mettre en 410 permet de
s’assurer de sa bonne suppression aux yeux de Google.

▪ 3 hits par erreur 410

Erreurs 410 : 6 fois moins hitées que 404

0,1%
Erreurs 410 : 1,5 fois moins hitées que 301

> Moins dépensières en budget de crawl que


redirection 301
DES HITS TOTAUX
> A préférer en cas de nombre important d’URLs
avec peu d’historique SEO

* 24 hits par page en 200 indexable

#seocamp 27
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Erreurs 500
Les erreurs 500 sont des erreurs serveur. Elles sont générées
quand il y a un souci du côté du serveur (chargement, temps de
réponse…).

Retour d’expérience :
▪ Cas d’un client avec un très grand nombre
d’erreurs 500 dans la Search Console
▪ Temps de réponse serveur trop important

A l’aide de la Search Console :


▪ Limitation du crawl à 2 secondes
▪ Possible aussi via le robots.txt

> Impact visible et immédiat sur les positions

#seocamp 28
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Blocage d’indexation
Balises Meta Robot et Canonical

#seocamp 29
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Meta Robot Noindex 0,6%
DES PAGES TOTALES
En cas de volonté de ne pas indexer une page, la balise meta robot réglée
sur “noindex” permet d’en empêcher l’indexation.

▪ 3 hits par URL en noindex dans Meta Robot

Pages en noindex ne bloquent pas le crawl

1,6%
Pas de vocation à être indexées

> Pas d’intérêt d’y dépenser du budget de crawl

DES HITS TOTAUX

* 24 hits par page en 200 indexable

#seocamp 30
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Meta Robot Noindex

#seocamp 31
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
X-robots-tag Noindex 0,8%
DES PAGES TOTALES
En cas de volonté de ne pas indexer une page, l’instruction X-robots-tag
réglée sur “noindex” permet d’en empêcher l’indexation.

▪ 7 hits par URL en noindex dans X-robots-tag

X-robots-tag noindex : 2,5 fois plus hitées que

5,8%
noindex dans balise meta robot

> Préférer la balise Meta Robot pour limiter le


crawl sur ces pages
DES HITS TOTAUX

* 24 hits par page en 200 indexable

#seocamp 32
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Balises Canonical 6,0%
DES PAGES TOTALES
Si des pages sont très proches, la balise canonical permet d’éviter le
contenu dupliqué et préciser la page principale à indexer.

▪ 340 hits par URL canonisée

Pages canonisées : 14 fois plus hitées que les

57,9%
pages en 200 indexables

> ATTENTION AU BUDGET DE CRAWL !

DES HITS TOTAUX

* 24 hits par page en 200 indexable

#seocamp 33
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Balises Canonical

> Concerne les URLs canonisées avec des liens


> Limiter le maillage vers les URLs canonisées
#seocamp 34
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Blocage de crawl
Fichier Robots.txt

#seocamp 35
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Fichier Robots.txt 1,9%
DES PAGES TOTALES
Le fichier robots.txt permet de bloquer l’accès à certaines pages aux
robots des moteurs de recherche.

▪ 2 hits par page bloquée dans robots.txt

En théorie, il ne devrait y avoir aucun hit sur les

3,3%
pages bloquées dans le robots.txt

> Instructions de crawl pas toujours respectées


> Demeure cependant la méthode la moins
DES HITS TOTAUX
gourmande en budget de crawl

* 24 hits par page en 200 indexable

#seocamp 36
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Fichier Robots.txt

> Ne pas avoir de liens vers des pages bloquées dans le robots.txt

#seocamp 37
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Astuce
Fichier Robots.txt
Astuce pour que les robots respectent dadvantage le fichier robots.txt

En plus de s’adresser à tous les User-agent


• User-agent: *

Rajouter User-agent correspondant à GoogleBot :


• User-agent: Googlebot
• User-agent: Googlebot-image

#seocamp 38
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Analyse de la répartition
du budget de crawl

#seocamp 39
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Répartition du budget de Crawl
Méthode utilisée Moyenne hits/URL

Robots.txt 1,7

Meta Robot Noindex 2,9

Erreur 410 3,4

Redirection 301 5,0

X-robots-tag Noindex 7,4

Redirection 302 20,3

Erreur 404 21,2

200 Indexable 24,2

Canonical 339,7

#seocamp 40
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Comment économiser du Budget de Crawl ?

Dans un but d’économiser du budget de crawl :

▪ Noindex dans balise Meta Robot plutôt que dans X-robots-tag

▪ Erreur 410 plutôt que redirection 301

▪ Maîtriser les redirection 302 et erreurs 404 qui consomment autant que les pages en 200

▪ Attention aux pages canonisées ! A n’utiliser que comme “rustine” (canonical auto-référente)

▪ Supprimer/Modifier les liens internes et externes des URLs non indexables

(à pondérer en fonction de la taille du site, de sa typologie, de son historique et de sa stratégie SEO)

#seocamp 41
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Pourquoi économiser du Budget de Crawl ?
Exemple concret 1 : site e-commerce de 80.000 pages

#seocamp 42
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Pourquoi économiser du Budget de Crawl ?
Exemple concret 2 : blog de 45.000 pages

#seocamp 43
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Merci de votre attention
Vous avez des questions ?

#seocamp 44
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
Question Mug

Quelle est la balise la plus gourmande


en budget de crawl ?

#seocamp 45
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz
MERCI AUX SPONSORS

#seocamp 46
Julie Chodorge @Jchodorge | Korleon’Biz @korleonbiz

Vous aimerez peut-être aussi