Vous êtes sur la page 1sur 114

SEO

KOFFI YANNICK

Parcours
Expériences
A propos de CALYCE
PARCOURS 
DOCTORANT I.A ET BUSINESS
JUNIA ISEN I 2021 à 2023

FINANCES
Master 2 Ingénierie financière et Gestion de patrimoine I
2017
WELLER / ESGF

COMMUNICATION & MARKETING


Bachelor master 1 en Communication et Management I
2016
WELLER BUSINESS SCHOOL

COMPTABILITÉ
3 ans de DCG : Diplôme de comptabilité et de
gestion I 2013
APEP SUP PARIS
3
E XPÉRIENCES
CONFÉRENCIER-2018 À CE JOUR
Let's reshape fashion together by Changemakers for
impact, 2018
AI & Business By JUNIA ISEN, 2020
IA : comment développer un projet organisé par swiss
umef university by Burkina Faso, 2021

GROUPE ESG-IICP-INSEEC-ESCE 2020-À


AUJOURD'HUI
Professeur - Marketing- Communication-Gestion de projet -
Innovation

CALYCE 2018
Co-fondateur de l'agence calyce

U CAR CACHAN 2015/2018


Assistant gérant

CASTORAMA 2013
Assistant comptable
4
A PROPOS

Créativité
STRATÉGIE MARKETING & INNOVATION
Créée officiellement en 2019

Mettre en place des actions stratégiques afin de faire

émerger des projets à forte valeur ajoutée pour un meilleur

monde à travers l’innovation.

Agilité
Responsabilité 5
1 - Histoire moteur de
recherche

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

6
Donnez des exemples
de search engine?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

7
Qui a créé google, et
en quelle année?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

8
Quel est le nom de
leur premier projet?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

9
1 - HISTOIRE MOTEUR DE RECHERCHE

Historique de Google et Bing

Historique de Google deux étudiants de


l'université de Stanford, Larry Page (22
ans) et Sergey Brin (21 ans), 1995.

10
Qu'est ce qu'un white
hat, un grey hat ou
un black hat?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

11
1 - HISTOIRE MOTEUR DE RECHERCHE

Le slogan de Google est « Don't be evil », traduit


littéralement par « Ne soyez pas malveillants ».

Les « White Hat » (internautes « propres »),

Les « Grey Hat » (referenceurs qui essaient de


rester dans les consignes)

Les « Black Hat » (referenceurs mal intentionnes


ou qui outrepassent les consignes)

12
Citer des projets
réalisés par google?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

13
1 - HISTOIRE MOTEUR DE RECHERCHE

Les projets google :


-Analytics,
-AdWords,
-Gmail,
-YouTube,
-Chrome,
-Google+,

14
Qui a développé
bing?
En quelle année a t-il
été créé?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

15
1 - HISTOIRE MOTEUR DE RECHERCHE

Historique de Bing

Bing est un moteur de recherche récent développé


par Microsoft

Il a ete lancé officiellement le 3 juin 2009.

Surnommé Kumo dans les captures de


présentation en mars 2009.

16
Quelles sont les mises
à jour google que
vous connaissez ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

17
1 - HISTOIRE MOTEUR DE RECHERCHE

Quelques mises a jour de Google

2009 la recherche en « temps reel » et de la


recherche universelle

Google Caffeine, deployé dès juin 2010

Caffeine a ete une mise a jour complete du


systeme d'indexation des pages dans le moteur
de recherche

18
Qu'est ce que google
mayday ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.

19
1 - HISTOIRE MOTEUR DE RECHERCHE

Google May Day, (mai 2010) et


qui a permis de mieux interpréter
les mots-clés et les requetes
larges issues de la « longue traine
».

20
Qu'est ce que la
longue traine ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
1 - HISTOIRE MOTEUR DE RECHERCHE

Le terme longue traîne est utilisé dans le domaine


du search marketing pour illustrer le fait qu'un
grand nombre de requêtes rares, longues et
spécifiques opérées sur les moteurs de recherche
peuvent représenter un potentiel d'activité non
négligeable pouvant être spécialement exploité
dans le cadre du référencement naturel et des liens
commerciaux.
1 - HISTOIRE MOTEUR DE RECHERCHE
Qu'est ce que google
Minty fresh ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
1 - HISTOIRE MOTEUR DE RECHERCHE

Développement de la recherche
en temps réel, notamment
autour du Minty Fresh Indexing
destiné à enregistrer des pages
quasiment en instantané
Qu'est ce que le
knowledge graph ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
1 - HISTOIRE MOTEUR DE RECHERCHE

-Knowledge Graph (ou « graphe de


connaissances ») de Google destiné
à apporter des informations
complémentaires aux usagers lors
des recherches.
1 - HISTOIRE MOTEUR DE RECHERCHE

Le processus se déroule en trois temps :

• l'analyse par Google de la recherche de l'internaute (analyse de


chacun des mots-cies de la requete)

• la creation de relations entre les mots-clés (Google fait appel a une


gigantesque base de donnees pour nouer des liens semantiques).

• la proposition de resultats encore plus performants et des


informations comple-mentaires sur la recherche effectuée.
1 - HISTOIRE MOTEUR DE RECHERCHE

Le Knowledge Graph de Google


analyse le sens des requetes et tente
d'apporter des donnees
supplementaires pour agrémenter la
recherche des internautes.
Qu'est ce que la
recherche
sémantique ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
1 - HISTOIRE MOTEUR DE RECHERCHE

Permet de présenter un contenu de qualité correspondant à


l'intention de l'internaute.

Ces algorithmes plus complexes comprennent de mieux en


mieux l'intention et la signification contextuelle de chaque
requête de recherche en utilisant plusieurs facteurs tels que
l'emplacement de l'utilisateur, les recherches précédentes, les
éléments du langage naturel, etc.
1 - HISTOIRE MOTEUR DE RECHERCHE

Permet d'obtenir des résultats de


recherche de meilleure qualité et plus
pertinents.
Elle ajoute une nouvelle couche de
complexité au SEO, nécessitant une
nouvelle approche des tâches comme la
recherche de mots clés et l'optimisation du
contenu.
1 - HISTOIRE MOTEUR DE RECHERCHE

ll s'agit d'un modèle sémantique


et intelligent qui comprend les
entités du monde réel et les
eventuelles relations qui les lient
les unes aux autres.
1 - HISTOIRE MOTEUR DE RECHERCHE

Le Knowledge Graph a donc


participe a l'evolution de la
recherche sémantique et a
apporté une nouvelle vision de
la recherche.
1 - HISTOIRE MOTEUR DE RECHERCHE

Cette fonctionnalité de la recherche


s'appuie sur des sources publiques
telles que Wikipedia, Freebase
(abandonnee peu a peu depuis
2015) et CIA World Factbook.
1 - HISTOIRE MOTEUR DE RECHERCHE

Il s'agit de monuments célèbres, de


personnalites, de lieux geographiques
marquants, de films et musiques, d'oeuvres
d'art, mais également de sites de marques ou
des domaines reconnus sur la Toile (mais
dans une moindre mesure).
1 - HISTOIRE MOTEUR DE RECHERCHE

Pas d'impact sur le positionnement


Être dans le Knowledge Graph
n'impacte pas directement le
positionnement, mais l'effet inverse
peut etre imagine.
1 - HISTOIRE MOTEUR DE RECHERCHE

Mises a jour de Bing

Bing est un moteur de recherche assez


innovant qui reprend dans les grandes
lignes ce que propose Google, ce qui lui a
d'ailleurs valu des attaques dans sa courte
histoire tant les analogies etaient
nombreuses.
2 - Le référencement
aujourd’hui :
généralités, définitions

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
DONNEZ UNE
DÉFINITION DU
RÉFÉRENCEMENT

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS
A) Référencement versus positionnement

Le terme de « référencement ».( dans la grande


distribution)

On dit d’ailleurs, dans le jargon commercial, que ces


produits sont « référencés » auprès de la grande surface.
En d’autres termes, ils sont « trouvables ».

Cependant, ils sont placés parmi des centaines, des milliers


d’autres.
Qu'est ce que le
positionnement?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS
A) Référencement versus
positionnement

Certains produits sont alors mis en


avant à des endroits stratégiques,
beaucoup plus facilement « trouvables »
par les clients potentiels. Ils sont ainsi
bien « positionnés »
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS
A) Référencement versus positionnement

Exemple

Grande surface et galerie marchande Pour continuer


l’analogie ci-dessus, on peut estimer que la grande surface
représente les résultats « naturels » du moteur de recherche,
alors qu’une galerie marchande proposera l’équivalent des
liens sponsorisés. Un produit peut donc se trouver dans les
deux zones d’achat sans qu’il y ait obligatoirement
concurrence entre les deux. À retenir
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS
A) Référencement versus positionnement

Le référencement aujourd’hui : généralités, définitions

C’est une première étape, nécessaire mais pas


suffisante, dans le processus de gain de visibilité de
votre source d’information.

Mais ce référencement devra déjà être optimisé, ce


qui représente un vrai travail préliminaire.
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS
A) Référencement versus positionnement

Mettre en « tête de gondole » votre site en le positionnant au mieux


dans les résultats de recherche pour les mots-clés les plus
importants pour votre activité.

Troisième étape, pour vérifier que le positionnement a porté ses


fruits en évaluant le trafic généré

En d’autres termes, il ne servira à rien d’être bien positionné sur


des mots-clés que personne ne saisit ou sur des moteurs que
personne n’utilise.
A votre avis à quoi
sert le SEO ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS

À quoi sert le SEO ?

Le SEO est une stratégie pérenne qui permet


d’accroître et de développer sa visibilité sur le web.
Il possède de nombreux avantages :
Attirer des visiteurs qualifiés sur votre site web
Gagner en notoriété en démontrant votre
expertise
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS
À quoi sert le SEO ?

Le SEO est une stratégie pérenne qui permet d’accroître et de


développer sa visibilité sur le web. Il possède de nombreux
avantages :
Améliorer le positionnement de vos différentes pages sur
Google
Arriver dans les premiers résultats de Google,
Avoir de nouveaux prospects et clients,
Accroître votre chiffre d’affaires (c’est bien le plus
important).
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS

1. L’optimisation technique (Technical SEO)


du site web
L’aspect technique constitue le squelette de
votre site. C’est la première chose que
Google verra de votre site. Ainsi que
l'indexation.
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS

2. La qualité et la quantité de
contenus
Le contenu d’un site est primordial
pour vous positionner sur les SERP et
affirmer votre expertise aux yeux des
internautes. La stratégie de mots clés
1-LE RÉFÉRENCEMENT
AUJOURD’HUI :
GÉNÉRALITÉS, DÉFINITIONS
3. La popularité du site web
La popularité d’un site web se justifie notamment à
travers le nombre de liens qu’il reçoit d’autres sites
internet.
Plus de sites vous citent ou renvoient ses
internautes visiter votre site web et plus Google
vous accordera de l’intérêt. Netliking, backlink et
social media
CAS PRATIQUE

Sur la base des informations vu aujourd'hui


faites des recherches sur les dernières mise à
jours de google qui influencent le SEO.
Et qui sont pertientns pour la rédaction Web ?
2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

Le référencement fait partie des disciplines en


vogue à la portée de tout passionné disposant
d'un socle de connaissances suffisant pour
administrer des sites web.

Limites par la barrière du développement et du «


code » qui pourrait leur permettre d'aller plus
loin.
2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

L'objectif est de fournir (ou rappeler) des


bases en matière de développement,

Apprendre des bases afin de pouvoir


améliorer notre référencement en
conséquence.
QUELS SONT LES
LANGUAGES
COTES CLIENT?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

Différencier les langages côté client et côté serveur La diversité des


langages est souvent le premier frein pour les non-initiés.

Le client correspond au navigateur web.


Globalement, un langage qui s'exécute côté client peut afficher des
contenus dans un navigateur et gérer des animations/

Côté client, les langages sont peu nombreux :


HTML pour la mise en page (structure du document),
CSS pour la mise en forme,
JavaScript pour les animations et scripts divers.
QUELS SONT LES
LANGUAGES
COTES SERVEUR?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

Côté serveur, nous pouvons citer des


technologies telles que PHP, ASP et
ASP.Net de Mi-crosoft, Java (JSP et
servlets), ColdFusion, Python, Perl ou
Ruby.
2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

Et Google, qu'utilise-t-il comme langage ? C'est


une excellente question.

Google utilise donc des technologies diverses


depuis toujours, puis en a ajouté au fur et à
mesure selon les services qu'il a acquis ou créés.
2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

En 2014, Jeff Nelson, un employé de Google, a fourni une amorce de


réponse Il a indiqué ceci :

• La partie Search est essentiellement programmée en C++ et


Python (notamment pour des algorithmes).

• La partie Ads (publicité) s'appuie surtout sur un socle Java et SQL


(base de données).

• Google Apps est développé avec un socle C++, Java et JavaScript.


2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

Côté moteur de recherche, l'ancêtre historique de Google,


Backrub, était programmé en C++ et Python.
La majorité de Google est développé en C et C++ pour leur
efficacité et peut fonctionner aussi bien sur Solaris que Linux
»

Et GoogleBot alors ?

Le crawler de Google sont programmés en Python.


2 • LA PROGRAMMATION
POUR LE RÉFÉRENCEMENT

Si nous prenons d'autres exemples, sachez que les forums de


Google et YouTube ont un gros socle programmé en Python
(côté serveur), avec en front-end HTML, CSS et JavaScript (pour
le côté client).

Gmail s'appuie essentiellement sur du Java côté ser-veur et


JavaScript côté client.

Go pour les applications (comme AlphaGo, le robot


d'intelligence artificielle qui a battu le champion du monde du
jeu de go).
3/MAITRISEZ
L'INDEXATION

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
Qu'est ce que
l'indexation ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
3/MAITRISEZ L'INDEXATION

Maîtriser les techniques d'indexation

L'indexation est une composante fondamentale du


référencement dont l'objectif est de faciliter l'enregistrement
des pages dans les bases de données des moteurs.

Souvent, les gestionnaires de sites ont tendance à optimiser


le positionnement des pages avant de penser à les indexer,
ne tombons pas dans cette mauvaise stratégie.
3/MAITRISEZ L'INDEXATION

Fonctionnement général d'un moteur

Du crawler au requêteur...

Ce sont ces programmes qui sont à la source de toutes les pages


indexées dans les bases de données de Google, Bing, Yandex, Baidu.

Alors comment fonctionne réellement un crawler ?

Nous pouvons distinguer trois grandes étapes dans le fonctionnement


d'un moteur de recherche.
Quelles sont les
différentes étapes
de l'indexation ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
Qu'est ce qu'un
crawler ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
3/MAITRISEZ L'INDEXATION

1 Le crawl (réalisé par le crawler) : son rôle est uniquement de lire des
liens et de les suivre, puis de composer une liste d'URL intéressantes à
analyser de plus près (parfois appelée « seed »).

search,
mobile,
ads,
images,
vidéos
Qu'est ce que le
fetch ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
3/MAITRISEZ L'INDEXATION

2 Le fetch (réalisé par l'indexer) : le moteur utilise les listes d'URL


préétablies (seed) et crawle les pages en détail, en récupérant et
inspectant les contenus. Dans cette étape, seuls les textes sont
décortiqués et les plus intéressants d'entre eux sont enregistrés (indexés)
dans les bases de données, avec des tables de correspon-dances (index
inversés) pour corréler chaque URL avec des expressions récupérées.
Qu'est ce que le
query processor ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
3/MAITRISEZ L'INDEXATION

3 Le query processor (réalisé par le requêteur) :


son rôle est de restituer les résultats en fonction de
nombreux algorithmes et de la requête de l'utilisateur.
C'est ici que le positionnement prend tout son sens
pour les référenceurs car il s'agit du résultat final et
visible.
3/MAITRISEZ L'INDEXATION

Chaque étape ne compte que pour un tiers

Le travail consiste à bien optimiser notre site web pour qu'il


réponde aux besoins des trois.

Il convient de présenter des liens lisibles et fonctionnels

Il faut que la qualité de nos contenus et du code source soit


suffisamment élevée pour que l'indexation se déroule
parfaitement.
3/MAITRISEZ L'INDEXATION
3/MAITRISEZ L'INDEXATION

Google MayDay a été le premier changement


marquant dans la compréhension de pages web et
de leurs contenus.

MayDay agissait en réalité dès l'indexation pour


mieux comprendre les contenus page par page.
3/MAITRISEZ L'INDEXATION

Les analyses individuelles ont commencé avec


Google MayDay, très liée à la sortie de
Google Caffeine dans la foulée.

Toute la technique d'indexation du moteur de


recherche a été revue et corrigée
4.INDEXER SON SITE
INTERNET SUR LES
MOTEURS DE
RECHERCHE

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
A VOTRE AVIS
QUELLES SONT
LES ÉTAPES ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
COMMENT
POUVONS NOUS
SOUMETTRE LE
SITE MAP ?
N'hésitez pas à en faire une discussion ouverte pour les
questions ou les éclaircissements avant de continuer.
4.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE

1- Créer son sitemap


2- Soumettre son sitemap aux moteurs de recherche
3-Vérifier que votre site est bien indexé
4-Repérer les erreurs et les corriger
5-Améliorer son crawl budget
QU'EST CE QUE LE
CRAWL BUDGET ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE

1- Le crawl budget

Le crawl budget peut se définir comme « le


nombre d'URL que GoogleBot peut et veut
explorer ». En d'autres termes, il s'agit de la
capacité d'indexation de Googlebot et Bingbot
pour chaque site, selon plusieurs facteurs :
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE

On intérêt pour le site et ses pages,


la vitesse de chargement des pages,
le nombre de pages d'erreurs trouvées,
etc.
Favoriser un meilleur budget d'exploration
pour nos sites web
Inciter les robots à crawler plus
régulièrement nos pages, mais aussi à en
indexer un maximum.
QU'EST CE QUE LE
CRAWL RATE ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE
1- Le crawl budget

On distingue donc le budget d'exploration en deux sous-parties :

• Crawl Rate : le taux de crawl correspond au nombre d'URL


que GoogleBot peut crawler simultanément ou, en tout cas,
pendant son passage. L'objectif du robot d'indexation est de
visiter un maximum de pages lors de son crawl, sans pour
autant gaspiller la bande passante disponible (à la fois pour
lui, mais aussi pour les visiteurs réels des sites web).
QU'EST CE QUE LE
CRAWL DEMAND ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE

1- Le crawl budget

On distingue donc le budget d'exploration en deux sous-parties


:

• Crawl Demand : il s'agit ici du nombre d'URL que Google veut


bien crawler, selon une rythmique déterminée. Si le moteur de
recherche estime que le site a un fort intérêt pour son index, il
voudra explorer davantage de pages que s'il est bondé de
spams ou propose peu de contenus à forte valeur ajoutée, etc.
QU'EST CE QUE LE
CRAWL DELAY ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE

Notion de crawl-delay

Pour optimiser les performances, tout


webmaster peut indiquer aux robots la
fréquence d'indexation qu'il souhaite, appelée
« crawl-delay ». Cela évite généralement de
perdre trop de bande passante en précisant au
robot une fréquence minimale de passage
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE

Notion de crawl-delay

L'intérêt d'obtenir un bon budget d'exploration est de


favoriser la capacité d'indexation de vos sites web.

Pour chaque ressource optimisée sur votre site, vous


améliorez l'expérience utilisateur mais également vos
chances d'être mieux exploré et indexé par GoogleBot
et BingBot.
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE

Il existe donc certaines pratiques à éviter, ou tout du moins à


utiliser avec parcimonie, en toute connaissance de cause.

Google et Bing en ont fourni une petite liste :

• navigation à facettes (URL avec des paramètres dans des


pages avec filtres) ;

• contenu en double sur le site (contenu dupliqué) ;


6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE
Il existe donc certaines pratiques à éviter, ou tout du moins à utiliser
avec parcimonie, en toute connaissance de cause.

Google et Bing en ont fourni une petite liste :

• pages d'erreurs « soft 404 » (pages qui renvoient un code 200,


donc sans erreur, alors qu'il s'agit d'une vraie page d'erreur) ;

• pages piratées, contenus de mauvaise qualité et spams ;

• nombre de fichiers JavaScript et CSS (plus il y a de ressources,


plus GoogleBot prend de temps à crawler).
QU'EST CE QUE LE
SITE MAP ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE
Maîtriser les Sitemaps XML

Origines et usages Le protocole Sitemap a été lancé dès 2005


par Google afin de faciliter le travail d'indexation des pages
web.

Créer son propre fichier Sitemap présente donc un réel intérêt


pour optimiser l'enregistrement des pages.

La présence et la soumission d'un fichier Sitemap ne garantit


pas que toutes les pages sont enregistrées dans l'index des
moteurs.
QU'EST CE QUE LE
SITE MAP ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
COMMENT
SOUMETTRE SON
SITE MAP ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
6.INDEXER SON SITE INTERNET SUR
LES MOTEURS DE RECHERCHE

`Deux règles essentielles sont à respecter dans ces fichiers XML


:

•Aucun d'entre eux ne doit contenir plus de 50 000 URL. Il est


rare d'atteindre ce chiffre mais, si tel est le cas, il convient de
créer plusieurs fichiers distincts ;

• Leur poids est limité à 50 Mo maximum (52 428 800 octets


pour être totalement
précis).
COMMENT
SOUMETTRE SON
SITE MAP ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
N'hésitez pas à en faire une discussion ouverte pour les
questions ou les éclaircissements avant de continuer.
Google search console pour soumettre son site map
7.LA
DÉSINDEXATION
ET BALISAGE

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
QU'EST CE QUE LE
BALISAGE ?

N'hésitez pas à en faire une discussion ouverte pour les


questions ou les éclaircissements avant de continuer.
7.LA DÉSINDEXATION ET BALISAGE

Desindexation (robots.txt et autres methodes...)

Role du dereferencement

L'objectif du dereferencement est de bloquer l'acces des crawlers a certains


types de fichiers (images, videos...) ou a certaines pages (via leur URL).

Les robots restent toutefois les décideurs et il peut arriver que des demandes
de non indexation (ou de desindexacion) ne soient donc pas respectees.

Les demandes de déréférencement peuvent être longues à être prises en


compte, de l'ordre de plusieurs jours a plusieurs semaines.
7.LA DÉSINDEXATION ET BALISAGE

Generalement, il est possible de forcer la désindexation


d'une page en appliquant certaines directives via un
fichier . htaccess ou en PHP par exemple, juste en
bloquant les robots d'indexation.

Cela force la main et accélère le processus de suppression


mais ces méthodes sont un peu plus complexes à mettre
en oeuvre.

Redirections VS desindexacion
7.LA DÉSINDEXATION ET BALISAGE

Gestion des metas robots

Pour desindexer une page, l'idéal est généralement de


créer un fichier robots.txt, comme nous le verrons a la
fin de cette section. La méthode la plus répandue et la
plus connue est celle des balises meta robots qui
permettent de fournir des directives simples aux divers
crawlers au sein d'une page.
7.LA DÉSINDEXATION ET BALISAGE

Techniquement, il convient d'intégrer une balise HTML spécifique


dans la section <head>...</head> d'une page web et les crawlers
appliquent les directives après avoir visité la page.

On peut donc gérer la désindexation de chaque page


indépendamment, en changeant la valeur de la balise HTML, ou en
la retirant (dans ce cas, l'indexation et le suivi des liens sont
autorisés par défaut). La balise se présente sous cette forme si vous
souhaitez bloquer l'indexation :
<meta name="robots" content="noindex, nofollow"I>
7.LA DÉSINDEXATION ET BALISAGE

Outil d'aide au balisage des extraits de code enrichis


Google a récemment mis en place un outil d'aide a la
réalisation du balisage sémantique des pages web.

Certes, les sites officiels de chaque format présentent


parfois des outils de création, mais le Markup Helper
de Google semble etre encore bien plus fiable. L'outil
est accessible a l'adresse ou via les Web Tools de la
Google Search Console dans la section dédiée aux
donnees structurees.
7.LA DÉSINDEXATION ET BALISAGE

L'outil met à disposition plusieurs solutions pour


réaliser son balisage sémantique :
• création des balises sémantiques a partir d'une URL
existante ou d'un code HTML donne pour les sites web ;
• création du balisage pour des e-mails HTML. Une liste
de types d'informations est proposée pour affiner le
balisage au fur et a mesure. Cela peut prendre un peu
de temps quand les pages sont complexes, mais il faut
en realite de repeter la démarche suivante :
7.LA DÉSINDEXATION

• entrez l'URL de votre site web ;


• sélectionnez le type de données parmi les choix
disponibles ;
• cliquez sur les zones a qualifier dans votre site
et indiquez le type d'information décrite ;
• afficher le code HTML Sere par Google Markup
Helper ;
• copiez ou téléchargez le code HTML généré
pour remplacer votre page existante.
7.LA DÉSINDEXATION ET BALISAGE

Commence le balisage

Présentation google hyper markup


Présentation google Markup helper

Vous aimerez peut-être aussi