Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Développement Web
2020 - 2021
Sommaire:
Introduction 01
Le référencement naturel 02
Optimisation du contenu 09
2.1 Généralités:
Le contenu dupliqué
Google est assez intelligent pour relever ces pratiques et lutte activement contre, en mettant
à jour ses algorithmes.
03. Les bases du SEO: /04
Chaque page doit avoir son propre ensemble de métadonnées ; ce n'est qu'un des
éléments qui aident les moteurs de recherche à mieux comprendre comment la structure
du site web est construite.
<meta keywords=""> - une série de mots-clés que vous jugez pertinents pour la page en
question
<meta viewport=""> - donne au navigateur des instructions sur la manière de contrôler les
dimensions et le cadrage de la page.
<meta charest=""> - définit un jeu de caractères
<meta author=""> - définit l'auteur d'une page
04. Amélioration de la structure de site /05
Eviter:
d'utiliser des URL longues avec des paramètres et des ID de session inutiles
de choisir des noms de pages génériques comme "page1.html
d'utiliser des mots-clés excessifs comme "baseball-cards-baseballcards.htm".
Elle sert à indiquer à Google la page principale à indexer lorsque celle-ci peut avoir
plusieurs URL (ex https://monsite.com/page et https://www.monsite.com/page), ou que
d’autres pages avec du contenu très similaire existent, et que vous ne souhaitez pas voir
indexées :
<link rel="canonical" href="https://monsite.com/page" />
Exemples d’utilisation:
Vous êtes propriétaire d’un site Internet de vente de vêtements : exemple-vente-
vetements.fr
/06
Vous vendez, entre autres, des robes bleues. Elles sont accessibles par deux chemins
différents pour permettre à vos visiteurs de filtrer par couleur ou par type de vêtement :
exemple-vente-vetements.fr/vetements-bleus/robes-bleues ;
ET exemple-vente-vetements.fr/robes/robes-bleues.
Ces pages sont exactement les mêmes, mais elles sont nécessaires.
Vous mettez donc en place une balise canonique sur ces deux pages :
<link rel="canonical" href="https://exemple-vente-vetements.fr/vetements-bleus/robes-
bleues" />
Pour montrer à Google que vous souhaitez que cette page soit utilisée comme page
principale pour l’indexation. Vous ne serez donc pas pénalisé par du contenu dupliqué.
Préparez deux sitemaps: un pour les utilisateurs (figure 4.4), un autre pour les
moteurs de recherche (figure 4.4). Les sitemaps ne sont que de simples
répertoires de toutes les pages qui se trouvent sur votre site. les visiteurs n'ont pas
besoin de les voir, mais les moteurs de recherche les utilisent ainsi pour indexer
rapidement et complètement votre contenu.
/07
Figure 4.4 Exemples d'un plan de site HTML et d'un plan de site XML
Il s'agit généralement d'un simple fichier au format xml, rss ou tst, et c'est en fait un plan
que les moteurs de recherche peuvent analyser pour voir toutes les pages de votre site
Web d'un seul coup d'œil.
C'est important car les moteurs de recherche comme Google et d'autres classent les
pages de votre site et non le site lui-même. Leurs robots d'exploration s'appuient sur les
plans de site pour comprendre votre contenu et orienter les utilisateurs qui recherchent ce
contenu dans votre direction, ce qui est particulièrement important pour les grands sites
Web comportant de nombreuses pages, surtout si votre structure n'est pas très bien
organisée ou reliée, s'il n'a pas beaucoup de liens externes ou s'il est tout nouveau, mais
même pour les sites plus anciens qui sont assez simples, bien reliés et organisés, ne pas
avoir de sitemap revient à se tirer une balle dans le pied car il n'y a pas d'inconvénient à en
avoir un, seulement des avantages.
Un plan de site bien structuré contient les URL de toutes les pages de votre site classées
dans l'ordre de la plus importante (la page d'accueil) à la moins importante ainsi que les
liens entre ces pages et si vous apportez des modifications à votre site, assurez-vous de
mettre à jour votre plan de site en conséquence pour le garder à jour.
/08
Il arrive parfois que les utilisateurs arrivent sur une page qui n'existe pas sur votre site, soit
en suivant un lien brisé ou en tapant une mauvaise URL. Le fait de disposer d'une page 404
personnalisée (figure 4.5) qui guide gentiment les utilisateurs vers une page fonctionnelle
de votre site peut améliorer considérablement leur expérience. page fonctionnelle de votre
site peut grandement améliorer l'expérience de l'utilisateur. Votre page 404 doit
probablement comporter un lien vers votre page racine et peut également fournir des liens
vers du contenu populaire ou connexe sur votre site. Google fournit un widget 404 que
vous pouvez intégrer à votre page 404 pour l'alimenter automatiquement avec de
nombreuses fonctionnalités utiles. Vous pouvez également utiliser les Outils pour les
webmasters de Google pour trouver les sources des URL qui provoquent des erreurs "non
trouvées".
Il faut éviter donc de mettre des ancres de lien telles que "ici" ou "en savoir plus".
et de suroptimiser les ancres de liens, en utilisant toujours la même.
Google découvrirait que la création des liens "non organiques" et pourrait
pénaliser ses sites.
En clair, il faut éviter de mettre une image de 2 500 px sur 3 800 px dans une
<div> de 500 px sur 500 px, et d’imposer le redimensionnement en CSS. Plus une
image est grande, plus elle est lourde et donc longue à télécharger pour le
navigateur. Il est par conséquent indispensable de la redimensionner avant de la
mettre sur votre site.
Vous pouvez également la recadrer pour enlever les parties superflues de l’image,
et donc réduire encore plus sa taille et son poids.
Si vous décidez d'utiliser une image comme lien, le fait de remplir son texte "alt"
aide Google à mieux comprendre la page vers laquelle vous vous dirigez.
Évitez d'écrire un texte alt excessivement long qui serait considéré comme du
spam et d'utiliser uniquement des liens image pour la navigation de votre site
Étant donné que les balises d'en-tête rendent le texte qu'elles contiennent plus
grand que le texte normal de la page, c'est un indice visuel pour les utilisateurs que
ce texte est important et peut les aider à comprendre quelque chose sur le type de
contenu qui se trouve sous le texte de l'en-tête.
Plusieurs tailles d'en-têtes sont utilisées afin de créer une structure hiérarchique
pour votre contenu, ce qui permet aux utilisateurs de naviguer plus facilement
dans votre document.
Il s'agit d'une étape importante dans la publication de tout site web car ce fichier
indique aux moteurs de recherche ce qu'ils doivent indexer sur un site et ce qu'ils
ne doivent pas indexer, les pages auxquelles ils doivent accéder et celles qu'ils
doivent ignorer (figure 6.1), ce qui inclut un contenu privé ou des éléments inutiles
qui consommeraient de la bande passante et augmenteraient le temps de
chargement sur le serveur sans raison valable.
Ce fichier, qui doit être nommé "robots.txt", est placé dans le répertoire racine du
site (figure 6.2).
L'absence de ce fichier génère également des erreurs dans le journal d'apache
lorsque les robots des moteurs de recherche demandent un fichier robot et n'en
trouvent pas.
Une autre utilisation du nofollow est lorsque vous écrivez du contenu et que vous
souhaitez référencer un site Web, mais que vous ne voulez pas lui transmettre votre
réputation sur ce site.
Si vous êtes intéressé par le nofollow de tous les liens sur une page, vous pouvez
utiliser "nofollow" dans votre balise robots, qui est placée à l'intérieur de la balise
<head> du code HTML de cette page. (figure 6.6)
Avoir un site web adapté aux mobiles est un élément essentiel de votre présence
en ligne. Lors des dernières années, l'indexation de google s'est vraiment
concentrée sur la promotion des sites web adaptés aux mobiles et ceux qui ne le
sont pas seront moins bien classés dans la recherche google. Il est donc très
important de mettre en œuvre cette convivialité mobile.
La plus grande partie de l'optimisation de la convivialité mobile se fera dans le
fichier CSS, où vous utiliserez des requêtes média pour présenter votre site Web
différemment sur tous les appareils.
Une fois que Googlebot-Mobile a parcouru vos URL, ensuite il vérifie si chaque URL
est affichable sur un appareil mobile.
Les pages qui ne sont pas consultables sur un téléphone mobile ne seront pas
incluses dans l'index des sites mobiles (bien qu'elles puissent être incluses dans
l'index du Web normal).
Cette détermination est basée sur une variété de facteurs, dont l'un est la
déclaration "DTD (Doc Type Definition)".
Vérifiez que la déclaration DTD de vos déclaration DTD de vos URL adaptées au
mobile est dans un format mobile approprié, tel que XHTML Mobile ou Compact
HTML (figure 7.3).
Lorsque Googlebot extrait une URL de la file d'attente d'exploration via une requête
HTTP, il vérifie d'abord si vous en autorisez l'exploration. Googlebot lit alors le
fichier robots.txt. Si l'URL est marquée comme non autorisée, Googlebot n'envoie
pas la requête HTTP pour cette URL et ignore cette dernière.
Googlebot analyse ensuite la réponse pour les autres URL dans l'attribut href des
liens HTML, puis ajoute les URL à la file d'attente d'exploration. Pour empêcher la
découverte de liens, utilisez le mécanisme nofollow.
8.1 Éviter les erreurs 404 dans les applications à page unique :
Dans les applications à page unique affichées côté client, le routage est souvent
mis en œuvre du côté du client. Dans ce cas, l'utilisation de codes d'état HTTP
adéquats peut se révéler impossible ou difficilement applicable. Pour éviter les
erreurs de type "erreur 404" lors de l'affichage et du routage côté client, optez
pour l'une des stratégies suivantes :
Utilisez une redirection JavaScript vers une URL pour laquelle le serveur répond
avec un code d'état HTTP 404 (par exemple, /not-found).
Ajoutez une balise <meta name="robots" content="noindex"> aux pages
d'erreur à l'aide de JavaScript.
8.2 Utiliser les balises Meta pour les robots avec précaution :
Vous pouvez empêcher Googlebot d'indexer une page ou de suivre des liens via
une balise Meta pour les robots. Par exemple, l'ajout de la balise Meta suivante en
haut de la page empêche Googlebot d'indexer cette dernière :
Vous pouvez utiliser JavaScript pour ajouter une balise Meta pour les robots à une
page ou pour modifier son contenu. L'exemple de code suivant montre comment
remplacer la balise Meta pour les robots par un code JavaScript pour empêcher
l'indexation de la page active si un appel d'API ne renvoie pas de contenu.
09. Amélioration de la vitesse d'un site: /19
En compressant vos pages web et CSS avec Gzip, vous pouvez réduire
considérablement le temps de chargement de votre site. C’est certainement la
méthode de compression la plus efficace, qui permet de réduire le nombre de
demandes HTTP et le temps de réponse, et ce jusqu’à 70 %.
cas n° 1, vous utilisez le JavaScript pour sublimer votre page ou pour modifier
le HTML une fois celui-ci chargé, par exemple l’utilisation de jQuery. Dans ce
cas, pas besoin de bloquer l’affichage de la page. Mieux vaut l’afficher au plus
vite pour ne pas faire attendre vos visiteurs ! Dans ce cas, il vous suffit
d’ajouter “async” ou “defer” dans vos balises script :
exécution asynchrone async <script async src=""></script>. Si l’ordre
d'exécution n’a pas d’importance et que les scripts peuvent être exécutés
dès qu’ils sont disponibles, préférez la méthode asynchrone,
exécution différée defer <script defer src=""></script>. Si l’ordre des scripts
est important, et qu’ils doivent être exécutés une fois le HTML
complètement chargé, préférez la méthode différée ;
cas n° 2, C’est le JavaScript qui permet d’afficher votre contenu, comme dans
le cas des framework JS. Nous traiterons ce cas dans la troisième partie du
cours !
Lorsqu'un visiteur de votre site consulte une page pour la première fois, le cache
navigateur est vide. Son navigateur va donc télécharger les éléments de la page
et les sauvegarder dans un espace temporaire.
La prochaine fois qu’il visitera cette même page, son navigateur n’aura pas à
retélécharger toutes les informations. Ceci permet donc un gain de temps
significatif pour charger la page !
Voici les autres types de cache que vous pourriez mettre en place :
Exemple
Prenons à nouveau pour exemple un serveur Apache, qui est la technologie la
plus utilisée chez les hébergeurs. Le paramétrage de ce cache va se situer dans
votre fichier .htaccess. Voici ci-dessous le code à ajouter :
Code à ajouter pour l'en-tête Cache-Control
Un RDC, réseau de diffusion de contenu (ou CDN qui est le terme le plus utilisé)
est un réseau mondial de serveurs proxy (des serveurs qui servent
d'intermédiaire), qui permet d'accélérer le traitement des données pour les
utilisateurs finaux.
Les CDN sont utilisés pour améliorer l'expérience globale de l'utilisateur et fournir
un réseau plus efficace.
La plupart des CMS vous permettent d’installer un thème (un design préconçu
pour vous faciliter le travail) et/ou un theme builder, qui permet de créer vos
pages en faisant “glisser-déposer” des éléments déjà préconstruits.
Voici les choses que vous devez absolument vérifier lorsque vous choisissez un
thème et un builder :
le thème doit être rapide. Il ne doit pas comporter trop d’animations CSS ni de
JavaScript qui bloquent l’affichage. Vous pourrez trouver ces informations
dans la description du thème. De plus, la plupart des thèmes propose une
version de démo en ligne, dont vous pourrez tester la vitesse grâce à Pingdom
ou GTmetrix ;
le thème doit respecter les bonnes pratiques SEO. Par exemple, pas de H1
multiples dans la page ;
le thème builder ne doit pas alourdir considérablement le temps de
chargement de vos pages. Faites un essai sur une page de votre site avec ou
sans, pour comparer les résultats.
Le souci de beaucoup de builders est qu’ils rajoutent énormément de code HTML
“inutile” dans les pages.
/23
Éliminez les plugins et les ressources inutiles
Tous les CMS proposent une fonctionnalité d’installation de plugins / modules /
extensions.
Attention, ces plugins peuvent être très utiles, mais également fortement alourdir
votre site s’ils sont de mauvaise qualité, et rajouter des failles de sécurité.
De manière générale, si vous avez des plugins installés que vous n'utilisez plus ou
que vous jugez inutiles, vous devez les désactiver et les supprimer. Vous pouvez
facilement identifier les plugins qui ralentissent votre site web en les désactivant
manuellement, puis en mesurant les performances du serveur. En supprimant les
plugins inutiles, vous pouvez considérablement améliorer le temps de
chargement de votre page.
Cependant, sachez que leur nombre n’est pas le seul facteur déterminant. Vous
pouvez avoir une cinquantaine de plugins et toujours disposer d’un site web plus
rapide. Le nombre de plugins est pris en compte, certes, mais leur qualité l’est
davantage.
Par exemple, les plugins de partage sur les réseaux sociaux peuvent affecter
considérablement le temps de chargement de votre page. Par conséquent, vous
pouvez envisager de développer vous-même ou de faire développer des boutons
de réseaux sociaux dans le code source du thème de votre site web. Évitez ces
plugins et, de manière générale, ceux qui chargent beaucoup de scripts.
Une requête http, c'est quand quelqu'un tape votre url dans son navigateur et
appel votre serveur pour demander un fichier (comme une page de votre site
web) et le serveur lui envoie ce fichier demandé. Cela a lieu pour tous les fichiers
nécessaires à la création de la page web.
La plupart des sondages sur le sujet indiquent que les gens s'attendent à ce qu'un
site web se charge en moins de 2 secondes et que si le chargement d'un site web
prend plus de trois secondes, 40 % des utilisateurs, soit près de la moitié,
sauteront le pas et abandonneront le site.
L'utilisation de sprites CSS qui consiste à combiner plusieurs images en une seule
et à utiliser CSS pour l'appeler, éliminant ainsi les multiples requêtes HTTP qui
seraient normalement nécessaires, c'est la meilleure solution pour les images de
fond, les boutons, les logos.
/24
Par exemple, disons que nous avons quatre éléments de menu sur notre site,
chacun avec une image différente. Au lieu de 4 requêtes HTTP pour amener ces 4
images, nous pouvons créer un sprite avec les 4 images, les diviser en une grille
de 4 colonnes et décaler l'index de chacune d'elles pour indiquer au navigateur
où la placer. De cette façon, une seule requête HTTP est nécessaire pour faire
apparaître le contenu de la feuille de sprite.
L'utilisation d'URIs de données pour intégrer des images dans votre HTML ou CSS
au lieu d'avoir un lien vers une source d'image externe qui nécessiterait une autre
requête http pour l'envoyer et l'obtenir
L'utilisation de CDN= content delivery network est l'utilisation d'un réseau de
serveurs pour héberger le contenu et le réseau enverra les données du serveur le
plus proche à l'utilisateur, il est même possible d'utiliser plus d'un CDN.