Vous êtes sur la page 1sur 19

Chapitre II - Initiation à la technologie Web

A. Présentation de l’Internet
1. Définitions

L'internet ou Internet est un réseau mondial de réseaux informatiques


interconnectés reposant sur le protocole IP. Le terme désigne en anglais n'importe quelle
interconnexion de réseaux d'ordinateurs, d'où la contraction : inter + net (abréviation de
network, réseau).

Internet sert de support à de nombreux systèmes, notamment le Web (hypertexte)


qui en a fait la popularité. Par extension, le terme Internet peut désigner, à tort, le World
Wide Web alors que celui-ci n'en désigne qu'une des utilisations, le courrier électronique
en étant une autre, tout aussi populaire.

Un internaute est une personne qui utilise un accès à internet. Cet accès peut être
obtenu grâce à un fournisseur d'accès via divers moyens de communication électronique
: soit filaire (réseau téléphonique commuté (bas débit), ADSL, fibre optique jusqu'au
domicile), soit sans fil (WiMAX, par satellite, 3G+, 4G, ou même prochainement en
5G).
14
2. Applications de l’Internet
Internet propose cinq types de services fondamentaux :
2.1. Le Web : Le World Wide Web (WWW), littéralement la « toile
(d’araignée) à l'échelle mondiale », communément appelé le Web, et
parfois la Toile, est un système hypertexte public fonctionnant sur
Internet. Le Web permet de consulter, avec un navigateur, des pages
accessibles sur des sites. Cette image de toile d’araignée vient des
hyperliens qui lient les pages web entre elles. Le Web est fréquemment
confondu avec Internet, à tort ; ce n’est qu’une application de ce dernier.

Aujourd'hui, le Web est un univers en perpétuelle expansion et


n’a pas toujours été le Web que nous connaissons aujourd’hui. Voici une
petite synthèse de l’évolution du Web depuis sa toute première version
connue du grand public :

 Le web 1.0 (1991-1999), encore appelé web traditionnel,


est avant tout un web statique, centré sur la distribution
d’informations. Il se caractérise par des sites orientés

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

produits, qui nécessitent peu l’intervention des


utilisateurs. Les premiers sites d’e-commerce datent de
cette époque. Le coût des programmes et logiciels
propriétaires est énorme et l’explosion de la bulle
dot.com, en 2000, remet en question cette approche de la
toile.
 Le web 2.0 (2000-2009), ou web social et participatif,
change totalement de perspective. Il privilégie la
dimension de partage et d’échange d’informations et de
contenus (textes, vidéos, images ou autres). Il voit
l’émergence des réseaux sociaux, des smartphones et des
blogs. Le web se démocratise et se dynamise. L’avis du
consommateur est sollicité en permanence et il prend goût
à cette socialisation virtuelle. Toutefois, la prolifération de
contenus de qualité inégale engendre une infobésité
difficile à contrôler.
 Le web 3.0 (2010-xx), aussi nommé web sémantique, vise
15
à organiser la masse d’informations disponibles en
fonction du contexte et des besoins de chaque utilisateur,
en tenant compte de sa localisation, de ses préférences,
etc. C’est un web qui tente de donner sens aux données.
C’est également un web plus portable et qui fait de plus
en plus le lien entre monde réel et monde virtuel. Il répond
aux besoins d’utilisateurs mobiles, toujours connectés à
travers une multitude de supports et d’applications
malines ou ludiques.
 Le web 4.0 (2020-xx), évoqué par certains comme le web
intelligent, effraie autant qu’il fascine, puisqu’il vise à
immerger l’individu dans un environnement (web) de plus
en plus prégnant. Il pousse à son paroxysme la voie de la
personnalisation ouverte par le web 3.0 mais il pose par la
même occasion de nombreuses questions quant à la
protection de la vie privée, au contrôle des données, etc.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

Une illustration graphique dynamique de l’évolution du Web très


intéressante est disponible sur le lien suivant :
http://www.evolutionoftheweb.com/?hl=fr

2.2. Diffusion multimédia (Audio/Vidéo) : La diffusion multimédia en


continu (en anglais streaming) est un multimédia qui est reçu de manière
continue et présenté à un utilisateur final tout en étant livré par un
fournisseur. Le verbe « diffuser » (en anglais « stream ») désigne le
processus de livraison ou d'obtention d'un support de cette manière ; le
terme désigne le mode de livraison du support (audio/vidéo) plutôt que
le support lui-même, et constitue une alternative au téléchargement de
fichier, processus dans lequel l'utilisateur final obtient l'intégralité du
fichier du contenu désiré avant de pouvoir le regarder ou de l'écouter. La
technologie de diffusion en direct (en anglais live streaming) est souvent
utilisée pour relayer des événements en direct, tels que le sport, les
concerts, ou de manière plus générale les programmes TV et radio en
direct. Parmi les plateformes les plus populaires et les plus connues de
diffusion multimédia, nous pouvons citer YouTube, Spotify, Deezer, etc. 16
2.3. Téléphonie Internet : La téléphonie Internet est un type de technologie
de communication qui permet de transmettre des appels vocaux et
d'autres services de téléphonie tels que fax, SMS et autres applications
de messagerie vocale en utilisant Internet comme moyen de connexion.
Les logiciels utilisant cette technologie sont économiques et pratiques,
car ils permettent à l’utilisateur de communiquer par télécopie, par appel
vocal et vidéo partout dans le monde, tant qu’une connexion Internet est
disponible. De cette manière, les utilisateurs peuvent contourner les taxes
courantes dans les services téléphoniques traditionnels. Cependant, la
qualité de ce service n’est pas aussi bonne que celle des réseaux à
commutation de circuits traditionnels utilisés dans les services
téléphoniques traditionnels, car elle est très dépendante de la qualité et
de la vitesse de la connexion Internet.

Même si les termes téléphonie Internet et voix sur IP (VoIP) sont


utilisés de manière synonyme, ils font référence à deux choses
différentes. En effet, la téléphonie Internet englobe toutes les utilisations

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

des protocoles Internet (IP) pour les communications téléphoniques


transmises sur l’Internet public. La VoIP, en revanche, est simplement
une technologie de la téléphonie Internet.

2.4. Transfert de fichiers : Un transfert de fichier est une opération


informatique, sur laquelle reposent les services de télécommunications.
Elle consiste à acheminer, vers un second ordinateur, un fichier
disponible sur un premier ordinateur. Elle permet de rendre le fichier
transféré disponible sur la machine distante sans la manipulation d'un
support physique. Le FTP (acronyme de File Transfer Protocol) est un
protocole de transfert de fichiers. Le transfert de fichiers s'effectue entre
un ordinateur et un périphérique connecté directement se fait à l'aide
de protocoles de communication (USB par exemple) et de pilotes et en
établissant une connexion entre un serveur FTP et un client FTP dans le
cas d’une connexion distante en demandant des droits d’accès si cela est
nécessaire.

Le transfert de fichier peut se faire d'ordinateur à périphérique, de


17
serveur à serveur, de client à serveur, ou de client à client par
l'intermédiaire d'un serveur de messagerie électronique (Skype,
Facebook, etc.) par exemple (transfert direct), ou même d'un serveur
intermédiaire qui stocke les données temporairement afin de permettre
au destinataire de les récupérer sans être en contact direct avec l'émetteur
d'origine (transfert indirect).

2.5. E-mail et messagerie instantanée :


 E-mail : Mail, e-mail, courrier électronique, courriel : c'est la même
chose. Ces termes désignent un message échangé entre utilisateurs
via Internet. Comme une lettre postale traditionnelle, ce courrier
électronique comporte :
- Une adresse (électronique) du ou des destinataires principaux (et
éventuellement d'autres destinataires en copie) constituées de
trois éléments : une partie locale (identifiant), le caractère
séparateur « @ » (arobase) qui signifie at en anglais et enfin

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

l’adresse du serveur mail (par exemple Gmail, Yahoo !, Outlook,


etc.);
- Un contenu c'est à dire le message à proprement parler. C'est en
général un texte auquel vous pouvez associer un fichier, des
images, des documents, etc.;
- Quelques informations destinées à l'acheminement du message,
équivalentes des tampons postaux (date et heure, etc.).

Par leur contenu et leur forme, les messages envoyés par


courrier électronique donnent à leurs destinataires une image de
l'expéditeur. Le rôle du courrier électronique est croissant dans le
maintien des liens sociaux, surtout en cas d'éloignement
géographique.

Le protocole SMTP (Simple Mail Transfer Protocol) est


utilisé pour gérer le transfert des courriers électroniques vers les
serveurs de messagerie électronique.

On appelle messagerie électronique l'ensemble du système 18


qui permet la transmission et l’acheminement des courriers
électroniques.

 Messagerie instantanée : La messagerie instantanée ou dialogue en


ligne désigne un logiciel où l'on peut communiquer en direct (ou
chatter) avec ses amis et sa famille (appelés contacts) et
éventuellement partager des fichiers, parler en vidéo/audio, jouer à
des jeux, etc. Parmi les plus connus, on compte Facebook Messenger,
Viber, Whatsapp, Google Hangout... A la différence d'un « chat », la
messagerie instantanée vous permet de parler avec votre liste de
contacts et pas n'importe qui.

De nombreux sites commerciaux, à l’instar d’Amazon, proposent


un service clientèle via messagerie instantanée permettant aux clients
désireux de soumettre quelque doléance d’éviter les désagréments d’une
longue attente à un standard téléphonique ou même de la lenteur du
courrier classique.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

3. Terminologie :
Nous donnons ici quelques terminologies en relation étroite avec Internet :
 Hypertexte : Un hypertexte est un ensemble de textes lisibles à l'aide
d'une interface informatique, et reliés entre eux par des liens (ou
hyperliens) associés à certains mots, ce qui permet à l'utilisateur
d'aller directement à l'unité qui l'intéresse, à son gré, d'une façon non
linéaire. Pour Ted Nelson, qui a inventé le terme « hypertexte » en
1965, la définition est un peu plus large puisqu'elle recouvre tous les
systèmes d'écriture non-linéaire utilisant l'informatique.
Actuellement, le World Wide Web est l'hypertexte le plus vaste et le
plus connu. D’autres logiciels hypertexte ont été développés durant
des années, et parmi ceux-ci nous pouvons noter : HES, Guide,
HyperCard, etc.
 Link, Hyperlink, lien, lien hypertexte, hyperlien, lien
dynamique : Dans un document hypertexte, liaison établie à partir
d'une zone activable du texte représentée par un mot-clé ou une
icône clé, ce qui permet d'avoir accès à d'autres renseignements.
19
 World Wide Web, Web, WWW, W3 : Le World Wide Web (ou
WWW ou W3, souvent appelé Web) signifie littéralement la "toile
d'araignée recouvrant le monde". Cette image représente tous les
ordinateurs interconnectés à travers le monde. Le World Wide Web
désigne plus précisément le système hypertexte que supporte le
réseau Internet. Les liens hypertextes sont comme les fils d'une toile
d'araignée qui relient les pages d'un site à l'autre.
 Protocole : Internet s'appuie principalement sur le protocole TCP/IP
(Transmission Control Protocol / Internet Protocol). Il existe de
nombreux autres protocoles en usage sur ce réseau, en particulier, les
principaux services offerts par Internet qui sont le web, la messagerie
électronique (e-mail) les forums, le chat et le FTP, utilisent chacun
un protocole différent. Ainsi nous pouvons distinguer les protocoles
HTTP, FTP, SMTP, POP, NNTP, IRC, etc.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

 Hypermédia : Mode hypertexte étendu qui permet à l'utilisateur de


naviguer sans parcours préétabli à travers les données textuelles,
sonores ou visuelles, les images animées ou les séquences vidéo.
 Multimédia : Technique de communication qui réunit sur un seul
support d'information les données suivantes : textes, graphiques,
images et sons.
 Browser, navigateur, explorateur, fureteur, butineur : Logiciel
de navigation conçu pour le Web, qui permet aux utilisateurs
d'explorer les ressources d'Internet, en particulier les documents
hypertextes. Un navigateur permet de se connecter à un serveur Web,
en utilisant le protocole HTTP, pour transférer et afficher des
pages Web au format HTML. La plupart des navigateurs gèrent aussi
d'autres protocoles, comme le HTTPS (sites Websécurisés) et
le FTP (transfert de fichiers), ou encore les transactions de paiement
sécurisées en SSL et SET. Les navigateurs doivent aussi gérer
plusieurs autres technologies utilisées sur le Web. Parmi les plus
connues, on peut citer les CSS, le DHTML, le XHTML et le
20
Javascript. Ces technologies sont standardisées par le W3C (à
l'exception d'extensions non normalisées comme Javascript, Flash ou
Java). Les navigateurs Web sont donc des logiciels très complexes et
en constante évolution, car de nouveaux standards ou des révisions
des standards existants ne cessent de voir le jour.
Exemples : Mozilla Firefox, Google Chrome, Opera, Safari, etc.
 Uniform Resource Locator, URL, adresse internet :
Emplacement uniformisé de ressource. Noms et adresses qui, sous
forme de chaînes de caractères qui réfèrent à des ressources sur le
Web ce qui permet aux utilisateurs des réseaux Internet ou intranet
de repérer l'endroit où se trouvent les informations recherchées sous
forme d'adresse (p. ex. : http://www.abc.com/).

Une URL est constituée d'un nom de protocole, du nom d'un


ordinateur hôte, d'un port (en option), d'un répertoire (en option) et
d'un nom de fichier (en option), Exemple :
protocole://ordinateur/répertoire/fichier.html

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

Les URI (pluriel d'URL) peuvent aussi servir à joindre d'autres


ressources Internet telles que les sites FTP, etc.
 Blog : un blog est un site Web composé d'articles ou de « posts »
généralement associés à une seule personne ou organisation. Les
blogs peuvent aborder un large éventail de sujets allant de la politique
à la culture culinaire en passant par les arts. Ils peuvent être le travail
d'un seul auteur ou d'un groupe de contributeurs.
 Cloud Computing, informatique en nuage : Le cloud computing
consiste à utiliser un réseau de serveurs distants hébergés sur Internet
pour stocker, gérer et traiter des données. C’est une alternative à la
pratique établie consistant à stocker et à traiter des données sur un
serveur dédié ou une machine informatique.
 Plugin, plugiciel, Add-on : En informatique, le plugin, ou greffon
en français, est un petit logiciel venant se greffer à une application
afin de lui apporter de nouvelles fonctions, des améliorations, etc. Le
greffon ne peut fonctionner seul, il ne peut être appelé qu'à partir du
programme auquel il a été ajouté. Il existe de nombreux plugins pour
21
les navigateurs Web comme Flash, Quicktime, Adblock Plus, etc.
 Bookmark, signet : Dans un navigateur Web, marque qui permet
de conserver en mémoire la référence consultée (document, page ou
site) afin d'y avoir directement accès la prochaine fois.
 Newsgroup, forum, groupe de nouvelles, forum de discussions
thématique : Réunion en différé des utilisateurs du réseau Internet,
soit par messagerie électronique, soit par le réseau Usenet, articulé
autour d'un sujet thématique.
 Internet Relay Chat (IRC) : Service d'échange de messages en
temps réel (synchrone) entre plusieurs utilisateurs du réseau Internet,
qui correspond en fait à un service de conférence électronique
improvisée qui s'articule autour du mode questions et réponses. Le
succès d'IRC a été quelque peu diminué par l'arrivée des messageries
instantanées (MSN, Yahoo Messenger, etc.) Ces réseaux restent
néanmoins très utilisés par ceux qui veulent discuter sans passer par
un programme client propriétaire.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

 Usenet (également connu sous le nom NetNews) : un ensemble de


protocoles servant à générer, stocker et récupérer des "articles" (qui
sont proches, dans leur structure, des emails), et permet l'échange de
ces articles entre les membres d'une communauté qui peut être
répartie sur une zone potentiellement très étendue. Usenet est
organisé autour du principe de groupes de discussion ou newsgroups,
qui rassemblent chacun des articles (contributions) sur un sujet
précis. Les sujets des groupes de discussion sont organisés selon une
hiérarchie. Les utilisateurs emploient généralement un logiciel client
appelé lecteur de news (parfois aussi appelé client de news, en
référence au modèle client-serveur) pour lire et composer des articles
Usenet. La plupart des navigateurs Internet permettent d'accéder à
Usenet, mais ils sont réduits aux fonctions de base, manquant de bien
des fonctions orientées spécifiquement vers la lecture d'articles
Usenet.
 Telnet : Dans Internet, protocole d'émulation de terminal qui permet
aux utilisateurs reliés à un ordinateur hôte de se connecter aux
22
ressources matérielles et logicielles d'un autre ordinateur hôte.
 Malware, virus informatique : également appelé logiciel
malveillant, c’est un logiciel spécialement conçu pour endommager
ou perturber le fonctionnement d’un système informatique. Il existe
de nombreux types de logiciels malveillants, mais les plus courants
sont conçus pour accéder à des données sensibles et les collecter, ou
pour forcer l'accès à un système informatique protégé.
 Firewall, pare-feu : un pare-feu est un logiciel qui bloque le trafic
indésirable d’un ordinateur et d’un intranet. Un pare-feu est déjà
installé sur la plupart des ordinateurs modernes et de nombreuses
applications de pare-feu tierces sont disponibles en ligne.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

B. La recherche sur le Web


1. Outils de recherche
a. Les moteurs de recherche
Un moteur de recherche est une application web permettant de trouver
des ressources à partir d'une requête sous forme de mots, appelés mots-clés.
Les ressources peuvent être des pages web, des articles de forums Usenet,
des images, des vidéos, des fichiers, etc.
Certains sites web offrent un moteur de recherche comme principale
fonctionnalité; on appelle alors « moteur de recherche » le site lui-même. Ce
sont des instruments de recherche sur le web sans intervention humaine, ce
qui les distingue des annuaires. Ils sont basés sur des « robots », encore
appelés « bots », « spiders », « crawlers » ou « agents », qui parcourent les
sites à intervalles réguliers et de façon automatique pour découvrir de
nouvelles adresses (URL). Ils suivent les liens hypertexte qui relient les
pages les unes aux autres, les uns après les autres. Chaque page identifiée est
alors indexée dans une base de données, accessible ensuite par les
internautes à partir de mots-clés. 23
Les moteurs de recherche ne s'appliquent pas qu'à Internet : certains
moteurs sont des logiciels installés sur un ordinateur personnel. Ce sont des
moteurs dits « de bureau » qui combinent la recherche parmi les fichiers
stockés sur le PC et la recherche parmi les sites Web ; on peut citer par
exemple Exalead Desktop, Google Desktop et Copernic Desktop Search,
Windex Server, etc.
Il existe de nombreux moteurs de recherche sur Internet, parmi les plus
populaires, nous pouvons citer : Google, Bing (Microsoft), Yahoo!, Yandex,
etc.
b. Les répertoires Web
Un annuaire web, répertoire web, annuaire Internet ou répertoire
Internet peut être défini comme étant un site web proposant une liste classée
de sites Web. Un répertoire Web peut également être défini comme étant un
serveur ou un groupe de serveurs dédiés à l'indexation et au classement des
pages du web, qui retournent une liste de pages de liens selon les requêtes
du visiteur.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

Le classement se fait typiquement dans une arborescence de catégories,


censée couvrir tout ou partie des centres d'intérêt des visiteurs. Chaque
catégorie contient des sous-catégories concernant des aspects plus pointus
d'un sujet donné et des hyperliens vers les sites agrémentés d'une description.
Un répertoire Web peut être généraliste, spécialisé (thématique) ou
géographique :
 Les répertoires généralistes n'excluent, a priori, aucun centre
d'intérêt ;
 Les annuaires spécialisés et thématiques se penchent
exclusivement sur les sites ou les pages Web traitant d'un certain
sujet, ou destinés à un certain public ;
 Les annuaires géographiques enfin, peuvent à la fois se révéler
généralistes ou spécialisés ; dans les deux cas, ils sont relatifs à
un pays, une région, une localité.

Grâce aux répertoires Web, Les sujets généraux sont faciles à localiser
dans la hiérarchie si l'on sait au préalable dans quelle catégorie ou sous-
catégorie l'information cherchée est susceptible de se trouver. Par exemple, 24

dans l'Annuaire Google, les critiques de films se retrouvent dans la catégorie


Loisirs- Cinéma- Critiques.

Cependant, Les répertoires ne couvrent qu'une partie des ressources du


Web. La recherche est également moins à jour qu'avec un moteur de
recherche dont le contenu est constamment réactualisé.

c. L’indexation automatique
L’indexation automatique de documents est un domaine de
l'informatique et des sciences de l'information et des bibliothèques qui utilise
des méthodes logicielles pour organiser un ensemble de documents et
faciliter ultérieurement la recherche de contenu dans cette collection.
Sur Internet, Le contenu de chaque page Web parcourue est analysé pour
déterminer comment l’indexer. Les informations recueillies sont alors
conservées dans une base de données. Les moteurs de recherche comme
Google mémorisent toute une page ou seulement une partie alors que
d’autres enregistrent systématiquement leur entièreté.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

Lors de l’indexation d’une page internet, l’outil d’indexation donne une


valeur à chaque terme significatif (important). Cette valeur (ce poids) dépend
de l’importance relative de ce mot-clé dans le document (utilisation dans le
titre, mise en évidence, fréquence d’utilisation, ancres des liens menant vers
la page, popularité, signaux d’intérêt d’autres sites, etc.).
d. Les navigateurs Web
Un navigateur web (web browser en anglais) est un logiciel vous
permettant d'afficher des sites Internet, télécharger des fichiers et faire des
recherches. C’est un logiciel conçu pour consulter et afficher le World Wide
Web. Techniquement, c'est au minimum un client HTTP.
Pour la grande majorité des navigateurs sur le marché, l'interface
utilisateur est composée d'une zone d'affichage éventuellement gérée sous
forme d'onglets, d'une barre de menus déroulants, d'une barre d'outils, d'une
barre d'état et surtout d'une barre d'adresse, parfois fusionnée dans le cas de
certains navigateurs. La barre de menus abrite les favoris (ou marque-pages),
les commandes des fichiers (ouverture, fermeture), les options de
configuration, etc.
25
La fonction principale d'un navigateur web est de permettre la
consultation d'informations disponibles (« ressource » dans la terminologie
du Web) sur le World Wide Web. Les principales étapes de la consultation
d'une ressource sont les suivantes :
 L'utilisateur donne au navigateur web l'adresse web de la
ressource à consulter. Il existe trois manières de donner une
adresse web :
1. Taper soi-même l'adresse web dans la barre d'adresse du
navigateur ;
2. Choisir une ressource dans la liste des favoris (ou marque-
pages ou bookmarks), sachant qu'à chaque favori est associée
une adresse web ;
3. Suivre un hyperlien, sachant qu'à chaque hyperlien est
associée une adresse web.
 Le navigateur se connecte au serveur web hébergeant la ressource
visée et la télécharge. Le protocole de communication
généralement utilisé est HTTP.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

 Le moteur de rendu du navigateur traite cette ressource,


télécharge les éventuelles ressources associées et affiche le
résultat sur l'écran de l'utilisateur.

Il existe de nombreux moteurs de recherche, mais principalement, les


navigateurs Web les plus populaires sont Google Chrome, Mozilla Firefox,
Microsoft Edge (remplaçant de Internet Explorer), Apple Safari ainsi que Opera
(les logos des navigateurs susmentionnés sont représentés dans la Figure
suivante).

Figure 1 - Logos des navigateurs Web les plus populaires

2. Affinage de la recherche
a. Choix des mots-clés 26
Les mots-clés sont les idées et les sujets qui définissent le contenu de des
pages de sites web. En termes de référencement naturel, ce sont les mots et
les phrases que les internautes utilisent dans les moteurs de recherche,
également appelés "requêtes de recherche" ou "expression de recherche".
Les mots-clés sont importants car ils sont le lien entre ce que les gens
recherchent et le contenu qui sera fourni pour répondre à ce besoin. Les
mots-clés qu’on choisira de cibler (ceux qui seront inclus dans le contenu
d’un site Web) détermine quel type de trafic qui sera obtenu pour un site
Web. Un mauvais choix de mots-clés et c'est toute la stratégie de
référencement d’un site Web qui devient bancale.
Pour choisir les mots-clés sur lesquels baser le référencement de son site
Web, il y a trois critères importants à prendre en compte :
 L’activité : Les mots-clés doivent décrire aux mieux votre activité
pour recevoir des visiteurs qualifiés qui seront intéressés par le
contenu de votre site.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

 Le volume de recherche : Le mots-clés doivent être saisis dans


les moteurs de recherche par de nombreux internautes.
 La concurrence : Difficile à évaluer, mais plus il y a de sites
présents sur ce mot-clé, plus il est difficile d'apparaitre en tête de
liste.

Il est donc nécessaire de trouver un bon compromis entre ces trois critères
pour bien choisir ses mots-clés.

b. Les opérateurs booléens


Il s’agit de signes permettant de relier les mots-clés de la requête de
recherche pour construire des expressions complexes et écrire des équations
de recherche selon une logique mathématique (algèbre de Boole). Ils
permettent d'affiner, d'orienter une recherche afin d'éviter le « bruit »
(l'obtention de données hors sujet lors d'une interrogation) ou, au contraire
le « silence » (l'obtention d'un nombre insuffisant de résultats par rapport au
nombre pertinent de réponses qu'on aurait dû obtenir).
Nous pouvons distinguer trois opérateurs booléens principaux, à savoir :
27
 ET/AND (intersection) : pour obtenir les résultats de recherche
comportant la présence simultanée des mots-clefs recherchés.

Figure 2- Exemple d'intersection

 OU/OR (union) : pour obtenir les résultats de recherche


comportant au moins l'un des mots-clés recherchés.

Figure 3 - Exemple d'union

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

 SAUF/NOT (exclusion) : sert à éliminer les résultats de


recherche incluant le mot-clef rejeté.

Figure 4 - Exemple d'exclusion

Les opérateurs booléens s’utilisent en association avec certains caractères


spéciaux. Voici quelques exemples:
 Les guillemets : pour afficher une expression exacte ;
 Les 2 points: pour rechercher entre deux chiffres (2 années par
exemple): Metallica 1983..1991 (Pour rechercher les albums de
Metallica apparus entre 1983 et 1991).
 Les parenthèses : pour celui qui effectue la recherche et non pour
le moteur de recherche (Google): elles permettent de se repérer 28

plus facilement dans une requête longue avec beaucoup de


combinaisons.

c. Proximité, adjacence et troncature


Étant donné que la recherche sur le Web se fait dans un texte, les
concepteurs des logiciels de recherche ont imaginé la notion de proximité.
Cette notion permet d'unir plusieurs termes en contexte. Le contexte est soit
la phrase soit le paragraphe. La notion de proximité se décline en proximité
proprement dite et en adjacence. Selon certains auteurs, ces deux notions
sont interchangeables (l’on peut utiliser l’un ou l’autre). Dans le cadre de
cette étude, l'opérateur de proximité relie deux mots côte-à-côte et
l'opérateur d'adjacence deux mots séparés par au moins un autre mot.
Tous les automates de recherche ont l'opérateur de proximité. Cet
opérateur est représenté par les guillemets anglais « " " ». Par exemple, la
recherche sur le « talon d’Achille » s'écrirait ainsi : "talon d'Achille". Les
guillemets anglais sont utiles pour les expressions et pour les noms propres

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

comme "Achille Talon". Sans les guillemets, vous auriez un résultat


combinant l'histoire, la médecine et la bande dessinée; avec les guillemets
vous obtenez les documents sur le héros de la bande dessinée du même nom.
L’opérateur d’adjacence a été introduit par le moteur de recherche Lycos
dans son automate de recherche avancé. Les équipes de Lycos avaient
développé quatre opérateurs: ADJ (adjacence), NEAR (près), NEARx (près
dans une distance limite de x mots), FAR (distant de 25 mots maximum) et
BEFORE (avant). Cet automate de Lycos avait enfin une autre fonction
avancée: l'ordre des mots. En accolant la lettre « O » devant chacun des
opérateurs, la recherche se faisait selon l'ordre exact des mots de la requête.
La troncature est utilisée pour remplacer des lettres manquantes lors
d’une recherche. Elle est généralement représentée par un astérisque « * ».
On pourra par exemple faire une troncature à droite, c’est-à-dire une
troncature en fin de mot, à partir d’un préfixe, ou même une troncature à
gauche, c’est-à-dire en début de mot ou à partir d’un suffixe. Certains
moteurs de recherche, tels que Google, rendent même possible de faire une
troncature centrale (en milieu de mot) en exploitant les symboles « ? » ou
29
« # » ou même « * », exemple : le terme de recherche « francopho#e »
renverrait des documents contenant les deux termes « francophone » et
« francophobe ».
Par exemple, le terme de recherche handicap* pourrait repêcher des
documents contenant les termes suivants: handicap, handicaps, handicapé,
handicapés, handicapée, handicapées, handicaper, handicapant,
handicapante, handicapeur.

3. Recherche avancée sur le Web


Saisir des mots-clés et lancer une recherche est facile, mais souvent insuffisant.
La plupart des moteurs de recherche commerciaux actuels (Google, Bing, Yahoo,
etc.) offrent des fonctionnalités très intéressantes permettant d’effectuer ce qui
s’appelle une recherche avancée. Ces fonctionnalités ou options de recherche
peuvent être regroupées en quatre grandes catégories, à savoir les options de
recherche booléenne et de proximité (vues précédemment), les options
linguistiques, les options de filtrage des requêtes de recherche et enfin les options
d’affinement et d’élargissement des requêtes.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

Les options linguistiques englobent toutes les fonctions, les opérateurs, les
aides, etc. portant sur les aspects linguistiques de la recherche, aussi bien les règles
de saisie (sensibilité à la casse, etc.) que des procédés de traitement automatisé du
langage naturel (TALN) mis en œuvre par les moteurs de recherche (lemmatisation1,
etc.). La sensibilité à la casse d’un moteur de recherche peut signifier, par exemple,
si ce dernier fait la distinction entre les majuscules et les minuscules, ce qui permet
de faire la différence entre les noms propres et les noms communs. Quant à la
lemmatisation, c’est un procédé de traitement automatisé du langage naturel, de
niveau lexical, consistant à ramener automatiquement les mots à leur racine, les
pluriels au singulier, les verbes à l'infinitif, etc.
L'une des principales évolutions des fonctionnalités de recherche des moteurs
est sans conteste l'augmentation et la diversification constantes des options de
filtrage des requêtes. Il existe plusieurs types de filtrages des requêtes :
géographique, linguistique, par types de ressources, etc. Il existe également
plusieurs niveaux de filtrage, du plus large au plus précis : recherches sur les
30
différentes parties du web, sur les types de documents, sur les documents eux-
mêmes, etc.
Les moteurs de recherche actuels offrent des possibilités d’affiner ou d’élargir
les requêtes de recherche avant l’affichage des résultats. Parmi les options
d’affinement, nous pouvons distinguer la recherche sur les pages similaires, qui
correspond, par exemple, à faire une recherche sur Google sur les bibliothèques
virtuelles2 et chercher les pages similaires au premier résultat. Nous pouvons aussi
trouver la recherche sur un site précis, par exemple rechercher les pages du
Ministère de l’Enseignement Supérieur qui apparaîtraient dans le site de l’UMMTO.
Quant aux options d’élargissement, les moteurs de recherchent peuvent proposer
d’élargir la recherche sur d’autres parties du Web non-concernées par ces derniers.
Comme par exemple, Google Scholar qui propose d’élargir la recherche au Web dit
« visible » en utilisant le bouton « Web Search », etc.
Par défaut, lorsque l’on lance une recherche dans Google, par exemple, celle-ci
est effectuée sur l'ensemble des pages Web (plusieurs milliards) indexées par le

1
Procédé de traitement automatisé du langage naturel, de niveau lexical, consistant à ramener
automatiquement les mots à leur racine, les pluriels au singulier, les verbes à l'infinitif, etc.
2
Une bibliothèque virtuelle (numérique) est une collection de documents (textes, images, sons) numériques
accessibles à distance (en particulier via Internet), proposant différentes modalités d'accès à l'information aux
publics.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

moteur de recherche. Quelques options telles que celles citées en amont, utilisables
simultanément, peuvent permettre d'effectuer une recherche plus ciblée. Une fois
ces options précisées, en cliquant sur le bouton Recherche Google, la requête sera
lancée. Les résultats s'affichent de la même manière que pour une recherche simple.
4. Autres outils de recherche sur le Web
a. Moteurs de recherche internes aux sites
Avec l'essor des Marketplace3 et une offre de plus en plus abondante,
l'accès aux produits par la simple navigation se fait plus difficile. Aussi, une
récente étude démontre que 27% des visiteurs d'un site e-commerce débutent
leur visite par le moteur de recherche interne et qu'ils sont 50% à l'utiliser au
moins une fois au cours de leur parcours d'achat. Ces chiffrent démontrent
bien l'importance qu'il prend dans le cadre d'une boutique en ligne. La
majorité des grands sites e-commerce l'a bien compris et intègre donc un
moteur de recherche interne. Ces moteurs de recherche permettent
d’effectuer une recherche par mots-clés à l’intérieur même du site.

31
b. Les méta-moteurs de recherche
Un méta-moteur ou un méta-chercheur est un moteur de recherche qui
puise ses informations à travers plusieurs moteurs de recherche généralistes.
De manière plus précise, le méta-moteur envoie ses requêtes à plusieurs
moteurs de recherche et retourne les résultats de chacun d'eux. Le méta-
moteur permet aux utilisateurs de n'entrer le sujet de leur recherche qu'une
seule fois tout en accédant aux réponses de plusieurs moteurs de recherche
différents.

Un méta-moteur élimine les résultats similaires renvoyés par différents


moteurs; par exemple, si Google et Yahoo! renvoient sur les deux mêmes
liens, le méta-moteur ne va l'afficher qu'une seule fois dans la liste des
résultats. Un méta-moteur trie également les résultats pour fournir en
premier les pages fournies par plusieurs moteurs de recherche.

3
La Marketplace, ou place de marché, désigne une plateforme sur Internet qui met en relation des acheteurs
et des vendeurs.

M. TAZIBT A. A.
Chapitre II - Initiation à la technologie Web

Parmi les méta-moteurs les plus populaires, nous pouvons citer Ixquick,
Songstr, Copernic, Innooo, etc.

c. Les sites portail thématiques


Les sites portail thématiques sont des sites qui, à l’initiative de passionnés
ou d’entreprises qui veulent drainer (et peut être même influencer) un grand
nombre d’internautes, ont l’ambitieux projet de répertorier le maximum
d’infos et de « cataloguer » un maximum de sites sur un thème donné.
Pour juger de la qualité et de l’impartialité (toujours imparfaite) d’un site
portail thématique, il est utile de savoir qui l’a conçu (particulier ou
entreprise), quels choix de sites il propose et sur quels critères il « note » les
sites. En général, ces sites proposent également une notation permanente par
les internautes des sites référencés.
d. La presse
La presse consacrée à Internet, qu’elle soit papier ou en ligne, est une
autre très bonne source de recherche et d’information. A partir des
recherches sur les moteurs, méta-moteurs et autres outils de recherche
d'information sur Internet, l’on peut avoir accès à bien d’autres sites qui 32
scrutent chaque jour le Web et en gardent les informations les plus populaires
ou les plus intéressantes.

M. TAZIBT A. A.

Vous aimerez peut-être aussi