Vous êtes sur la page 1sur 11

Université

M’hamed Bougara Boumerdes


Faculté des Sciences
Département d’Informatique

Support de cours
Technologies de l’Information et de la Communication
1ére année M.I.

Baddari Ibtihel, Chaouche Ali, Si Salah Hayet

Mai 2020

Cours 4
Semaine 4: 17-21 mai 2020

Ce document a été préparé dans le cadre de la réalisation des cours en ligne pour
l’enseignement universitaire suite à la situation de crise générée par Covid-19.
Chapitre 2-- Initiation à la technologie web

1. La recherche sur le Web

"Trouver l'information est un art, pas une science". Jean-Pierre Lardy

Internet est en même temps une infrastructure mondiale de communication (notion de réseau),
un ensemble de ressources, un ensemble de services, un ensemble de pratiques sociales, et
une communauté d’usagers.

Le web est devenu une source d’information incontournable. Il utilise le protocole http
(Hypertext Transfer Protocol) pour l’échange d’information entre le logiciel client et le
serveur.

Pour faire une recherche sur internet, il est nécessaire d’avoir une idée de l’information
recherchée, par exemple les mots clés à mettre, les sources et formes possibles de celle-ci.

Les sites web sont la base de ces sources.

1.1.Typologie et caractéristiques des sites web:

Plusieurs types de sites existent: sites d’entreprises ou associations; sites personnels; sites de
laboratoires de recherche des universités ; sites de bibliothèques ; sites gouvernementaux et
institutionnels ; etc. Ces sites sont caractérisés par:

− Grande hétérogénéité dans les contenus et en termes de publics (grand public et


professionnels) ;
− Contenus dynamiques et renouvellement continue ;
− Instabilité des localisations ;
− Fragmentation plus ou moins importante, selon les disciplines ;
− Multilinguisme et couverture géographique mondiale ;

1.2. Outils de recherche

La recherche d'informations sur Internet pose plusieurs problèmes tels que: la quantité
d'informations disponibles est colossale, la méconnaissance des sources d’informations
intéressantes, la fiabilité et la redondance d’informations, etc. Dans une bibliothèque
classique, on peut faire appel au bibliothécaire pour aider à trouver l’information pertinente,

1
ce qui n’est pas le cas sur Internet! Pour faire une recherche sur internet, nous faisons recours
à plusieurs outils de recherche.

1.2.1. Les moteurs de recherche

Un moteur de recherche est un programme capable de trouver des informations recherchées


parmi un grand nombre de documents de différents types. Certain nombre de sites web
proposent un moteur de recherche.

un element indispensable pour


Moteur de
recherche

trouver l'information sur Internet

outil chargé d'indexer des pages web

façon pour permettre une recherche


correspondante à des critéres

Il existe de nombreux moteurs de recherche, les plus connus sont «Google», «Yahoo» et
«Altavista ». Si nous effectuons la même recherche sur ces trois moteurs, nous pouvons
remarquer que, souvent, les dix premiers sites référencés sont les mêmes. « Wikipédia » est
très souvent le premier site proposé. Cependant, il existe de nombreux autres moteurs de
recherche qui proposent un accès différent à l’information et parfois plus adapté à notre
recherche.

Exemple :

«Lecdi.net» est un portail multi-moteur de recherche documentaire qui permet d’interroger


simultanément les moteurs, dictionnaires, encyclopédies et bases de données de son choix.

2
«Exalead» permet, comme la majorité des moteurs de recherche actuels, la recherche de sons
et de vidéo, mais son originalité vient des fonctions avancées, comme l'affichage de captures
d'écran de chaque résultat, ce qui permet de visualiser plus facilement l’information. Mais
aussi la possibilité d'affiner les résultats de la recherche selon des critères (filtres) de localité,
choix de la langue, types de documents (blogs, forums …) et termes associés (afin de mieux
formuler sa recherche).

Fonctionnement :

Un moteur de recherche fonctionne de manière automatique grâce à des robots. Vous pouvez
également trouver le terme “crawler” ou encore “spider” pour désigner ces robots. Ces
derniers sont chargés de recenser les différentes pages web existantes et les annexer. Pour cela
le moteur d’indexation va associer chaque page web à des mots fréquemment utilisés. Puis ils
les stockent dans d’immenses bases de données. Lorsque vous entrez des mots clés pour votre
recherche, ces robots vont parcourir ces bases de données et les interroger pour vous offrir les
pages les plus pertinentes par rapport à votre requête.

Vous obtenez donc une liste de résultats, que l’on appelle également SERP (Search Engine
Result Page, les pages de résultats d’un moteur de recherche).

C’est-à-dire, à partir de mots-clés, les moteurs de recherche font le tri de toutes les pages du
net, mais en utilisant les options de recherche avancées, on obtient des résultats plus précis.

Plus la recherche est ciblée (bien spécifiée), plus la chance pour trouver les bonnes
informations augmente. Il faut donc commencer par formuler sa recherche grâce à des mots
clés bien choisis.

Lorsqu'on effectue une requête sur un moteur de recherche, celui-ci interroge la banque de
données (les serveurs d'index) dont il dispose pour répondre à la question posée selon le
processus suivant:

- Un internaute envoie une requête sur un moteur de recherche.

- Les systèmes informatiques du moteur de recherche interrogent la banque de données des


serveurs d'index.

- Les serveurs d'index renvoient une série de résultats pour la requête qui a été transmise.

- Le serveur web du moteur de recherche retourne les résultats à l'internaute.

3
Les résultats retournés dépendent de plusieurs critères entre autres:

- Le fait que les mots-clés figurent dans le titre de la page

- Le fait que les mots-clés apparaissent plusieurs fois dans les sous-titres ou même dans le texte

de la page

- Un ou plusieurs mots-clés apparaissent dans l'adresse du site

- Le fait que le site web soit renommé (beaucoup d'autres sites web font un lien vers ce site)

- Le nombre de clics enregistrés sur le lien lors d'une recherche sur ce moteur (le site est

populaire)

Dans un moteur de recherche comme Google par exemple, un simple espace entre deux mots-
clés est considéré comme un ‘ET’ logique par le moteur. Pour une recherche simple, Google
propose une barre de requête permettant d'effectuer des recherches. Vous pouvez y inscrire
des mots-clés simplement séparés par des espaces.

Par contre, une recherche avancée permet de combiner les mots-clés et d'utiliser des filtres
pour paramétrer les recherches.

1.2.2. les répertoires

Dans un tel outil de recherche, cette dernière s’effectue par navigation. Contrairement aux
moteurs de recherche où les bases de données sont alimentées par des robots, les répertoires
sont organisés par les êtres humains (petites équipes d’experts, des éditeurs volontaires pour
valider les ressources). Ces experts classent les pages Web dans différentes catégories, elles-
mêmes éclatées en plusieurs sous-catégories.

Un répertoire ne référencera pas l'adresse URL automatiquement, puisqu'il n'utilise pas de


logiciel d'indexation. Il faudra donc donner plus d'informations qu'une simple URL (le titre,
un texte descriptif, une catégorie et quelques mots-clés), afin qu'il référence le site dans la
catégorie la plus appropriée.

Principe

En résumé, les répertoires reposent sur

- Des collections généralistes ou spécialisées de sites web classées par catégories


organisées hiérarchiquement.

4
- Un filtrage et classement manuels: la sélection peut être plus ou moins rigoureuse, avec
une évaluation et une description des sites éventuellement enrichies.
- Des outils de première approche: donnent une vue d'ensemble d'un domaine à
l'utilisateur, qui peut ensuite naviguer à l'intérieur des sites indiqués pour raffiner ça
recherche.
- La non génération des requêtes complexes, mais permettent généralement de faire une
recherche par mot-clé sur une catégorie seule.

Utilisation

Les répertoires sont à réserver pour des recherches plutôt thématiques, ou sur des mots clés
assez généralistes. Notons toutefois que les catégories deviennent au fil du temps de plus en
plus pointus en fonction du sujet. Si l'on utilise des mots clés trop précis, ou trop de mots clés,
la plupart des répertoires passent le relais à des moteurs de recherche partenaires qui
effectuent des recherches sur le texte intégral des pages web. C’est pourquoi la distinction
entre répertoires et moteurs de recherche est de plus en plus difficile à percevoir, mais elle
reste néanmoins fondamentale.

Les répertoires sont aussi utiles :


- pour se faire une idée du vocabulaire utilisé dans un domaine
- pour retrouver, à partir d'un site web donné, d'autres sites traitant un même sujet
- pour trouver des sites fédérateurs ou portails spécialisés
- pour obtenir rapidement tous les sites d'une organisation importante.

Exemples de répertoires web

Il y a des centaines et des milliers d’annuaires (répertoire) de recherche, parmi les plus
populaires on cite DMOZ (https://dmoz-odp.org/), un répertoire de recherche à usage général
qui accepte des liens vers tous les types de sites ; Yahoo! Directory et Google annuaire.

5
1.2.3. les navigateurs

Un navigateur web est un logiciel dont la fonction principale est de permettre la consultation
d'informations disponibles sur le Web. Il se compose d'un moteur de rendu des standards du
web, d'une interface utilisateur et accessoirement d'un gestionnaire d'extensions (modules ou
plugins). La consultation de page web se fait en trois étapes:

- l'utilisateur donne au navigateur l'adresse de la ressource à consulter ;


- le navigateur se connecte au serveur web hébergeant la ressource visée et la télécharge ;
- le moteur de rendu du navigateur traite cette ressource et affiche le résultat sur l'écran de
l'utilisateur.
Pour naviguer avec un appareil électronique, il faut en supplément un logiciel qui sache
interpréter les langages HTML, PHP et autres pour afficher des pages à la présentation
irréprochable et au graphisme voulu par les concepteurs/programmateurs des interfaces web
consultées. Par définition, un navigateur ou browser en anglais, est avant tout une interface
graphique, téléchargeant des données (textes, images, vidéos, bandes sonores) à présenter à
l'usager. Il sert d'interface entre l'homme et la machine.

Remarque

Les navigateurs sont des logiciels complexes qui offrent de nombreuses fonctionnalités aux
utilisateurs. Ils évoluent constamment pour parer les problèmes de sécurité pouvant survenir.
En effet, les pirates du web essaient sans cesse de trouver des parades pour attaquer les pare-
feu des navigateurs et récupérer les données des utilisateurs. Les navigateurs doivent être
vigilants et évoluer sans cesse pour contrer ses attaques.

6
L’interface graphique d’un navigateur web est généralement composée de:

− La barre d’adresse du navigateur permet de saisir le chemin pour accéder à la page Web,
on dit que l’on saisit l’URL (Uniform Ressource Locator), l’adresse de la page Web ;
− Une barre de menus pour accéder au menu du navigateur ;
− flèches de navigation, pour naviguer dans l’historique des différents liens visités ;
− Une barre personnelle pour abriter les favoris (raccourci vers des sites web préférés) ;
− Une zone d’affichage des pages Web gérée sous forme d’onglets ;
− Une barre d’état (en bas de fenêtre) pour visualiser l’adresse des hyperliens.

Les principaux navigateurs web utilisés actuellement sont :

− Google Chrome: Rapide ; Les mises à jour sont automatiques et permanentes (toujours à
jour) ; Barre d'adresse qui est également moteur de recherche Google. Design épuré (la
barre des menus est cachée); Recueille de nombreuses informations personnelles à des
fins commerciales.
− Mozilla Firefox: Logiciel libre. Page d'accueil avec champs de recherche Google.
− Internet Explorer : Installé par défaut avec Windows sur les ordinateurs. Sujet à des failles
de sécurité et plus souvent ciblé par les attaques du fait de sa popularité.

7
− Safari : Installé par défaut avec Mac OS sur les ordinateurs.

Caractéristiques communes

Coté utilisateur: Restauration d’onglets fermés; Barre d’adresse


intelligente ; Mosaïque des sites les plus visités ou définis à
l’ouverture d’un onglet ; Gestionnaire de mot de passe ;
Navigation privée ; Mises à jour automatiques ; Mode Hors
Ligne; Blocage Pop ups.

Coté développeur: Affichage des caractéristiques de la page ;


Affichage du code source ; Langages (JavaScript, CSS, HTML,
Java,..) ; Lecteur de flux RSS ; Outils débogage.

Quelle est la différence entre un Navigateur et un moteur de Recherche ?

Pour naviguer sur Internet vous avez besoin d'un logiciel (gratuit) que l'on appelle un
navigateur. Un moteur de recherche est à la base un site Internet comme les autres, dont le
rôle est de parcourir le Web et indexer tous les sites qu’il trouvera. Quand un internaute arrive
sur le moteur de recherche et tape sa requête, le moteur affiche tous les résultats par ordre de
pertinence. Donc, un navigateur est un logiciel qui affiche des pages web, alors qu'un moteur

8
de recherche est un site web qui aide les utilisateurs à trouver les pages web d'autres sites
web. La confusion est due à l'affichage de la page d'accueil d'un moteur de recherche lors de
l'ouverture initiale d'un navigateur.
Pour plus de détails sur les notions de page web, de site web, d’un moteur de recherche, etc.
vous pouvez consulter la page suivante:
https://developer.mozilla.org/fr/docs/Apprendre/page_vs_site_vs_serveur_vs_moteur_recherc
he

1.3. Affinage de la recherche

La recherche sur Internet peut se faire de manière plus efficace lorsqu’on emploie des
stratégies de recherche qui tiennent compte du fonctionnement des moteurs de recherche.
Dans certains cas, les moteurs de recherche renvoient des résultats sans rapport avec le sujet
qui nous intéresse. Comment alors éviter cela et mieux cibler la recherche ?
Lorsqu’on recherche un résultat très précis, les requêtes classiques ne sont pas suffisantes.
Alors on est obligé de bien choisir les mots clés utilisés en se basant sur les points suivants :

1.3.1. Choix des mots clés

− Avant de commencer toute recherche, trouver les mots-clés qui correspondent bien au
sujet étudié.
− Ne pas hésiter à utiliser des synonymes
− Élargir le champ de recherches avec des termes plus généraux (pour obtenir plus de
résultats).
− Affiner les résultats en ajoutant des termes plus précis.
− Ne pas faire des recherches contenant moins de deux ou trois mots-clés bien choisis
simultanément.
− Certains mots trop commun qui pourraient figurer dans une requête sont écartés par les
moteurs de recherche (le, la, de, un, des, ...). Ils ne servent donc à rien.
− Varier les combinaisons de mots clés utilisés
− Les caractères accentués sont sans importance

1.3.2. opérateurs booléens

Les moteurs de recherche ont mis en place de nombreuses astuces pour affiner la recherche
dont les plus pratiques sont les opérateurs de recherche booléens. Ils reposent sur la logique
booléenne, tout en proposant des fonctionnalités optimisées extrêmement puissantes.

9
− Lorsqu'une recherche renvoie des résultats connexes qui ne sont pas souhaités, on peut
demander à ce que certains mots soient évités en mettant un signe "-" devant le mot. Le
«-» remplace SAUF.
− Pour obtenir les résultats qui contiennent en même temps plusieurs mots; utiliser
l'opérateur "AND" (qui signifie "ET", en français).
− Pour obtenir les résultats qui contiennent l'un ou l'autre des mots : utiliser l'opérateur
"OR" (qui signifie "OU", en français).
− Pour n'obtenir que les résultats qui contiennent obligatoirement un mot précis : mettre un
signe "+" devant le mot.

1.3.3. l'adjacence, la troncature

Dans l’univers des moteurs de recherche, la troncature est un signe qui remplace une ou
plusieurs lettres d'un mot. En général, elle est représentée par l'astérisque « * ». La troncature
permet de rechercher des termes qui ont une racine identique en substituant un ou plusieurs
caractères par un symbole. Elle est aussi utile pour chercher les mots au singulier et au pluriel
irrégulier comme « cheval » et « chevaux » au lieu d'utiliser l'opérateur logique OU.

− Utiliser le JOKER *, pour remplacer un mot ou une partie de mot dans une recherche.
Utilisé pour remplacer des lettres manquantes : télé* = téléphone, télécommande,
téléchargement,… etc.
− Le ~ cherche les pluriels sur certains mots.

Exemple :

vache AND mouton voyage AND bus –taxi

10

Vous aimerez peut-être aussi