Vous êtes sur la page 1sur 3

Le WEB

Le thème “WEB” vise à travailler sur les liens hypertextes, les balises HTML, le
langage CSS, les protocoles HTTP ou HTTPS. Les élèves découvrent également les
requêtes HTTP, le fonctionnement des moteurs de recherche, le référencement
naturel, les algorithmes de classement, le protection des données personnelles
(historique de navigation), les cookies, les annonces ou publicités des moteurs de
recherche etc.
Capacités attendues :

 Décomposer l’URL d’une page


 Décomposer le contenu d’une requête HTTP
 Inspecter le code d’une page hébergée par un serveur
 Distinguer ce qui relève du contenu d’une page et de son style de présentation
 Étudier et modifier une page HTML simple
 Maîtriser les renvois d’un texte à différents contenus
 Mener une analyse critique des résultats d’un moteur de recherche
 Comprendre les enjeux de la publication d’informations
 Maîtriser les réglages les plus importants d’un navigateur
 Sécuriser sa navigation
 Reconnaître les pages sécurisées
 Connaître certaines notions juridiques

Introduction
Le Web (toile ou réseau) désigne un système donnant accès à un ensemble de
données (page, image, son, vidéo) reliées par des liens et accessibles sur le réseau
internet.
Le "World Wide Web", plus communément appelé "Web" a été développé au CERN
(Conseil Européen pour la Recherche Nucléaire) par le Britannique Sir Timothy John
Berners-Lee et le Belge Robert Cailliau au début des années 90. À cette époque les
principaux centres de recherche mondiaux étaient déjà connectés les uns aux autres,
mais pour faciliter les échanges d'information Tim Berners-Lee met au point le
système hypertexte. Le système hypertexte permet, à partir d'un document, de
consulter d'autres documents en cliquant sur des mots clés. Ces mots "cliquables"
sont appelés hyperliens et sont souvent soulignés et en bleu. Ces hyperliens sont
plutôt connus aujourd'hui sous le simple terme de "liens".
Première page web, les hyperliens sont soulignés et en bleu
Cette première page web est toujours consultable à l'adresse suivante :
http://info.cern.ch/hypertext/WWW/TheProject.html
Tim Berners-Lee développe le premier navigateur web (logiciel permettant de lire des
pages contenant des hypertextes), il l'appelle simplement "WorldWideWeb". Il faudra
attendre 1993 et l'arrivée du navigateur web "NCSA Mosaic" pour que le web
commence à devenir populaire en dehors du petit monde de la recherche.
Un navigateur web permet d’accéder à n’importe quel site web en fonction de ce que
l’on souhaite obtenir comme information. Tous ces sites web sont écrits en utilisant
les langages HTML et CSS.

Le langage HTML (HyperText Markup Language) a fait son apparition dès 1991 lors
du lancement du Web. Son rôle est de gérer et organiser le contenu d’un site. Le
langage CSS (Cascading Style Sheets, aussi appelées Feuilles de style) permet de
gérer l'apparence de la page web (agencement, positionnement, décoration,
couleurs, taille du texte…). Ce langage est venu compléter le HTML en 1996.

À partir des années 2000, le Web « social » avec l’apparition de sites sociaux comme
Facebook, Twitter, YouTube ou Flickr, permet le partage en tout genre. Aujourd’hui le
Web continue de se développer en devenant immersif et en interagissant avec le réel.
Ainsi, les accès au Web se diversifient et se joignent à tout type de terminal (lecteur
mp3, tablette, smartphone, montre connectée, etc.). Ces données collectées
alimentent des bases de données dont l’exploitation et le traitement présentent un
enjeu économique majeur. Le Web démocratise les voix de l’information en se
calquant sur le phénomène de mondialisation. Il gomme les frontières, mais reste tout
de même façonné selon les lois et particularités des pays. Ceux qui créent le Web le
font à leur image.

Techniquement le web se base sur trois choses : le protocole HTTP (HyperText


Transfert Protocol), les URL (Uniform Resource Locator), expression anglaise pouvant
se traduire par « localisateur universel de ressources » et le langage de description
HTML (HyperText Markup Language, « protocole de transfert hypertexte »).
À sa création, le Web était destiné aux chercheurs. Le but était de faciliter l’échange
d’informations entre les membres de la communauté scientifique en utilisant internet.
Point Info.
Code source d’une page Web
Pour accéder au code source d’une page Web, il faut commencer par effectuer un
clic droit sur la page. Dans le menu contextuel, il faut ensuite sélectionner la
commande « Examiner l’élément » avec Firefox, « Inspecter » avec Chrome ou «
Inspecter l’élément » avec Edge, par exemple.

Mécanisme des échanges sur le Web


Bande passante : débit binaire ou quantité d’informations pouvant être transmises
simultanément sur une voie de transmission.

Sécurité dans le protocole HTTP


L’HyperText Transfer Protocol Secure ou HTTPS est la version sécurisée de la
connexion HTTP. Elle protège les données échangées en ne les rendant
compréhensibles que par le destinataire, grâce au protocole TLS (Transport Layer
Security) qui chiffre les données. Pour s’assurer que le serveur destinataire est bien
celui qu’il prétend, le HTTPS authentifie la cible grâce aux certificats appelés
communément « Certificats SSL (Secure Socket Layer) ».

Intégration d’une ressource externe dans une page Web


Le code iFrame ou inline Frame est un document HTML qui sert à intégrer d’autres
pages Web (source externe) dans une page Web. Des sites comme Youtube
proposent des codes iFrames pour afficher directement les vidéos sur des sites Web
tiers. Des régies publicitaires comme Google AdSense les proposent pour afficher
des bannières publicitaires sur d’autres sites.

Fonctionnement de l’iFrame
Une page Web complète pourra être construite à partir de différents sous-
documents qui sont récupérés sur différents serveurs. Par exemple : du texte, des
descriptions de mise en page, des images, des vidéos, des scripts et bien plus.

Point info
« Je ne suis pas un robot ! » Les captcha servent à différencier les robots et les
humains dans le cas où les pages se feraient espionner par un logiciel malveillant.
Ils servent aussi de « machine training » pour entraîner les algorithmes à
reconnaître les images.

Le Web profond ou Web invisible


Toutes les pages Web, bien qu’accessibles avec un navigateur internet, ne sont pas
référencées par les moteurs de recherche. Ces pages ont des particularités : elles
sont dynamiques, protégées par un mot de passe et contiennent des ressources
volumineuses, entre autres. Ces ressources non indexées par les moteurs de
recherche composent le Web profond ou le « Deep Web » (96 % du Web). Le Dark
Web en représente la partie illégale. Les ressources indexées, quant à elles,
composent le Web de surface.

Vous aimerez peut-être aussi