Vous êtes sur la page 1sur 43

INSA - ASI

TechnoWeb : Serveur Web et protocole HTTP

Technologie Web
Serveur Web et protocole HTTP

Alexandre Pauchet
INSA Rouen - Département ASI

BO.B.RC.18, pauchet@insa-rouen.fr

1/43

INSA - ASI

TechnoWeb : Serveur Web et protocole HTTP

Plan
1

Historique

2

Fonctionnement

3

Protocole HTTP

4

Négociation de contenu

5

Les proxys

6

Limites

7

Sources

2/43

INSA - ASI

TechnoWeb : Serveur Web et protocole HTTP

Historique

Arpanet

3/43

(1/5)

1959-68 : le programmeARPA naît pendant la guerre froide

La peur d'une guerre nucléaire
Faiblesse du système centralisé

versus

distribué

Proposition d'un maillage d'ordinateurs (1964, P. Baran)
e`re
1
communication téléphonique entre 2 machines en 1965

1969 : ARPANET
1969 : 4 noeuds, 1971 : 15 noeuds, 1972 : 37 noeuds
1970-82 : ouverture sur le monde
Apparition du courrier électronique
Communications internationales (Angleterre, Norvège)
Apparition de TCP/IP (1974) plus puissant que NCP

1983 : TCP/IP adopté comme standard ARPANET

Internet

INSA - ASI

TechnoWeb : Serveur Web et protocole HTTP

Historique

(2/5)

Internet/World Wide Web

1983-89 : expansion du réseau (autoroutes de l'information )
La NSF

1 eectue des progrès importants (réseau NFSNET)

Utilisation importante par les scientiques
Réseaux hétérogènes (NCP et TCP/IP)
Fin ocielle de ARPANET en 1989 (TCP/IP)

1990-97 : explosion d'internet
1990, le physicien Tim Berners Lee (CERN) étend le concept de lien
hypertexte à Internet
HyperText Markup Language (HTML) et HyperText Transfer
Protocol (HTTP)
er
1
navigateur : NCSA Mosaic
1995 ouverture au grand public (Netscape et Internet Explorer)
1997 des dizaines de milliers de n ?uds dans plus de 42 pays

1. National Science Foundation

4/43

ASI TechnoWeb : Serveur Web et protocole HTTP Historique (3/5) Nombre de sites Web source : http://www.netcraft.com 5/43 .INSA .

com 6/43 .INSA .ASI Historique TechnoWeb : Serveur Web et protocole HTTP (4/5) Logiciels disponibles Clients Netscape. iPlanet (Netscape) Sources : http://www.netcraft. Konqueror. Internet Information Server (Microsoft). Internet Explorer Serveurs Apache. emacs. Opera. Mozilla. Lynx.

netcraft.ASI TechnoWeb : Serveur Web et protocole HTTP Historique (5/5) Répartition des serveurs sur le marché source : http://www.com 7/43 .INSA .

INSA .ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement La base du Web (1/11) Architecture Client/Serveur Nécessité d'un protocole de communication : Http 8/43 .

requête ressource Serveur Web Apache Http PHP + SQLite (LASP) (LAMP) MySQL PostgreSQL (LAPP) Serveur Web J2EE Servlets/JSP + Hibernate Oracle .. .. . Plugin.. jQuery Applet.ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement Diérents types de ressources 9/43 (2/11) Ressources statiques : HTML. ActiveX.. Côté serveur : CGI. son. vidéos Ressources dynamiques Côté client : applet (Java). requête ressource Client Web Javascript.. jQuery Applet. . servlets/JSP. . Client Web Javascript.INSA .. scripts serveur (php). images... Javascript/JQuery.

INSA . la forme d'URI la plus utilisée est l'URL la . URN et URI 10/43 (3/11) URL : Uniform Ressource Locator Spécication de la localisation d'une ressource de manière unique URN : Uniform Ressource Name Mécanisme de nommage des ressources urn:<Namespace>:<SpecificString> Namespace : identicateur de nommage (ex : isbn) SpecificString : chaîne de caractères spécique désignant ressource de manière unique URI : Uniform Resource Identier URI = URL + URN En pratique.ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement URL.

insa-rouen. Exemples : http://www.org/ file://home/cours/ mailto:pauchet@insa-rouen.com:80/fr/index.linux-mandrake.html).fr telnet://user:password@host:port 11/43 .fr/enseignants/~apauchet/ ftp://ftp.fr.html http://asi.debian.html ⇒ doc%232.INSA .ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement URL : Uniform Ressource Locator (4/11) Format <protocole>://<serveur>:<port>/<chemin>/<ressource> Remarque : certains caractères doivent être encodés par % suivi de leur valeur hexadécimale en ISO Latin ou ASCII (ex : doc#2.

INSA . 8080 (Serveur web J2EE) Serveur maître : utilisateur root écoute le port standard Serveurs esclaves : créés par le maître (propriétaire diérent) Réception d'une requête : 1 le maître reçoit la connexion 2 le maître crée un esclave et lui transmet le canal de communication 3 l'esclave traite la requête et retourne le résultat 12/43 .ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement Fonctionnement d'un serveur HTTP (5/11) Serveur : application qui écoute un port de communication Port standard : 80 (Apache HTTP).

ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement Fonctionnement d'un serveur HTTP (6/11) 13/43 .INSA .

INSA .ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement Système de chiers Apache HTTP (7/11) 14/43 .

ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement Système de chiers Apache HTTP 15/43 (8/8) http://<serveur>/ http://<serveur>/fic.html http://<serveur>/cgi-bin http://<serveur>/~arthur http://<serveur>/~arthur/cgi-bin http://<serveur>/cgi-bin/arthur racine du serveur fic.html extérieurs au serveur WEB (système) CGI la homepage de Arthur les scripts les scripts Remarque : Interdiction d'accéder aux chiers de conguration du serveur à la racine répertoire des scripts CGI CGI de Arthur de Arthur .INSA .

. XHTML. Un descripteur de déploiement (chier XML) 16/43 . HTML. ). .ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement Application Web J2EE (9/11) Une application web J2EE est composée De Servlets/JSP De bibliothèques de classes annexes.INSA . De ressources statiques (images. .

jar 17/43 .MF |_ WEB-INF |_ web.0.jar Ajout dans le classpath.xml |_ classes |_ Servlets.Final.0.ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement Archive WAR (10/11) Arborescence d'une archive WAR (Web ARchive) ApplicationWeb.INSA .jsp |_ répertoires/fichiers |_ META-INF | |_ MANIFEST. pour JBOSS de : JBOSS_HOME/modules/javax/servlet/api/main/ jboss-servlet-api_3.html |_ fichiers.war |_ fichiers.class |_ lib |_ bibliotheques.0_spec-1.

jar cf ApplicationWeb.war * Appel sur JBOSS Dépôt de l'archive WAR dans le répertoire de déploiement Appel : http://localhost:8080/ARCHIVE/ressource .war ApplicationWeb : Ou un chier contenu (chier archive web) ayant pour cd ApplicationWeb .war est placé dans le répertoire d'applications du conteneur web webapps pour Tomcat JBOSS_HOME/standalone/deployement pour Jboss ApplicationWeb.INSA .ASI TechnoWeb : Serveur Web et protocole HTTP Principes de fonctionnement Compilation et déploiement 18/43 (11/11) Déploiement Le répertoire ApplicationWeb.

.org/Protocols/rfc2616/rfc2616.. HTTP NG.0 (rfc1945) ◦ ajout du n de version. du statut apparition des entêtes (user-agent) les cookies (simulation de session) 2 HTTP 1. protocole très simple HTTP 1.9. DELETE. .html . en standby gestion des sessions 2.w3.INSA . http://www.ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP Présentation de HTTP 19/43 (1/13) http://www.org/ Protocole orienté caractères netcat host 80 ⇒ telnet host 80 ou Non sécurisé (par opposition à HTTPS) HTTP 0. version actuelle persistance des connexions méthodes PUT.1 (rfc2616 ).w3.

2.6-3ubuntu4. tournant sur la machine cliente.1 with Suhosin-Patch Last-Modified: Tue. 15 Jul 2009 13:08:49 GMT Server: Apache/2.txt est placé à la racine d'un serveur Apache Http.11 (Ubuntu) PHP/5.1 Le chier phrase.txt HTTP/1.2.ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP (2/13) Exemples de requête HTTP 1.INSA .1 200 OK Date: Wed.1 Host: localhost HTTP/1. 14 Jul 2009 18:24:33 GMT ETag: "31c06d-1c-46eae8cd55a40" Accept-Ranges: bytes Content-Length: 28 Content-Type: text/plain Voici un exemple de phrase. 20/43 . > netcat localhost 80 GET /phrase.

6-3ubuntu4.1.2. 21/43 .0. Connected to localhost.1 Host: localhost HTTP/1.txt HTTP/1. Connection closed by foreign host..1 with Suhosin-Patch Last-Modified: Tue.INSA . GET /phrase.11 (Ubuntu) PHP/5.2. 14 Jul 2009 18:28:30 GMT Server: Apache/2.ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP (3/13) Exemples de requête HTTP 1.0..1 > telnet localhost 80 Trying 127.1 200 OK Date: Tue. Escape character is '^]'. 14 Jul 2009 18:24:33 GMT ETag: "31c06d-1c-46eae8cd55a40" Accept-Ranges: bytes Content-Length: 28 Content-Type: text/plain Voici un exemple de phrase.

INSA .ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP (4/13) Exemples de requête HTTP 1.1 22/43 .

1 Host: localhost HTTP/1.6-3ubuntu4. 14 Jul 2009 18:27:21 GMT ETag: "31c072-2d-46eae96d8d440" Accept-Ranges: bytes Content-Length: 45 Content-Type: text/html <html><body><h1>It works!</h1></body></html> 23/43 .html HTTP/1.11 (Ubuntu) PHP/5.1 netcat localhost 80 GET /index.INSA .1 with Suhosin-Patch Last-Modified: Tue.2.1 200 OK Date: Wed.ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP (5/13) Exemples de requête HTTP 1.2. 15 Jul 2009 13:17:53 GMT Server: Apache/2.

INSA .ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP Requête et Réponse (6/13) Requête Réponse Request line Status line General header General header Request header Response header Entity header Entity header CRLF CRLF Message body Message body 24/43 .

ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP Requête : Request-Line (7/13) Request-Line METHODE URI [HTTP-Version] Les méthodes OPTIONS GET : demande les méthodes utilisables sur l'URI : demande les informations et les données de l'URI HEAD : demande uniquement les informations sur l'URI POST : envoie de données (ex : formulaire) traitées par l'URI PUT : enregistre le corps de la requête à l'URI DELETE TRACE : supprime les données pointées par l'URI : retourne ce qui a été envoyé par le client (' echo) Par défaut la version utilisée est la 1.INSA .0 25/43 .

ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP 26/43 (8/13) Requête/Réponse : General header Cache-Control : dénit la politique de cache pour la ressource Connection : paramètre de gestion de la connexion (ex : Connection: close) Date : date du message Pragma : utilisé pour spécier des comportements aux serveurs intermédiaires (proxy) Transfer-Encoding : types de transformations appliquées au corps du message Upgrade : spécie quels autres protocoles supporte le client Via : indique les intermédiaires par lesquels est passée la requête .INSA .

INSA . If-Unmodified-Since : requête conditionnelle sur la dernière date de modication de l'URI Range : précise la portion de données de la ressource Referer : spécie l'URI à l'origine de la requête User-Agent : contient l'identiant du navigateur client 27/43 .ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP Requête : Request header (9/13) Accept : dénit les types de médias acceptés Accept-Charset : spécie les jeux de caractères acceptés Accept-Encoding : spécie les types de transformations (compressions) du message acceptés Accept-Language : spécie les langues acceptées From : e-mail de l'utilisateur du client (nécessite accord) Host : spécie le serveur (et le port) pour la requête If-Modified-Since.

INSA . charset=ISO-8859-1) Expires : date d'expiration de la ressource Last-Modified : date de dernière modication 28/43 .ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP (10/13) Requête/Réponse : Entity header Allow : liste les méthodes autorisées Content-Encoding : indique l'encodage utilisé pour la ressource (complément au type de média du Content-Type) Content-Language : déni la langue utilisée Content-length : taille du corps du message Content-Location : donne la véritable URI de la ressource si celle-ci a été trouvée grâce à une autre URI Content-Range : donne la plage de données récupérées sur la totalité de la ressource Content-Type : le type du média (ex : text/html.

ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP Réponse : Status-Line 29/43 (11/13) Status-Line HTTP-Version Status-Code Reason-Phrase Status-Code : code numérique représentant le succès où l'échec de la requête Reason-Phrase 5 classes de 1XX 2XX 3XX 4XX 5XX : texte expliquant le Status-Code : Information : Succès : Redirection : Erreur client : Erreur serveur Status-Code .INSA .

ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP Réponse : les Status-Code Code 100 200 203 30/43 (12/13) Code 101 201 204 Signication Switching Protocols Created No Content Code Signication 202 205 Accepted Reset Content 206 300 303 400 403 406 Signication Continue OK Non-Authoritative Information Partial Content Multiple Choices See Other Bad Request Forbidden Not Acceptable 301 304 401 404 407 302 305 402 405 408 Moved Temporarily Use Proxy Payment Required Method Not Allowed Request Time-out 409 412 Conict Precondition Failed 410 413 411 414 415 Unsupported Media Type Internal Server Error Service Unavailable Moved Permanently Not Modied Unauthorized Not Found Proxy Authentication Required Gone Request Entity Too Large Length Required Request-URI Too Large 501 504 Not Implemented Gateway Time-out 502 505 Bad Gateway HTTP Version not supported 500 503 .INSA .

INSA .ASI TechnoWeb : Serveur Web et protocole HTTP Le protocole HTTP Réponse : Response header Accept-Ranges 31/43 (13/13) : informe l'acceptation des requêtes Range par le serveur Location : redirige la requête vers une autre URI (ex : Status-Code : 3XX) Server : indique le type du serveur web répondant à la requête .

ASI TechnoWeb : Serveur Web et protocole HTTP Négociation de contenu Principe (1/6) Le client exprime ses capacités Le serveur doit alors retourner la ressource la plus adéquate Les types de spécication possibles : Langue Type MIME Charset (encodage des caractères) Encodage (compression.INSA .) 32/43 . encodage. etc.

6-3ubuntu4.en et info. 14 Jul 2009 18:24:33 GMT ETag: "31c070-15-46eae8cd55a40.fr sont placés à la racine du serveur Apache Http.11 (Ubuntu) PHP/5.1 200 OK Date: Wed.ASI TechnoWeb : Serveur Web et protocole HTTP Négociation de contenu (2/6) Exemple de négociation sur la langue Les chiers info.q=1.txt.2.5 HTTP/1.1 with Suhosin-Patch Content-Location: info.txt. 15 Jul 2009 13:50:02 GMT Server: Apache/2.1 Host: localhost Accept-Language: fr.46ebeabae2180" Accept-Ranges: bytes Content-Length: 21 Content-Type: text/plain Content-Language: fr Ceci est du francais.INSA .accept-language TCN: choice Last-Modified: Tue.2. GET /info.txt.txt HTTP/1. 33/43 .q=0.fr Vary: negotiate.en.

txt HTTP/1.1 Host: localhost Accept-Language: en.6-3ubuntu4.q=1.11 (Ubuntu) PHP/5.INSA .1 with Suhosin-Patch Content-Location: info.accept-language TCN: choice Last-Modified: Tue.fr. 34/43 . 15 Jul 2009 13:50:34 GMT Server: Apache/2.46ebeabae2180" Accept-Ranges: bytes Content-Length: 25 Content-Type: text/plain Content-Language: en These are english words. 14 Jul 2009 18:24:33 GMT ETag: "31c06f-19-46eae8cd55a40.txt.en Vary: negotiate.2.1 200 OK Date: Wed.ASI TechnoWeb : Serveur Web et protocole HTTP Négociation de contenu (3/6) Exemple de négociation sur la langue GET /info.5 HTTP/1.q=0.2.

txt HTTP/1.4c90880b353c0" Accept-Ranges: bytes Content-Length: 25 Content-Type: text/plain Content-Language: en These are english words.ASI TechnoWeb : Serveur Web et protocole HTTP Négociation de contenu (4/6) Exemple de négociation sur chier absent GET /info.1 200 OK Date: Thu. 35/43 .2.txt. 06 Sep 2012 13:48:44 GMT Server: Apache/2.en Vary: negotiate.accept-language.1 Host: localhost Accept-Language: de HTTP/1.Accept-Encoding TCN: choice Last-Modified: Thu.22 (Ubuntu) Content-Location: info.INSA . 06 Sep 2012 13:30:33 GMT ETag: "4000b7-19-4c9087ee99040.

en.html.txt.1 Host: localhost Accept-Language: fr.en.4c908ec867a00" Accept-Ranges: bytes Content-Length: 29 Content-Type: text/html Content-Language: fr Ceci est en français.Accept-Encoding TCN: choice Last-Modified: Thu.1 200 OK Date: Thu.ASI TechnoWeb : Serveur Web et protocole HTTP Négociation de contenu 36/43 (5/6) Exemple de négociation multi-critères info.accept. .fr.fr sont placés à la racine du serveur Apache Les chiers GET /info HTTP/1. info. 06 Sep 2012 14:01:12 GMT ETag: "400176-1d-4c908ec867a00. 06 Sep 2012 14:04:04 GMT Server: Apache/2.q=0.INSA .7 Accept: text/plain.accept-language.txt.q=0.html.q=1.text/html.2.22 (Ubuntu) Content-Location: info.5. info.en info.(HTML) et Http.fr Vary: negotiate.q=1 HTTP/1.html.

txt.html.en.1 Host: localhost Accept-Language: fr.en Vary: negotiate.q=1.q=0. (HTML) sont placés à .ASI TechnoWeb : Serveur Web et protocole HTTP Négociation de contenu 37/43 (6/6) Exemple de négociation multi-critères Les chiers text.html.INSA .q=0. GET /text HTTP/1.7.q=0.8 HTTP/1.fr et text.accept.en. 06 Sep 2012 14:22:20 GMT Server: Apache/2.Accept-Encoding TCN: choice Last-Modified: Thu.en la racine du serveur Apache Http.2 Accept: text/plain.text/html.txt. 06 Sep 2012 14:01:06 GMT ETag: "40017a-20-4c908ec2aec80.accept-language.4c909190ccac0" Accept-Ranges: bytes Content-Length: 32 Content-Type: text/html Content-Language: en These are english words.1 200 OK Date: Thu. text.2.22 (Ubuntu) Content-Location: text.

INSA .ASI HTTP et proxys Utilisation d'un proxy TechnoWeb : Serveur Web et protocole HTTP (1/3) 38/43 .

S'il possède déjà la page. 39/43 . il la renvoie. lors d'une requête. sinon il va la chercher.INSA .ASI TechnoWeb : Serveur Web et protocole HTTP HTTP et proxys (2/3) Deux grands types de proxy Le proxy classique Il s'agit d'un relais pouvant servir de ltre ou de rewall Le proxy cache Il archive les pages.

INSA . . l'archive et la retourne au client.ASI TechnoWeb : Serveur Web et protocole HTTP HTTP et proxys 40/43 (3/3) Protocole HTTP et proxy cache le client eectue une requête (GET) via un proxy cache le proxy vérie s'il dispose de la page demandée si oui le proxy vérie la date d'expiration de l'URI (Expires) interroge le serveur de l'URI an de comparer les dates de dernière modication de l'URI dans le cache de dernière modication de l'URI sur le serveur Utilisation des méthodes GET ou HEAD et des directives If-Modified-Since ou Last-Modified si l'URI du cache est à jour alors le proxy retourne la ressource de son cache le proxy récupère la ressource du serveur.

INSA . xée par le site visité Problème avec les vieux navigateurs : il est possible pour un serveur de récupérer des cookies d'un client dont il n'est pas à l'origine .ASI TechnoWeb : Serveur Web et protocole HTTP Limites 41/43 (1/2) Gestion des sessions : les cookies Le protocole Http 1.1 ne gère pas les sessions ⇒ Alternative utilisée par les navigateurs : cookies Fichiers textes stockés sur le disque dur du client Durée de vie limitée.

INSA . .ASI TechnoWeb : Serveur Web et protocole HTTP Limites 42/43 (2/2) Http sécurisé : Https Le protocole Http n'est pas sécurisé ⇒ Alternative à Http : Https `s' pour secured Combinaison de Http avec SSL ou TLS Vérication de l'identité d'un site par un certicat d'authentication Garantie condentialité et intégrité des données envoyées par l'utilisateur (ex : formulaires) Port par défaut : 443.

netcraft.fr/cours/caleca/http/ index.html 43/43 .org/ http://stielec.ac-aix-marseille.org/ http://apache.INSA .com http://www.ASI TechnoWeb : Serveur Web et protocole HTTP Sources http://www.w3.