Vous êtes sur la page 1sur 4

Analyse

Cookies en folies
Laurent.Kling@ep.ch, EPFL - STI, coordinateur informatique la Facult Sciences et Techniques de lingnieur

Browsing Web is not anonymous


Surfer sur Internet nest pas anonyme Nos butineurs doivent se retrouver dans la fort de fentres ouvertes par chaque usager. Un jalon immatriel est dissimul dans les entrailles des navigateurs, le cookie. Ce tmoin peut se dcomposer en deux catgories temporelles: z bref, juste le temps ncessaire pour laction, z interminable, des dures qui surpassent largement lhistoire &.

cinq sites sont prsents dans cet article, deux acadmique lEPFL et le MIT, un du monde du logiciel libre Sourceforge et deux entreprises, Yahoo et Apple. Si on exclut les anomalies, les sites Web de lEPFL sont raisonnables, la dure de vie ne dpasse pas deux ans.

Le tmoin immuable
Dsireux de partir dun exemple concret, jai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumule depuis 3 ans. Le rsultat est impressionnant: z 8500 cookies dans Safari, z 270 cookies dans Flash. A priori, la dure ncessaire pour accomplir une action technique ne devrait pas dpasser une heure, peut-tre atteindre 24 heures. En ralit, uniquement 0.1 % (9 cookies) rpondait ce critre limit un jour. Intrigu par une proportion si faible, jai ralis une analyse en combinant les tableaux croiss dans Excel et la puissance du logiciel statistique R.
g. 2 ch.ep un cookie Flash est prsent avec une adresse IP 128.178.50.23

g. 3 edu.mit

Pour un autre campus, le MIT les dures deviennent difcilement comprhensibles, pourquoi conserver des jalons techniques pendant 10 ans ?

g. 1 rpartition statistique des cookies duen dure suprieure 1 jour

Dsireux danalyser dans le dtail la distribution des donnes, 26 domaines DNS (comme ep.ch) ont t retenus. Pour simplier le dpouillement, lordre habituel serveur.entreprise.pays a t invers.

g. 4 net.sourceforge

12

30 aot 2011 - N 7

flash informatique

Cookies en folies Pour Sourceforge, on peut galement sinterroger sur la dure de vie sur un site hbergeant des projets open source. Pour deux sites commerciaux, Apple et Yahoo lutilisation de cookies pour suivre lusager avec des chances importantes semble logique dans un esprit mercantiliste. crateur de contenu dutiliser un objet enregistr dans votre ordinateur (Local Shared Object). Cette donne cache permet de contourner leffacement de cookies. Il suft de dupliquer linformation avec un jalon Flash LSO. Cette fonction a suscit lintrt de la commission amricaine du commerce (FTC) en 2010. Probablement par raction, la dernire version 10.3 de Flash du 15 mai 2011 propose la suppression de ces informations !

Un monde sans Flash et sans cookies

g. 5a com.apple

g. 5b com.yahoo

Pour lensemble des sites, la dure de vie trs longue des cookies (au plus 7089 ans) suggre une utilisation pour identier linternaute, pas pour conserver des prfrences. Pour visualiser les cookies sur Safari, je recommande lutilisation de safaricookies qui permet de se rendre compte de ltendue des dgts.

La directive 2002/58/CE & sur la Protection des donnes dans le secteur des tlcommunications par le parlement europen a engendr relativement peu dintrt sa parution en 2002, contrairement la date de la mise en application dans les tats membres du 25 mai 2011. La principale nouveaut est laccord explicite de lusager pour lenregistrement de ses donnes, y compris pour les cookies. Naturellement les chantres de la libert du commerce voient dans cette directive une contrainte insupportable. Mme aux USA o la protection des donnes personnelles informatiques est presque inexistante, il existe un dbat dans une commission du snat sur la vie prive (Senate Commerce Committee on Privacy). Lobjectif est de supprimer les informations quand on le dsire avec la mise en place des instruments lgislatifs Do Not Track &. Pour ceux qui dsirent goter au monde paisible de lInternet sans Flash, il existe lextension clicktoash & sur Safari qui prsente vos pages avec des encarts pour chaque composant Flash. Si lun deux vous intresse, un clic et cest visible. Un effet remarquable de cette absence est une conomie consquente des ressources informatiques (processeur et mmoire). Pour Firefox et Google Chrome, lextension Flashblock & utilise une mthode similaire. Et nalement, les utilisateurs dInternet Explorer possdent une solution moins lgante en interdisant les sites pouvant utiliser Flash (lifehacker.com/5533694/use-Internet-explorers-built+inash-block-feature).

g. 7 page Web libre de Flash g. 6 http://sweetpproductions.com/safaricookies/

Flash, cookies cachs


Apple est le fer de lance de la croisade refusant lintgration de la technologie Flash. En premier dans sa tablette iPad, puis dans la dernire version dultraportable MacBook Air. Sans entrer dans ce dbat sur lintrt de disposer de cette extension, nombreux sont les bandeaux publicitaires en Flash. Sur un iPad, leur absence reprsente un confort dutilisation indniable. En 2002, partir de la version 6 de Flash, il est possible pour un

Il existe la solution ultime de supprimer rgulirement lensemble de vos cookies et LSO dans votre ordinateur, par exemple sur un Macintosh avec Safari:
~/Library/Cookies/Cookies.plist ~/Library/Preferences/Macromedia/Flash Player/#SharedObjects/ ~/Library/Preferences/Macromedia/FlashPlayer/ macromedia.com/support/flashplayer/sys/

Malheureusement, la suite de cet article va dmonter que ces actions ne sont pas sufsantes pour protger votre vie prive. 30 aot 2011 - N 7

flash informatique

13

Cookies en folies

Entropie numrique
En 1948, le mathmaticien Claude Shannon & publie larticle qui cre la thorie de la communication moderne, entre autres il dcrit la relation entre le signal et le bruit. Dans le mme papier, il dcrit lentropie qui correspond la quantit dinformations transmises. Dans son article en 1951, lentropie nest pas uniquement fonction de la complexit, mais galement de la frquence dutilisation. Un caractre possde une entropie de 0.6 a 1.3 bit, un mot inhabituel employ par Shakespeare ou Umberto Eco reprsente 0.4 bit par caractre. Une retombe inattendue de ce thorme est la capacit de comprimer linformation sous une forme non destructive. Tout usager qui compresse un dossier utilise sans le savoir la mthode LZW imagine par des lves de Claude Shannon. Pour dnombrer les 6,92 milliards dhabitants vivants de la terre, il faut utiliser 32.7 bits. Pour tous les humains ayant vcu sur notre plante, environ 106 milliards en 2002, 36.6 bits sont sufsants (www.prb.org/pdf/PT_novdec02.pdf). Un cinquime des cookies dpasse le long terme (une dure de vie suprieure 9 ans). Dans ce sous-groupe, 42 % possdent une entropie suprieure au nombre total dhumains. Le moins quon puisse dire est que les informaticiens ont une vision trs long terme... Parfois, la quantit dinformations contenues dans le cookie est digne dun article, le record est 3141 caractres pour com.yieldmanager.ad dont voici un extrait:
b!!!$K!!%#4!!<NC<ynxU!!)OK!!!!#<PulM!!) OU!!!!#<LTvT!!-?2!!!!%=!20>!!-O3!!!! #=!20>!!0eW!!!!#<YOqs!!0o,!!!!%<y>BB! !0sA!!!!*<x>nC!!1Mx!!!!8=!=48!!1N4!! !!8=!=48!!1N=!!!!-=!=48!!1NC!!!!.=!=48!!1NO!!!!3=!=48!!2!d!!!!#<nA.[!!2-9!!!!$<dZO @!!28Y!!!!$<o(!8!!3I$!!6D)<NR!8!!3gT!!!!/<QXp J!!3gX!!!!/<QXpJ!!3gh!!!!/<QXpJ!!3go!!!!/<TW) Q!!3i3!!!!)

/* Google Analytics */ jQuery.jGoogleAnalytics(UA-4833294-1, {topLevelDomain: .epfl.ch} );

En 2010, un chercheur dune association de dfense des liberts individuelles amricaines (Free Frontier Fondation) a crit un article avec comme hypothse: Votre navigateur est-il unique ? & Au dpart, nous pensons navement que le fait dutiliser un navigateur standard dans notre ordinateur nous rend anonymes. Une visite sur le site https:panopticlick.eff.org nous dmontre le contraire. Mon butineur est unique, seul parmi 1611981. Cela reprsente 20.62 bits dentropie de linformation ! Quels sont les indices rvlateurs ? 1. mes polices de caractres, unique, 1 sur 1611981 2. mes extensions, 1 sur 806000 3. le type du navigateur, 1 sur 230000 4. la langue, 1 sur 637 5. mon cran, 1 sur 28 6. ma zone horaire, 1 sur 8 7. jaccepte des supercookies, 1 sur 2.3 8. jaccepte des cookies, 1 sur 1.3. Il est tonnant de constater que la liste des polices de caractres installes chez moi suft me distinguer. Encore plus surprenant, comment un site Web peut-il dtecter le contenu de mon ordinateur ? La rponse est malheureusement simple, lutilisation du mlange de deux technologies Flash et Java. Sur mon iPad, qui est une machine ferme sans Flash ni Java, josais esprer tre moins reconnaissable.

Votre environnement informatique, une trace indlbile


Pour prserver sa vie prive, on pourrait tre tent de supprimer rgulirement les cookies et les donnes persistantes contenues dans nos navigateurs Internet. A priori, on imagine que lutilisation du mode navigation prive cache aux regards extrieurs nos visites sur les sites Web. En pratique, cest une illusion, car ds quon visite une page sur Internet, on laisse des empreintes sur le serveur. Si le concepteur utilise un service externe danalyse de frquentation comme Google Analytics, vos visites vont directement tomber dans lescarcelle de Google. Il est improbable que vous regardiez le code source de vos sources dinformations favorites pour dcouvrir ce contenu JavaScript:
<script src="http://www.google-analytics.com/ urchin.js" type="text/javascript"> </script> <script type="text/javascript"> _uacct = "UA-610236-1";urchinTracker(); </script>

g. 8 panopticlick Ipad unique

En pratique il nen est rien, je suis galement unique, pas par la prsence de polices que labsence de Flash et de Java rend impossible dtecter, mais par la combinaison des autres facteurs.

La premire dfense, vous-mme


Si on vous demande de communiquer votre code bancaire, il est certain que vous allez refuser. Bizarrement, si vous allez faire rparer un ordinateur, peut-tre allez-vous spontanment proposer votre mot de passe informatique. Comment peut-on imaginer une telle diffrence de comportement ? Je crois que la cl rside dans la dmatrialisation de linformation. Sous la forme habituelle de

Pour la page daccueil de lEPFL, le code de Google Analytics est contenu dans un chier annexe: www.ep.ch/js/globalnav.js.

14

30 aot 2011 - N 7

flash informatique

Cookies en folies papier, de classeurs ou darchives, linformation est tangible. Si vous dmnagez un classeur fdral, personne ne va sinquiter. Si par contre vous transportez une suite de chariots remplis de papier, il est probable que quelquun arrte ce transfert physique. Dans le cas des fuites des cbles diplomatiques amricains, cest probablement des wagons de documents qui ont t transfrs sous une forme numrique apparemment inoffensive, des DVD. Une autre proprit de linformation digitale est quelle est inaltrable, telle une uvre dart reproductible linni sans perte de qualit. Cette copie est tellement parfaite quil est impossible de distinguer loriginal de la copie. Cette problmatique nest pas nouvelle, en 1935 Walter Benjamin a dcrit la perte de laura, jalon important pour comprendre lart moderne: fr.wikipedia.org/ wiki/Luvre_dart__lpoque_de_sa_reproductibilit_technique. La scurit peut prendre des cheminements particulirement tortueux. Confront la ncessit de renforcer la complexit des mots de passe dans un cnacle de spcialistes informatiques, la premire remarque est dordre pratique, ce changement provoque trop de demandes de support. Par analogie avec la limitation de la vitesse automobile, lobjection serait que cette mesure va engendrer trop de contraventions. La rponse rationnelle est que cette contrainte va rduire la gravit des accidents, vitant des vies brises. z on duplique les cls pour entrer chez vous. Cela nest pas un roman despionnage, cest rellement arriv pour RSA et Lookeed. Heureusement, Lookeed possdait dautre mcanisme de scurit que seulement la cl RSA. Suite cette attaque, RSA vient dannoncer le changement de quarante millions de cls lectronique.

g. 9 quarante millions de cls lectroniques RSA changer

Cette mthode est connue depuis lantiquit, face une muraille infranchissable, on peut saper ses fondations ou simplement construire une rampe daccs au piton rocheux.

Un monde civilis ?
Bizarrement, les usagers sur Internet se comportent comme si celui-ci est un espace de libert sans contrle. Tel un Far West du monde moderne, ils imaginent la possibilit de naviguer sans laisser de traces et disposer de ressources sans limites. Navement, on pourrait esprer se rendre invisible par lutilisation de redirection qui cache et transforme votre adresse IP. Cette parade est caduque sil est particulirement facile didentier votre navigateur. Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trac Internet dans un environnement partag, voir article Dscuris, paru dans FI4/08). Probablement par une simplication sans gale, on nous promet des guerres cyberntiques similaires au lm Indpendance Day. Dans cette lgumineuse hollywoodienne, navet ou citrouille, lhumanit est confronte une menace extraterrestre disposant de technologies suprieures aux ntres. Le dnouement est vraiment grotesque, un virus informatique humain dtruit les envahisseurs. Par un curieux hasard du scnario, les extraterrestres ont dcid de nous copier en utilisant un microprocesseur de chez nous. Un danger nettement plus tangible est une attaque dlibre contre votre forteresse numrique: z on attaque le coffre-fort dune entreprise commerciale spcialis dans la fabrication de cl;

g. 10 rampe daccs au piton de Massada construite en 7 mois, 73 aprs J.C

Les attaques informatiques fonctionnent uniquement si le code malicieux sinscrit dans une architecture matrielle et logicielle trs spcique. Au lieu de prner un monde homogne o les dfauts se propagent la vitesse de la lumire, il est prfrable dutiliser des environnements htrognes. De la mme manire, il est vain de vouloir se protger si nos habitudes ou lingniosit des pirates nous convainquent douvrir un document manifestement vrol. Dans ce cas qui est familier, la cause nest pas rechercher du ct dune faille technologique inconnue, mais plutt de notre soif de dcouvertes accompagne dune curiosit inbranlable. n
Shannon, Claude E.: Prediction and entropy of printed English, The Bell System Technical Journal, 30:50-64, January 1951: en.wikipedia.org/wiki/Information_entropy Votre navigateur est-il unique ? https://panopticlick.eff.org/browseruniqueness.pdf

GLOSSAIRE

&

Flashblock: ashblock.mozdev.org lhistoire: la dfinition de lhistoire est gnralement associe au dbut de lcriture, soit environ 5400 ans depuis les poteries dAbydos en gypte. Chez moi, 4 cookies expirent le 1er janvier 10000, dpassant la limite des dates dans mon tableur favori.

clicktoash: rentzsch.github.com/ clicktoash/ directive 2002/58/CE: europa.eu/legislation_summaries/information_society/legislative_framework/l24120_fr.htm Do Not Track: www.ftc.gov/os/ testimony/101202donottrack.pdf

flash informatique

30 aot 2011 - N 7

15