Vous êtes sur la page 1sur 52

VIELLE TECHNOLOGIQUE

SUR INTERNET

Mr Mounir GRARI

2007/2008

Plan
2

Enjeux
j
de la veille
Spcificits des moteurs de recherche
Les agents intelligents
Elaborer une stratgie de recherche
Extraire linformation
Types de recherche
Savoir exploiter le Web invisible et les zones spcifiques
Constituer une banque doutils
Rdiger et consigner les rsultats de la recherche

Introduction
3

La veille technologique est une activit qui met en


uvre des techniques d'acquisition, de stockage et
d'analyse d'informations
La veille technologique peut s'alimenter de donnes
provenant de tous types de sources :

Internet :
Moteur de recherche : Google , Yahoo,
Site
Si web
b
Forum

Introduction ((Moteur de recherche))


4

Google
g ((environ 60% des 61 milliards de recherches sur
internet)
Yahoo (8,5 milliards de recherches, soit 14% du total)
Baidu le Google chinois"" qui monte en puissance (3,3
milliards de requtes, soit 5,4% du total)
Live Search moteur de recherche de Microsoft (2,1
(2 1
milliards de recherches, 3,4%)
Naver moteur de recherche coren du groupe NHN (2
milliards de recherches).
Le site de commerce eBay (1,3 milliards de recherches).

Enjeux
j
de la veille ((Quelques
q
dfinitions)
5

Une organisation est :

Un ensemble d'individus,
regroups au sein d
d'une
une structure rgule,
dans le but de rpondre des besoins et d'atteindre
des objectifs dtermins.

L'information est :

le moyen pour
environnement.

un

individu

de

connatre

son

Enjeux
j
de la veille ((Quelques
q
dfinitions)
6

LLInformation
Information technique :

Il s'agit donc d'une information gnralement fiable et


une donne pertinente.
Ces informations sont diffuses par diffrentes sources.

Internet : annuaires, moteurs de recherche, mta moteurs et


agents intelligents .

Enjeux
j
de la veille ((Quelques
q
dfinitions)
7

La Veille :

se dfinit comme une activit continue et en grande


partie itrative visant une surveillance active de
lenvironnement technologique, commercial pour en
anticiper les volutions.
Il sagit donc dun outil de recherche et de
dveloppement.

Enjeux
j
de la veille ((Objectifs)
j
)
8

La veille permet :

d'viter les erreurs de dcision,


de dtecter les opportunits et les menaces,
de faciliter le processus de dcision,
De voir ce q
qui s'est dj
j fait
Mieux cibler et bien choisir des projets innovants
Comparer
p
son savoir et le dvelopper
pp
Anticiper lvolution de lenvironnement
Dvelopper louverture de lorganisation sur son
environnement.

Enjeux
j
de la veille
9

Les diffrents types de veille :

conomique
Commerciale
Marketing
Socitale
Technologique
Concurrentielle

La veille est un processus qui permet de collecter,


danalyser et de diffuser des informations juges utiles.

Enjeux de la veille :
Intgrer la veille dans les processus de ll'entreprise
entreprise
10

Le processus de la veille comporte plusieurs tapes


cycliques .
Il se dcompose
p
en deux p
parties savoir :
La surveillance de lenvironnement
L
Lexploitation
exploitation de llenvironnement
environnement

Enjeux de la veille :
Intgrer la veille dans les processus de ll'entreprise
entreprise
11

La surveillance de llenvironnement
environnement :
Cette phase ncessite en premier lieu la recherche et
la collecte de linformation. Il faut donc cibler le sujet
j
et ses enjeux et mettre en place une stratgie de
recherche efficace de linformation utile.
En deuxime lieu, il est ncessaire de passer
ltape de lanalyser et de la validation des
informations, en respectant les critres de validation :
pertinence , exhaustivit, fiabilit des donnes.

Enjeux de la veille :
Intgrer la veille dans les processus de ll'entreprise
entreprise
12

L exploitation de llenvironnement
Lexploitation
environnement :
Il sagit du traitement, de la diffusion et de
lutilisation des informations p
pour la p
prise de
dcision.
Le traitement des informations permet de retrouver
linformation pertinente do la ncessit de mettre en
place un dispositif de stockage et darchivage de
donnes.
donnes
La diffusion des informations traites permet leur
utilisation pour une prise de dcision dans
lenvironnement socio-conomique de lorganisation.

Veille et la recherche sur internet


13

Face llnormit
normit exponentielle du web devenu la
premire source dinformation mondiale, linternaute
qui dsire obtenir la rponse une question peut
recourir diffrents outils ; on distingue entre
annuaires, moteurs de recherche, mtamoteurs et
agents
t intelligents
i t lli
t

Spcificits
p
des moteurs de recherche
14

Dfinition des outils de recherche utiliser :


Les annuaires :

recensent selon une arborescence souvent complexe de


catgories et de sous-catgories les sites Internet qui leur
sont soumis (par leur auteur ou leur propritaire, le plus
souvent)
t) ; leur
l
f ti
fonctionnement
t repose sur une dclaration
d l ti
pralable, associe le plus souvent une validation qui peut
faire intervenir de faon alatoire ou systmatique un agent
humain. On peut citer Yahoo!, Voila, Nomade ou encore
Lycos.

Spcificits
p
des moteurs de recherche
15

Dfinition des outils de recherche utiliser :


Les annuaires :

Le nombre de sites rfrencs est infrieur ce que


proposent en gnral les moteurs de recherche, et la
pertinence relle des sites rfrencs est difficile valuer.
Ces annuaires, dabord ports par leur inscription dans un
portail offrant dautres services (voir Yahoo!), sont de moins
en moins utiliss

Spcificits
p
des moteurs de recherche
16

Dfinition des outils de recherche utiliser :


Les moteurs de recherche :

fonctionnent diffremment : ils commencent par constituer


un index de pages Internet (et non de sites) ; les auteurs
peuvent soumettre leurs pages pour inscription dans cet
i d
index,
mais
i la
l grande
d masse en est rcupre
de
d faon
f
automatique, laide dun robot (un logiciel) qui suit et
analyse
y les liens rencontrs dans les p
pages
g et navigue
g
ainsi de lune lautre.

Spcificits
p
des moteurs de recherche
17

Dfinition des outils de recherche utiliser :


Les moteurs de recherche :

Une copie de ces pages est stocke sur des serveurs ddis
(le chiffre exact est tenu secret, mais on estime dans le cas
de Google plus de 15 000 le nombre de PC permettant
d faire
de
f i tourner
t
ce cache
h ).
) Lorsque
L
li t
linternaute
t tape
t
ensuite un mot dans la zone de saisie, un programme
lanalyse sommairement (reconnaissance de la langue
dorigine, filtre orthographique), puis parcourt les pages
ainsi stockes sa recherche.

Spcificits
p
des moteurs de recherche
18

Dfinition des outils de recherche utiliser :


Les moteurs de recherche :

Ce sont les rsultats de cette recherche, classs selon une


mthode que nous verrons plus loin, qui sont prsents
linternaute, avec ladresse de la page correspondante ainsi
quun
extrait
t it du
d contexte
t t dans
d
l
lequel
l le
l mott apparatt au
sein de la page. La quantit de pages examines est
beaucoup plus importante que dans le cas des annuaires
la recherche se fonde pour lessentiel sur le contenu des
pages, et non sur le rsum dun site fourni par son auteur.

Spcificits
p
des moteurs de recherche
19

Dfinition des outils de recherche utiliser :


Trier les rsultats :

Chaque requte via un moteur de recherche pouvant


produire une quantit norme de rsultats, il est bien
entendu ncessaire de les trier avant de les prsenter
li
linternaute.
C prcisment
Cest
i
sur la
l pertinence
i
d ce trii
de
que Google a assur son succs rapide au dbut des
annes 2000.

Spcificits
p
des moteurs de recherche
20

Dfinition des outils de recherche utiliser :


Trier les rsultats :

Pour tudier la pertinence dune page rapporte au mot-cl


recherch,
ec e c , les
es moteurs
o eu s se fondent
o de d
dabord
abo d su
sur le
e co
contenu
e u de la
a
page et sa structure :

le mot est-il prsent dans le titre de la page ?


Dans la page elle-mme ? quelle frquence ?
Apparat-il rapidement ou plus loin au sein du document ?
Apparat-il dans les balises (ces zones dont le contenu nest pas
affich lors de la consultation par linternaute mais qui permettent de
renseigner les moteurs : description de la page,
page mots-cls de la page,
page
etc.) ?
Apparat-il dans ladresse da la page ?
Dans les liens conduisant vers cette page ?

Spcificits
p
des moteurs de recherche
21

Dfinition des outils de recherche utiliser :


Les mtamoteurs:

quant eux, sont des outils logiciels qui interrogent en


simultan
i lt plusieurs
l i
moteurs
t
d recherche
de
h h ; principal
i i l dfaut
df t de
d
la plupart dentre eux :
Google, acteur technologique incontournable, interdit laccs
son moteur ce type doutils.

Quant aux agents intelligents ,

il ssagit
agit d
doutils
outils paramtrables destins effectuer de faon
semi-autonome des missions de recherche dinformation et
surtout de veille (observation des changements) sur diffrentes
sources choisies.

Agents
g
intelligents
g

22

Exemples d
d'agents
agents intelligents
Agents

de recherche
Agents de veille
Agent de navigation

Agents intelligents
A t d
Agents
de recherche
h h d'informations
d'i f
ti
23

Par le terme d
d'agents
agents de recherche d
d'informations,
informations,
nous qualifierons toute la gamme de logiciels
intermdiaires entre les moteurs de recherche et les
"agents intelligents", consacrs la recherche
d'informations. Leur intrt rside dans leur capacit
remplir
li et automatiser
i
d tches
des
h la
l place
l
d
de
l'utilisateur. Ils suivent la lettre la dfinition du terme
agent : "entit
entit agissant pour le compte de quelqu
quelqu'un"
un .
On distinguera quatre fonctions principales :

Agents intelligents
A t d
Agents
de recherche
h h d'informations
d'i f
ti
24

Recherche d
d'informations
informations : celle
celle-ci
ci peut se faire de
manire "intelligente" par l'utilisation de mtamoteurs perfectionns (WebSeeker, Copernic Pro),
d'outils d'analyse linguistique des requtes (Autonomy,
DigOut4U) ou par exploration de liens hypertextes
partir
i d'une
d'
URL (adresse
( d
d'
d'une
page web)
b) donne,
d
sans utilisation d'un moteur de recherche (DigOut4U)

Agents intelligents
A t d
Agents
de recherche
h h d'informations
d'i f
ti
25

Analyse des informations rcupres : indexation


smantique des rsultats (EchoSearch, WebCompass),
rsum automatique (EchoSearch, WebCompass,
DigOut4U)
Filtrage, dition, archivage, mise jour de rsultats
(WebSeeker, BullsEye)
Navigation off-line parmi des pages ou des sites
web tlchargs (WebWhacker, Teleport Pro)

Agents intelligents
C
Caractristiques
t i ti
des
d agents
t intelligents
i t lli t
26

Les chercheurs en intelligence artificielle ss'accordent


accordent
sur la ncessit de l'existence de quelques
caractristiques pour qu'on puisse parler d'agents
intelligents. A l'heure actuelle, aucun produit ne
rassemble toutes ces caractristiques.
L'autonomie
Capacit communiquer et cooprer
Capacit raisonner, ragir leur environnement
La mobilit

Agents intelligents
C
Caractristiques
t i ti
des
d agents
t intelligents
i t lli t
27

LL'autonomie
autonomie

L'agent doit pouvoir prendre des initiatives et agir sans


intervention de l'utilisateur final. Dans le contexte du web
il doit pouvoir agir alors que l'utilisateur est dconnect.

d'Autonomy de la socit Agentware.


Les agents de General Magic devraient aussi en tre capable.
capable

La mobilit

Les agents doivent pouvoir tre multi-plate-forme et multiarchitecture. Ils doivent pouvoir se dplacer sur le rseau o
ils accomplissent des tches sans que l'utilisateur ait le
moindre
d contrle
l sur celles-ci.
ll

Agents intelligents
C
Caractristiques
t i ti
des
d agents
t intelligents
i t lli t
28

Capacit communiquer et cooprer


L'agent doit pouvoir changer des informations plus
ou moins complexes
p
avec d'autres agents,
g
, avec des
serveurs ou avec des humains.

Service Firefly : Indiquez cet agent vos gots


musicaux et cinmatographiques et il vous fera
lui aussi des recommandations assez pertinentes.

Agents intelligents
C
Caractristiques
t i ti
des
d agents
t intelligents
i t lli t
29

Capacit raisonner, ragir leur environnement

Capable de s'adapter son environnement et aux


volutions de celui-ci. Cette adaptation doit s'appuyer
sur l'analyse de l'environnement extrieur des agents.

Firefly : les connaissances d'un agent sont en partie


fonction des connaissances des autres agents Firefly. A
mesure que leurs connaissances ss'enrichissent
enrichissent, les
connaissances d'un agent particulier s'enrichissent aussi
grce aux changes entre agents

Elaborer une stratgie


g de recherche
30

Formuler sa requte, stratgie de recherche


Exemple :
Sujet:

Lpuisement professionnel et la satisfaction


au travail chez les informaticiens

Elaborer une stratgie


g de recherche
1
1.

Identifier les principaux concepts


(Plus il y a de concepts, plus la recherche est prcise)
EExemple
l : L
Lpuisement
i
t professionnel
f i
l ett lla satisfaction
ti f ti au ttravailil
chez les informaticiens

Concept A

Concept B

Concept C

puisement
professionnel

Satisfaction au travail

informaticiens

Elaborer une stratgie de recherche


2 Choisir,
2.
Choisir traduire et enrichir son vocabulaire

Identifier les synonymes ou termes quivalents en franais. Si ncessaire, utiliser


un thsaurus, un dictionnaire, liste de mots cls, etc. Ainsi que la troncature ((*))
* sert de troncature dans plusieurs Bases de donnes. On peut utiliser la
troncature pour viter d avoir rcrire des termes ayant la mme racine: Ex.:
la racine Informaticien* permet de reprer les termes Informaticien,
Informaticiens, Informaticienes, ETC,
Concept 1

Concept 2

Concept 3

puisement professionnel

Satisfaction au travail

Informaticien*

Burnout

Satisfaction professionnelle

Personnel informatique

(Burn out, Burn-out)

Stress

Motivation

OU
ET

Elaborer une stratgie


g de recherche
(Traduire les termes en anglais pour faire une recherche
dans des Bases de donnes anglophones)
Concept 1

Concept 2

Burnout

Job satisfaction

Concept 3
Nurs*

(Burn out, burn-out)

Stress

(Nurrse, Nurses, Nursing)

Motivation

Computer science
personnel
OU
ET

3. Lier les concepts avec des oprateurs logiques (oprateurs


boolens --> ET, OU, SAUF (AND, OR, NOT))

Elaborer une stratgie


g de recherche
(Formuler des quations de recherche en liant les concepts avec les oprateurs
logiques appropris (ET, OU, SAUF)(AND, OR, NOT). On peut formuler plusieurs
quations simples de recherche)
Concept 1

Concept 2

Concept 3

puisement
p
professionnel

Satisfaction au travail

Informaticien*

Burnout

Satisfaction
professionnelle

Personnel
informatique

(Burn out, burn-out)

Stress

Motivation

OU
ET

Exemples dquations
d recherche
de
h h

Concept 1

Concept 2

Concept 3

puisement
professionnel

Satisfaction au travail

Informaticien*

B
Burnout

Satisfaction
S
if i
professionnelle

Personnell
P
informatique

(Burn out, burn-out)

Stress

Motivation

OU
ET

Exemples pour chercher dans des bases francophones


puisement professionnel* ET satisfaction au travail ET informaticien*

puisement
professionnel ET satisfaction au travail ET personnel informatique
puisement professionnel ET satisfaction professionnelle ET informaticien*
puisement professionnel ET satisfaction professionnelle ET personnel computer
science
Burnout ET satisfaction au travail ET informaticien
informaticien*
Burnout ET satisfaction au travail ET personnel computer science
etc

Exemples pour chercher dans des Banques


g p
anglophones
Concept 1

Concept 2

Concept 3

Burnout

Job satisfaction

Nurs*

Motivation

Medical Personnel

(Burn out, burn-oput)

Stress

OU
(OR)
ET (AND)

Burnout AND Job satisfaction AND Nurs*


Burnout AND Job satisfaction AND computer science personnel
Burnout AND Motivation AND Nurs
Nurs*
Burnout* AND Motivation AND computer science personnel
Stress AND Job satisfaction AND Nurs*
Stress AND Job satisfaction AND computer science personnel
Stress AND Motivation AND Nurs*
Stress AND Motivation AND computer science Personnel

Elaborer une stratgie


g de recherche
Formulation plus globale de la requte : un exemple
Burnout ET satisfaction professionnelle ET informaticien*
Burnout ET satisfaction au travail ET informaticien*
Burnout ET satisfaction p
professionnelle ET personnel
p
informatique
q
puisement professionnel ET satisfaction professionnelle ET
informaticien*
puisement professionnel ET satisfaction au travail ET informaticien*
puisement professionnel ET satisfaction au travail ET personnel
informatique*

Elaborer une stratgie


g de recherche
O peut
On
p aussi formuler sa recherche de faon
plus
p
complexe en faisant des ensembles (i.e. placer les
concepts entre parenthses):
(Burnout OU puisement professionnel) ET (satisfaction au
travailil OU satisfaction
i f i professionnelle)
f i
ll ) ET (informaticien*
(i f
i i * OU
personnel informatique)
(Burnout OR stress) AND (job satisfaction OR motivation) AND
(nurs* OR computer science personnal)

Elaborer une stratgie de recherche


R h h une expression
Rechercher
i
Par exemple,
p , on peut
p essayer
y de trouver des informations
sur les chles de cachemire, l'exclusion des collections.
La recherche sera transcrite ainsi :
+chle
hl +cachemire
h i -collection
ll i
En fait, de plus en plus, les moteurs de recherche
proposent des menus droulants qui crivent les
oprateurs votre place. Pour y accder, cherchez les
boutons du genre plus d'options , recherche
avance .

Elaborer une stratgie de recherche


L oprateurs
Les
t
boolens
b l

Sont :
ET, en anglais AND.
OU, en anglais OR, noter : de plus en plus d'outils de recherche
considrent que le ET est implicite... mais pas tous, vous le saurez
en allant chercher dans les options de recherche avance.
SAUF,
SAUF en anglais AND NOT ou NOT
NOT.

Ces oprateurs peuvent tre remplacs par les signes :


+ coll devant le terme de la recherche et qui est ll'quivalant
quivalant de
ET.
- coll devant le terme de la recherche et qui est l'quivalent de
SAUF.

Elaborer une stratgie de recherche


i une recherche
crire
h h complexe
l

Par exemple,
p , on p
peut essayer
y de trouver
v des
informations sur les chles de cachemire, l'exclusion
des collections. La recherche sera transcrite ainsi :

+chle +cachemire -collection

En fait, de plus en plus, les moteurs de recherche


proposent des menus droulants qui crivent les
oprateurs votre place. Pour y accder, cherchez les
b t
boutons
du
d genre plus
l d'
d options
ti
recherche
,
h h
avance .

Elaborer une stratgie de recherche


M j
Majuscules
l ou minuscules
i
l ((une hi
histoire
t i d
de casse))

Les avis
v sont partags.
p
g Il faut savoir
v que,
q , si de plus
p en
plus d'outils de recherche ne sont pas sensibles la
casse, certains gardent la diffrence.
Si vous tapez tout en minuscules ils chercheront toutes
les occurrences, quelle que soit leur graphie. Si vous
utilisez des majuscules, ils ne chercheront que celles
strictement crites comme vous l'avez tap. Les
rsultats peuvent tre totalement diffrents.
diffrents
Par contre, Google s'en fiche compltement, il en va
de mme pour les accents d
d'ailleurs
ailleurs, pas sre que a
soit vraiment un progrs...

Extraire linformation
E l
Evaluer
la
l pertinence
ti
d
de l'i
l'information
f
ti
44

Premire

rgle, vidente et pourtant, ne pas se


limiter une seule source d'information. Bref
agir comme on le fait lorsque l'on utilise des
supports papier et, bien videmment croiser les
informations. Certes, il peut arriver qu'une seule
personne aiti raison
i
contre tous, et il y a
effectivement des exemples historiques. Mais le cas
inverse se justifie le plus souvent.
souvent

Extraire linformation
E l
Evaluer
la
l pertinence
ti
d
de l'i
l'information
f
ti
45

Deuxime

rgle, vrifier les sources des avis


convergents. S'ils ont tous t pills au mme
endroit, ils n'ont pas de valeur renforante. C'est en
fait le gros problme d'internet o il est si facile de
recourir au copier-coller pour ajouter du contenu
sur un site
i alors
l qu'on
' ne saiti pas trop quoii di
dire.

Extraire linformation
E l
Evaluer
la
l pertinence
ti
d
de l'i
l'information
f
ti
46

Troisime

point : une information srieuse est une


information qui raconte son histoire. On peut
donc savoir d'o elle provient, par qui elle a t
mise et de quand elle date. S'il n'est pas possible
de trouver ces lments, mfiance
Et si l'on sait d'o elle provient mais que la source
est une entreprise dont l'objectif est de
commercialiser
i li un produit
d it en rapportt avec
l'information, mfiance aussi car on peut douter de
son objectivit et de sa neutralit.

Extraire linformation
E l
Evaluer
la
l pertinence
ti
d
de l'i
l'information
f
ti
47

Quatrime

point : son origine. Il est vident que,


par exemple, en astronomie, une information
dlivre ou en provenance d'un observatoire sera
beaucoup plus fiable qu'une information mise par
un amateur, moins quip et souvent moins
savant .

Extraire linformation
E l
Evaluer
la
l pertinence
ti
d
de l'i
l'information
f
ti
48

Cinquime

point : les liens. Gnralement un site


soigneusement fait prte attention ses liens. En
outre certains types de liens peuvent donner
l'orientation gnrale.
Exemple en mdecine : une information mdicale
est susceptible d'avoir plus de valeur lorsque le site
lie vers des pages d'information mdicale srieuse
que vers des
d pages de
d diverses
di
pratiques
ti
mdicales dites douces ou alternatives.

Extraire linformation
E l
Evaluer
la
l pertinence
ti
d
de l'i
l'information
f
ti
49

Sixime

point : ne pas hsiter douter si


l'information vous semble bizarre, mme si elle est
dlivre par un organisme envers lequel vous avez
toute confiance.
Septime point : la charte graphique du site n'a
strictement aucune incidence sur la qualit de son
contenu. Il convient donc de ne pas se laisser
prendre
d son esthtique,
thti
nii d'
d ailleurs
ill
d
de rejeter
j t a
priori le contenu sous prtexte que le contenant ne
plat pas.

Types
yp de recherche
50

- Recherche globale.
- Recherche d'une image, d'un son, d'une vido.
- Recherche d'une
d une personne
personne.
- Recherche d'information sur une socit.
- Recherche de donnes conomiques
conomiques, scientifiques
scientifiques.

Constituer une banque


q doutils
51

Mthode incrmentale d
d'approche
approche

52

Rdiger et consigner les rsultats de


l recherche
la
h h

Vous aimerez peut-être aussi