Vous êtes sur la page 1sur 12

II Information Economique II

CONTACT

Accueil Information Economique


Direction du Dveloppement Industriel et Territorial

Rendez-vous gratuit du lundi au vendredi de 9h 12h00


CCI de Lyon Place de la Bourse 69289 Lyon cedex 02 Mtro Cordeliers T. 04 72 40 56 60 F. 04 72 40 57 45 iedoc@lyon.cci.fr www.lyon.cci.fr

Guide pratique de la recherche dinformations sur internet

Novembre 2013

- Sommaire

Amliorez votre recherche dinformations sur Internet .................................... 3 1 Typologie des outils de recherche sur Internet ............................................ 4 2 Les outils de recherche du Web visible ....................................................... 5 2-1. Les moteurs de recherche.................................................................. 5 2-2. Les mtamoteurs.............................................................................. 6 2-3. Les annuaires gnralistes ................................................................. 6 2-4. Les fils RSS...................................................................................... 7 3 Les outils de recherche du web invisible ..................................................... 8 3-1 Les moteurs de recherche du web invisible ........................................... 8 3-2 Les rpertoires slectifs ...................................................................... 9 3-3 Les outils de recherche thmatiques .................................................. 10 Les annuaires thmatiques ou portails sectoriels ............................................. 10 Les sites fdrateurs................................................................................................ 10 4 Syntaxe dinterrogation .......................................................................... 11 4-1 Principe de formulation .................................................................... 11 4-2 Fonctions avances des moteurs de recherche les plus utiliss .............. 11 5 Pour aller plus loin ............................................................................... 12

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 2 Reproduction interdite

Amliorez votre recherche dinformations sur Internet

Internet vhicule lchelle mondiale une immense quantit dinformations et reprsente une mine de renseignements pas toujours faciles identifier. Pour mener une recherche efficace, il est ncessaire de consulter une mthodologie et de connatre les diffrents outils. Il existe de nombreux outils accessibles en ligne permettant de sonder le Web et didentifier linformation dont vous avez besoin. Ces outils nutilisent pas tous le mme fonctionnement, aussi il est utile den connatre les principes. Il y a une distinction faire entre les outils de recherche disponibles sur Internet : les outils du Web visible et les outils du Web invisible. Linformation contenue sur Internet nest pas accessible de faon homogne, il existe diffrents langages, diffrentes mthodes pour la collecter. Le Web visible regroupe les pages web indexes par les moteurs, mtamoteurs et rpertoires, ce sont des pages dites statiques , qui ne se modifient pas lorsquun internaute les consulte . Ces pages sont accessibles facilement grce aux outils classiques de recherche. Le Web invisible reprsente la majeure partie de la masse dinformations contenue sur Internet et nest donc pas carter dans le cadre dune recherche dinformations. Il r egroupe les pages Web dites dynamiques , les outils classiques ne peuvent pas les rpertorier. Ces pages sont soit non localisables (la page Web ne se constitue que lorsque linternaute linterroge), non rfrences ou construites partir dun langage spcifique que les outils de recherche classiques ne reconnaissent pas. Toutefois, la frontire entre web visible et web invisible est moins marque quil y a quelques annes. "Les ressources du Web invisible comprennent, entre autres, les sites Web construits autour d'une base de donnes (interrogeable uniquement par un moteur de recherche interne), les pages accessibles par un formulaire de recherche, les pages protges par un mot de passe, les pages interdites aux robots d'indexation, []." Lespace Information Economique de la CCI de Lyon vous propose ici une typologie des outils de recherche de base ainsi quune mthode pour laborer une bonne stratgie de recherche sur Internet (comment rechercher de linformation sur un secteur dactivit, un produit spcifique, une entreprise, etc.). Ce guide pratique, loin dtre exhaustif, ne prsente pas le web social, les outils de veille, les portails personnalisables etc mais renvoie vers des sources sur le sujet.

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 3 Reproduction interdite

1. Typologie des outils de recherche sur Internet


Description Outils de recherche du web visible Moteur Base de donnes de pages Web, classes dans un index Ralis par un robot Outil de recherche sur plusieurs moteurs simultanment Catalogue de sites concernant un thme donn Ralis par une personne Liste de pages Web, texte intgral Rpond des questions prcises Classement des rsultats par ordre de pertinence Recherche simple et prcise sur des mots cls spcifiques Liste de sites Internet Identification de sources spcialises Liste de sites similaires par exploration de la rubrique Liste de sites Internet (quelques milliers maximum), largement ouvert sur le Web invisible Deux types de portail : - Horizontal (droit, marketing, etc.) - Vertical (secteur dactivit) Annuaire spcialis, informations pratiques, changes et espace de fidlisation Accessible via les moteurs de recherche du Web invisible avec une syntaxe particulire Information publie par des internautes (amateurs ou professionnels), Utile en veille concurrentielle pour dtecter les avis des consommateurs, rseaux sociaux, le-rputation dune marque ou un produit, etc. Utilis par les organes de presse. Permet de suivre lactualit en temps rel sans avoir besoin de se connecter au site concern. Utile en veille concurrentielle pour dtecter les rumeurs, avis de consommateurs Les forums comprenant un modrateur (qui filtre les messages) sont un gage de qualit Suivi de lactualit dun secteur (veille) Les listes comprenant un modrateur (qui filtre les messages) sont un gage de qualit Mutualisation des connaissances Par mot-cl Gnraliste Spcialise Gnraliste Spcialise Gnraliste Spcialise Spcificit Mode de recherche Type dinformation

Mtamoteur Annuaire

Par mot-cl Par thme Par mot-cl

Outils de recherche du web invisible Rpertoire slectif Annuaire thmatique Portail sectoriel Site fdrateur Page de liens Autres outils Blog Page Web publie par un internaute Par mot-cl Gnraliste Spcialise Gnraliste Spcialise Spcialise Rpertoire de sites classs par thmes, ralis par une personne Rpertoire de sites concernant un thme, un secteur dactivit, une filire Par thme Par mot-cl Par thme Par mot-cl Spcialise

Spcialise

Portail thmatique avec un aspect marchand Liste de liens hypertextes sur un sujet donn dans des sites Internet

Par thme Par mot-cl

Spcialise Spcialise

Fil RSS Forum de discussion

Fichier texte dont le contenu est produit automatiquement en fonction des mises jour d'un site Web. Echange et consultation de messages en diffr, ncessite gnralement une inscription (gratuite ou payante)

Par mot-cl Par mot-cl Par arborescence de sujets

Liste de diffusion Wiki

Echanges par courrier lectronique, ncessite gnralement une inscription (gratuite ou payante) Site Web collaboratif o chaque internaute visiteur peut participer la rdaction du contenu.

Par mot-cl quand les archives sont disponibles Par mot-cl Par rubrique

Spcialise

Gnraliste Spcialise

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 4 Reproduction interdite

2 Les outils de recherche du Web visible


Le Web visible peut tre interrog partir de trois types doutils : les moteurs de recherche, les mtamoteurs et dans une moindre mesure les annuaires.

2-1 Les moteurs de recherche


Le moteur de recherche est un outil entirement automatis qui utilise un robot pour collecter le contenu des pages Web et les stocker dans une base de donnes. Cet outil permet donc de rechercher en texte intgral dans les pages Web de plusieurs sites. Lien Moteurs dorigine francophone Exalead Voil Moteurs dorigine anglophone Bing en anglais Bing en franais Google en anglais Google en franais Yahoo ! Search en anglais Yahoo ! Search en franais Ask en anglais Ask en franais Gigablast Mondiale Mondiale Mondiale Mondiale Mondiale Europenne Francophone Couverture

Pour interroger les moteurs de manire pertinente, il est utile de connatre leur syntaxe dinterrogation. Pour cela, vous pouvez notamment consulter le site Abondance : une notice dtaille est disponible pour chaque outil. Par ailleurs, un outil accessible en ligne permet de comparer la couverture des moteurs de recherche : Thumbshots Ranking.

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 5 Reproduction interdite

2-2 Les mtamoteurs


Le mtamoteur est un outil qui interroge simultanment plusieurs moteurs de recherche, annuaires ou banques de donnes.

Lien

Couverture

Indication des sources sur loutil

Mtamoteurs gnralistes anglophones et autres Clusty Dogpile Hervester42 Mondiale Mondiale Mondiale Oui Oui Bing, Google, Yahoo Oui Plus de 50 moteurs et outils spcialiss accde aux bdd du web invisible Spezify.com WebCrawler Twingine Mondiale Mondiale Mondiale Oui Yahoo, MSN, Digg, Flickr, Twitter visuel innovant mtamoteur sudois Oui - Bing, Google, Yahoo Oui - Google et Yahoo (prsentation des rsultats des 2 moteurs sur 2 colonnes) Mtamoteurs gnralistes francophones Orindon Francophone Oui

2-3 Les annuaires gnralistes


Un annuaire est un rpertoire de sites Internet, valus, dcrits et classs par une personne dans des rubriques. Lannuaire gnraliste possde une large couverture thmatique. Il ne recense que lURL du site et un descriptif de son contenu (un moteur lui pointe sur des pages). La recherche porte donc uniquement sur les lments recenss. Ces outils qui sont en perte de vitesse depuis plusieurs annes ont disparu pour la plupart (y compris lancien annuaire de Google). Lien Annuaires dorigine anglophone Yahoo ! en anglais Dmoz en anglais
(ou Open Directory)

Couverture Mondiale Mondiale Mondiale

The Internet Public Library

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 6 Reproduction interdite

Annuaires dorigine francophone NEToo Indexa Francophone Francophone

2-4 Les fils RSS


Un fil RSS est un fichier texte, gnr automatiquement, contenant la description des nouveauts mises en ligne sur un site web, ainsi que le lien pointant vers le contenu de ces nouvelles informations. Ainsi, il permet de suivre lactualit en temps rel sans avoir besoin de se connecter au site concern. Lorsquun site dispose dun flux RSS, on le reconnat par un des symboles suivants :

Pour pouvoir lire et sabonner des flux RSS, il faut un lecteur ou agrgateur de flux RSS. Il existe trois formes de lecteurs de flux RSS : les lecteurs intgrs au navigateur Internet : Mozilla Firefox, Internet Explorer les lecteurs en ligne : Netvibes, Bloglines (en anglais), Google Reader. les lecteurs sous forme de logiciel : Alertinfo, RSS Bandit, FeedReader, Feeddemon.

Plusieurs logiciels de messagerie comme Outlook ou Mozilla Thunderbird, permettent galement de collecter les flux RSS.

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 7 Reproduction interdite

3 Les outils de recherche du web invisible


Le web invisible, appel aussi web profond, contient des pages non indexes par les moteurs de recherche et notamment les bases de donnes accessibles via un formulaire. On peut y accder grce aux outils suivants : les moteurs de recherche spcialiss, les rpertoires slectifs, les outils de recherche thmatiques (annuaires thmatiques, portails sectoriels, sites fdrateurs, pages de liens, etc.). Les outils de recherche thmatiques et slectifs sont nombreux et nous ne citerons que quelques sources titre dexemple, dautres tant prsents dans lannuaire de sites 1000 sites .

3-1 Les moteurs de recherche du web invisible


Afin didentifier les sites du Web invisible, il convient dutiliser des moteurs, mtamoteurs. Voici quelques outils qui pourront vous aider dbuter vos recherches. Lien Couverture Type dinformations

Moteurs de recherche Yahoo ! Search Google Scholar Mtamoteur Scirus Mondiale Mmoires, thses, rapports et papiers de recherche Mondiale Mondiale Publications de rfrence, dtudes et de grands serveurs commerciaux Documents acadmiques, livres blancs et articles scientifiques

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 8 Reproduction interdite

3-2 Les rpertoires slectifs


Les rpertoires slectifs sont des outils crs et aliments par des personnes, bien souvent professionnels de linformation. Ce sont des listes de sources juges pertinentes dans leur domaine et sont gnralement ouvertes sur le Web invisible. Linternaute pourra y trouver des liens vers des bases de donnes, des sites de rfrences, la presse, les listes de diffusions, les documents de recherche. Lien Rpertoire de signets Bibliothque Nationale de France Bibliothque Georges Pompidou Annuaire 1000 sites Infomine Plus de 1000 sites utiles pour lentreprise : informations conomiques, juridiques, cration dentreprise etc- CCI de Lyon 9 rubriques (dont Sciences, Economie, Business, Sant, etc.) En anglais Rpertoire de bases de donnes Dadi Complete Planet 1120 bases de donnes gratuites 70 000 banques de donnes 3400 ressources - 800 rubriques. Outils Internet en page daccueil aide reprer des outils de recherche. 47 rubriques Ressources

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 9 Reproduction interdite

3-3 Les outils de recherche thmatiques


Les annuaires thmatiques ou portails sectoriels

Pour trouver une information spcifique une filire ou un secteur dactivit, il existe des annuaires thmatiques ou portails sectoriels. Pour trouver ce type doutils, vous pouvez consulter des portails de portails , cest--dire des rpertoires ou annuaires de portails sectoriels. Vous trouverez une liste non exhaustive de ces outils dans la rubrique Rpertoires de sites de lannuaire 1000 sites . Vous pouvez galement consulter ces deux outils : Indexa et Les Annuaires. Les sites fdrateurs

Les sites fdrateurs sont des outils proches des portails thmatiques, mais avec un aspect marchand. Ils associent les acteurs et centralisent les informations et transacti ons dun secteur particulier. Les sites fdrateurs sont gnralement composs de quatre sections : un annuaire spcialis, un contenu ditorial (information, interviews, dossiers), des changes (forum, liste de diffusion, petites annonces) et un espace de fidlisation (espace membre, boutique, catalogue). Ces outils sont localisables sur Internet grce aux annuaires thmatiques, rpertoires de signets, etc. Vous pouvez galement interroger le site Search Engine Colossus, qui rpertorie des moteurs et des annuaires par pays et par thmes.

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 10 Reproduction interdite

4 Syntaxe dinterrogation
Une recherche efficace sur un moteur de recherche suppose lutilisation de certaines fonctions et formulations. Voici les lments de syntaxe les plus utiles pour dbuter une recherche.

Principes de formulation
Les oprateurs boolens : ET / AND / + : la recherche se fait sur deux mots et plus OU / OR : la recherche prend en compte au moins lun des mots SAUF / NOT / - : La recherche exclut les pages contenant ce(s) mot(s) Les guillemets (" ") : pour retrouver une expression exacte La troncature (*) : tous les moteurs ne proposent pas cette fonctionnalit, il vaut mieux utiliser loprateur OR pour demander les singuliers et les pluriels. Caractres accentus : la question se pose pour la langue franaise : tous les moteurs ne les grent pas de la mme faon. A priori, il vaut mieux saisir le mot-cl avec accent et pour une recherche exhaustive comparer les rsultats avec ou sans accent.

Fonctions avances des moteurs de recherche les plus utiliss


Bing Oprateurs boolens AND (par dfaut) OR - (pour sauf ) Recherche sur champs intitle:mot / mots / / site : inurl:mot inurl:(mot 1 mot 2) site : Exalead AND (par dfaut) OR - (pour sauf ) intitle:mot intitle:(mot 1 mot 2) intitle:mot allintitle:plusieurs mots inurl:mot allinurl:plusieurs mots site :(ex : site :gouv.fr) site: inurl:mot intitle:mot / OR - (pour sauf ) Google AND (par dfaut) Yahoo ! Search AND (par dfaut) OR (parenthses) - (pour sauf )

A noter que les moteurs proposent des crans de recherche avance qui facilitent lutilisation de ces champs. Par ailleurs, la syntaxe dtaille des diffrents moteurs de recherche est disponible sur le site Abondance.
Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 11 Reproduction interdite

5 Pour aller plus loin


Une rubrique de lannuaire 1000 sites (Management de linformation) est entirement consacre aux ressources et producteurs dinformations. Vous pourrez y trouver des lien s vers des sites spcialiss sur la recherche dinformations sur Inte rnet (Abondance), des bases de donnes (Dialog, Electre), des informations pratiques sur lintelligence conomique (lAdit, Veille Magazine), des revues spcialises (Archimag), etc. Il est important de se tenir inform de lactualit des sources dinformation et de lvolution de ces outils. Les revues spcialises Bases et Netsources (diteur Bases Publications) diffusent de nombreuses informations et conseils pratiques sur la recherche sur Internet (les archives de plus dun an sont consultables gratuitement). Ce mme diteur a publi louvrage Recherche veille sur Internet : mode demploi (Auteur : Batrice Foenix-Riou, date : 2011) qui prsente de manire dtaille et concrte les outils et mthodes pour explorer le web visible, le web invisible, le web social et le web en temps rel (fiches pratiques). LEspace Numrique Entreprises, centre de ressources et de comptences sur les Technologies de lInformation et de la Communication au service des entreprises, publie des fiches pratiques trs utiles sur les thmes du Web, des nouvelles Technologies ou encore de la scurit informatique.

Guide pratique de la recherche dinformations sur Internet CCI DE LYON Service Information Economique Novembre 2013 page 12 Reproduction interdite

Vous aimerez peut-être aussi