Vous êtes sur la page 1sur 18

1

Ricerca di
informazioni
in internet







Cinzia Bocchi

versione 2 del 07/09/2014


2
Introduzione

La vasta dimensione del Web e la sua crescita esponenziale causano non pochi problemi
a chi tenta di accedere alle informazioni di interesse. Gli strumenti di ricerca attualmente
disponibili, nonostante il miglioramento degli algoritmi, presentano ancora numerose
limitazioni.
In primo luogo, si stima che i motori di ricerca riescano a censire non pi di un terzo delle
pagine web dei normali siti internet (dati 2010); gran parte dellimmenso patrimonio
di materiale memorizzato in centinaia di banche dati on-line rimane sommerso.
In secondo luogo, lattuale dinamicit della conoscenza, pesantemente influenzata dalla
condivisione in rete, determina il problema della frammentazione e della obsolescenza, a
breve termine, delle informazioni.
Inoltre, i motori di ricerca tradizionali, basandosi prevalentemente sulla ricerca per parole
chiave, non sono esenti da fenomeni di omonimia e polisemia. Omonimia e polisemia
possono influire negativamente sugli esiti di una ricerca.
Un ulteriore problema lattendibilit delle fonti consultate. Uno studio, condotto da W.
Russell Neuman, e pubblicato sulla rivista statunitense The Information Society, ha
mostrato che la maggioranza delle persone intervistate si dichiara soddisfatta e apprezza
la quantit e la variet di informazioni disponibili in rete e non si sente particolarmente
oppressa dal sovraccarico di informazioni (information overload). I principali fattori di
frustrazione sono, nelle dichiarazioni delle persone, il sensazionalismo e la partigianeria, la
parzialit, crescente di alcuni canali televisivi, le distrazioni causate da social network
(Facebook e Twitter) che veicolano informazioni non richieste e la difficolt di distinguere
linformazione attendibile e professionale da quella che non lo .
Infine, un altro studio, condotto da Borchuluun Yadamsuren della University of Missouri
School of Journalism, evidenzia come le persone molto spesso vengano a contatto con le
notizie in maniera del tutto casuale (serendipity) mentre sono impegnate in altre attivit di
ricerca. Tale situazione, se da un lato rappresenta una opportunit per laccrescimento
della conoscenza, causa di distrazione e allontana lutente dallobiettivo informativo che
si era prefissato.
Alla luce di quanto stato detto, si pu affermare che attualmente il vantaggio competitivo
non risiede nel conoscere di pi ma nel sapere come e dove procurarsi linformazione e
nel capire i nessi fra i frammenti che ci pervengono dai molteplici canali di distribuzione.


3
Lunico modo per gestire il problema dellinformation overload nellimmediato ma anche e
soprattutto nel futuro una mirata attivit di formazione che possa fornire a tutti i cittadini
la capacit di apprendere in maniera autonoma, di cercare e integrare le informazioni in
rete, per poterle usarle nei contesti di interesse.

Strumenti di ricerca tradizionali

Gli strumenti pi comunemente utilizzati per ricercare informazioni in Internet sono i motori
di ricerca e le directory.

I motori di ricerca (MdR) si basano sullanalisi del contenuto dei documenti presenti
in rete, che vengono periodicamente visitati da moduli software particolari, denominati
spider o crawler. Lanalisi del contenuto dei documenti realizzato mediante la tecnica
delle parole chiave e il risultato dellanalisi (indicizzazione) viene memorizzato in enormi
archivi che specificano, per ogni parola incontrata dallo spider, lelenco delle pagine che la
contengono.
I MdR sono molto semplici da utilizzare ma spesso forniscono risultati poco soddisfacenti
a causa dei fenomeni di polisemia (una parola con pi significati diversi es. processo) e
di sinonimia (pi parole con lo stesso significato es. capacit, abilit, competenza).
Inoltre, i MdR forniscono i risultati non ordinati in base al significato, costringendoci cos a
scorrere decine di pagine prima di trovare ci che stiamo cercando.
Il MdR pi utilizzato al mondo, che garantisce risultati apprezzabili Google Search -
www.google.com. Esistono altri MdR molto utilizzati come Bing - it.bing.com, Yahoo! -
it.yahoo.com, Ask - it.ask.com, anche se Google leader del settore.

Le directory differiscono dai MdR perch sono create e gestite da operatori umani.
Una directory costituita da una raccolta di link, suddivisi per argomenti e spesso
organizzati in categorie gerarchiche. Solitamente presente anche un motore che ricerca
automaticamente le categorie rilevanti allinterno della directory. Linconveniente quello
di non trovare la categoria adatta ai propri bisogni. Una directory web interessante
lOpen Directory Project (ODP) - www.dmoz.org, di propriet della Time Warner e
mantenuta da una comunit virtuale di redattori volontari.



4
Classificazione dei motori di ricerca

A. MdR orizzontali generalisti
I MdR generalisti non consentono di eseguire ricerche su argomenti specifici ma
conducono la ricerca in molti ambiti differenziati. La conseguenza che le risposte
ottenute riguardano singoli argomenti, non correlati. Le ricerche tramite MdR generalisti il
pi delle volte sono infruttuose perch, a fronte di una specifica richiesta, vengono
individuati migliaia o milioni di siti comprendenti anche argomenti non pertinenti.
Spesso i MdR orizzontali offrono strumenti di ricerca avanzata che permettono di
esprimere le richieste in modo pi dettagliato, ma che non risolvono il problema
dellorganizzazione delle informazioni ottenute, che deve essere svolta manualmente.

B. MdR verticali per contenuti specifici
I MdR verticali tematici, al contrario dei MdR orizzontali, effettuano ricerche su uno
specifico argomento. I risultati forniti sono gi organizzati e soddisfano maggiormente il
bisogno informativo dellutente.

C. MdR su media costruiti da utenti
Tali MdR effettuano le ricerche allinterno di archivi che sono generati e alimentati dagli
utenti. Esempi di tali archivi sono blog, forum e siti di condivisione di immagini, audio e
video, per i quali la maggior parte del materiale indicizzato prodotto e distribuito da
persone e non da aziende o editori. Una caratteristica interessante di questi MdR la
possibilit per lutente di influenzare il ranking, ossia la graduatoria con la quale sono
presentati i risultati, sulla base dellespressione esplicita di preferenze o attraverso link alle
risorse.

D. MdR per contenuti multimediali
Sono MdR specializzati nella ricerca di materiali multimediali.

E. MdR che classificano automaticamente i risultati
Questa categoria di motori di ricerca comprende motori di clustering che raccolgono e
raggruppano semanticamente le informazioni emerse dalla ricerca. In questo modo si
facilita l'orientamento e si fornisce una prospettiva abbastanza ampia e ad un maggiore
livello di astrazione rispetto alle caratteristiche dell'oggetto della ricerca.




5
F. MdR che utilizzano tecniche di visualizzazione non convenzionali dei risultati
Alcuni MdR visualizzano i risultati della ricerca in modo alternativo. Le tecniche di
visualizzazione sono principalmente grafiche (MdR visuali) e consistono nella
presentazione di grafi o mappe multimediali, dai quali possibile partire per affinare
ulteriormente la ricerca.

G. MdR o directory che si basano su processi cooperativi svolti dagli utenti per
indicizzare, classificare o operare tagging
Questi motori di ricerca si basano sul Social Bookmarking (condivisione in rete dei
bookmark): gli utenti creano un catalogo personale di risorse Internet ritenute valide e le
identificano attraverso parole chiave (tag) scelte liberamente. La ricerca avviene proprio su
tali parole chiave, individuate dagli altri utenti che fungono da filtro alle informazioni, e non
attraverso sofisticati algoritmi.

H. MdR in cui viene effettuata anche qualche operazione di information
extraction
I MdR che si basano sull Information Extraction (IE) analizzano il contenuto dei
documenti trovati nel web per estrarre e presentare all'utente solo le informazioni
specifiche richieste.

I. Metamotori
I metamotori si avvalgono di altri MdR per effettuare le ricerche nel web, aggregando i
risultati cos ottenuti o presentandoli separatamente.

Panoramica degli strumenti di ricerca

Nel seguito vengono presentate le caratteristiche e le funzionalit di alcuni strumenti di
ricerca. Lelenco non , ovviamente, esaustivo e la selezione si basata su criteri sia
oggettivi (qualit, affidabilit, ...) sia soggettivi (usabilit). Vicino ai nomi sono indicate le
categorie di appartenenza, se individuabili.

OSKOPE (F - I)
oskope.com/
Si tratta di una sorta di metamotore di ricerca visuale che offre la possibilit di trovare
materiale negli archivi di Amazon, e-Bay, Flickr, Fotolia e Youtube e che rende la ricerca di


6
immagini nel web pi attraente ed intuitiva. Sia che si faccia una ricerca per parole chiave
che per categorie, Oskope provveder a fornire la visualizzazione delle miniature delle
immagini dei risultati e i relativi link alle pagine esterne. Lutente pu scegliere tra cinque
diversi layout di visualizzazione delle miniature: a griglia (grid), a pila (stack), a mucchio
(pile), a lista (list), a grafo (graph). Particolarmente interessante la possibilit di salvare
le risorse prescelte in una cartella e inviarla via email.



Figura 1 - Oskope, visualizzazione a stack



Figura 2 - Oskope, visualizzazione a list


7


Figura 3 - Oskope, visualizzazione a graph

RedZee (F)
www.redzee.com/
Si tratta di un motore di ricerca che permette di visualizzare unanteprima dei siti che si
cercano, ancora prima di aprirli e di scorrere tra i risultati come se si trattasse di una
galleria fotografica. Si pu scegliere di ricercare in tutto il web, tra le immagini o i video.



Figura 4 - RedZee



8
TouchGraph Google Browser (F - I)
www.touchgraph.com/TGGoogleBrowser.html
MdR visuale che restituisce i collegamenti tra i siti utilizzando la tecnologia di Google e
visualizzando i risultati in una mappa personalizzabile e interattiva. I risultati possono
essere filtrati e riorganizzati all'interno della mappa stessa. TouchGraph Google Browser
richiede, per funzionare, il Java plugin, reperibile allurl www.java.com/it/download/.



Figura 5 - TouchGraph Google Browser



Figura 6 - TouchGraph Google Browser, la mappa esportata


9
Clusty (E)
clusty.com
Clusty un metamotore che oltre ad effettuare ricerche su differenti motori di
ricerca raggruppa i risultati in cluster o categorie per renderli pi facilmente consultabili e
interpretabili.
Il servizio permette di focalizzare la ricerca su diverse aree tematiche: web, news,
immagini, mappe, blog, wikipedia, job, shopping e gov. E prevista, inoltre, la possibilit di
personalizzare sia la visualizzazione dei risultati che la ricerca ed effettuare ricerche
avanzate.



Figura 7 - Clusty

Omgili (C)
omgili.com
Omgili ricerca nelle discussioni presenti nei forum e nei blog consentendo, inoltre, di
restringere la ricerca ad un determinato periodo temporale.



Figura 8 - Omgili





10
Academia.edu (C)
www.academia.edu
Academia.edu un sito web per ricercatori dedicato alla condivisione delle pubblicazioni
scientifiche. stato lanciato nel settembre 2008 e conta pi di 2 milioni di utenti registrati.
La piattaforma pu essere utilizzata per condividere articoli, monitorare il proprio impact
factor
1
e seguire studiosi di tematiche specifiche.



Figura 9 - Academia.edu

AudioCast .it (C - D)
www.audiocast.it/podlist
MdR per podcast italiani.



Figura 10 - AudioCast.it

1
Il fattore di impatto (impact factor o IF in inglese) un indice sintetico che misura il numero medio di citazioni ricevute in un particolare
anno da articoli pubblicati in una rivista scientifica nei due anni precedenti [fonte: http://it.wikipedia.org/wiki/Impact_factor].


11
Blinkx (D)
http://www.blinkx.com/
MdR di contenuti multimediali.



Figura 11 - Blinkx

Search PDF (A)
it.pdfsb.net
Search PDF un motore di ricerca che ricerca di file PDF, siano essi interi libri,
documenti, bibliografie, curriculum o altro ancora. La maschera di ricerca davvero molto
spartana e semplice e ricorda quella di Google.



Figura 12 - Search PDF




12
FindSounds (B)
www.findsounds.com
Motore per la ricerca di suoni ed effetti sonori vari. Per ogni risultato viene fornita la
visualizzazione di una piccola forma donda, che permette di ricercare ulteriori effetti sonori
con una forma donda simile a quella selezionata.



Figura 13 - FindSounds

TinEye (D)
www.tineye.com
Motore specializzato nella ricerca di immagini Per avviare la ricerca bisogna caricare
unimmagine o specificarne lurl. Il risultato costituito da immagini identiche o somiglianti
a quella fornita.



Figura 14 - TinEye




13
Podcast Pup (D - I)
www.podcastpup.com
Metamotore specializzato nella ricerca di podcast.



Figura 15 - Podcast Pup

Delicious (G)
delicious.com
Delicious un social bookmarking, cio un sito che permette agli utenti registrati di salvare
i link preferiti (i bookmark). Delicous offre un motore interno per ricercare tra i bookmark
presenti.


Figura 16 - Delicious




14
Quintura for Kids (A)
quinturakids.com
Quintura un MdR che fornisce contenuti sicuri per i bambini.



Figura 17 - Quintura
Dooblet (A)
dooblet.com
Motore che ricerca un'alternativa per qualsiasi cosa



Figura 18 - Dooblet





15
Liveplasma (B F)
www.liveplasma.com
Liveplasma un MdR specializzato nella ricerca di musica, libri e film. I risultati sono
rappresentati in forma grafica.



Figura 19 - Liveplasma

Gnod
www.gnod.com
Gnod non un vero e proprio MdR ma un recommendation engine, cio un sistema che
fornisce raccomandazioni sulla base delle preferenze espresse dallutente. Inserendo un
brano musicale preferito, per esempio, vengono fornite raccomandazioni su artisti e gruppi
che potrebbero essere di interesse. I risultati sono rappresentati con una mappa. La
maggiore vicinanza di un nodo a quello oggetto della ricerca indica una pi alta probabilit
che il risultato sia utile per chi effettua la ricerca.



Figura 20 - Gnod




16
Wolfram Alpha
www.wolframalpha.com
Wolfram Alpha non propriamente un motore di ricerca ma un motore computazionale
di conoscenza che interpreta le parole chiave inserite dall'utente e propone direttamente
una risposta, invece che offrire una lista di collegamenti ad altri siti web.



Figura 21 Dooblet

Altri strumenti di ricerca

Project Gutenberg
www.gutenberg.org
Sito che contiene oltre 30.000 libri tutti completamente free e scaricabili gratuitamente,
grazie al loro copyright scaduto. Al link http://www.gutenberg.org/browse/languages/it si
trovano i libri in italiano.

Biblioteca italiana
www.bibliotecaitaliana.it
Un progetto esclusivamente realizzato in Italia dallUniversit degli Studi di Roma La
Sapienza, che prevede la condivisione di opere esenti da diritto dautore. Ulteriori siti di
ebook gratuiti sono reperibili al link sites.google.com/site/trovaebook/ebook-gratuiti-scorri-
liste.


17
Archivio Storico Luce
www.archivioluce.com/archivio
L'Archivio Storico Luce la pi grande raccolta di documenti audiovisivi della storia
d'Italia.

Mediateca Digitale Italiana (RAI)
www.medita.rai.it
La pi grande mediateca digitale dEuropa, messa a disposizione dei docenti italiani in
convenzione con il Ministero dellIstruzione dellUniversit e Ricerca.

Podcast RAI
www.rai.tv/dl/RaiTV/cerca_podcast.html
Raccolta di podcast di trasmissioni RAI.

Wikipedia
it.wikipedia.org/wiki/Pagina_principale
Wikipedia un'enciclopedia online disponibile in oltre 280 lingue, realizzata dagli utenti
stessi mediante un wiki.

Ulteriori strumenti di ricerca offerti da Google

YouTube
www.youtube.com
Sito per la condivisione di video caricati dagli utenti. Possiede un motore di ricerca interno.

Google Scholar
scholar.google.com
Motore di ricerca che consente di individuare testi della letteratura accademica.

Google Books
books.google.com
Motore di ricerca di libri.



18
Google Images
images.google.com
Motore di ricerca di immagini.

Google Videos
www.google.it/videohp
Motore di ricerca per video.


Fonti
- C. Trocciola, Loverload informativo nellera di Internet in CamminandoScalzi.it,
16/01/2010, url: http://www.camminandoscalzi.it/wordpress/overload-informativo-era-
internet.html
- C. Tasso, P. Omero, La personalizzazione dei contenuti web, Franco Angeli, 2007,
scheda libro: http://www.francoangeli.it/ricerca/Scheda_libro.aspx?ID=9766