Vous êtes sur la page 1sur 65

Indice generale

Introduzione...................................................................................................... 2

Capitolo 1...........................................................................................................5

Wikipedia e la classificazione gerarchico – enumerativa Dewey......................5


1.1 Le origini dell'enciclopedia collaborativa...................................................................... 5
1.2 Organizzare la conoscenza............................................................................................ 7
1.3 Schemi organizzativi ..................................................................................................... 9
1.4 Strutture organizzative................................................................................................. 12
1.4.1 Struttura organizzativo - gerarchica di Wikipedia................................................................................... 13

Capitolo 2......................................................................................................... 15

Due schemi di classificazione a confronto...................................................... 15


2.1 La classificazione gerarchico – enumerativa................................................................ 15
2.1.1 Le classificazioni gerarchica sul Web e la questione dell'incoerenza..................................................... 17
2.2 Classificazione analitico – sintetica ............................................................................ 19
2.2.1 Il concetto di faccetta................................................................................................................................... 19
2.2.2 Classificazione Colon .................................................................................................................................. 21
2.2.3 Ordine di citazione delle faccette............................................................................................................... 25
2.2.4 Applicare la classificazione a faccette sul Web......................................................................................... 28
2.2.5 Architettura a faccette in un sito Web....................................................................................................... 30
2.3 Classificazione a Faccette vs. Classificazione Tradizionale.........................................32

Capitolo 3........................................................................................................ 35

Il caso studio: WikiArte e la classificazione a faccette....................................35


3.1 Lo stato dell'arte.......................................................................................................... 35
3.1.1 Strutturare i dati con Mediawiki................................................................................................................. 37
3.2 Usare una struttura a faccette come sistema di ricerca e navigazione........................40
3.3 Usare le faccette per l'architettura dell'informazione di WikiArte..............................42
3.4 Preparare la collezione di dati per Flamenco.............................................................. 49

Conclusioni......................................................................................................53

Appendice........................................................................................................54

Bibliografia...................................................................................................... 64

1
Introduzione

Introduzione
L'acutezza del pensiero, la
chiarezza nell'espressione,
l'esattezza nella comunicazione, la
prontezza nella risposta, e la
precisione nel servizio dipendono in
ultima analisi dalla successione
conveniente, ovvero dalla
Classificazione.
[S. R. Ranganathan 1967]

Sin dalla sua comparsa, l'uomo ha dovuto sempre affrontare l'ostacolo della
comunicazione, per comprendere ed essere compreso. Nei secoli il linguaggio, sia verbale
che scritto, si è evoluto distinguendosi nei diversi idiomi e producendo un ingente quantità
di materiali e documenti che oggi costituiscono il patrimonio dell'umanità. Questa è una
realtà dinamica, un insieme aperto, non definitivo, ma in perenne ampliamento; di cui
vengono a far parte ritrovamenti e acquisizioni continui di dati e materiali.

La sorprendente mole di documenti e manufatti che l'uomo è riuscito a produrre sino ad


oggi porta con se il problema di una comunicazione ottimale. Organizzare questo sistema
aperto di dati, informazioni e conoscenze diventa una particolare sfida da affrontare, per
rispondere all'esigenza di porre ordine al caos dell'informazione. Gestire la conoscenza, al
fine di favorirne la reperibilità è indispensabile per poterla utilizzare, trovando le
informazioni che occorrono al momento della ricerca tra le innumerevoli a disposizione.

Questo è quello di cui si occupa l' Architettura dell'informazione, ossia strutturazione,


organizzazione e catalogazione del sapere.

In qualsiasi ambito e settore è necessario mettere ordine al materiale di cui si dispone,


gestire ed organizzare i dati permettendo così una buona reperibilità degli stessi. Anche
gestire la merce di un magazzino ha bisogno di un sistema ottimale di archiviazione, per
reperire i prodotti in modo semplice e rapido.

Il punto di partenza di qualsiasi ricerca è sapere quali conoscenze sono già note e come
sono strutturate, infatti reperire informazioni da un sistema ben strutturato agevola l'attività
di ricerca, risparmiando tempo prezioso. Per cui, gestire l'architettura dell'informazione, in

2
una società in cui la reperibilità del dato è fondamentale, diventa un lavoro prioritario da
estendere a tutti i settori e ambiti disciplinari.

Già nell'antica Grecia Aristotele aveva affrontato la difficoltà di organizzare il sapere


umano, discutendone in opere separate, raggruppandolo in tre grandi classi: teoretica,
pratica e poetica.

Nell'era in cui viviamo adesso, l'era della digitalizzazione, le informazioni viaggiano per
mezzo di un nuovo canale, ossia quello virtuale di Internet. Il World Wide Web, elidendo le
barriere fisiche e geografiche, ha messo in comunicazione l'intero pianeta con uno scambio
di informazioni senza limiti e ha raccolto in un unico grande contenitore tutto lo scibile
umano. In questo contesto, la progettazione dell'architettura dell'informazione diviene
l'obiettivo primario per soddisfare l'esigenza dell'utente, ossia reperire l'informazione che ci
è utile dal flusso continuo di documenti.

Già da tempo, Internet offre la possibilità, a tutti gli utenti, di reperire, caricare e
pubblicare qualsiasi informazione, che giorno dopo giorno aumenta esponenzialmente. Se
prima la responsabilità di classificare, organizzare e fornire accesso ai dati era
principalmente di bibliotecari o addetti ai lavori, adesso è l'utente a farsi carico di tutto ciò,
nel momento stesso in cui li pubblica. Allora, risulta necessario etichettare i contenuti,
adottare uno schema di classificazione specifico, e gestire nel migliore dei modi
l'amministrazione del perenne flusso di informazioni.

La Tesi vuole dimostrare che è possibile ampliare le potenzialità di un mezzo innovativo


come MediaWiki per un facile reperimento dei beni artistico-culturali, rendendo la
navigazione e la ricerca intuitiva e minuziosa. Il progetto ha lo scopo di dare
all'informazione una struttura a faccette grazie al software Flamenco, al fine di garantire
una ricerca e una navigazione ottimale per arrivare al documento desiderato, passando da
una pluralità di accessi; una volta trovato il manufatto, la pagina di Flamenco che ne
descrive le proprietà rimanderà l'utente alle pagine di MediaWiki, opportunamente
realizzate, che gestiscono le informazioni archiviate nel suo database.

La seguente tesi si articola in tre capitoli:

• il primo capitolo prende in esame l'ormai nota Enciclopedia collaborativa


Wikipedia e la classificazione gerarchico – enumerativa; una breve panoramica
sull’organizzazione dell’informazione, soffermandoci sui sistemi di

3
classificazione maggiormente adottati, sull'importanza delle strutture e dei
sistemi organizzativi.

• Il secondo capitolo mette a confronto i due schemi di classificazione: gerarchico


- enumerativa ed analitico - sintetica, ossia, la Dewey classification contro la
Colon classification; mettendo in evidenza i corrispettivi punti di forza
nell'applicazione.

• Il terzo capitolo tratta del caso studio, vale a dire, la realizzazione di


un'enciclopedia collaborativa, sulla scia di Wikipedia, destinata ad accogliere le
informazioni sul Patrimonio artistico-culturale; migliorando la gestione dei
contenuti mediante l'apporto di una classificazione a faccette. Nel caso specifico
del progetto l'attenzione è stata rivolta alle opere dell'Avanguardia Futurista.
Gestire l'architettura dell'informazione tramite un analisi top-down, dall'alto
verso il basso ci permette di stabilire a priori le classi principali del nostro
schema. Questa metodologia permette una ricerca più accurata, dovuta ad
apposite faccette, che permettono un filtraggio dei documenti archiviati.

4
Capitolo 1

Capitolo 1
Wikipedia e la classificazione gerarchico – enumerativa Dewey.
1.1 Le origini dell'enciclopedia collaborativa.

Wikipedia nella sua accezione più elementare è un database Internet che permette a
chiunque, indipendentemente da competenze o qualifiche, di scrivere e modificare voci su
qualsiasi argomento. L'insieme dei contenuti di diversi autori volontari è autodefinito
“Enciclopedia” dal gestore del servizio (Wikimedia Foundation, Inc., una società no-profit
statunitense) e come tale riconosciuta dai medesimi collaboratori non necessariamente
specialisti.

L'obiettivo di Wikipedia è di creare un'enciclopedia libera e "universale", in termini sia di


ampiezza che di profondità degli argomenti trattati. Wikipedia è stata descritta da uno dei
suoi fondatori, Jimmy Wales, come ''uno sforzo per creare e distribuire un'enciclopedia libera della
più alta qualità possibile ad ogni singola persona sul pianeta nella sua propria lingua''.

La differenza più evidente con le tradizionali enciclopedie è che in Wikipedia


l'organizzazione dei contenuti fa spazio ad una fitta rete ipertestuale accessibile e
modificabile sul Web, e i riferimenti a fonti interne ed esterne assumono la forma di
altrettanti collegamenti ipertestuali.

Wikipedia ha le sue origini in un progetto complementare, avviato nel 2000 da una


società commerciale statunitense sotto il nome Nupedia, un progetto per la creazione di
un’enciclopedia libera online le cui voci erano scritte da esperti attraverso un processo
formale di revisione.

Wikipedia, autodefinitasi “enciclopedia libera” sceglie il World Wide Web come mezzo
di distribuzione e scrittura delle voci enciclopediche, ed in particolare una tecnologia web
denominata Wiki, da cui prende il nome. Un wiki (un termine in lingua hawaiana che
significa “veloce”, “rapido”) è un software collaborativo per il Web ideato nel 1995
dall'ingegnere informatico statunitense Ward Cunningham per permettere la pubblicazione
di ipertesti direttamente modificabili dagli utenti, che possono scrivervi usando una sintassi
più semplice di HTML. Il termine wiki è usato sia per indicare il software in sé, più
precisamente software wiki o wiki engine, che l'ipertesto modificabile.
5
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

Con la crescita nella consultazione e l'aumento dell'estensione di Wikipedia, diffusasi


nelle varie versioni in lingua, a partire dall'originaria versione in lingua inglese, è aumentato
anche l'interesse degli studiosi che hanno dedicato al modello wiki in generale e a Wikipedia
in particolare saggi ed articoli scientifici inizialmente limitati agli aspetti più informatici e
tecnici per poi integrare recentemente anche le scienze sociali.

Nel giro di dieci anni questa enciclopedia online ha raggiunto il quattordicesimo posto
nella graduatoria mondiale di Alexa1 per richieste, superando fra gli altri il sito della
Biblioteca del Congresso statunitense (dal 2003-12) e dell'Enciclopedia Britannica (dal
2003-06), diventando l'enciclopedia online più consultata al mondo.

1
La Alexa Internet Inc. è un'azienda statunitense sussidiaria di Amazon.com che si occupa di statistiche sul
traffico di Internet. Alexa è anche un motore di ricerca con un servizio di web directory.
6
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1.2 Organizzare la conoscenza


Da secoli gli esseri umani strutturano, organizzano e classificano le informazioni, dando
al sapere un valore aggiunto come quello della sistematizzazione, poiché lo rende
maggiormente comprensibile e consultabile.

Per molti secoli, l’organizzazione aristotelica del sapere, è stato un punto di riferimento
principale, raggruppando tutti i campi della conoscenza in tre classi: teoretica, pratica e
poetica.

Fino a quando, attorno al 1600 il filosofo inglese Francis Bacon distingueva le scienze a
seconda delle facoltà conoscitive che le producono: memoria, immaginazione e ragione.
Tale successione arriverà fino al 1873, quando Mervil Dewey, un bibliotecario di un college
di New York, sviluppò un Sistema Decimale di classificazione, che prese il suo nome. Uno
strumento per classificare e fornire accesso al crescente numero di libri.

[…] Dewey suddivise ogni disciplina in sottoclassi e queste a loro volta in sotto-
sottoclassi e così via, in modo da distinguere anche argomenti molto specifici. Per indicare
ciascuna classe, Dewey utilizzò dei numeri, inizialmente di tre cifre: così 800 significava
Letteratura in genere, ma 810 significava Letteratura Americana, […] potenzialmente
all’infinito, poiché le cifre decimali di un numero possono essere infinite. Il nuovo sistema
prese quindi il nome di Classificazione Decimale di Dewey (Gnoli, Marino, & Rosati,
2006).

La nostra epoca si contraddistingue per una congestione informativa, un sovraccarico


d’informazioni, che pone con urgenza la necessità di archiviare questa mole di dati, in
modo da favorirne un recupero intelligente. Ma se l’era digitale ha amplificato questo
problema, esso non è del tutto nuovo: discipline come le scienze bibliotecarie e la
documentazione si occupano già di classificazione del sapere.

L’esplosione della quantità di conoscenze pubblicate sul Web ha reso più arduo il
reperimento delle informazioni, in particolare trovare quello che ci interessa in breve
tempo. Perciò, occorre una buona Architettura dell’informazione.

Peter Morville (Morville & Rosenfeld, 2002) definisce tale concetto in quattro punti
fondamentali:
7
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1. la combinazione di organizzazione, categorizzazione e schemi di navigazione


all’interno di un sistema di informazioni.

2. Il design strutturale e di uno spazio informativo atto a facilitare l’esecuzione dei


compiti e l’accesso intuitivo ai contenuti.

3. L’arte e la scienza della strutturazione e classificazione dei siti Web e delle intranet
per assistere gli utenti a trovare e gestire le informazioni.

4. Una disciplina emergente ed un gruppo di pratiche focalizzate a portare i principi


del design e dell’architettura del paesaggio digitale.

Oggi, attraverso l’esperienza di libri, biblioteche ed enciclopedia online, abbiamo


familiarità con il concetti di base dell’organizzazione delle informazioni. Però, La
rivoluzione informatica ha creato l’illusione che si potesse improvvisamente risolvere il
problema dell’organizzazione e della gestione dell’informazione per favorirne la reperibilità.
Oggi si è capito che la tecnologia è sicuramente un supporto per la gestione della
conoscenza ma ciò non elimina il problema dell’organizzazione dei suoi contenuti. Sempre
più persone hanno la libertà di pubblicare informazioni, ma anche la responsabilità di
organizzarle in quanto tali.

Uno degli aspetti che interessano l'architettura dell'informazione è l'organizzazione


ottimale dei contenuti nei documenti, in particolare nei siti web. Per mantenere efficace un
sito Web di grandi dimensioni, specialmente se vi collaborano molte persone, occorre
seguire metodi di lavoro e convenzioni strutturali sostenibili, per le quali le tecniche “da
bibliotecari” possono risultare molto utili (Gnoli, 2002). La possibilità di integrare diverse
forme comunicative e di creare dei collegamenti istantanei da un punto a un altro di un sito,
o anche dell’intera Rete, rende particolarmente importante la progettazione di un efficace
Architettura dell’informazione.

A questo scopo vengono utilizzate, più o meno consapevolmente, varie forme di sistemi
per l'organizzazione della conoscenza (knowledge organization system, KOS), come parole-
chiave, tesauri, stringhe di soggetto, tassonomie, ontologie, schemi di classificazione.

Gli schemi di classificazione sono forse i più classici tra i KOS. Sono stati sviluppati
soprattutto a partire dalla fine dell'Ottocento, per far fronte alla crescente quantità di
documenti da ordinare e gestire nelle biblioteche e nelle bibliografie. La maggior parte degli
8
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

schemi di classificazione sono sostanzialmente enumerativi, ossia si basano sull'elencazione


delle classi nelle quali è possibile ripartire i documenti da classificare. Poiché le possibilità di
combinare fra loro i concetti sono limitate, quasi tutti i concetti da utilizzare devono essere
già previsti dallo schema, che perciò è necessariamente costituito da tavole voluminose.
L'universo della conoscenza viene suddiviso in un certo numero di classi principali, ognuna
di queste in sottoclassi, e così via, sviluppando in questo modo un albero gerarchico, di
profondità teoricamente illimitata. L'esempio più famoso, come abbiamo già detto, è la
Classificazione decimale Dewey (CDD), introdotta dal bibliotecario newyorkese Melvil
Dewey a partire dal 1876, e da allora progressivamente espansa, aggiornata e adottata in
biblioteche di tutto il mondo.

1.3 Schemi organizzativi


Per consentire il facile recupero dei dati, in una quantità notevole di documenti, occorre
organizzarli adoperando un buon metodo di classificazione. Classificare non è però un
compito semplice. Un attività di classificazione non supportata da strategie, metodologie e
competenze adeguate rischia di produrre organizzazioni illogiche degli articoli, poco
scalabili e difficilmente utilizzabili dagli utenti.

Il successo di un sito web è determinato dall’organizzazione delle informazioni. Per


questo i sistemi organizzativi sono composti da: <<schemi organizzativi>> e <<strutture
organizzative>>.

Uno schema organizzativo definisce le caratteristiche condivise nei contenuti ed


influenza il raggruppamento logico di questi contenuti. Una struttura organizzativa
definisce i tipi di relazione tra singoli contenuti e gruppi. […] L’organizzazione è
strettamente correlata alla navigazione, denominazione e indicizzazione. Le strutture di
organizzazione gerarchica dei siti spesso costituiscono il principale sistema di navigazione.
Le denominazioni delle categorie giocano un ruolo significativo nel definire i contenuti di
quelle categorie. L’indicizzazione manuale o la marcatura dei metadati è in ultima analisi
uno strumento per organizzare i singoli contenuti in gruppi a livello estremamente
dettagliato (Morville & Rosenfeld, 2002).

Possiamo avere schemi organizzativi esatti e ambigui.

9
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

Il file system del nostro computer ci da un buon esempio di alcuni schemi esatti di
organizzazione. Quando navighiamo le cartelle del nostro hard disk possiamo ordinarne i
contenuti per nome, data di ultima modifica, tipo di file o dimensione. Un'altro buon
esempio è il client di posta elettronica. Generalmente ordiniamo le mail in entrata in base
alla data di arrivo, ma possiamo ordinarle anche per oggetto o per mittente. Nome, data,
dimensione di un file, oggetto, mittente di una mail sono schemi di ordinamento esatti,
perché sono informazioni che si basano su quantità che possono essere su scala ordinale,
come l'ordine alfabetico, o ad intervalli, come le date, o a rapporti, come la dimensione di
un file. Un altro schema esatto può essere quello geografico. La open directory
www.dmoz.org, ad esempio, presenta anche una categorizzazione per area geografica, e
dunque i siti internet dedicati alla città di Rovereto si trovano sotto il percorso

Regional > Europe > Italy > Trentino Alto Adige > Trento > Rovereto

Il vantaggio degli schemi esatti è che l'ordinamento può essere fatto automaticamente
dall'applicazione. Non è necessario, dunque, ordinare a mano le mail ricevute in base alla
data di arrivo, in quanto è il programma stesso a farlo per noi. Ma soprattutto se si conosce
la data di arrivo di un'e-mail risulta facile trovarla.

A volte, però, gli utenti si trovano in difficoltà nell'usare gli schemi esatti, in quanto le
loro conoscenze in merito a ciò che cercano non sono precise. Se, ad esempio, non ricordo
la data precisa di un'e-mail che sto cercando, né il mittente, né l'oggetto trovare quell’e-mail
in base agli schemi esatti può risultare un'impresa non facile.

In altre circostanze, poi, è l'informazione stessa che non si presta a schemi esatti, in
quanto è per sua natura ambigua. Gli schemi ambigui sono meno semplici da
implementare, ed introducono degli elementi di soggettività. Ciononostante risultano
spesso estremamente utili. C’è un semplice motivo per cui la gente trova i sistemi di
classificazione ambigui così utili: non sempre sappiamo cosa cercare (Morville &
Rosenfeld, 2002).

I responsabili delle biblioteche usano molto spesso schemi ambigui per argomento
come il Dewey Decimal. Vi sono differenti tipologie di schemi ambigui. Un corpus di
informazioni può essere classificato ad esempio per argomento, per compito, per tipologia
di utenza. Immaginiamo, ad esempio, il sito web di una facoltà universitaria. Le risorse

10
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

possono essere raggruppate per argomento, e allora potremo avere le categorie: didattica,
ricerca, servizi. Possono essere raggruppate per tipologia di utente, e allora avremo un
ingresso diverso per studenti, docenti, personale, aziende, persone interessate ad iscriversi ai
corsi di laurea e così via. Nella sezione dedicata alla didattica on line le risorse possono
essere raggruppate per argomento: consultare il programma di un insegnamento, seguire le
lezioni online, iscriversi all'esame. Naturalmente in questo caso la classificazione è soggetta
ad ambiguità e difficoltà. Dove collochiamo, ad esempio, la pagina dedicata alla biblioteca;
nella categoria Ricerca, nella categoria Didattica o nella categoria Servizi?

È proprio nella creazione di questa tipologia di schemi che diviene necessario, in fase di
design, coinvolgere gli utenti utilizzando degli strumenti di conoscenza.

11
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1.4 Strutture organizzative


Le strutture organizzative si occupano della modalità di immagazzinamento e
presentazione delle informazioni. L'adozione di appropriate strutture organizzative è
soggetta a tre fattori: il fattore tecnologico, la tipologia dei contenuti, gli aspetti di usabilità
legati alla modalità di presentazione dei dati. Rosenfeld e Morville identificano tre tipi di
strutture: gerarchiche, tabellari ed ipertestuali.

Una struttura gerarchica divide il dominio semantico della struttura informativa in


partizioni. Un tipico esempio di struttura gerarchica esatta è la tassonomia Linneana degli
esseri viventi. Su internet vi sono degli esempi estremamente celebri, le directory come
dmoz.org o Yahoo. In questo caso, però, la struttura gerarchica è di tipo ambiguo. Un esempio
di struttura a tabella è costituito dal servizio offerto da librarything.com, un sito che permette
di condividere la propria libreria, inserendo la lista dei libri che si possiede. Chi entra nella
mia libreria virtuale cliccando http://www.librarything.com troverà la lista dei miei
libri, che potrà essere ordinata per autore, per titolo, per punteggio di gradimento.

La struttura ipertestuale costituisce, invece, la più importante caratteristica distintiva del


web. Il web è, dal punto di vista dell'utente, una ragnatela di risorse testuali o multimediali
fra loro collegati attraverso dei collegamenti ipertestuali. Un sito web non è tale se non ha
collegamenti ipertestuali, in quanto questi costituiscono lo strumento universale di
navigazione all'interno del web. Anche le strutture gerarchiche e tabellari usano i
collegamenti ipertestuali per la navigazione. Vi sono però dei sistemi informativi dove i
collegamenti ipertestuali costituiscono e rappresentano la struttura. L'esempio più
importante è costituito da Wikipedia (it.wikipedia.org nella versione italiana), la più
importante enciclopedia elettronica, un progetto open source. Questo tipo di struttura è
particolarmente adatto per le conoscenze di tipo enciclopedico; ad una struttura
ipertestuale non gerarchica manca però la struttura categoriale tipica delle strutture
gerarchiche. (Bussolon)

12
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

1.4.1 Struttura organizzativo - gerarchica di Wikipedia


Nella struttura interna di Wikipedia, le categorie sono raccolte di «indici tematici»
automatizzati e strutturati in un albero che ha come singola radice la
Categoria:Enciclopedia.
Ad esempio, se scriviamo nella barra di ricerca a sinistra la parola “ornitorinco”, in
fondo alla pagina comparirà l'elenco navigabile delle categorie a cui appartiene la voce.

Figura 1. Sistema di navigazione a categorie di Wikipedia.

Le categorie diventano così il secondo metodo di navigazione legato alla voce subito
dopo i link interni, ma il loro utilizzo non è esente da controversie.

L'albero delle categorie di Wikipedia è stato pensato originariamente come uno schema
di classificazione del tipo “dove inserisco questa voce” piuttosto di “come la descrivo” per
cui ogni categoria ha nome univoco, che non è detto sia anche il più rappresentativo. La
catalogazione è però applicata in modo disomogeneo, per cui ognuno finisce per usare le
categorie che preferisce o conosce 2.

In soccorso alle carenze delle categorie giungono i template, inclusioni di codice


richiamabili all'interno di altre pagine con il nome del template racchiuso fra doppie
parentesi graffe ed eventuali parametri separati da pipe (“|”, la barra verticale), richiamati in
maniera simile alle funzioni dei linguaggi di programmazione o ai comandi via shell.

Gli utilizzi principali sono tre:

• navigazione contestuale (template di navigazione),


• messaggi (template di avviso)
• strutturazione delle informazioni (template sinottici) 3.

2
Essendo integrati semplicemente come link in un namespace differente, ad oggi è possibile
categorizzare a piacimento qualsiasi voce, e la classificazione non è sottoposta ad alcun controllo
semantico automatico prima della pubblicazione, che impedirebbe ad esempio l'inserimento della
medesima voce in più categorie collegate in linea retta.
13
Wikipedia e la classificazione gerarchico – enumerativa Dewey.

Ritornando all'esempio dell'ornitorinco, scorrendo il testo leggerò che è un piccolo


mammifero e selezionando il termine “mammifero” sarò rimandato alla relativa voce,
selezionando la data “1799” otterrò una lista delle ricorrenze di quel periodo, e così via per
tutti le Hots Words sparse nel testo che rimandano ad altri documenti collegati secondo una
logica ipertestuale.

Diversi studi hanno affrontato il problema dell'architettura dell'informazione su


Wikipedia, oltre all'acceso dibattito in seno alla comunità. Una relazione presentata a
Wikimania 2005 proponeva di aggiornare i sorprendentemente primitivi strumenti di
ricerca di Wikipedia, introducendo un sistema di collegamenti tipizzati che sia per i
collegamenti ipertestuali ciò che le categorie sono per le voci esprimendo il tipo di relazione
fra la voce da cui parte il link e quella di destinazione.

3
Sulla navigazione contestuale, cfr. Rosenfeld – Morville 2002, 116-118. I template di navigazione
forniscono una serie di link contestuali comuni ad un gruppo di voci.
14
Capitolo 2

Capitolo 2
Due schemi di classificazione a confronto
2.1 La classificazione gerarchico – enumerativa
Alla base di quasi tutte le architetture dell’informazione ben riuscite c’è una gerarchia o
tassonomia ben progettata […]. Da sempre le informazioni sono state organizzate in modo
gerarchico. Gli alberi genealogici sono gerarchici. La suddivisione di libri in capitoli,
sottocapitoli, paragrafi, frasi, parole, lettere. La gerarchia è ovunque nella nostra vita. A
causa di tale pervasività delle strutture gerarchiche, gli utenti sono in grado di comprendere
facilmente e rapidamente quei siti che utilizzano modelli organizzativi gerarchici […]
(Morville & Rosenfeld, 2002).

Nei sistemi di classificazione tradizionale (struttura gerarchico - enumerativa) ogni


elemento è classificato sotto un’unica categoria. Nella classificazione tradizionale gli
elementi hanno una collocazione corretta e univoca in uno schema ampio e
gerarchicamente profondo che può essere reso attraverso un percorso a gradini, partendo
da una categoria padre si arriva alla categoria figlio.

La struttura gerarchico - enumerativa è l’organizzazione più diffusa nel web: essa


prevede categorie-padre che contengono categorie-figlie come in un gioco di scatole cinesi.

Figura 2. Esempio di modello gerarchico semplice

15
Due schemi di classificazione a confronto

Questo approccio, che potremmo definire top-down, consente di dotarsi rapidamente di


un punto di partenza per comprendere la portata del sito senza dover attivare un processo
estensivo di rilevazione dei contenuti (Morville & Rosenfeld, 2002). Il processo top-down è
un processo deduttivo, dall’alto verso il basso, che permette di ricavare le classi di un
dominio operando raggruppamenti di dettaglio via via crescente.

Ogni giorno abbiamo a che fare con procedure simili, anche quando usiamo il computer
domestico. Se vogliamo memorizzare un file nello spazio fisico riservato ai documenti non
facciamo altro che assegnare un nome significativo, che ricordi il suo contenuto, in modo
da trovarlo facilmente in mezzo agli altri. Ma dopo qualche tempo i documenti cominciano
ad essere così numerosi che scorrerli solo per nome diventa scomodo. Per risolvere il
problema è consuetudine creare delle cartelle che ordineranno i documenti affini. In questo
modo si viene a creare una “gerarchia”, ossia per arrivare al file desiderato è necessario
compiere più passaggi (aprire la cartella giusta e scorrere i file ivi contenuti per trovare il
documento). In questo caso le cartelle rappresentano le “classi”, in cui disporre unità di
conoscenza affini. Raggruppando le singole unità in classi, siamo partiti dal basso verso
l’alto (Bottom-up), ossia abbiamo adottato un approccio a posteriori.

Nel caso in cui dobbiamo progettare uno schema è necessario farci un’idea iniziale di
quale sarà la sua struttura generale, sin dall’inizio ci immaginiamo l’insieme delle
conoscenze da organizzare e ci chiediamo come dovranno essere suddivise. In questo
modo, stiamo adottando un approccio dall'alto verso il basso (Top-down), ossia a priori.
Possiamo stabilire di suddividere i nostri oggetti secondo una prima caratteristica, per
esempio la data, quindi tutti i documenti del 2006, quelli riguardanti il 2005, e così via.
Queste saranno quindi le classi principali del nostro schema. A loro volta esse potranno
essere divise secondo un’altra caratteristica.

Stabilendo una serie di classi, sottoclassi e così via, possiamo formare un albero
gerarchico, ramificato quanto vogliamo. Con la Classificazione Decimale Dewey possiamo
contrassegnare ogni nodo dell’albero con una notazione decimale, potenzialmente
all’infinito.

16
Due schemi di classificazione a confronto

2.1.1 Le classificazioni gerarchica sul Web e la questione dell'incoerenza


L'uso più evidente sul Web dei
principi della classificazione si può
riscontrare negli indici sistematici,
cioè in quei siti che fungono da
cataloghi organizzati delle risorse
presenti on-line. Yahoo!, Virgilio, Open
Directory, Virtual Library sono tutti
esempi di questa tipologia di siti alla
quale spesso ci si riferisce anche con i
termini di “directory”, “indici
Figura 3. I primi livelli della classificazione di Yahoo! ragionati”, “indici di ricerca per
categorie”, “subject guide”, “subject gateway”. Gli indici sistematici consentono il recupero
dell'informazione attraverso la compilazione di un unico schema di classificazione
gerarchico - enumerativo e la successiva indicizzazione, sulla base di questo, delle risorse del
Web selezionate dagli indicizzatori o proposte per l'inserimento dai responsabili stessi del
sito.

Generalmente tali indici sistematici hanno ripreso dalle classificazioni bibliografiche


anche l'approccio semantico: i siti sono infatti raggruppati prevalentemente a seconda dei
loro contenuti. La directory di Yahoo! esplicita persino tale scelta: “sites organized by subject”.

Tuttavia, nonostante tale dichiarazione, l'homepage di Yahoo!


integra l'approccio strettamente per contenuti, di fatto
dominante, con principi di divisione di tutt'altra specie. Il caso
lampante è dato dalla categoria “Regional”, in cui i siti sono
raggruppati non rispetto al contenuto, ma a seconda della loro
collocazione geografica. Nel livello successivo inizia infatti una
tassonomia geografica. È evidente che lo schema di
classificazione impiegato è emblematico. Il problema di un top- Figura 4. La categoria
level realizzato in questo modo è che la violazione della regola “Regional” in Yahoo!

dell'unico fundamentum divisionis per ogni nodo della

17
Due schemi di classificazione a confronto

classificazione produce categorie non mutuamente esclusive e, quindi, uno schema


organizzativo ibrido (più principi di divisione operano contemporaneamente) che è, per sua
natura, anche incoerente. Una classificazione ancora più ibrida e incoerente si può ritrovare
nell'homepage di Open Directory.

Oltre alla categoria “Regional”, sono infatti presenti classi come “Kids and Teens”,
“World” o “Shopping”. Se un utente vuole acquistare on-line un gioco per bambini, da
quale categoria del top-level di Open Directory deve cominciare? È probabile che siano previsti
rinvii tra i vari rami di Open Directory e che quindi si riesca ugualmente ad arrivare alla
categoria desiderata partendo da tutti e quattro i top-level possibili, ma l'effetto labirinto dello
schema ibrido rimane.

È ancora aperta la questione sul Web, se impiegare un principio di divisione alla volta, o
rispettare la mutua esclusività delle categorie al fine di rendere gli schemi di classificazione
coerenti. Vizine-Goetz (1996) dimostra come la Classificazione della Library of Congress e
la Classificazione decimale Dewey prevedano una copertura di argomenti sufficientemente
ampia per classificare le risorse di Internet. Nel proporre le classificazioni bibliografiche per
il Web, i bibliotecari sono consapevoli del fatto che l'impianto tradizionale deve essere
opportunamente modificato per la sostanziale differenza tra la fisicità del libro e la virtualità
del Web. Ma le classificazioni bibliografiche classiche, in quanto enumerative e condivise,
sono di fatto strutturalmente chiuse, istituzionalizzate e centralizzate. Gli schemi
tradizionali non consentono in fase di indicizzazione l'inserimento, da parte del
classificatore, di una nuova categoria. Solo il compilatore può modificare la classificazione,
redigendo un foglio di revisione ufficiale o pubblicando un'edizione successiva dello
schema. Ciò può avvenire anche a distanza di molti anni: tempi troppo lunghi per il Web.

La soluzione per il Web, a questa chiusura, è la classificazione home-grown (creata e


mantenuta localmente da una singola istituzione), ma anche in questa classificazione, il
classificatore continua a non avere alcuna autonomia in fase di indicizzazione e il ricorso a
un compilatore che modifichi lo schema è indispensabile. Il loro impianto di base rimane
assolutamente tradizionale, quindi strettamente enumerativo, gerarchico e chiuso. Il
vantaggio sta nella maggiore rapidità dei cambiamenti, rispetto alle classificazioni

18
Due schemi di classificazione a confronto

bibliografiche condivise, ma ciò è dovuto solo alla loro natura home-grown, che permette ai
compilatori di modificare la gerarchia in qualsiasi momento.

2.2 Classificazione analitico – sintetica


Ben diverso è il caso delle classificazioni analitico - sintetiche (o a faccette), le quali
consentono un'effettiva apertura grazie a innovazioni sostanziali nel procedimento stesso di
classificazione. Tali sistemi, dichiaratamente alternativi agli schemi gerarchico - enumerativi
tradizionali, sono infatti frutto di un ripensamento radicale delle tecniche di classificazione.
Si abbandona l'idea di un'enumerazione a priori di tutte le classi a favore di una
metodologia che consente di creare le categorie "on the Fly" partendo da alcuni elementi
preventivamente decisi (faccette e foci). Si assicura finalmente anche al classificatore, in fase
di indicizzazione del materiale, la possibilità di generare le classi di cui ha bisogno. In un
sistema on-line la classificazione a faccette può essere una soluzione, potendoci affidare su
schemi flessibili e
velocemente adattabili,
in quanto effettivamente
aperto. Prima di andare
avanti diamo una
definizione più chiara e
dettagliata del concetto
di faccetta e dei relativi
foci.
Figura 5: schema a faccette

2.2.1 Il concetto di faccetta


Negli anni ’30 il bibliotecario indiano S. R. Ranganathan creò un nuovo tipo di sistema
di classificazione. Nella concezione di Ranganathan uno schema di classificazione deve
essere utilizzato non solo per realizzare un catalogo da consultare, ma anche per disporre i
volumi negli scaffali secondo un ordine adeguato, che permetta agli utenti di localizzare
direttamente quelli che trattano gli argomenti di loro interesse.

19
Due schemi di classificazione a confronto

Perciò, egli dedicò molto del suo lavoro a identificare dei principi fondanti per la
classificazione, per risolvere il problema di rappresentare le sfumature del sapere umano. In
alternativa agli schemi di classificazione già esistenti da diversi decenni, come la tradizionale
Classificazione Decimale Dewey, Ranganathan studiò un sistema meno rigido e più
articolato, che definì classificazione a faccette.

Riconoscendo problemi e limiti delle soluzioni a singola tassonomia top-down,


Ranganathan costruì il suo sistema sulla nozione che documenti ed oggetti hanno
molteplici dimensioni o facets, faccette. Il vecchio modello, che poneva la questione “dove lo
metto?”, è più strettamente legato alla nostra esperienza nel mondo fisico, un posto per
ogni cosa. Per contro, l’approccio a faccette pone la domanda, “come lo posso descrivere?”
(Morville & Rosenfeld, 2002).

La classificazione a faccette (Faceted Classification) è un metodo di classificazione


dell’informazione il cui valore distintivo consiste, appunto, nell’essere un sistema aperto e
adattivo, in grado cioè di adattarsi a una pluralità di esigenze di archiviazione e/o
interrogazione. Faccetta è un termine utilizzato da Ranganathan per denotare qualsiasi
componente di un soggetto composto, è un vocabolo comune nella lingua inglese che
significa ad esempio “aspetto”.

Considerando che l’analisi a faccette consiste nella scomposizione di un soggetto in


diverse coordinate, ciascuna delle quali esprime un aspetto, si potrebbe tradurre “faceted
classification” anche con “classificazione multidimensionale”. In questo senso, il soggetto
composto può essere immaginato come ubicato all’intersezione delle coordinate-faccette, in
uno spazio a tante dimensioni quante sono le faccette (Gnoli, Classificazione a faccette,
2004). La classificazione mediante faccette sfrutta un sistema di attributi (metadati)
mutuamente esclusivi rappresentanti ciascuno un aspetto o proprietà persistente
dell’oggetto e capaci, nel loro insieme, di descrivere esaustivamente l’oggetto stesso. Tali
attributi sono le faccette contraddistinti da alcune peculiarità:

• sono invariabili dal punto di vista semantico (ad es. la proprietà “colore” di un
oggetto può variare in termini di valori che può assumere – giallo, rosso etc. – ma è
invariabile come concetto; cioè quell’oggetto avrà sempre un colore).
20
Due schemi di classificazione a confronto

• costituiscono un insieme aperto, per cui è sempre possibile aggiungere nuove


faccette a quelle già esistenti.
• sono utilizzabili come attributi di ricerca sia singolarmente sia in combinazione.

• Tali caratteristiche rendono particolarmente efficace l’adozione di questo sistema in


ambienti digitali, per un più veloce ed efficiente ritrovamento dell’informazione.

Assodato che la classificazione a faccette non si preoccupa di collocare un oggetto in


una gerarchia, ma di descriverlo in termini di sue proprietà o caratteristiche mutuamente
esclusive, il contenuto dei documenti è analizzato in una serie di aspetti fra loro
complementari e quindi espresso per combinazione dei codici corrispondenti a ciascuna
faccetta. Poiché le tavole di uno schema a faccette devono elencare solo i possibili valori
(foci) di ogni faccetta, lasciando le loro possibili combinazioni al classificatore, esse
risultano molto più compatte di quelle di uno schema enumerativo.

Per cui le peculiarità e i vantaggi di questo metodo sono:

• pluridimensionalità: inversamente ai sistemi tradizionali, nei sistemi a faccette, ogni


oggetto è classificato secondo una pluralità di attributi.

• persistenza: tali attributi/faccette costituiscono proprietà essenziali e persistenti


dell'oggetto; in questo modo l'impatto (sullo schema di classificazione) di eventuali
cambiamenti (di nomenclatura, di workflow etc.) è fortemente ridotto o nullo.

• scalarità: è sempre possibile aggiungere una nuova faccetta descrittiva di un nuovo


aspetto dell'oggetto.

• flessibilità: esistono una pluralità di chiavi di accesso parallele (faccette); ogni


oggetto può essere reperito utilizzando un singolo attributo di ricerca (o faccetta)
alla volta, oppure più attributi insieme in combinazione.

2.2.2 Classificazione Colon


La classificazione a faccette realizzata da Ranganathan è nota come Colon Classification,
per la frequenza con cui ricorre nella sua notazione il simbolo di due punti (in inglese
"colon"). Lo schema presenta due piani separati attraverso i quali il soggetto viene
21
Due schemi di classificazione a confronto

analizzato, scisso e sintetizzato: quello verbale e quello notazionale. Il piano verbale


permette un'analisi del soggetto attraverso la sua scomposizione in categorie: ogni
fenomeno, ogni realtà, ogni modo dell'essere può essere rapportato a cinque categorie
fondamentali che permettono di individuarne l'essenza. Ranganathan scelse queste 5
categorie fondamentali:

• personalità
• materia
• energia
• spazio
• tempo

Esse possono essere immaginate come dei binari sui quali l'oggetto viene scomposto e
attraverso i quali è possibile individuare la singola manifestazione, ovvero la faccetta. Le
faccette sono dunque le molteplici espressioni della realtà, dei modi di essere, individuati
dalle categorie che a loro volta possono essere espresse da concetti elementari, gli isolati,
contenuti in quella certa area concettuale individuata dalla faccetta. (Lavazza, 2003).

Es.:
Storia delle religioni (categoria)
Storia del cristianesimo (faccetta)
Patristica (isolato)

Veniamo all'analisi delle cinque categorie.


La personalità (l’oggetto centrale di un discorso) è la più complessa e misteriosa, che
per ammissione dello stesso Ranganathan si ottiene con ciò che rimane dopo aver separato
tutte le altre faccette. Essa rappresenta l’oggetto principale considerato in quel contesto, il
contenuto centrale di un documento o di un settore, indipendentemente dalla sua natura:
non soltanto quindi una persona umana, ma qualsiasi entità anche inanimata o astratta
Il Classification Research Group (CRG) che ancora oggi continua ad approfondire la ricerca
inaugurata da Ranganathan ha preferito usare il termine entità al posto di personalità. Ad
esempio, in un testo sul trattamento in medicina dei polmoni affetti da tubercolosi con i
raggi X, alla categoria personalità corrisponderà il concetto di polmoni:

22
Due schemi di classificazione a confronto

Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X

Polmoni = personalità

La materia (i componenti e le proprietà dell’oggetto) rappresenta, più che le altre


categorie, le manifestazioni dell'oggetto nel reale; il CRG ha preferito usare il termine
proprietà ovvero le caratteristiche contingenti che quel fenomeno possiede. Nell'analisi del
soggetto essa può assumere varie caratteristiche a seconda del ruolo che riveste nella
stringa: matter material, matter property o matter method. Questi che rappresentano gli aspetti
materiali della materia, le proprietà o i mezzi possono coesistere in un'unica stringa. Sulla
base dell'esempio precedente:
Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X

Tubercolosi = materia/proprietà
Raggi X = materia/metodo

L'energia (le caratteristiche dinamiche dei processi che lo interessano), o attività secondo
il CRG, rappresenta l'azione che quel certo soggetto con quelle date caratteristiche compie.
Secondo lo stesso Ranganathan le difficoltà di focalizzazione che questa categoria presenta
potevano essere ovviate attraverso l'esperienza classificatoria: componendo ogni frase del
linguaggio naturale era possibile individuare volta per volta il concetto di energia.
Spazio (i suoi elementi geografici o spaziali).
Tempo (le sue fasi cronologiche).
Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X

Trattamento = energia

Infine abbiamo le categorie di spazio e tempo che sono le meno difficili da definire:

Medicina -- polmoni -- tubercolosi -- trattamento -- raggi X -- India


-- 1950

India = spazio
1950 = tempo

Una volta individuate le categorie del soggetto le singole faccette vengono messe in
relazione tra di loro attraverso segni d'interpunzione che rimangono anche nella sequenza
numerica:
23
Due schemi di classificazione a confronto

P = , (virgola)
M = ; (punto e virgola)
E = : (due punti)
S = . (punto)
T = . (punto)*

* In seguito nel 1959 venne sostituito dall'apostrofo (').

Sulla base del precedente esempio avremo la seguente stringa:

Medicina , polmoni : tubercolosi : trattamento ; raggi X : ricerca '


India nel 1950

La scomposizione in faccette e le loro relazioni permettono nella Colon un tipo di


indicizzazione molto specifica, con la possibilità di mettere più termini in relazione
biunivoca:

Classificazione dei libri di medicina (2;51)


Classificazione dei libri di medicina secondo la Colon (2;51 N3)
Vocali chiuse nella lingua inglese (P,111,11)
Storia dell'India fino al 1894 (V,2;1'M94)
Storia dell'India dal 1894 al 1894 (V,2;1'M92<-94)
Religione e filosofia antica (Q & R*Z)

Una volta individuate le faccette e gli isolati il soggetto analizzato viene sintetizzato
numericamente. Il piano notazionale della Colon prevede numerose tavole indicate da
lettere maiuscole e minuscole e da numeri. Si scompone la stringa individuando i settori di
interesse: per "tubercolosi" si vede la faccetta "medicina". Ecco dunque che il soggetto
presenta il seguente risultato:

medicina -- polmoni -- tubercolosi -- trattamento -- raggi X -- India -- 1950


faccetta proprietà materia
personalità energia spazio tempo
base materia metodo
L 0,45 ; 421 : 6 ; 253 . f ' N5

Il procedimento di classificazione della Colon può essere sintetizzato nello schema


seguente:

• 1: Piano verbale
o Categorie (PMEST)
o Faccette
o Isolati
24
Due schemi di classificazione a confronto

• 2: Analisi e sintesi
• 3: Piano notazionale
o Sequenza alfanumerica

In altre parole, la classificazione a faccette consiste sostanzialmente nella scomposizione


(analisi) di concetti composti nelle loro parti semplici, dette isolati. […] I diversi frammenti
vengono ricomposti (sintesi), secondo un ordine di citazione stabilito. Perciò il metodo è
detto anche analitico-sintetico. (Gnoli, 2004)

2.2.3 Ordine di citazione delle faccette


Dopo aver analizzato e scomposto il contenuto di un documento abbiamo due
prospettive: utilizzare gli isolati così come sono, limitandoci a elencarli, oppure ricombinarli
secondo un ordine significativo. Nel primo caso gli isolati funzioneranno come semplici
parole-chiave, che non vengono combinate da noi a priori, ma solo nel momento della
ricerca da parte dell'utente, quindi avremo una indicizzazione post-coordinata (soltanto nel
momento della ricerca la richiesta di più parole-chiave restringe la gamma delle possibili
risposte). Nel secondo caso, possiamo specificare sin dall'inizio che i termini sono
coordinati in un preciso rapporto sintattico, scegliamo, cioè, una pre-coordinazione, ossia si
specifica sin dall'inizio quali rapporti sussistono tra gli isolati e dobbiamo anche adottare un
ordine convenzionale.
Le ricerche di Ranganathan e del CRG hanno confermato la convenienza nell'elencare
per prima la faccetta dell'oggetto o della persona che subisce l'azione, seguita dalle sue
eventuali proprietà e specificazioni, poi dall'azione, ossia dalle faccette dei Processi e
Operazioni, quindi dai soggetti delle azioni, ossia gli Agenti, e per ultimo dal contesto
spazio-temporale. Dunque, le categorie corrispondenti alle nostre faccette devono
succedersi secondo l'ordine di citazione standard seguente:
Categorie fondamentali di Ranganathan (PMEST)
Personalità Materia Energia Spazio Tempo

Oppure adottando le 13 categorie individuate dal CRG


Categorie fondamentali del Classification Research Group
Oggetto Tipi Parte Proprietà Materiali Processi Operazioni Prodotti Sottoprodotti

25
Due schemi di classificazione a confronto

Pazienti Agenti Spazio Tempo

Secondo Ranganathan tale ordine corrisponde a una concretezza decrescente, ovvero


l'oggetto principale di interesse è la cosa più concreta, seguita dalle azioni, dagli agenti e dal
contesto spazio-temporale (PMEST). Supponendo di avere due documenti con soggetti
quasi uguali, ma in cui la faccetta del luogo non è specificata nel secondo documento; a
parità di tutto il resto il posto di tale faccetta è immediatamente prima, poiché il generico
deve precedere lo specifico. Il che significa che un soggetto composto, che consista di
termini tratti da più di una categoria, li combinerà in tale ordine. Un esempio ipotetico può
essere il seguente:
titolo documento:
Raccolta del riso in India nella stagione secca
analisi concettuale:
Agricoltura: raccolta (E): riso (P): India (S): Stagione secca (T)
categorie:
Raccolta (Operazione/Energia/azione)
Riso (Oggetto/Personalità)
India (Spazio)
Stagione (Tempo)

ordine di citazione standard:


Personalità -- Entità -- Spazio -- Tempo

stringa di citazione:
riso - raccolta - India – Stagione X
Come si può notare, non tutte le faccette vengono sempre espresse in ogni documento.
Se dovessimo avere un documento sulla raccolta del riso in genere, poiché
nell'organizzazione della conoscenza il niente equivale a generalità, secondo il principio
della gradazione della specificità, lo elencheremo prima degli altri:
riso: raccolta: India
riso: raccolta: India: stagione x
riso: raccolta: India: stagione y

26
Due schemi di classificazione a confronto

questo significa che all'interno di una singola voce (stringa) in orizzontale le proprietà
precedono le azioni, mentre elencando diverse voci, le azioni precedono le proprietà. Tale
sottile, ma importante, principio è chiamato principio di inversione.
Il contributo di Ranganathan nel campo della scienza della classificazione può essere
sintetizzato attraverso gli elementi fondamentali che caratterizzano l'impianto della Colon:

• il disegno, lo sviluppo e l'applicazione di una classificazione analitico-sintetica;


• la preoccupazione di far operare i bibliotecari in totale autonomia nei confronti
dell'oggetto e dell'approccio;
• lo sviluppo di una guida per la classificazione delle materie che prevede 5 elementi
principali, 15 postulati, 21 canoni e 20 principi;
• la partizione del lavoro di classificazione in tre piani: quello dell'idea, quello della
parola (piano verbale) e quello della notazione (piano notazionale) specificando
dipendenza ed interdipendenza fra di essi;
• lo sviluppo dell'idea di categoria, faccetta, isolato, ordine e catena;
• lo sviluppo di un sistema notazionale molto versatile composto da elementi quali il
numero del soggetto (substantive digits), il numero degli indicatori (indicator digits), gli
empty digits, gli emptying digits e gli empty-emptying digits;
• lo stabilire una struttura per lo sviluppo della teoria e della pratica della
classificazione.

Oggi la Colon è caduta in quasi totale disuso, eppure ha generato sistemi di


indicizzazione complessi e diffusi quali PRECIS e POPSI. Questi sono sistemi di
indicizzazione pre-coordinati che sfruttano il linguaggio naturale e prevedono l'uso
dell'elaboratore, e forse va ricordato a riguardo che Ranganathan fu convinto sostenitore
dei primi tabulatori elettronici. Anche se la Colon non viene più applicata i sistemi che ne
seguono la logica sono l'eredità più evidente del lavoro e dell'impegno di S. R. Ranganathan.

Malgrado sia stata accolta dagli esperti di tutto il mondo in maniera entusiasta, la Colon
classification è stata poi abbandonata ovunque in favore della Dewey. Le indubbie difficoltà
di applicazione potevano in qualche modo essere ovviate qualora il sistema si fosse rivelato
rivoluzionario, come si era preannunciato. Rispetto alla Dewey, la Colon prevedeva uno

27
Due schemi di classificazione a confronto

schema facilmente memorizzabile e lo prova il fatto che quando il direttore dell'Università


di Delhi, S. Dasgupta, sperimentò la facilità di ricerca con alcuni studenti mettendo a
confronto le due classificazioni, quella indiana vinse di gran lunga.

2.2.4 Applicare la classificazione a faccette sul Web


Un sistema on-line basato su una classificazione a faccette, in quanto effettivamente
aperto, è quindi una soluzione interessante per andare incontro alla necessità, così urgente
sul Web, di fare affidamento su schemi di classificazione flessibili e velocemente adattabili.

Non si deve però cadere nell'errore di considerare tale apertura assoluta. È infatti chiaro
che il numero di categorie potenziali previste ha un limite che, sebbene molto elevato,
rappresenta in ogni caso un vincolo nelle capacità rappresentative del sistema. Ma gli
schemi a faccette rimediano a questo problema attraverso un alto livello di scalabilità, assai
maggiore rispetto alle classificazioni gerarchico - enumerative classiche. Queste ultime sono
infatti difficilmente scalabili: l'aggiunta di una nuova categoria rende spesso necessaria la
modifica delle classi dello stesso livello (per assicurarne la mutua esclusività) e/o di una
grossa parte della struttura ad albero dello schema. La colpa di tale imperfezione delle
classificazioni gerarchico - enumerative è da imputare anche alla loro struttura gerarchica.
In uno schema ad albero tradizionale ci sono infatti forti relazioni per ogni ramo: le classi
inferiori dipendono da quelle superiori. Negli schemi a faccette è, invece, sempre possibile
aggiungere una nuova faccetta descrittiva di un nuovo aspetto dell'oggetto (Rosati, 2003) e
non si avranno ripercussioni di alcun tipo sulle altre faccette. In una classificazione analitico
- sintetica ogni faccetta è infatti autonoma dalle altre: determina una proprietà
("sfaccettatura") dell'oggetto da classificare indipendentemente dalle proprietà descritte
dalle altre faccette.

Però se il sistema può accogliere nuove faccette senza doversi “aggiustare” globalmente,
ed è quindi intrinsecamente scalabile, si ripropone tuttavia anche in questo caso, così come
per le classificazioni gerarchico - enumerative, la questione della riclassificazione. L'aggiunta
di una faccetta rende infatti necessaria la riclassificazione di tutte le entità secondo la nuova
faccetta e, quando gli oggetti già classificati sono migliaia, il lavoro non è certo di poco
conto. Tale riclassificazione assume connotati ancora più gravi persino di quelli causati nelle

28
Due schemi di classificazione a confronto

classificazioni gerarchico - enumerative: l'inserimento di una nuova categoria in uno schema


gerarchico richiede generalmente la riclassificazione solo di una zona circoscritta della
struttura ad albero. È però evidente come l'aggiunta di una faccetta abbia vantaggi di gran
lunga superiori rispetto all'inserimento o alla modifica di una o più categorie in uno schema
gerarchico. Una faccetta in più determina, infatti, un aumento esponenziale del numero
delle combinazioni possibili e, quindi, un livello di specificazione maggiore del carattere
descrittivo delle classi.

È consigliabile allora prestare sempre molta attenzione alla preliminare analisi a faccette:
tale fase è infatti di strategica importanza nello sviluppo di un sistema di classificazione
analitico - sintetico e, se compiuta con cura, evita poi problemi di riclassificazione.

Alcuni autori non parlano di “faccette”, ma di “proprietà” e di “matrici”, come per


esempio Jeffrey Veen, famoso Web designer, responsabile di Wired Digital ed esperto di
pubblicazioni elettroniche presso il W3C. Altri parlano di classificazione «orientata agli
oggetti», ma il senso è sempre lo stesso: classificare il prodotto, la notizia, l’informazione,
secondo diverse categorie, che nel complesso lo descrivono. Si tratta di una classificazione
utile per trovare l’informazione più velocemente, ma non sempre strettamente
indispensabile per la sua reperibilità. Luca Rosati (Rosati, 2003) nella classificazione dei vini,
così spesso citata per la classificazione a faccette, si immagina delle diverse categorie relative
a:

• Colore (rosso, bianco,


rosato)
• Tipo (secco, frizzante,
dolce)
• Origine (regione, stato)
• Vitigno
• Abbinamento a cibi
• Produttore
• Fascia di prezzo
È ovvio che con questa
impostazione si può cercare in
modo più rapido e preciso, ma
29
Due schemi di classificazione a confronto

anche una navigazione per approfondimenti (scegliendo prima il colore, poi il tipo, poi
l’origine e così via) consente comunque all’utente di trovare il prodotto, anche se con più
fatica e in modo non ottimale, rispetto alle sue esigenze, che potrebbero, per esempio, voler
privilegiare il prezzo come punto di inizio della ricerca. In altri casi, la classificazione a
faccette è l’unico modo per rendere disponibile l’informazione a diverse categorie di utenti.

2.2.5 Architettura a faccette in un sito Web


La classificazione multidimensionale a faccette è attualmente un metodo da tenere in
considerazione, in quanto consente la coesistenza di logiche di ricerca diverse, livelli diversi
di competenza dell’utente, motivazioni diverse, senza sacrificare troppo le esigenze di
nessuno.

Il prezzo da pagare per un’architettura a faccette è rinunciare all’immagine tradizionale


della struttura e della navigazione del sito. La mappa del sito semplicemente non esiste più,
perché la struttura del sito non è più tassonomica, cioè gerarchica. I menu e relativi
sottomenu possono esserci o meno e più che navigare in senso tradizionale, si effettuano
delle ricerche. L’interfaccia di un sito con classificazione a faccette richiede grande
precisione, grande attenzione all’usabilità ed estremo rigore. La decisione di fondo da
prendere è se privilegiare una delle faccette e basare la tassonomia su quella, offrendo la
possibilità di ricercare le informazioni anche in altro modo. Ciascuna informazione verrà
categorizzata secondo tutti i parametri che possono essere
attinenti e verrà successivamente estratta sulla base della
ricerca dell’utente (Sofia Postai, 2004). Sinora siti di questo
tipo sono perlopiù dedicati all’e-commerce, come per
esempio wine.com (www.wine.com/search/default.asp) o
Yoox (www.yoox.com). In questi casi la classificazione a
faccette e la relativa ricerca tramite selezione di parametri
multipli ha lo scopo di affinare la query e ridurre il numero di
articoli trovati. Yoox (figura 8) ha centinaia di migliaia di
articoli di capi di abbigliamento e l’unica maniera per non
disorientare l’utente con un numero di pagine esagerato è di
Figura 6: Menu a faccette del
sito Wine.com fargli scegliere la firma, la tipologia e magari anche la taglia.
30
Due schemi di classificazione a confronto

Anche il sito Elastic lists (figura 8) rende il principio di navigazione e di lettura molto rapido,
migliora la presentazione delle informazioni riguardo ai primi Nobel.

Figura 7: Schermata di “Elastic List Demo”: classificazione a faccette dei premi Nobel

Il freno a questi tipi di approccio è la difficoltà a


immaginare interfacce adeguate a rendere facile la ricerca
anche da parte di un pubblico non particolarmente evoluto.
In altre parole: i responsabili non sentono l’esigenza di
affrontare questo investimento (la classificazione costa)
proprio perché non riescono a immaginare come potrebbe
poi l’utente sfruttarla con vantaggio. In realtà è solo un
Figura 8: Yoox: classificazione problema di progettazione d’interfaccia, che sarà abbastanza
multidimensionale per categorie diversa dall’abituale navigazione.

31
Due schemi di classificazione a confronto

2.3 Classificazione a Faccette vs. Classificazione Tradizionale


Nei sistemi di classificazione tradizionali (detti
anche tassonomie tradizionali o sistemi
enumerativi), ogni elemento è classificato sotto
una e una sola categoria. Esso possiede una
corretta e univoca collocazione all’interno di un
unico schema, ampio e gerarchicamente molto
profondo, e può essere ritrovato attraverso un
percorso a gradini categoria padre > categoria
figlio. Ne sono un esempio il sistema di Linneo
Figura 9. Sistema di Linneo (figura 9), il sistema decimale Dewey e quello
della Library of Congress (va tuttavia osservato che i sistemi Dewey e Library of Congress,
dopo il 1960 sulla scorta dell’influenza di Ranganathan furono ritoccati, accogliendo, se
pure limitatamente, parte della logica delle faccette). Un sistema di questo tipo è quindi
monodimensionale (il criterio di catalogazione è unico), e molto esteso in verticale
(essenzialmente, titolo, soggetto, autore). Essi costituiscono una sorta di ‘recipienti’ chiusi,
disposti in sequenza, e concepiti in forma di matriosca.

Alla verticalità dei sistemi di catalogazione tradizionali, e alla loro rigidità, la


classificazione a faccette contrappone un sistema di classi (faccette) orizzontale e aperto
(laddove ciascuna faccetta è descrittiva di una proprietà o aspetto dell’oggetto).

Le applicazioni basate su sistemi di classificazione a faccette hanno dimostrato di essere


molto più veloci da consultare e di garantire percentuali più alte di successo rispetto a
quelle più tradizionali. I vantaggi di una classificazione a faccette dipendono dalle
caratteristiche già indicate precedentemente con le etichette di pluridimensionalità,
persistenza, scalarità e flessibilità. Phil Murray nel suo Faceted Classification of Information (Phil
Murray, 2002) sintetizza così i vantaggi della adozione di un sistema di classificazione a
faccette per la gestione della conoscenza aziendale:

32
Due schemi di classificazione a confronto

• pur non conoscendo il nome o la collocazione di un oggetto, è possibile


nondimeno renderlo comprensibile e raggiungerlo, descrivendolo attraverso un
insieme di categorie (faccette) mutuamente esclusive;
• possibilità di aggiungere nuove faccette a quelle già stabilite in una fase
precedente (carattere aperto del sistema);
• possibilità di combinare fra loro i valori delle diverse faccette o per fornire una
descrizione più precisa dell’oggetto o per limitare i risultati di una ricerca o per
descrivere relazioni esistenti fra vari oggetti (rappresentazione della conoscenza
contenuta nel sistema).
Per esemplificare meglio tale differenza di impostazione vediamo in pratica come le due
classificazioni, Colon e Dewey, affrontano lo stesso argomento.

Esempio:
Possiamo riportare come esempio un documento sulla prevenzione del virus della pianta
del riso in Giappone nel 1970.

Secondo la Colon classification l'impostazione è questa:

Agricoltura -- prevenzione -- malattia -- pianta -- Giappone -- 1970


da virus di riso
J , 381 ; 421 : 5 . 42 , NT

risultato: J,381;421:5.42,NT

Secondo la Dewey classification l'impostazione è:

630 agricoltura e tecnologie ammesse


633 colture da pieno campo
18 riso
189 danni e malattie da infestazioni
8 virosi e rickettosi
09 (storia e geografia del soggetto)
52 Giappone
09 (storia e geografia del soggetto)
046 tra il 1960 e il 1969

risultato: 633.189 809 520 904 6

33
Due schemi di classificazione a confronto

Come si è potuto notare la sequenza alfanumerica delle due stringhe presenta la stessa
forma rappresentativa insita nella logica delle due differenti classificazioni: la Dewey appare
il prodotto di una elencazione/enumerazione, la Colon come una frase scomponibile
frutto di una sintesi analitica.

Figura 10. Confronto tra i due tipi di classificazione

34
Capitolo 3

Capitolo 3
Il caso studio: WikiArte e la classificazione a faccette.
3.1 Lo stato dell'arte
Con la locuzione stato dell'arte si intende il più alto livello di sviluppo finora raggiunto
da una tecnologia o un campo scientifico, sinonimo de “all'avanguardia”, “dell'ultima
generazione”. Il fine del progetto è quello di realizzare un enciclopedia sull'arte, avvalendosi
di strumenti, come il software libero Mediawiki 4, messo a disposizione dalla “Wikimedia
foundation 5”, permettendo di ridurre i tempi di lavoro.

Un wiki è un sito web (o comunque una collezione di documenti ipertestuali) che viene
aggiornato dai suoi utilizzatori e i cui contenuti sono sviluppati in collaborazione da tutti
coloro che vi hanno accesso. La modifica dei contenuti è aperta, nel senso che il testo può
essere modificato da tutti gli utenti (a volte soltanto se registrati, altre volte anche anonimi)
procedendo non solo per aggiunte, ma anche cambiando e cancellando ciò che hanno
scritto gli autori precedenti. Ogni modifica è registrata in una cronologia che permette in
caso di necessità di riportare il testo alla versione precedente; lo scopo è quello di
condividere, scambiare, immagazzinare e ottimizzare la conoscenza in modo collaborativo.

Spesso sul Web ci si avvale di sistemi automatici di gestione dei contenuti per rendere
più semplice la realizzazione di un sito e la manutenzione dei sui documenti. Questo
strumento software non è altro che un CMS (content management system).

Letteralmente l'acronimo significa “sistema di amministrazione dei contenuti”, un


software studiato per facilitare la gestione dei contenuti di siti web, svincolando
l'amministratore da conoscenze tecniche di programmazione web. Esistono CMS
specializzati, cioè appositamente progettati per un tipo preciso di contenuti
(un'enciclopedia on-line, un blog, un forum, ecc.) e CMS generici, che tendono ad essere
più flessibili per consentire la pubblicazione di diversi tipi di contenuti.

Tecnicamente un CMS si appoggia su un database per la gestione dei contenuti ed è


suddiviso in due parti: la sezione di amministrazione (back end), che serve ad organizzare e

4
http://www.mediawiki.org/wiki/MediaWiki
5
http://wikimediafoundation.org/wiki/Home
35
Il caso studio: WikiArte e la classificazione a faccette.

supervisionare la produzione dei contenuti, e la sezione applicativa (front end), che l'utente
web usa per fruire dei contenuti e delle applicazioni del sito. Date queste caratteristiche
comuni Mediawiki può essere considerato un CMS.

L'organizzazione alfabetica dei contenuti dell'enciclopedia in Wikipedia fa spazio ad una


fitta rete ipertestuale accessibile e modificabile sul World Wide Web, mentre i riferimenti a
testi interni ed esterni all'ipertesto assumono la forma di altrettanti collegamenti
ipertestuali. Se ciò non introduce alcuna innovazione rivoluzionaria alle tecnologie
assimilabili, che sono state già utilizzate nelle enciclopedie digitali su disco e da altre
enciclopedie disponibili su Internet, è il metodo usato da Wikipedia per produrre e gestire
le voci enciclopediche a meritare maggiore attenzione.

36
Il caso studio: WikiArte e la classificazione a faccette.

3.1.1 Strutturare i dati con Mediawiki

Figura 11: Screenshot schermata principale WikiArte


Facendo uso del software open source messo a disposizione dalla Wikimedia Foundation,
abbiamo realizzato “WikiArte”, un enciclopedia libera finalizzata alla raccolta di tutte le
informazioni, dati, documenti che riguardano il Patrimonio artistico-culturale, nel caso
specifico: il Futurismo. Una volta creati, i Wiki sono un mezzo completamente ipertestuale,
con una struttura di navigazione non lineare. Tipicamente ogni pagina contiene un gran
numero di link ad altre pagine; nei wiki di dimensioni notevoli esiste comunque una
navigazione gerarchica, ma non deve essere necessariamente usata. I collegamenti vengono
creati usando una sintassi particolare, la cosiddetta “link pattern”. Solitamente in un wiki le
nuove pagine sono create semplicemente inserendo il link appropriato partendo da una
pagina che tratta un argomento correlato. Se la pagina non esiste, il link è evidenziato
normalmente come rosso (broken link). Cercando di seguire questo link viene aperta una
finestra di modifica, che permette all'utente di inserire il testo della nuova pagina. Una volta
create le pagine che ospiteranno i contenuti dell'enciclopedia è possibile collegarle con i
link, come se si trattasse di una maglia reticolare. Questo crea una struttura flessibile,

37
Il caso studio: WikiArte e la classificazione a faccette.

potenzialmente infinita, che permette all'utente di aggiungere, di volta in volta, pagine e


documenti nuovi.

WikiArte offre una ricerca per


titolo, e spesso è presente anche
una ricerca full text che analizza il
Figura 12: Barra di ricerca di WikiArte
testo dei contenuti. La scalabilità
della ricerca dipende dall'utilizzo o meno di un database per i contenuti: un accesso a un
database indicizzato è indispensabile per ottenere ricerche rapide su wiki di grandi
dimensioni. Su Wikipedia, il cosiddetto pulsante "Vai" permette al lettore di visualizzare
direttamente la pagina che si avvicina il più possibile ai criteri della ricerca. Ma il limite, in
qualche modo, di WikiArte e quindi di Wikipedia sta proprio in questo, nella modalità di
ricerca e indicizzazione dei dati. Nel momento in cui l'utente immette una parola-chiave
nell'apposita casella e clicca per cercare il documento, il motore di ricerca su cui è fondato
Mediawiki riporterà non la singola pagina che desideriamo ma tutte le occorrenze e pagine
in cui compare la parola-chiave.

Figura 13: tutte le corrispondenze trovate dopo la ricerca.

38
Il caso studio: WikiArte e la classificazione a faccette.

Questo tipo di navigazione non agevola la ricerca nel momento in cui si vuole
consultare un documento in particolare, poiché costringe l'utente a scorrere tutti i risultati
sino a trovare quello giusto. Volendo fare un esempio pratico su WikiArte, alla luce di
quello che è stato detto, possiamo cercare tutte le opere di Marinetti che fanno parte di
“Parole in libertà”. In questo caso non basta digitare la stringa “parole+libertà+marinetti”,
poiché il software troverà tutte le pagine che contengono i termini su citati non
consentendo una ricerca mirata e minuziosa delle opere in questione, ossia Dune (parole in
libertà, 1914), Zang Tumb Tumb (Adrianopoli ottobre 1912. Parole in libertà), ecc...
Per un ritrovamento veloce ed efficiente del documento gli architetti dell'informazione
prediligono la classificazione a faccette per le caratteristiche già discusse. Per tale motivo, al
fine di estendere le potenzialità di WikiArte e
permettere più interrogazioni possibili, risulta
utile adottare una struttura multidimensionale.
L’architettura a faccette offre a tutti uno
strumento adeguato al reperimento
dell’informazione in un sito Web. Classificare il
prodotto, la notizia, secondo diverse categorie,
che nel complesso lo descrivono è utile per
Figura 14: Struttura multidimensionale trovare l’informazione più velocemente.
Probabilmente la classificazione a faccette è, al
momento, un metodo da tenere in considerazione in quanto consente la coesistenza di
diverse logiche di ricerca, diversi livelli di competenza e motivazioni dell'utente, senza
sacrificare le esigenze di nessuno.

Se si applica una navigazione multidimensionale all'architettura di WikiArte si dà


all'utente la possibilità di accedere, sulla base di diversi bisogni informativi, da più parti;
soddisfare varie esigenze senza troppi click; portando avanti una classificazione coerente,
intuitiva e autoesplicativa.

39
Il caso studio: WikiArte e la classificazione a faccette.

3.2 Usare una struttura a faccette come sistema di ricerca e navigazione

Figura 15: risultati della ricerca dopo la selezione di alcuni criteri

Ai fini del progetto, gli esempi esplicativi sono applicati al solo movimento del
Futurismo, poiché come avanguardia ha abbracciato più discipline, dalla Letteratura
all'Architettura, con un corollario di artisti poliedrici che ci permettono di rivolgere il
progetto a tutto il Patrimonio artistico-culturale. Nella figura 15 viene presentata la logica
multidimensionale delle faccette, in cui ogni elemento è associato ad una serie di
caratteristiche che lo identificano da vari punti di vista. In questo caso in particolare, sono
state selezionate due faccette che hanno raffinato la ricerca, ottenendo come risultato solo
gli oggetti che corrispondono a quelle proprietà.

Quindi, seguendo la logica multidimensionale, ogni blocco informativo può essere


identificato con una faccetta, in modo da soddisfare un'esigenza di ricerca dell'utente. Le
faccette, se prese singolarmente o combinate, possono aiutare chi cerca la stessa
informazione partendo da motivazioni diverse. Il sistema prevede, quindi, la possibilità di
percorsi multipli sulla base dei diversi bisogni informativi e delle differenti tipologie di

40
Il caso studio: WikiArte e la classificazione a faccette.

utenti. Il vantaggio consiste nel poter incrociare facilmente più caratteristiche dello stesso
oggetto, ottenendo risultati mirati e soddisfacenti. L'utente può intraprendere percorsi
diversi per arrivare al medesimo risultato.

Figura 16: Schema concettuale di ricerca del documento in un sistema di


navigazione faccette

Questa struttura multidimensionale rende lo stile di navigazione interattivo, dal


momento che l'utente filtra un insieme di articoli, selezionandoli progressivamente solo da
una serie di valori di un sistema di classificazione. La figura 16 mostra lo schema
concettuale di una navigazione a faccette, in cui è possibile effettuare un primo filtraggio
degli articoli per ottenere un sottoinsieme dei documenti, seguito da altre fasi di filtraggio,
se occorre, per affinare la ricerca ed arrivare al documento desiderato. Il lato positivo
consiste nello sviluppare un'interfaccia di ricerca innovatrice, che permette agli utenti non
esperti di muoversi attraverso i grandi spazi informativi in modo flessibile, senza cadere nel
labirinto dell'architettura.

41
Il caso studio: WikiArte e la classificazione a faccette.

3.3 Usare le faccette per l'architettura dell'informazione di WikiArte


Al fine di rendere il processo di organizzazione della conoscenza meno casuale e più
maneggevole, si è cercato di strutturare l'architettura dell'enciclopedia sull'arte (figura 17)
mediante il software “Flamenco”, progettato dall'Università di Berkeley.

Figura 17: Mappa concettuale dell'architettura dell'informazione

La figura 17 illustra la mappa concettuale dell'architettura del progetto, vale a dire,


l'integrazione di due database, quello di Wikiarte e quello di Flamenco, per la formazione di
un'unica Knowledge organization, che permetterà la ricerca dei documenti sia in modo
42
Il caso studio: WikiArte e la classificazione a faccette.

generico che multidimensionale (a faccette); il documento ricavato dalla navigazione a


faccette ci rimanderà ad una pagina wiki, appositamente creata, contenente tutte le
informazioni desiderate.

Flamenco (FLexible information Access using MEtadata in Novel Combinations) è un


progetto curato dall'Università di Berkeley, scritto in Python 6, che consiste in un motore di
ricerca e directory organizzati con il criterio delle faccette, disponibile open source con
licenza BSD7. E’ uno strumento concepito per guidare gli utenti attraverso la vastità delle
architetture delle informazioni presenti sul web. L'interfaccia guida i suoi esploratori
attraverso categorie di scelta e parole chiave in un'organizzazione strutturale fondata sul
meta-dato. Consente quindi un'amplificazione delle tradizionali pratiche di catalogazione
bibliografica in ambiente elettronico.

Come si può osservare nella figura 18 la


directory di link si presenta graficamente
simile a quella di Yahoo o Google dando
l’impressione che ogni riquadro colorato
sia l’insieme di oggetti diversi. In realtà la
logica della directory è molto diversa:
ciascun ramo rappresenta un percorso di
accesso alternativo alla stessa collezione
di documenti, ma parallelo agli altri; ogni
riquadro è quindi una faccetta della
medesima collezione, rappresentato
Figura 18: Interfaccia per la ricerca di informazioni in
Flamenco visivamente con un colore diverso.

6
Python è un linguaggio di programmazione ad alto livello, orientato agli oggetti, adatto, tra gli altri
usi, per sviluppare applicazioni distribuite, scripting, computazione numerica e system testing.
Python è spesso paragonato a Tcl, Perl, Java, JavaScript, Visual Basic o Scheme[1]. Ideato da Guido
van Rossum all'inizio degli anni novanta. Sito ufficiale: http://www.python.org/
7
Le licenze BSD sono una famiglia di licenze permissive per software. Molte sono considerate libere
ed open source. Il loro nome deriva dal fatto che la licenza BSD originale (detta anche licenza BSD
con 4 clausole) fu usata originariamente per distribuire il sistema operativo Unix Berkeley Software
Distribution (BSD), una revisione libera di UNIX sviluppata presso l'Università di Berkeley.
43
Il caso studio: WikiArte e la classificazione a faccette.

E’ necessario notare che le faccette rappresentano non tanto un contenitore dei dati a
nostra disposizione ma un loro descrittore semantico (proprietà o aspetto dei dati stessi). E’
possibile effettuare, sfogliando la directory, una selezione progressiva, in pratica un
filtraggio. Una volta operata una prima selezione è sempre possibile raffinare ulteriormente
la ricerca all'interno del sottoinsieme estratto utilizzando le altre faccette che vengono
sempre ripresentate assieme ai risultati.

Figura 19: Home page Flamenco Fine Arts: Fine Arts Museums of San Francisco

Inoltre, per ogni insieme di risultati vengono specificate le sue coordinate semantiche
rispetto a tutte le faccette del sistema: oltre a mostrare l’insieme dei risultati, Flamenco
rende visibile la collocazione di tali risultati rispetto alle varie faccette. Quando si opera una
ricerca diretta, esso non esegue una semplice ricerca full-text, ma si appoggia al sistema di
classificazione a faccette per estrarre i risultati. L’utente, impiegando in modo combinato e
complementare searching e browsing, può:

• scegliere se cercare un’informazione mediante ricerca diretta o sfogliando una


directory;
• raffinare o espandere i risultati della propria ricerca;
• esplorare risorse correlate in maniera semantica a quelle trovate;
• scegliere punti di vista alternativi in ogni momento.

44
Il caso studio: WikiArte e la classificazione a faccette.

Per la costruzione effettiva del sistema di classificazione possiamo individuare i seguenti


criteri fondamentali:

1. raccolta di un campione sufficientemente rappresentativo del dominio che si


intende classificare;
2. isolamento dei concetti o delle proprietà costitutive di ciascun oggetto;
3. individuazione dei termini più appropriati per descriverli ed elencarli in una lista;
4. definizione delle faccette e dei relativi foci sulla base della lista.

William Denton sostiene questi principi:

• differenziazione: quando dividiamo un'entità nelle sue componenti, è importante


utilizzare criteri di divisione (ossia faccette) capaci di distinguere chiaramente le
componenti stesse;
• rilevanza: quando scegliamo le faccette attraverso cui dividere le entità, è
importante assicurarsi che tali faccette riflettano lo scopo, l'argomento
(soggetto) e l'ambito del sistema di classificazione;
• certezza: è importante scegliere faccette ben definite e che possono essere
accertate con facilità;
• permanenza: le faccette dovrebbero rappresentare qualità permanenti
dell'oggetto da classificare;
• omogeneità: le faccette dovrebbero essere omogenee;
• mutua esclusione: le faccette devono essere mutuamente esclusive, poiché
ognuna deve rappresentare soltanto un criterio di divisione.

Bisogna sempre tenere presente lo scopo della classificazione e il target a cui ci si


riferisce, ossia chi la utilizzerà. Per un sistema di classificazione funzionale è indispensabile
una buona notazione, al fine di garantire un ordine di citazione conveniente. La notazione
non è utile solo in uno spazio fisico (biblioteche) per il collocamento o il reperimento di un
oggetto, ma anche in contesti digitali. Infatti, una corretta notazione è in grado di garantire
una presentazione delle risorse secondo un ordine conveniente (dal generale al particolare,
come stabilito dalla teoria della classificazione), più efficace del semplice criterio alfabetico
o cronologico.

45
Il caso studio: WikiArte e la classificazione a faccette.

Conviene sempre eseguire dei test con utenti per controllare la coerenza dello schema
architetturale, la sua chiarezza, le etichette scelte per faccette e foci. Inoltre, è opportuno
tenere aggiornato lo schema, affinché sia possibile rispondere a eventuali difetti che il
comportamento degli utenti può manifestare, adeguare la terminologia al cambiamento o
alle nuove esigenze e adattare lo schema per l'introduzione di nuovi elementi non previsti al
momento della costruzione.

Riferendoci al modello di Ranganathan a 5 categorie fondamentali e a quello del CRG a


13 categorie, potremmo abbozzare uno schema di questo tipo:

5 Categorie di
13 Categorie del CRG Faccette
Ranganathan
Oggetti Manufatti
Personalità
Tipi

Parti Temi, Soggetti e Generi


Materia Proprietà

Materiale Materiale
Processi Stile e Movimento
Energia
Operazioni Discipline
Prodotto

Sottoprodotto

Pazienti

Agenti Realizzatori
Spazio Spazio Luoghi
Tempo Tempo Periodo
Questo può essere un buon punto di partenza per riflettere su come realizzare una
classificazione a faccette, le quali possono essere rinominate e riadattate per ogni
circostanza particolare.

I criteri adottati per la definizione di queste faccette sono legati all'usabilità di un sito
Web, ossia dare la possibilità ai visitatori d'interrogare il sistema e ricevere delle risposte
sensate e veloci, senza rimanere intrappolati nel labirinto della rete. Il punto di partenza è
46
Il caso studio: WikiArte e la classificazione a faccette.

stato quello di ideare un sistema centrato sull'utente. Poiché il Web e le faccette si fondono
bene insieme, è necessario mostrare all'utente una lista di faccette sotto forma di menù da
cui selezionare e scegliere ciò che gli interessa maggiormente. Tali faccette rappresentano
un descrittore semantico delle proprietà o degli aspetti dei dati immagazzinati, che
agevolano l'operazione di ricerca dell'utente rendendola mirata ed efficace.
William Denton (2003) affermò che:

“[...]The user can make quick choices, thinking, "I'd like to see something
with that, and that, and a bit of that, and I don't care about the rest,[...]”

In un Portale Web, che racchiude un enciclopedia sull'arte, è importante pensare ad un


metodo di ricerca intuitivo, con parole-chiave che permettono il facile reperimento dei
documenti per un ampio spettro di utenza, anche per chi non conosce la terminologia del
settore. L'utente può operare delle scelte rapide senza preoccuparsi del resto, rendendo la
navigazione e la ricerca particolarmente mirata.

Il sistema di navigazione comprende un totale di otto faccette, precedentemente citate,


che definiscono un opera d'arte in tutte le sue proprietà, a partire dal tipo di manufatto, il
materiale, da chi è stato realizzato, dove e quando. Naturalmente a completare le faccette vi
sono i relativi foci e sottocategorie (dove necessario), che permettono di approfondire con
accuratezza la ricerca.

Di seguito, la tabella 1 riporta le faccette con la relativa definizione e alcuni dei propri
foci (in Appendice viene riportato il file di riferimento di ogni faccetta con la lista completa
dei foci).

47
Il caso studio: WikiArte e la classificazione a faccette.

Faccette Definizione Foci

La faccetta “Manufatti” si Affresco, Ceramica, Dipinto,


riferisce a tutte le entità che Disegno, Fotografia,
Manufatti sono state riconosciute come Installazione, Libro, Murale,
bene artistico-culturale. Mosaico, Rilievo, Scultura,
Stampa,Video

La faccetta “Temi, Soggetti e Amore, Bellezza,


Generi” si riferisce alle Dinamismo, Dolore, Donna,
Tematiche affrontate nei Elettricità, Forza, Gioia,
Temi Soggetti e Generi
secoli dagli artisti, i soggetti Macchina, Musica...
rappresentati e i Generi
dell'arte.

La faccetta “Materiali” si Argilla, Avorio, Bronzo,


riferisce a ciò che compone il Carta, Cartone, Ceramica,
manufatto. La maggior parte Ferro, Gesso, Inchiostro,
dei termini raggruppati in Legno, Marmo, Pietra,
Materiali
questa faccetta Plastica, Sabbia, Seta, Stoffa,
rappresentano il materiale Tavola, Tela, Terracotta,
basato sulla loro Vetro...
composizione.

La faccetta “Stile e Art Deco, Art Nouveau,


Movimenti” fornisce i nomi Barocco, Bauhaus, Blaue
dei vari stili e movimenti Reiter, Classicismo,
dell'architettura e dell'arte; Cubismo, Cubismo, orfico,
gruppi e scuole che sono Dada, Dadaismo,
Stile e Movimenti
stati rappresentati nel lavoro Decadentismo,
di classificazione. Divisionismo,
Espressionismo,
Espressionismo astratto,
Fauvismo, Futurismo...

La faccetta “Discipline” Scultura, Pittura, Letteratura,


contiene i principali ambiti Architettura, Musica,
disciplinari che l'arte Cinema, Teatro, Danza,
Discipline abbraccia, sottolineando Giornalismo, Videoarte,
l'appartenenza di un Medicina, Grafica
manufatto alla Letteratura o pubblicitaria
alla Pittura, ecc.

Realizzatori La faccetta “Realizzatori” si Paolo Buzzi Aldo


riferisce all'entità che crea o Palazzeschi, Giuseppe
produce l'oggetto o il lavoro. Carrieri, Auro D'alba,

48
Il caso studio: WikiArte e la classificazione a faccette.

Francesco Cangiullo,
Giovanni Papini, Carlo
Belloli, Carlo Dalmazzo
Carrà, Federico De Maria,
Piero Bellanova, Ardengo
Soffici, Filippo Tommaso
Marinetti, Fortunato Depero

La faccetta “Luoghi” Africa, Asia, America,


contiene il nome dei Europa, Oceania...
continenti, delle regioni, dei
Luoghi
paesi e delle province
generali in cui l'oggetto è
stato creato.

La faccetta “Periodi” elenca i Dal 1900 al 2010


diversi periodi storici,
Periodi
raggruppati in secoli e
decadi.

Tabella 1: Tabella di definizione delle faccette e dei foci.

3.4 Preparare la collezione di dati per Flamenco


Per fare in modo che Flamenco carichi la vostra collezione di dati, i metadati relativi alla
raccolta devono essere forniti in file delimitati da tabulazioni (noto anche come file TSV,
con estensione “.tsv”). I file TSV possono essere facilmente manipolati utilizzando un
semplice editor di testo. Una raccolta, in Flamenco, consiste in un set di articoli tutti dello
stesso tipo (per esempio, tutti gli elementi sono libri, o tutti gli elementi sono canzoni, e
così via). Il metadato di un
qualsiasi articolo consiste nei
valori delle faccette e i valori
degli attributi. Il primo passo
per preparare la collezione è
quello di decidere quali
informazioni saranno nelle
faccette e quali negli attributi. I
valori delle faccette vengono
Figura 20: Faccette utilizzati per organizzare gli

49
Il caso studio: WikiArte e la classificazione a faccette.

elementi in categorie, mentre i valori degli attributi sono visualizzati solo con i singoli
elementi.

Per esempio, nella nostra collezione “Manufatti” è la faccetta che indica il tipo di oggetto,
(bene artistico) che è stato raccolto, mentre “titolo” è l'attributo per il titolo del manufatto.
Questo perché, ha senso raggruppare i manufatti in categorie in base al tipo di oggetto, ma
non per il suo titolo.

Figura 21: valori degli Attributi


I valori delle faccette sono associati a numeri ID, mentre i valori degli attributi sono
stringhe.

I file TSV che bisogna fornire sono:

• attrs.tsv
• facets.tsv
• items.tsv
• facet_terms.tsv (per ogni faccetta)
• facet_map.tsv (per ogni faccetta)

50
Il caso studio: WikiArte e la classificazione a faccette.

Il file attrs.tsv racchiude la lista degli attributi. Ogni linea rappresenta un attributo.

Campo 1 Campo 2
attribute identifier displayable name

Il campo attribute identifier deve essere un nome corto e univoco che contiene solo
lettere e “_” (no spazi o punteggiatura) mentre displayable name è ciò che viene
visualizzato dall’utente.
Il file facets.tsv contiene la lista delle faccette. Il campo facet identifier deve essere un
nome corto e univoco (anche rispetto agli attributi) che contiene solo lettere o underscores ,
displayable name è ciò che viene visualizzato dall’interfaccia utente e long description

fornisce una descrizione dettagliata della faccetta.

Campo 1 Campo 2 Campo 3


facet identifier displayable name long description

Il file items.tsv fornisce ID e attributi per tutti gli oggetti.

Campo 1 Campo 2 Campo 3 ... Campo n + 1


item Value for Value for ... Value for
identifier attribute 1 attribute 1 attribute n

Ogni oggetto ha un suo ID univoco che può essere una stringa o un numero. Il campo item
identifier è seguito dai valori degli attributi per l’oggetto nell’ordine in cui gli attributi sono
inseriti nel file attrs.tsv.

Il file facet_terms.tsv ( dove facet è il “facet identifier” specificato nella prima


colonna di facet.tsv) fornisce, per ogni faccetta, l’albero dei termini delle categorie nella
faccetta.

Campo 1 Campo 2 ... Campo d - 1 Campo d Campo d + 1

term grandparent
top-level term ... parent term category term
identifier term

E’ l’unico file che, in ogni riga, può avere un diverso numero di campi. Ogni linea
rappresenta una categoria e fornisce l’intera catena di categorie “padre”. Il campo term
identfer deve essere un numero univoco all’interno della faccetta.
51
Il caso studio: WikiArte e la classificazione a faccette.

Il file facet_map.tsv collega, per ogni faccetta, gli oggetti ai termini della categoria. Ogni
linea in questo file ha 2 campi:

Campo 1 Campo 2
item identifier term identifier

Il Campo 1 contiene l'ID del file item.tsv il Campo 2 contiene l'ID del file facet_terms.tsv.

52
Conclusioni

Conclusioni
Lungi da voler intraprendere una classificazione di tutto il Patrimonio Artistico-culturale,
il progetto vuole dimostrare la possibilità e l'efficacia di acquisire informazioni da fonti
strutturate e non strutturate e presentarli all'utente in forma semplice e facilmente
consultabile.

I risultati vengono infatti raggruppati per categorie e visualizzati con il sistema “a


faccette”, che permette di raffinare la ricerca secondo la direzione voluta, avendo, al
contempo, una visione d'insieme delle informazioni disponibili.

Il lavoro è stato svolto su due fronti :

• La realizzazione di un enciclopedia Wiki sul mondo dell'arte, con particolare


attenzione al movimento del Futurismo, per dare struttura all'informazione non
strutturata, ma semplicemente archiviata in un database.
• la pubblicazione sul web di un ambiente con interfaccia a faccette, realizzato
grazie al software Flamenco.

Tutti i vantaggi di una classificazione a faccette possono essere realizzati in pieno sul
web, a partire dal lavoro dei designer ed architetti dell'informazione che possono affidarsi
ad un sistema aperto, facilmente scalabile e flessibile; sino ad arrivare al miglioramento
sensibile dell'esperienza dell'utente in diverse situazioni di navigazione e ricerca. Gli utenti
possono iniziare la ricerca dalla faccetta che interessa maggiormente. Ognuno può trovare i
documenti che rispondono alla caratteristica selezionata, senza l'obbligo di effettuare un
unico percorso che parta da una faccetta specifica e senza dover controllare diverse sotto
categorie. Infatti, il sistema garantisce una pluralità di accessi, modalità di ricerca e
navigazione differenti, che rispondono ai bisogni informativi dei vari utenti, permettendo la
coesistenza di diversi livelli di competenza e migliorando la reperibilità dell'informazione.

53
Appendice

Appendice
Elenco dei file .tsv necessari a Flamenco
Attr.tsv Facets.tsv
artista nome artista manufatti Manufatti tipo di oggetto
nascita data di nascita temiSoggettiGen Temi Soggetti e Tematiche artistiche
eri Generi
morte data di morte
materiali Materiali materiale usato
realizzazione data di realizzazione
stileMovimenti Stile e stile e Movimento
titolo titolo dell' oggetto
Movimenti Artistico
fotografia Fotografia
disciplina Disciplina Ambito disciplinare
biografia Biografia dell'artista di riferimento
realizzatori Realizzatori chi ha realizzato il
bene culturale
luoghi Luoghi luogo in cui il bene è
stato prodotto
periodo Periodo periodo storico e
anno di riferimento

Gli articoli che contengono le descrizioni dei manufatti e le biografie degli artisti sono
contenuti nel file item.tsv, una tabella che fornisce ID e attributi per tutti gli oggetti. Di
seguito un esempio del modo in cui è strutturato il file, per ogni attributo corrisponde un
campo della tabella.
Attr.tsv Item.tsv
Artista nome artista Ardengo Soffici
nascita data di nascita 1879
morte data di morte 1964
realizzazione data di realizzazione 1914
titolo titolo dell' oggetto Natura morta con uovo rosso
fotografia Fotografia http://192.168.1.2:8888/mediawiki/image
s/thumb/8/83/1469_Ardengo_Soffici_Co
i_Natura_morta_con_uovo_rosso.jpg/350
px-
1469_Ardengo_Soffici_Coi_Natura_morta
_con_uovo_rosso.jpg
http://192.168.1.2:8888/mediawiki/index.
54
Appendice

biografia Biografia dell'artista php/Ardengo_Soffici

MANUFATTI_TERM MANUFATTI_MAP

1 Affresco ID-item ID-Manufatti_term


2 Ceramica
3 Ceramica Porcellana
4 Ceramica Ceramica dipinta
Esempio
5 Ceramica Maiolica
1 9
6 Ceramica Terracotta
7 Ceramica Terraglia Ardengo Soffici –
Natura morta con Pitura a olio
8 Dipinto
uovo rosso
9 Dipinto Pittura a olio
10 Dipinto Pittura a tempera
11 Disegno
12 Disegno acquerello
13 Disegno carbone
14 Disegno gesso
15 Disegno grafite
16 Disegno Inchiostro
17 Disegno pastello
18 Fotografia
19 Installazione
20 Libro
21 Murale
22 Mosaico
23 Rilievo
24 Rilievo Altorilievo
25 Rilievo Bassorilievo
26 Scultura
27 SculturaAvorio
28 SculturaBronzo
29 SculturaLegno
30 SculturaMarmo
31 SculturaOttone
32 SculturaPietra
33 SculturaTerracotta
34 Stampa
35 Stampa Acquaforte
36 Stampa Acquatinta
37 Stampa Fotoincisione
38 Stampa Incisione
55
Appendice

39 Stampa Litografia
40 Stampa Manifesto
41 Stampa Mezzotinto
42 Stampa Puntasecca
43 Stampa Serigrafia
44 Stampa Xilografia
45 Video

TEMISOGGETTIGENERI_TERM TEMISOGGETTIGENERI_MAP

1 Amore ID-item ID-temiSoggettiGeneri_term


2 Bellezza
3 Dinamismo
4 Dolore
5 Donna Esempio
6 Elettricita
7 Forza 1 11
8 Gioia Ardengo Soffici – Natura morta
9 Macchina Natura morta con
10 Musica uovo rosso
11 Natura morta
12 Paesaggio
13 Pericolo
14 Ritratto
15 Ritratto Autoritratto
16 Treno
17 Velocità
18 Viaggio
19 Madre

MATERIALI_TERM MATERIALI_MAP

1 Argilla ID-item ID-materiali_term


2 Avorio
3 Bronzo
4 Carta Esempio
5 Cartone 1 18
6 Cera Ardengo Soffici – Tela
Natura morta con
7 Ceramica uovo rosso
8 Ferro
9 Inchiostro
10 Legno
11 Marmo
56
Appendice

12 Pietra
13 Plastica
14 Sabbia
15 Seta
16 Stoffa
17 Tavola
18 Tela
19 Terracotta
20 Vetro

STILEMOVIMENTI_TERM STILEMOVIMENTI_MAP

1 Art Deco ID-item ID-stileMovimenti_term


2 Art Nouveau
3 Barocco
4 Bauhaus
5 Blaue Reiter Esempio
6 Die Brücke
7 Classicismo 1 17
8 Cubismo Ardengo Soffici – Futurismo
9 Cubismo Natura morta con
10 Dada uovo rosso
11 Dadaismo
12 Decadentismo
13 Divisionismo
14 Espressionismo
15 Espressionismo astratto
16 Fauvismo
17 Futurismo
18 Gotico
19 Impressionismo
20 Luminismo
21 Macchiaioli
22 Manierismo
23 Minimalismo
24 Neo-Plasticismo
25 Neo-Romanticismo
26 Neoclassica pittura
27 Nucleare Arte
28 Optical Art
29 Orfismo
30 Pop Art
31 Preraffaelliti
32 Primitivismo

57
Appendice

33 Purismo
34 Realismo
35 Realismo cubista
36 Realismo magico
37 Realismo sociale
38 Rinascimento
39 Rococò
40 Romanisto
41 Romanticismo
42 Scuola di Parigi
43 Simbolismo
44 Sintetismo
45 Suprematismo
46 Surrealismo
47 Umanesimo
48 Valori Plastici
49 Verismo
50 Vorticismo

DISCIPLINE_TERM DISCIPLINE_MAP

1 Scultura ID-item ID-discipline_term


2 Pittura
3 Letteratura
4 Architettura
5 Musica Esempio
6 Cinema
7 Teatro 1 2
8 Danza Ardengo Soffici – Natura Pittura
9 Giornalismo morta con uovo rosso
10 Videoarte
11 Medicina
12 Grafica pubblicitaria
13 Arte Musiva

REALIZZATORI_TERM REALIZZATORI_MAP

1 Architetto ID-item ID-realizzatori_term


2 Architetto Antonio Sant'Elia
3 Avvocato
4 Avvocato Giuseppe Carrieri
5 Collezioni Esempio
6 Collezionisti
7 Compositore 1 32
8 Compositore Luigi Russolo Ardengo Soffici – Pittore Ardengo
9 Critico d' arte Natura morta con Soffici
10 Critico d' arte Carlo Belloli uovo rosso
11 Critico d' arte Carlo Carrà
12 Critico d' arte Federico De Maria
58
Appendice

13 Drammaturgo
14 Drammaturgo Filippo Tommaso Marinetti
15 Drammaturgo Paolo Buzzi
16 Fondazioni
17 Giornalista
18 Giornalista Paolo Buzzi
19 Giornalista Enrico Cavacchioli
20 Giornalista Gesualdo Manzella Frontini
21 Giornalista Federico De Maria
22 Medico
23 Medico Piero Bellanova
24 Mercanti d'arte
25 Mosaicista
26 Mosaicista Gino Severini
27 Musei
28 Pittore
29 Pittore Francesco Cangiullo
30 Pittore Carlo Dalmazzo Carrà
31 Pittore Giacomo Balla
32 Pittore Ardengo Soffici
33 Pittore Uberto Boccioni
34 Pittore Fortunato Depero
35 Pittore Enrico Prampolini
36 Pittore Luigi Russolo
37 Pittore Gino Severini
38 Poeta
39 Poeta Paolo Buzzi
40 Poeta Enrico Cavacchioli
41 Poeta Corrado Govoni
42 Poeta Libero Altomare
43 Poeta Luciano Folgore
44 Poeta Gesualdo Manzella Frontini
45 Poeta Auro D'alba
46 Poeta Francesco Cangiullo
47 Poeta Federico De Maria
48 Poeta Ardengo Soffici
49 Poeta Filippo Tommaso Marinetti
50 Pubblicitario
51 Pubblicitario Fortunato Depero
52 Scenografo
53 Scenografo Giacomo Balla
54 Scenografo Enrico Prampolini
55 Scenografo Fortunato Depero
56 Scrittore
57 Scrittore Paolo Buzzi
58 Scrittore Aldo Palazzeschi
59 Scrittore Giuseppe Carrieri
60 Scrittore Auro D'alba
61 Scrittore Francesco Cangiullo
62 Scrittore Giovanni Papini

59
Appendice

63 Scrittore Carlo Belloli


64 Scrittore Carlo Dalmazzo Carrà
65 Scrittore Federico De Maria
66 Scrittore Piero Bellanova
67 Scrittore Ardengo Soffici
68 Scrittore Filippo Tommaso Marinetti
69 Scrittore Fortunato Depero
70 Scultore
71 ScultoreGiacomo Balla
72 ScultoreUmberto Boccioni
73 ScultoreFortunato Depero
74 ScultoreEnrico Prampolini
75 Grafico pubblicitario
76 Grafico pubblicitario Fortunato Depero

LUOGHI_TERM LUOGHI_MAP

1 Africa ID-item ID-luoghi_term


2 Africa Angola
3 Africa Benin
4 Africa Burkina Faso
5 Africa Camerun Esempio
6 Africa Congo
7 Africa Costa d' avorio 1 45
8 Africa Egitto Ardengo Soffici – Italia
9 Africa Gabon Natura morta con
10 Africa Gana uovo rosso
11 Africa Madagascar
12 Africa Mali
13 Africa Nigeria
14 Africa Repubblica di Liberia
15 Africa Sierra Leone
16 Africa Sud Africa
17 Africa Zaire
18 Asia
19 Asia Afghanistan
20 Asia Asia Centrale
21 Asia Assiria
22 Asia Cina
23 Asia Giappone
24 Asia India
25 Asia Persia
26 Asia Russia
27 Asia Tailandia
28 Asia Tibet
29 Asia Turchia
30 Asia Turkmenistan
31 Asia Uzbekistan
32 Australia

60
Appendice

33 Europa
34 Europa Austria
35 Europa Belgio
36 Europa Boemia
37 Europa Cecoslovacchia
38 Europa Cipro
39 Europa Danimarca
40 Europa Francia
41 Europa Germania
42 Europa Gran Bretagna
43 Europa Grecia
44 Europa Irlanda
45 Europa Italia
46 Europa Norvegia
47 Europa Olanda
48 Europa Paesi Bassi
49 Europa Polonia
50 Europa Portogallo
51 Europa Scozia
52 Europa Spagna
53 Europa Svezia
54 Europa Svizzera
55 Europa Ungheria
56 America
57 America
58 Oceania
59 Oceania Australia
60 Oceania New Zelanda
61 Oceania Polinesia
62 Oceania Micronesia
63 Oceania Melanesia

PERIODO_TERM PERIODO_MAP

1 1900s ID-item ID-periodo_term


2 1900s 1901
3 1900s 1902
4 1900s 1903
5 1900s 1904 Esempio
6 1900s 1905
7 1900s 1906 1 16
8 1900s 1907 Ardengo Soffici – Natura 1914
9 1900s 1908 morta con uovo rosso
10 1900s 1909
11 1910s
12 1910s 1910
13 1910s 1911
14 1910s 1912
15 1910s 1913
16 1910s 1914
61
Appendice

17 1910s 1915
18 1910s 1916
19 1910s 1917
20 1910s 1918
21 1910s 1919
22 1920s
23 1920s 1920
24 1920s 1921
25 1920s 1922
26 1920s 1923
27 1920s 1924
28 1920s 1925
29 1920s 1926
30 1920s 1927
31 1920s 1928
32 1920s 1929
33 1930s
34 1930s 1930
35 1930s 1931
36 1930s 1932
37 1930s 1933
38 1930s 1934
39 1930s 1935
40 1930s 1936
41 1930s 1937
42 1930s 1938
43 1930s 1939
44 1940s
45 1940s 1943
46 1940s 1944
47 1940s 1945
48 1940s 1946
49 1940s 1947
50 1940s 1948
51 1940s 1949
52 1950s
53 1950s 1950
54 1950s 1951
55 1950s 1952
56 1950s 1953
57 1950s 1954
58 1950s 1955
59 1950s 1956
60 1950s 1957
61 1950s 1958
62 1950s 1959
63 1960s
64 1960s 1960
65 1960s 1961
66 1960s 1962

62
Appendice

67 1960s 1963
68 1960s 1964
69 1960s 1965
70 1960s 1966
71 1960s 1967
72 1960s 1968
73 1960s 1969
74 1970s
75 1970s 1970
76 1970s 1971
77 1970s 1972
78 1970s 1973
79 1970s 1974
80 1970s 1975
81 1970s 1976
82 1970s 1977
83 1970s 1978
84 1970s 1979
85 1980s
86 1980s 1980
87 1980s 1981
88 1980s 1982
89 1980s 1983
90 1980s 1984
91 1980s 1985
92 1980s 1986
93 1980s 1987
94 1980s 1988
95 1980s 1989
96 1990s
97 1990s 1990
98 1990s 1991
99 1990s 1992
100 1990s 1993
101 1990s 1994
102 1990s 1995
103 1990s 1996
104 1990s 1997
105 1990s 1998
106 1990s 1999
107 2000s
108 2000s 2000
109 2000s 2001
110 2000s 2002
111 2000s 2003
112 2000s 2004

63
Bibliografia
Broughton,V. (2004, Gennaio 26), Una classificazione per il 21' secolo. Tratto il giorno Giugno
13, 2010 da AIB-WEB: <http://www.aib.it/aib/contr/broughton1.htm>

Bussolon, S. (s.d.). Organizzazione - Schemi organizzativi. Tratto il giorno Marzo 17, 2010 da
Hyperlabs <http://www.cardsorting.info/it/architettura/03.html>

Denton, W. (2003). How to Make a Faceted Classification and Put It On the Web. Tratto il giorno
10 Giugno, 2010 da Miskatonic university press,
<http://www.miskatonic.org/library/facet-web-howto.html>

Gnoli, C. (2000, Novembre 03). Il tavolino di Ranganathan. Tratto il giorno Giugno 14, 2010
da <http://didattica.spbo.unibo.it/bibliotime/num-iii-3/gnoli.htm>

Gnoli, C. (2002, Ottobre 17). Indicizzazione semantica nell'era digitale, ESB forum. Tratto il
giorno Marzo 22, 2010 da <http://www.burioni.it/forum/gnoli-sem.htm>

Gnoli, C. (2004). Classificazione a faccette. Roma: Associazione italiana Biblioteche.

Gnoli, C., Marino, V., & Rosati, L. (2006). Organizzare la conoscenza - Dalle biblioteche
all'architettura dell'informazione per il Web. Milano: Tecniche Nuove.

Hearst M. , English J., Sinha R., Swearingen K., & Yee K.-P. (Settembre 2002). Finding the
flow in web site search. Communications of the ACM.

Hearst M. A., Smalley P., & Chandler C., (2006, Aprile 26) Faceted Metadata for Information
Architecture and Search. New York: Association for Computing Machinery.

Instone, K. (2004, Luglio 8), Faceted Browsing - How User Interfaces Represent and Benefit from a
Faceted Classification System, SOASIST meeting, Dayton, Ohio

Jacob, Elin (1999). Utilizing Faceted Structures for Information Systems Design, Proceedings of the
62st Annual Meeting of ASIS. Uta Priss

Lavazza, C., Fiacchi, A., & Lauro, B. (2006, Novembre 06). Breve guida alla classificazione.
Tratto il giorno Marzo 18, 2010 da Trovabile <http://trovabile.org/articoli/guida-
alla-classificazione>

64
Marino, V. (2004, Febbraio 12). Classificazioni per il Web - I vantaggi dell'adozione di schemi a
faccette. Tratto il giorno Marzo 09, 2010 da AIB-WEB:
<http://www.aib.it/aib/contr/marino1.htm>

Ménard E., Mas S., & Alberts I., (2010) Faceted Classification for Museum Artefacts: A
Methodology to Support Web Site Development of Large Cultural Organizations tratto il
giorno 15 Giugno, 2010 da <www.cais-
acsi.ca/proceedings/2010/CAIS045_MenardMasAlbert_Final.pdf>

Morville, P., & Rosenfeld, L. (2002). Architettura dell'informazione per il World Wide Web.
Milano: Hops Libri.

Murray Phil, 2002, Conventional categorization: a complement to faceted classification, Knowledge


management connection, <http://www.kmconnection.com/Popularity-
based_classification.htm>

Postai, S. (Ottobre 2004) Facilitare la reperibilità dell’informazione: la classificazione a faccette tratto


il giorno Marzo 2010, 20 da Internet.pro <http://www.internet-
pro.typepad.com/aaaaArchFaccetteF.pdf>

Rosati, L. (2003). La classificazione a faccette fra Knowledge Management e Information Architecture


(parte I). Tratto il giorno Marzo 2010, 16 da itConsult:
<http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM.pdf>

-(2003). La classificazione a faccette fra Knowledge Management e Information Architecture (parte II).
Tratto il giorno Marzo 2010, 16 da itConsult:
<http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM_2.pdf>

Rosati, L. (2007). Architettura dell'informazione - Trovabilità: dagli oggetti quotidiani al Web. Milano:
Apogeo.

Spiteri L. (Aprile-Luglio 1998). A simplified model for facet analysis: Ranganathan 101. Canadian
Journal of Information and Library Science 23.

Vickery, B.C. (1972.) La classificazione a faccette. Guida per la costruzione e la utilizzazione di schemi
speciali. Roma, Consiglio nazionale delle ricerche.

65